首页 > 数据库 > MySQL > 正文

mysqli_set_charset和SET NAMES优劣分析

2024-07-24 12:38:22
字体:
来源:转载
供稿:网友

本文章来分析一下关于mysqli_set_charset和SET NAMES吧,有需要学习的朋友可参考参考,我最常用会用set names来解决php与mysql乱码问题.

程序设置,代码如下:

mysql_query("SET NAMES UTF8");

my.ini设置

  1. # CLIENT SECTION 
  2.  
  3. [mysql] 
  4.  
  5. default-character-set=utf8 
  6.  
  7. # SERVER SECTION 
  8.  
  9. [mysqld] 
  10.  
  11. default-character-set=utf8 

这两个字段来更改数据库的默认字符集。第一个是客户端默认的字符集,第二个是服务器端默认的字符集。假设我们把两个都设为utf8,然后在MySQL Command Line Client里面输入“show variebles like“character_set_%”;”,可看到如下字符:

  1. character_set_client   latin1 
  2. character_set_connection    latin1 
  3. character_set_database     utf8 
  4. character_set_results    latin1 
  5. character_set_server   utf8 
  6. character_set_system     utf8 

其中的utf8随着我们上面的设置而改动。此时,要是我们通过采用UTF-8的PHP程序从数据库里读取数据,很有可能是一串“?????”或者是其他乱码。网上查了半天,解决办法倒是简单,在连接数据库之后,读取数据之前,先执行一项查询“SET NAMES UTF8”,即在PHP里为即可显示正常(只要数据库里信息的字符正常)。为什么会这样?这句查询“SET NAMES UTF8”到底是什么作用?

到MySQL命令行输入“SET NAMES UTF8;”,然后执行“show variebles like“character_set_%”;”,发现原来为latin1的那些变量“character_set_client”、“character_set_connection”、“character_set_results”的值全部变为utf8了,原来是这3个变量在捣蛋。查阅手册,上面那句等于:

  1. SET character_set_client = utf8; 
  2.  
  3. SET character_set_results = utf8; 
  4.  
  5. SET character_set_connection = utf8; 

这里要声明一点,“SET NAMES UTF8”作用只是临时的,MySQL重启后就恢复默认了。

接下来就说到MySQL在服务器上的配置问题了。岂不是我们每次对数据库读写都得加上“SET NAMESUTF8”,以保证数据传输的编码一致?能不能通过配置MySQL来达到那三个变量默认就为我们要想的字符集?手册上没说,我在网上也没找到答案。所以,从服务器配置的角度而言,是没办法省略掉那行代码的.

那mysql_set_character_set又做了什么呢?代码如下:

  1. //mysql-5.1.30-SRC/libmysql/client.c, line 3166: 
  2.  int STDCALLmysql_set_character_set(MYSQL*mysql, const char *cs_name) 
  3.  { 
  4.    structcharset_info_st *cs; 
  5.    const char *save_csdir= charsets_dir; 
  6.    
  7.    if (mysql->options.charset_dir) 
  8.      charsets_dir= mysql->options.charset_dir; 
  9.    
  10.    if (strlen(cs_name) < MY_CS_NAME_SIZE && 
  11.       (cs= get_charset_by_csname(cs_name, MY_CS_PRIMARY, MYF(0)))) 
  12.    { 
  13.      char buff[MY_CS_NAME_SIZE + 10]; 
  14.      charsets_dir= save_csdir; 
  15.      /* Skip execution of "SET NAMES" for pre-4.1 servers */ 
  16.      if (mysql_get_server_version(mysql) < 40100) 
  17.        return 0; 
  18.      sprintf(buff, "SET NAMES %s", cs_name); 
  19.      if (!mysql_real_query(mysql, buff, strlen(buff))) 
  20.      { 
  21.        mysql->charset= cs; 
  22.      } 
  23.    } 
  24.    //以下省略 

我们可以看到,mysqli_set_charset除了做了”SET NAMES”以外, 还多做了一步,代码如下:

  1. sprintf(buff, "SET NAMES %s", cs_name); 
  2. if (!mysql_real_query(mysql, buff, strlen(buff))) 
  3.   mysql->charset= cs; 

而对于mysql这个核心结构的成员charset又有什么作用呢?

这就要说说mysql_real_escape_string()了, 这个函数和mysql_escape_string的区别就是, 它会考虑”当前”字符集. 那么这个当前字符集从哪里来呢?

对了, 你猜的没错, 就是mysql->charset.

mysql_real_string在判断宽字符集的字符的时候, 就根据这个成员变量来分别采用不同的策略, 比如如果是utf-8, 那么就会采用libmysql/ctype-utf8.c.代码如下:

  1. <?php 
  2.      $db = mysql_connect('localhost:3737''root' ,'123456'); 
  3.      mysql_select_db("test"); 
  4.      $a = "x91x5c";//"?"的gbk编码, 低字节为5c, 也就是ascii中的"" 
  5.    
  6.      var_dump(addslashes($a)); 
  7.      var_dump(mysql_real_escape_string($a$db)); 
  8.      //Vevb.com 
  9.      mysql_query("set names gbk"); 
  10.      var_dump(mysql_real_escape_string($a$db)); 
  11.    
  12.      mysql_set_charset("gbk"); 
  13.      var_dump(mysql_real_escape_string($a$db)); 
  14.  ?>

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表