首页 > 数据库 > MySQL > 正文

MySQL下数据表混乱的字符编码处理以及一些处理字符编码时的常用命令整理

2024-07-24 12:58:31
字体:
来源:转载
供稿:网友

  因为不知道什么时候的原因,我们有一个数据库超级无赖的具有了无敌的特性:数据表的编码是Latin1-swXXXX什么的。而保存在里面的中文又是php强制以utf8保存在其中。因此,出了各种乱七八糟的怪里怪气的毛病。让我等对于MySQL这种数据库本就没有什么爱的人深感恶心。

  因此,今日在研究之下终于解决此问题。再次说明,本文是把latin1转为utf8。

  问题的核心还是在于要改变已有保存字符的混乱问题,最彻底和便捷的方法就是直接导出,然后再以对应所需的字符导入。

  为了能够正确的导入,我们必须要确保导出的数据在你的文字编辑器下能够正常显示中文。对于我们这次的这个数据库,我们最终的导出语句是:

view plaincopy to clipboardPRint?
/usr/local/mysql/bin/mysqldump -p --opt --default-character-set=latin1  sends> /home/test/sends.sql 
/usr/local/mysql/bin/mysqldump -p --opt --default-character-set=latin1  sends> /home/test/sends.sql

  导出后你就自觉的先看看中文显示正不正常吧,如果不正常就回去改个编码继续导。。。。

  如果正常,继续:

  现在要准备导入,但是导入的工作之前有个预备工作要做,如果你之前只导出一个表。那修改你导出的文件中的这一行:

view plaincopy to clipboardprint?
/*!40101 SET NAMES latin1 */;  
 
成为  
 
/*!40101 SET NAMES utf8 */; 
/*!40101 SET NAMES latin1 */;

成为

/*!40101 SET NAMES utf8 */;
 

  如果不幸你导出的是整个有很多不同编码的数据表的数据库,ok。请使用替换工具把原来有的各种编码都替换成你要的目的编码。我这里原来有utf8和latin1,所以只需要把Latin1全部替换成utf8即可。

  之后新建一个要导入数据的数据库:

view plaincopy to clipboardprint?
mysql> create database `TARGET_DB` default character set utf8 collate utf8_general_ci 
mysql> create database `TARGET_DB` default character set utf8 collate utf8_general_ci

  OK,现在可以导入数据表了:

view plaincopy to clipboardprint?
mysql -uroot -p TARGET_DB --default-character-set=utf8 < /home/test/sends.sql 
mysql -uroot -p TARGET_DB --default-character-set=utf8 < /home/test/sends.sql

  这样,导回去以后世界就清静了。回顾以前,原来一直不大成功都是因为我们没有去修改.sql文件里面的那些编码设置。这次终于好了。这个破数据库,麻烦死了。我以后写程序绝对不用mysql了。。。。。

  最后附带一些mysql操作字符集的时候会用到的命令,都是从网上收集的:

view plaincopy to clipboardprint?
1. 修改 MySQL 数据库默认字符集(mysql database default character set)  
 
alter database testdb default character set = gb2312;  
2. 修改 MySQL 数据表默认字符集(mysql table default character set)  
 
alter table ip_to_country default character set = gb2312;  
注意:修改 MySQL 的默认字符集,不管是在数据库级别,还是数据表级别, 对已经存储的字符数据无任何改变。只是新增的表或列,开始使用新的 字符集。  
 
3. 转换 MySQL 数据表字符集(mysql table character set)  
 
MySQL 中有一个数据表 ip_to_country,以前该表字符列数据都是以 utf8 编码格式存放的, 现在想转换为 gb2312 编码格式存放。需要使用 MySQL 转换字符集命令:convert to character set  
 
alter table ip_to_country convert to character set gb2312;  
提示:convert to 也会把数据表 ip_to_country 的默认字符集从 utf8 更改为 gb2312。  
 
4. 转换 MySQL 数据表中某个列的字符集(mysql column character set)  
 
alter table ip_to_country modify country_name varchar(50) character set gb2312;  
这个语句把单独一个列 country_name 的字符集转换为 gb2312。这在用法在实际中比较少见, 因为大多数情况下,都是改变整个表的字符集。  
 
来自:http://www.sqlstudy.com/sql_article.php?id=2008082102 
1. 修改 MySQL 数据库默认字符集(mysql database default character set)

alter database testdb default character set = gb2312;
2. 修改 MySQL 数据表默认字符集(mysql table default character set)

alter table ip_to_country default character set = gb2312;
注意:修改 MySQL 的默认字符集,不管是在数据库级别,还是数据表级别, 对已经存储的字符数据无任何改变。只是新增的表或列,开始使用新的 字符集。

3. 转换 MySQL 数据表字符集(mysql table character set)

MySQL 中有一个数据表 ip_to_country,以前该表字符列数据都是以 utf8 编码格式存放的, 现在想转换为 gb2312 编码格式存放。需要使用 MySQL 转换字符集命令:convert to character set

alter table ip_to_country convert to character set gb2312;
提示:convert to 也会把数据表 ip_to_country 的默认字符集从 utf8 更改为 gb2312。

4. 转换 MySQL 数据表中某个列的字符集(mysql column character set)

alter table ip_to_country modify country_name varchar(50) character set gb2312;
这个语句把单独一个列 country_name 的字符集转换为 gb2312。这在用法在实际中比较少见, 因为大多数情况下,都是改变整个表的字符集。

来自:http://www.sqlstudy.com/sql_article.php?id=2008082102

view plaincopy to clipboardprint?
创建一个名为test的数据库,并且设置字符集都是utf8:  
create database `test` default character set utf8 collate utf8_general_ci  
 
查看ta数据库中类似test的数据表的信息:  
show table status from ta like '%test%';  
 
查看 MySQL 数据库服务器和数据库字符集。   
show variables like '%char%';   
+--------------------------+-------------------------------------+------   
| Variable_name            | Value                               |......   
+--------------------------+-------------------------------------+------   
| character_set_client     | utf8                                |......   -- 客户端字符集   
| character_set_connection | utf8                                |......   
| character_set_database   | utf8                                |......   -- 数据库字符集   
| character_set_filesystem | binary                              |......   
| character_set_results    | utf8                                |......   
| character_set_server     | utf8                                |......   -- 服务器字符集   
| character_set_system     | utf8                                |......   
| character_sets_dir       | D:/MySQL Server 5.0/share/charsets/ |......   
 
 
查看 MySQL 数据表(table) 的字符集。   
 
show table status from sqlstudy_db like '%countries%';   
+-----------+--------+---------+------------+------+-----------------+------   
| Name      | Engine | Version | Row_format | Rows | Collation       |......   
+-----------+--------+---------+------------+------+-----------------+------   
| countries | InnoDB |      10 | Compact    |   11 | utf8_general_ci |......   
 
 
查看 MySQL 数据列(column)的字符集。   
 
show full columns from countries;   
+----------------------+-------------+-----------------+--------   
| Field                | Type        | Collation       | .......   
+----------------------+-------------+-----------------+--------   
| countries_id         | int(11)     | NULL            | .......   
| countries_name       | varchar(64) | utf8_general_ci | .......   
| countries_iso_code_2 | char(2)     | utf8_general_ci | .......   
| countries_iso_code_3 | char(3)     | utf8_general_ci | .......   
| address_format_id    | int(11)     | NULL            | .......   
 
 
查看当前安装的 MySQL 所支持的字符集。   
 
show charset; 或  
show char set;   
+----------+-----------------------------+---------------------+--------+   
| Charset  | Description                 | Default collation   | Maxlen |   
+----------+-----------------------------+---------------------+--------+   
| big5     | Big5 Traditional Chinese    | big5_chinese_ci     |      2 |   
| dec8     | DEC West European           | dec8_swedish_ci     |      1 |   
| cp850    | DOS West European           | cp850_general_ci    |      1 |   
| hp8      | HP West European            | hp8_english_ci      |      1 |   
| koi8r    | KOI8-R Relcom Russian       | koi8r_general_ci    |      1 |   
| latin1   | cp1252 West European        | latin1_swedish_ci   |      1 |   
| latin2   | ISO 8859-2 Central European | latin2_general_ci   |      1 |   
| swe7     | 7bit Swedish                | swe7_swedish_ci     |      1 |   
| ascii    | US ASCII                    | ascii_general_ci    |      1 |   
| ujis     | EUC-JP Japanese             | ujis_japanese_ci    |      3 |   
| sjis     | Shift-JIS Japanese          | sjis_japanese_ci    |      2 |   
| hebrew   | ISO 8859-8 Hebrew           | hebrew_general_ci   |      1 |   
| tis620   | TIS620 Thai                 | tis620_thai_ci      |      1 |   
| euckr    | EUC-KR Korean               | euckr_korean_ci     |      2 |   
| koi8u    | KOI8-U Ukrainian            | koi8u_general_ci    |      1 |   
| gb2312   | GB2312 Simplified Chinese   | gb2312_chinese_ci   |      2 |   
| greek    | ISO 8859-7 Greek            | greek_general_ci    |      1 |   
| cp1250   | Windows Central European    | cp1250_general_ci   |      1 |   
| gbk      | GBK Simplified Chinese      | gbk_chinese_ci      |      2 |   
| latin5   | ISO 8859-9 Turkish          | latin5_turkish_ci   |      1 |   
| armscii8 | ARMSCII-8 Armenian          | armscii8_general_ci |      1 |   
| utf8     | UTF-8 Unicode               | utf8_general_ci     |      3 |   
| ucs2     | UCS-2 Unicode               | ucs2_general_ci     |      2 |   
| cp866    | DOS Russian                 | cp866_general_ci    |      1 |   
| keybcs2  | DOS Kamenicky Czech-Slovak  | keybcs2_general_ci  |      1 |   
| macce    | Mac Central European        | macce_general_ci    |      1 |   
| macroman | Mac West European           | macroman_general_ci |      1 |   
| cp852    | DOS Central European        | cp852_general_ci    |      1 |   
| latin7   | ISO 8859-13 Baltic          | latin7_general_ci   |      1 |   
| cp1251   | Windows Cyrillic            | cp1251_general_ci   |      1 |   
| cp1256   | Windows Arabic              | cp1256_general_ci   |      1 |   
| cp1257   | Windows Baltic              | cp1257_general_ci   |      1 |   
| binary   | Binary pseudo charset       | binary              |      1 |   
| geostd8  | GEOSTD8 Georgian            | geostd8_general_ci  |      1 |   
| cp932    | SJIS for Windows Japanese   | cp932_japanese_ci   |      2 |   
| eucjpms  | UJIS for Windows Japanese   | eucjpms_japanese_ci |      3 |   
 
 
修改表和字段的字符集   
//修改表   
alter table 表名 convert to character set gbk;   
//修改字段   
alter table 表名 modify column '字段名' varchar(30) character set gbk not null; 


发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表