安装mysql之后。假设存储中文。再读出的时候就会出现乱码问题。
如今的字符集有几百种之多,都是一些公司或者组织定义的。
我们应该使用可以容纳世界所有语言所有字符的字符集,这样就不会再出现乱码问题。
这就是如今通用的UTF-8。
要理解编码就应该区分字符集和编码格式是说的同一问题的两个方面。
导致乱码的原因是存储和读取时採用的是不同的字符集。
推荐在建库之前改动编码格式:
一、进入mysql(mysql -uroot -p),查看当前数据库字符集(status;)
二、#vim /etc/mysql/my.cnf
三、
[client]
default-character-set=utf8
[mysqld]
default-storage-engine=INNODB
character-set-server=utf8
collation-server=utf8_general_ci
四、重新启动mysql(/etc/init.d/mysql stop /etc/init.d/mysql start)
上面是建库之前的操作。假设是数据库正在使用。然后发现编码格式不正确应该怎么办呢?
一、导出表结构:mysqldump -uroot -p --default-character-set=gbk -d databasesname > createtable.sql
二、手工改动createtable.sql中的表结构定义的字符集为新的字符集。
三、确保记录不再更新。导出全部记录。
mysqldump -uroot -p --quick --no-create-info --extended-insert --default-character-set=latin1 databasename>data.sql
--quick:转存大表时使用,一次次检索表中的行,而不是一次检索全部行,输出时存储在缓存。
--no-create-info:不导出建表语句。
--extended-insert:使用包括几个VALUES列表的多行INSERT语法。
--default-character-set=latin1:依照原有字符集导出,这样在导出文件里全部中文都是可见的。
四、打开data.sql,将SET NAMES latin1改为SET NAMES gbk
五、使用新的字符集创建新的数据库。
create database databasename defaule charset gbk;
六、创建表,运行createtable.sql
mysql -uroot -p databasename < createtable.sql
七、导入数据
mysql -uroot -p databasename < data.sql
以下是我国自己定义的一些编码标准:
1)GB2312-80:1980年公布,双字节编码字符集。
2)GB13000:1993年公布,使用非常少。仅仅是一个形式上的标准。
3)GBK:1995年公布,由于得到了windows 95的支持大行其道。
4)GB18030:2000年公布,没怎么听过。
以下是经常使用字符集的比較:
1)ASCII,定长。单字节7位编码。最早的奠基性编码。
2)GBK,定长,双字节编码。自持广泛。
3)UTF-8。不定长,1-4字节编码。互联网和UNIX广泛支持的Unicode字符集。
4)UTF-16,不定长,Java等内部使用的字符集。
字符集怎样选择呢:
1)在多国使用,国际化的范儿,使用Unicode,也就是UTF-8。
2)假设数据库中已有数据的导入,就要考虑数据库字符集对已有数据的兼容性。
3)数据库仅仅支持中文,数据量非常大,性能要求高,能够使用双字节编码的GBK。由于相比于UTF-8的3字节,空间占用更少。
4)假设数据库要做大量的字符运算。如比較排序等,定长的比不定长的更快。
5)client普遍採用的字符集格式。
mysql支持多种字符集。在同一台server。同一个数据库。甚至同一个表的不同字段都能够制定不同的字符集。
能够仅仅用命令show character set; 插卡看支持的字符集。
相对字符集还有校对规则的问题。能够查阅相关文档。
mysql字符集的设置:
有四个级别:server级,数据库级,表级和字段级。
1)数据库字符集的设置:在my.cnf(windows为my.ini)中设置:[mysqld]character-set-server=utf-8 在启动选项中设置:mysqld --character-set-server=utf-8 也能够在编译时制定。
2)数据库字符集和校对规则,可在创建数据库时制定,也可在创建之后通过alter database命令改动。
3)标的设置同上,要显示表的字符集和设置规则能够通过show create table命令查看。