字符集(Charset)
是一个系统支持的所有抽象字符的集合。字符是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。
MySQL数据库的字符集:
- 字符集(CHARACTER) 这个好理解
- 校对规则(COLLATION) 即排序规则
MySQL中常见的字符集:
- UTF8 (utf8mb4用的比较多一些)
- LATIN1
- GBK
常见校对规则:
- ci: 大小写不敏感
- cs或bin: 大小写敏感
对于字符集和字符序补充:
什么是字符集、字符序?简单的来说: 字符集(character set):定义了字符以及字符的编码。 字符序(collation):定义了字符的比较规则。 举个例子: 有四个字符:A、B、a、b,这四个字符的编码分别是A = 0, B = 1, a = 2, b = 3。这里的字符 + 编码就构成了字符集(character set)。 如果我们想比较两个字符的大小呢?比如A、B,或者a、b,最直观的比较方式是采用它们的编码,比如因为0 < 1,所以 A < B。 另外,对于A、a,虽然它们编码不同,但我们觉得大小写字符应该是相等的,也就是说 A == a。 这上面定义了两条比较规则,这些比较规则的集合就是collation。 同样是大写字符、小写字符,则比较他们的编码大小; 如果两个字符为大小写关系,则它们相等。
我们可以使用以下命令查看:
– show charset;
– show collation;
查看当前数据库支持的字符集,以及其对应的默认校对规则和存储最大字符长度
查看utf8支持的校对规则
MySQL字符集级别
服务器端字符集:控制的是,存到mysql中时,字符集控制 客户端字符集: 控制的是用户的输入及显示 系统字符集: 控制的是系统相关的显示,和一些依赖于操作系统的应用
在生产中我们必须保证操作系统、MySQL客户端实例、MySQL服务器端的字符集保持一致
1. 操作系统字符集设置
source /etc/sysconfig/i18n [root@db02 logs]# echo $LANG zh_CN.UTF-8
2. MySQL实例级别
方法1: 在编译安装时候就指定如下服务器端字符集
cmake . -DDEFAULT_CHARSET=utf8 -DDEFAULT_COLLATION=utf8_general_ci -DWITH_EXTRA_CHARSETS=all
方法2: 在配置文件中设置
[mysqld] character-set-server=utf8
3. Mysql实例客户端级别
第一种方式:
临时生效单条命令法
mysql> set names utf8; Query OK, 0 rows affected (0.00 sec)
第二种方式:
通过修改my.cnf实现修改mysql客户端的字符集,配置方法如下。
[client] default-character-set=utf8
注意:如果我们在创建数据库或者表时指定好字符集之后,那么这个数据库或者表就以创建时指定的字符集为准,将忽略配置文件中的字符集。
创建数据库
CREATE DATABASE `oldboy` /*!40100 DEFAULT CHARACTER SET utf8 */ create database oldboy DEFAULT CHARACTER SET UTF8 DEFAULT COLLATE = utf8_general_ci;
创建表
CREATE TABLE `test` ( `id` int(4) NOT NULL AUTO_INCREMENT, `name` char(20) NOT NULL, PRIMARY KEY (`id`) ) ENGINE=InnoDB AUTO_INCREMENT=13 DEFAULT CHARSET=utf8
获取帮助并查询
help create database; show character set;
如果都没有做,我们想要在生产环境中更改数据库的字符集?
alter database oldboy CHARACTER SET utf8 collate utf8_general_ci; alter table t1 CHARACTER SET latin1;
注意:更改字符集时,一定要保证由小往大改,后者必须是前者的严格超集。生产中别随便改。一定要反复确认。