字符与字节的区别
一个字符由于所使用的字符集的不同,会并存储在一个或多个字节中,所以一个字符占用多少个字节取决于所使用的字符集
注意:char与varchar后面接的数据大小为存储的字符数,而不是字节数(其实是5.0版本以上是这样)
字符表示无论存放的是数字、字母还是UTF8汉字(每个汉字3字节),都可以存放20个,最大大小是65532字节。
char与varchar的差异
为方便说明,我们下面定义一个表:
CREATE TABLE `t_users` ( `name` CHAR(10) NOT NULL, `subject` VARCHAR(10) NOT NULL, `description` CHAR(10) NOT NULL ) INSERT INTO `t_users` (`name`, `subject`, `description`) VALUES ('zejin', 'zejin ', 'zejin ');
存数据时的区别
char定义的是固定长度,长度范围为0-255,存储时,如果字符数没有达到定义的位数,会在后面用空格补全存入数据库中,在上例中,name实际存储在数据中的数据为'zejin '
varchar是变长长度,长度范围为0-65535,存储时,如果字符没有达到定义的位数,也不会在后面补空格,在上例subject字段中,实际存储在数据中的数据为'zejin ',当然还有一或两个字节来描述该字节长度
取数据时的区别
数据库取char的数据时,会把后面的空格全部丢弃掉,譬如上例中的description字段取出来时只剩zejin
mysql> select concat('(',name,')'),concat('(',description,')') from t_users; +----------------------+-----------------------------+ | concat('(',name,')') | concat('(',description,')') | +----------------------+-----------------------------+ | (zejin) | (zejin) | +----------------------+-----------------------------+ 1 row in set (0.00 sec)
也就是说,在char中的尾部存入空格时,最后取出来都会被丢弃。
当然指定PAD_CHAR_TO_FULL_LENGTH时,在取数据时让尾部的空格保留。
而数据库在取varchar数据时,尾部空格会保留,譬如subject字段:
mysql> select concat('(',subject,')'),concat('(',description,')') from t_users; +-------------------------+-----------------------------+ | concat('(',subject,')') | concat('(',description,')') | +-------------------------+-----------------------------+ | (zejin ) | (zejin) | +-------------------------+-----------------------------+ 1 row in set (0.00 sec)
占用字节差别
以latin编码为便,一个字符占用一个字节。
Value | CHAR(4) | Storage Required | VARCHAR(4) | Storage Required |
'' | ' ' | 4 bytes | '' | 1 byte |
'ab' | 'ab ' | 4 bytes | 'ab' | 3 bytes |
'abcd' | 'abcd' | 4 bytes | 'abcd' | 5 bytes |
'abcdefgh' | 'abcd' | 4 bytes | 'abcd' | 5 bytes |
可以用上表来表示,当定义char时,不管你存入多少字符,都会占用到你定义的字符数,而用varchar时,则和你输入的字符数有关,会多一到两个字节来记录字节长度,当数据位占用的字节数小于255时,用1个字节来记录长度,数据位占用字节数大于255时,用2个字节来记录长度,还有一位来记录是否为nul值。
注意
mysql每一行的最大字节数为65535,当你使用utf8,一个字符有可能占用三个字节的时候,varchar如果定义允许空的话能定义的最大长度为(65535-1-2)/3=21844.
Mysql在对比char,varchar,text类型的数据时,是不会把尾部的空格考虑在内的,这对所有字符集都适用,但在这里是除了like比较符的,譬如:
mysql> select name='zejin',name='zejin ' from t_users; +--------------+----------------+ | name='zejin' | name='zejin ' | +--------------+----------------+ | 1 | 1 | +--------------+----------------+ 1 row in set (0.00 sec) mysql> select name like 'zejin',name like 'zejin ' from t_users; +-------------------+---------------------+ | name like 'zejin' | name like 'zejin ' | +-------------------+---------------------+ | 1 | 0 | +-------------------+---------------------+ 1 row in set (0.00 sec)