char和varchar都是mysql中用来存储字符型数据的,而他们又有些不同。
一、varchar类型
一般初学者会认为,二者占用的空间是一样的。比如说我存储5个char,二者确实实际占用了5个char。但是仔细思考一下,如果二者真的一样的话,那么在设计数据库的时候有必要弄两个类型吗?显然他们是不同的。
varchar类型需要在数据之前利用一个或者两个字节来存储数据的长度,并且二者在内存中的操作方式也是不同的。
如存储一个用户的地址信息。根据评估,只要使用100个字符即可。但是有些数据库管理员会认为,反正Varchar数据类型是根据实际的需要来分配长度的,还不如给其大一点呢。为此他们可能会为这个字段一次性分配200个字符的存储空间。
那VARCHAR(100)与VARCHAR(200)真的相同吗?结果是否定的。
虽然他们用来存储90个字符的数据,其存储空间相同。但是对于内存的消耗是不同的。对于VARCHAR数据类型来说,硬盘上的存储空间虽然都是根据实际字符长度来分配存储空间的,但是对于内存来说,则不是。实际是使用固定大小的内存块来保存值的。简单的说,就是使用字符类型中定义的长度,即200个字符空间。显然,这对于排序或者临时表(这些内容都需要通过内存来实现)作业会产生比较大的不利影响。
原因如下:假设VARCHAR(100)与VARCHAR(200)类型,实际存90个字符,它不会对存储端产生影响(就是实际占用硬盘是一样的)。但是,它确实会对查询产生影响,因为当MySql创建临时表(SORT,ORDER等)时,VARCHAR会转换为CHAR,转换后的CHAR的长度就是varchar的长度,在内存中的空间就变大了,在排序、统计时候需要扫描的就越多,时间就越久。
二、char类型
(1)从碎片角度进行考虑,使用CHAR字符型时,由于存储空间都是一次性分配的,因此某个字段的内容其实是存储在一起的。单从这个角度来讲,其不存在碎片的困扰。而可变长度的字符数据类型,其存储的长度是可变的。当其更改前后数据长度不一致时,就不可避免的会出现内存碎片问题。所以在使用可变长度的字符型数据时,数据库管理员要时不时的对碎片进行整理。如执行数据库导出导入作业,来消除碎片。
(2)考虑其长度是否相近,如果某个字段其长度虽然比较长,但是其长度总是近似的,如一般在90个到100个字符之间,甚至是相同的长度。此时比较适合采用CHAR字符类型。比较典型的应用就是MD5哈希值。当利用MD5哈希值来存储用户密码时,就非常使用采用CHAR字符类型。因为其长度是相同的。另外,像用来存储用户的身份证号码等等,一般也建议使用CHAR类型的数据。
CHAR(1)与VARCHAR(1)两这个定义,会有什么区别呢?
虽然这两个都只能够用来保存单个的字符,但是VARCHAR要比CHAR多占用一个存储位置。这主要是因为使用VARCHAR数据类型时,会多用1个字节用来存储长度信息。这个管理上的开销char字符类型是没有的。
三、总结
虽然char和varchar二者在磁盘上存储时实际占用的空间是一样的。但他们仍有区别。
主要区别有两点:
(1)varchar是变长的,char是固定长度;
(2)两者在内存中的操作方式不同,varchar是按照最长的方式在内存中进行操作的。比如说要进行排序的时候,varcahr(100)是按照100这个长度来进行的,即使实际没有存储100个字符。
参考博文:
(1) https://www.cnblogs.com/zhuyeshen/p/11642211.html (char与varchar的区别与联系)
(2) https://www.cnblogs.com/jasonboren/p/11361995.html (mysql数据类型)
(3)https://www.jianshu.com/p/08eff7720c6f (mysql varchar长度的设置问题,分析比较到位)