1. 基本概念
1.1 字符
人们所使用的记号,抽象意义上的符号(包括文字、字母、数字、标点符号)。
1.2 字符集
就是特定字符的集合。(如ASCII字符集、ISO 8859字符集、GB2312字符集、BIG5字符集、GB18030字符集、Unicode字符集等)
1.3 字符编码
字符集中字符对应的二进制编码。(如ANSI字符集对应的就是ANSI码)
1.4 编码
规定每个字符分别用一个字节还是多个字节存储,用哪些字节来存储,这个规定就叫做编码。(如UTF-8、UTF-16、UTF-32等)
各个国家和地区在制定编码标准的时候,字符集和编码一般都是同时制定的。因此,平常我们所说的字符集,除了有字符集这层含义外,同时也包含了编码的含义。(注意:Unicode字符集有多种编码方式,其他的字符集一般都只有一种)
所有的编码都是将字符转化为字节的过程。
参考资料:
http://polaris.blog.51cto.com/1146394/377468/
http://www.regexlab.com/zh/encoding.htm