1. ASCII编码:(AmericanStandard Code for Information Interchange,ASCII)
美国信息交换标准代码,是一种用于信息交换的美国标准代码,它的作用是给英文字母、数字、标点、字符转换成计算机能识别的二进制数
ord('a') chr(97) 相互转换
Ascii表:
数字范围为:48—57
大写字母范围为:65—90
小写字母范围为:97—122
2.GB2312编码:适用于汉字处理、汉字通信等系统之间的信息交换。
3.GBK编码:是汉字编码标准之一,是在GB2312-80 标准基础上的内码扩展规范,使用了双字节编码。
4.ANSI编码:是与你使用的windows操作系统的语言有关系的,像windows 7 简体中文版就是GBK(用一个字节表示英文,用两个字节表示一个中文)。
5.Unicode编码:
这是一种世界上所有字符的编码,但是它没有规定的存储方式。
Unicode标准也在不断发展,但最常用的是用两个字节表示一个字符(如果要用到非常偏僻的字符,就需要4个字节)。
现代操作系统和大多数编程语言都直接支持Unicode。
print unichr(30000)
print unichr(30001)
6.UTF-8编码:(Unicode Transformation Format - 8 bit)
UTF-8 是 Unicode 的一种实现方式。它是可变长的编码方式,可以使用 1~4 个字节表示一个字符,可根据不同的符号而变化字节长度。
7.Utf-8和GBK(GB2312)之间都必须通过Unicode才能转换
GBK、GB2312----Unicode----UTF-8
UTF-8----Unicode----GBK、GB2312