Unicode是计算机可以支持这个星球上多种语言的秘密武器。在Unicode之前,用的都是ASCII。
ASCII码非常简单,每个英文都是7位二进制的方式存贮在计算机内,其范围是32~126。当用户在文
件中键入一个大写字母A时,计算机把A的ASCII码值65写入磁盘,然后当计算机读取该文件时,它会
首先把65转化成字符A然后显示在屏幕上。
ASCII编码的文件小巧易读。一个程序只需简单地把每个字节读出来,把对应的数值转换成字符显
示出来就可以了。但是ASCII字符只能表示95个可打印字符。后来的软件商把ASCII码扩展到了8位,
这样一来它就可以多标识128个字符,可以233个字符对需要成千上万的字符的非欧洲语系的语言来说
仍然太少。
Unicode通过使用一个或多个字节来表示一个字符的方法突破了ASCII的限制。在这样的机制下,
Unicode就可以表示超过90000个字符。