三种编码格式:
最原始: ASKII: 只能表示128个字符;
为什么是128?
计算机内存的最小单位是字节, 一个字节是八位二进制. 为什么是二进制, 因为电信号最有效的传递方式就是正负传递.
为什么是八位, 谁规定的? 美国人, 当初计算机储存诞生时候就这么定义的, 网络通信中物理层以太网协议规定传输最小单位也是八位二进制;
128是因为八位数,当时觉得用不到就留着第一位空着,每个数都能显示两种状态, 排列组合为2的七次方.
可能无数中国人在骂祖宗,为什么中国祖先没有发明计算机
一统江湖: Unicode编码
128个字符显然不够其他国家用, 为了适应全球, Unicode这种编码诞生.
每个符号长度为3个字节.
但是还是不很好,有些原先能够一个字节表示的字符,用三个字节表示, 内存占用大了两倍.
优化: utf-8
可变字节, 有自己的排列原则, 适合大规模的处理数据.