• 编码格式


    三种编码格式:

           最原始:  ASKII: 只能表示128个字符; 

                        为什么是128?

                        计算机内存的最小单位是字节, 一个字节是八位二进制. 为什么是二进制, 因为电信号最有效的传递方式就是正负传递. 

                        为什么是八位, 谁规定的? 美国人, 当初计算机储存诞生时候就这么定义的, 网络通信中物理层以太网协议规定传输最小单位也是八位二进制;

                        128是因为八位数,当时觉得用不到就留着第一位空着,每个数都能显示两种状态, 排列组合为2的七次方.

                  可能无数中国人在骂祖宗,为什么中国祖先没有发明计算机

           一统江湖: Unicode编码

                   128个字符显然不够其他国家用, 为了适应全球, Unicode这种编码诞生.

                   每个符号长度为3个字节. 

                   但是还是不很好,有些原先能够一个字节表示的字符,用三个字节表示, 内存占用大了两倍.

           优化: utf-8

                  可变字节, 有自己的排列原则, 适合大规模的处理数据.

            

                        

  • 相关阅读:
    bzoj2400 Spoj 839 Optimal Marks
    01分数规划
    bzoj1565 植物大战僵尸
    bzoj1497 最大获利(最大权闭合子图)
    bzoj3144 切糕
    loj6045 价
    bzoj3894 文理分科
    luogu3731 新型城市化
    快速傅里叶变换(FFT)
    bzoj1030 文本生成器
  • 原文地址:https://www.cnblogs.com/dangdanghepingping/p/10695258.html
Copyright © 2020-2023  润新知