• ASCII part of UTF8


    UTF8

    • 所以,本着节约的精神,又出现了把Unicode编码转化为“可变长编码”的UTF-8编码。
    • UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符,用UTF-8编码就能节省空间。
    字符ASCIIUnicodeUTF-8
    A 01000001 00000000 01000001 01000001
    中文 x 01001110 00101101 01001110 00101101
    • 从上面的表格还可以发现,UTF-8编码有一个额外的好处,就是ASCII编码实际上可以被看成是UTF-8编码的一部分,所以,大量只支持ASCII编码的历史遗留软件可以在UTF-8编码下继续工作。


    作者:JamesHH
    链接:https://www.jianshu.com/p/8c57d87a76c6
    来源:简书
    简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。
  • 相关阅读:
    广义表的创建和遍历
    dev c++ Boost库的安装
    NAT模式
    vmware桥接模式
    smb与samba
    利用Linux的Samba服务模拟NT域
    使用samba进行共享文件操作步骤
    安装chrome
    使用虚拟机上网第二步
    TCP协议三次握手过程分析
  • 原文地址:https://www.cnblogs.com/kakaisgood/p/10805568.html
Copyright © 2020-2023  润新知