ASCII part of UTF8

UTF8

所以，本着节约的精神，又出现了把Unicode编码转化为“可变长编码”的UTF-8编码。
UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节，常用的英文字母被编码成1个字节，汉字通常是3个字节，只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符，用UTF-8编码就能节省空间。

字符	ASCII	Unicode	UTF-8
A	01000001	00000000 01000001	01000001
中文	x	01001110 00101101	01001110 00101101

从上面的表格还可以发现，UTF-8编码有一个额外的好处，就是ASCII编码实际上可以被看成是UTF-8编码的一部分，所以，大量只支持ASCII编码的历史遗留软件可以在UTF-8编码下继续工作。

作者：JamesHH
链接：https://www.jianshu.com/p/8c57d87a76c6
来源：简书
简书著作权归作者所有，任何形式的转载都请联系作者获得授权并注明出处。

相关阅读:
广义表的创建和遍历
dev c++ Boost库的安装
NAT模式
vmware桥接模式
smb与samba
利用Linux的Samba服务模拟NT域
使用samba进行共享文件操作步骤
安装chrome
使用虚拟机上网第二步
TCP协议三次握手过程分析

原文地址：https://www.cnblogs.com/kakaisgood/p/10805568.html