day 2 编码的问题

day 2 编码的问题
python2解释器器在加载 .py 文件中的代码时，会对内容进行编码（默认ascill）,而python3对内容进行行编码的默认为utf-8

计算机:
早期. 计算机是美国发明的. 普及率不高, 一般只是在美国使用. 所以. 最早的编码结构就是按照美国人的习惯来编码
的. 对应数字+字母+特殊字符一共也没多少. 所以就形成了了最早的编码ASCII码. 直到今天ASCII依然深深的影响着我们.

ASCII（American Standard Code for Information Interchange，美国标准信息交换代码）是基于拉丁字母的一套电
脑编码系统，主要用于显示现代英语和其他西欧语言，其最多只能用 8 位来表示（一个字节），即：2**8 = 256，所
以，ASCII码最多只能表示 256 个符号。

随着计算机的发展. 以及普及率的提高. 流行到欧洲和亚洲. 这时ASCII码就不合适了了. 比如: 中文汉字有几万个. 而ASCII
最多也就256个位置. 所以ASCII不行了. 怎么办呢? 这时, 不同的国家就提出了不同的编码用来适用于各自的语言环境.
比如, 中国的GBK, GB2312, BIG5, ISO-8859-1等等. 这时各个国家都可以使用计算机了了.

GBK, 国标码占用2个字节. 对应ASCII码 GBK直接兼容. 因为计算机底层是用英文写的. 你不支持英文肯定不行. 而英
文已经使用了ASCII码. 所以GBK要兼容ASCII.

这里GBK国标码. 前面的ASCII码部分. 由于使用两个字节. 所以对于ASCII码而言. 前9位都是0
```
字母A:0100 0001 # ASCII
字母A:0000 0000 0100 0001 # 国标码
```
国标码的弊端: 只能中国用. 日本就垮了. 所以国标码不满足我们的使用. 这时提出了一个万国码Unicode.

unicode一开始设计是每个字符两个字节. 设计完了. 发现我大中国汉字依然无法进行编码. 只能进行扩充. 扩充成32位也就是4个字
节. 这回够了了. 但是. 问题来了了. 中国字9万多. 而unicode可以表示40多亿. 根本用不了了. 太浪费了了. 于是乎, 就提出了了新的
UTF编码.可变长度编码

UTF-8: 每个字符最少占8位. 每个字符占用的字节数不定.根据文字内容进行具体编码. 比如. 英文. 就一个字节就够了.

汉字占3个字节. 这时即满足了了中文. 也满足了节约. 也是目前使用频率最的一种编码

UTF-16: 每个字符最少占16位.

GBK: 每个字符占2个字节, 16位.

单位转换:

8bit = 1byte

1024byte = 1KB
相关阅读:
Servlet
Web服务器和Tomcat
DOM文档对象模型
 JavaScript总结
 CSS总结
 商城——购物车模块
 用户注册登录认证模块
 P2P技术之STUN、TURN、ICE详解
 P2P中的NAT穿越(打洞)方案详解
 NAT技术详解
原文地址：https://www.cnblogs.com/xiaomai-rhce/p/10168289.html

day 2 编码的问题

python2解释器器在加载 .py 文件中的代码时，会对内容进行编码（默认ascill）,而python3对内容进行行编码的默认为utf-8

UTF-8: 每个字符最少占8位. 每个字符占用的字节数不定.根据文字内容进行具体编码. 比如. 英文. 就一个字节就够了.

汉字占3个字节. 这时即满足了了中文. 也满足了节约. 也是目前使用频率最的一种编码

UTF-16: 每个字符最少占16位.

GBK: 每个字符占2个字节, 16位.