编码

ascll #只包含英文和特殊字符用一个字节表

GBK #中国式编码包含两万一千多多中国汉字用俩字节表示一个字符同时兼容ascll码

gb2312 #包含六千左右汉字也是俩字节表示也个汉字

GB18030 #包含两万7千多文字也是俩字节一个汉字

unicode #用2-4个字节表示一个文字它包含全球文字约13万多其中它有映射其他国家语言的功能别的国家下载中国GBK软件可以直接被转成中文

UTF-8 #用1，2，3，4不同文字或者符号表示不同的字节是unicode的升级轻量版也是用的最多的

UTF-16 #用2-4个字节表示全球的所有文字不常用

UTF-32 #用4个字节表示一个全球文字用的更少　　·

文件名.encode('utf-8') #编码

文件名.decode('utf-8') #解码用啥格式编码就用啥格式解码

‘GBK’包含ascii但是只包含127位包括127位以内的称作低字节超过127-256的全部认为是中文称作高字节

py2中：

str ==bytes==‘Unicode’三种类型

　　为什么要有bytes：

　　　　因为要存储视频图片音频等格式的数据

以utf -8的格式在windows上无法正常显示

　　因为window是默认的‘GBK格式的编码

如何在python2上写一个软件在全球各个电脑都可以看？

　　1：在每个电脑安上你写软件用的编码

　　2：使用‘Unicode’去用你原来的编码去解码

文件头：

　　　以’utf-8‘ or ’gbk‘的格式编写的代码加载到内存里还是你原来的编码格式并不会变成’unicode‘ 除非再次用‘decode（‘你原来的格式’）’解码成‘Unicode’

py3：

　　以’utf-8‘ or ’gbk‘的格式编写的代码加载到内存里编码格式会自动变成’unicode‘

相关阅读:
js正则表达式，判断字符串是否以数字组结尾，并取出结尾的数字
js中的正则表达式入门
jQuery获取元素对象本身的html
正则表达式，求判断字符串是否以数字组结尾，并取出结尾的数字正则表达式
行为树的设计与实现
BMFONT 字体制作
VMware 9.0.1安装Mac OS X Mountain Lion 10.8.2
XCODE修改IOS应用的名称
Xcode 生成 ipa包
Xcode 打包 ipa 包

原文地址：https://www.cnblogs.com/yuexijun/p/9787075.html