python编码

python2 在文件头部加 # -*- coding:utf8 -*- 才能解析中文，python 3 不需要

原因：python2默认用AsciLL,8位，最多表示256

                       ascill           00000000   8位表示
                        unicode     至少用16位表示，（万国码）
                        utf8             能用多少表示就是用多少表示，全球通用，一个中文占用3个字节
                        gbk              专门用于中文，一个中文占用2个字节

总结：由于计算机刚开始在美国兴起，所有表示都是英文，所以出现ascill码，随着计算机在全球普及，

各国都需要用到，ascill已经不能满足其需求，就出现uicode,俗称万国码，基本哪个国家都能用，但是它至少

占用16位，太浪费内存，后来就有UTF8的出现，UTF8的优势很明显，既能满足各国的需要，又不浪费内存，

能用多少表示就用多少表示。gbk是专门为中国人使用的。

python2默认是ascill码，所以有中文的情况下，一定要在文件的头部加： # -*- coding:utf8 -*-

对于一个有思想的人来说，没有地方是荒凉而遥远的

相关阅读:
hbase安装（zookeeper等）
虚函数表以及RTTI阅读（阅后焚）
void及void指针含义的深刻解析
泛型和模版的区别
C++析构函数为什么要为虚函数
C++对象模型
在C++中子类继承和调用父类的构造函数方法
什么是复合类型
C++ read
gdb 调试c/c++的一些小技巧

原文地址：https://www.cnblogs.com/quanag/p/9628994.html