我们知道计算机CPU里只认识0和1,但是我们真实世界的文字远远多于这两个简单的字符,那怎么办呢?聪明的人类就发明了编码这种东西,从最早的摩斯电码使用电流的通断间隔来传递信息,到现在的Ascll编码Unicode编码等。
Python 文件中如果未指定编码,在执行过程会出现报错:
#!/usr/bin/python
print "你好,世界";
以上程序执行输出结果为:
File "test.py", line 2
SyntaxError: Non-ASCII character 'xe4' in file test.py on line 2, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details
Python中默认的编码格式是 ASCII 格式,在没修改编码格式时无法正确打印汉字,所以在读取中文时会报错。
解决方法为只要在文件开头加入 # -*- coding: UTF-8 -*- 或者 #coding=utf-8 就行了。
实例(Python 2.0+)
#!/usr/bin/python # -*- coding: UTF-8 -*- print "你好,世界";