1,# coding:utf-8
设置文件内容的编码
2,sys.setdefaultencoding()
设置python解析器默认的编码
首先python编解码的过程是:
str.decode('str的编码') --> unicode
unicode.encode('想要的编码') --> 想要的编码
换句话说就是:unicode就是中间态编码,只用先将str字符串decode成unicode之后,才能将其encode成其他编码格式
例子:
# coding:utf-8
s = '中文字符' # s是str类型的,而不是unicode类型的
s.encode('utf-8') # 这里对s直接encode,其实系统默认在中间做了一步转换,就是先对s进行decode,然后在进行encode。因为decode是系统自己默认进行的,所以使用的是系统默认的编码格式进行decode的,这里的系统默认编码就是可以通过sys.setdefaultencoding()设置的。