codecs 自然语言编码转换模块
模块内的主要方法如下:
codecs.encode(obj[, encoding[, errors]]):对obj用encoding编码
codecs.decode(obj[, encoding[, errors]]):对obj用encoding解码
codecs.lookup(encoding):返回CodecInfo对象,
codecs.open(filename, mode[, encoding[, errors[, buffering]]]):可以对一个文件用指定编码方式打开操作,是这个模块主要的用处
errors有以下5种内置类型:
'strict':遇到错误即抛出UnicodeError
'ignore':忽略错误并继续
'replace':解码时用U+FFFD代替出错部分,编码时用'?'代替
'xmlcharrefreplace':用合适的XML字符代替,只能用于编码
'backslashreplace':用backslashed escape sequences代替,只能用于编码