一.chardet使用方法
问:假如你不知道你要处理的文件是什么编码可怎么办呢?
import chardet f = open('通讯录.txt',mode='rb') data = f.read() f.close() result = chardet.detect(data) print(result)
输出:
{'encoding': 'GB2312', 'confidence': 0.99, 'language': 'Chinese'}
上述代表此文件是用GB2312编码的,并且是中文,正确的概率是0.99
二.chardet的安装
Linux和Windows下都可以使用pip3来安装(Windows在cmd命令行下)
pip3 install chardet