codecs在读取文件时,发生错误:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbe in position 0: invalid start byte
中文切换编码:gbk,正常解决。
但有时,utf-8和gbk都不好使用,使用notepad++,打开有乱码;看到有小块黑色。
这时候,需要加个参数, errors="ignore"
# 读文件:含特殊字符 import codecs f = codecs.open('20.txt', 'rb',encoding='gbk', errors="ignore") # 默认编码utf-8,中文是gbk content = f.readline() f.close() print('in:',content)
参考网站:https://www.cnblogs.com/always-fight/p/10304806.html