搞了很多天的不能识别0xe5的错误终于搞定了!
原来是nltk不是最新版本,跟standard版本不一致,我就说嘛,为什么就是不能识别“校”字!
总结:遇到编码错误,首先检查utf-8与gbk能不能,不行的话就byte,再不行就检查某些库的版本!
搞了很多天的不能识别0xe5的错误终于搞定了!
原来是nltk不是最新版本,跟standard版本不一致,我就说嘛,为什么就是不能识别“校”字!
总结:遇到编码错误,首先检查utf-8与gbk能不能,不行的话就byte,再不行就检查某些库的版本!