• 编码问题:UnicodeEncodeError: 'gbk' codec can't encode character u'xa0'


    练习一个爬虫,报了如下错误:
    # UnicodeEncodeError: 'gbk' codec can't encode character u'xa0' in position 148:
    # illegal multibyte sequence
    

    (1)出现UnicodeEncodeError –> 说明是Unicode编码时候的问题;
    (2) ‘gbk’ codec can’t encode character –> 说明是将Unicode字符编码为GBK时候出现的问题;
    此时,往往最大的可能就是,本身Unicode类型的字符中,包含了一些无法转换为GBK编码的一些字符。

    str_html.replace(u'xa0', u' ')  
    

    将'xa0‘替换成u' '空格。

  • 相关阅读:
    shared pointer
    realsense数据分析
    cmake log
    Qt自定义类添加qvector报错
    Java csv
    opencv C++ mask_rcnn
    realsense data
    Test
    ubuntu18 bluebooth
    LSTM_Model
  • 原文地址:https://www.cnblogs.com/huangsxj/p/8514925.html
Copyright © 2020-2023  润新知