python3 输出中文、日文等等乱码问题的解决办法

例如：

url = 'https://zozo.jp/shop/mrolive/goods-sale/44057773/?did=73037089'
resp = requests.get(url=url)
html = etree.HTML(resp.text)
title = html.xpath('//div[@id="item-intro"]/h1/text()')[0]
print(title)

打印结果为：

AeB[N ubN JEU[  / MA-1 U[ u]

以上打印结果为乱码，解决办法：

1 先获取网址的编码：

url = 'https://zozo.jp/shop/mrolive/goods-sale/44057773/?did=73037089'
resp = requests.get(url=url)
encodings = requests.utils.get_encodings_from_content(resp.text)
print(encodings)

结果为：

['Shift_JIS']

由此可知网站的编码是['Shift_JIS']

2 将获取的response.conetent的编码设置为['Shift_JIS']，再次请求，获取到的就不是乱码了。

url = 'https://zozo.jp/shop/mrolive/goods-sale/44057773/?did=73037089'
resp = requests.get(url=url)
resp_txt = resp.content.decode('Shift_JIS')
html = etree.HTML(resp_txt)
title = html.xpath('//div[@id="item-intro"]/h1/text()')[0]
print(title)

结果为：

アンティーク ブラック カウレザー  / MA-1 レザー ブルゾン

相关阅读:
zookeeper
Kafka：无丢失提取kafka的值，详解kafka的消费过程
Mysql + canal + zookeeper环境搭建
获取mybaties插入记录自动增长的主键值
jsp报错java.io.IOException: Stream closed
ueditor使用本地保存，自动恢复上次编辑的内容
chrome查看js报错Uncaught SyntaxError: Unexpected string
记两个用于修改用户态内存的函数
一个不当使用fclose引发的异常
大数据迁移

原文地址：https://www.cnblogs.com/loren880898/p/12171712.html