Python: 在CSV文件中写入中文字符

0.2 2016.09.26 11:28* 字数 216 阅读 8053评论 2喜欢 5

最近一段时间的学习中发现，Python基本和中文字符杠上了。如果能把各种编码问题解决了，基本上也算对Python比较熟悉了。

For UTF-8 encoding, Excel requires BOM (byte order mark) codepoint written at the start of the file or it will assume ANSI encoding, which is locale-dependent.
对于UTF-8编码，Excel要求BOM(字节顺序标记)写在文件的开始，否则它会假设这是ANSI编码，这个就是与locale有依赖性了。

#!python2
#coding:utf8
import csv

data = [[u'American',u'美国人'],
        [u'Chinese',u'中国人']]

with open('results.csv','wb') as f:
    f.write(u'ufeff'.encode('utf8'))
    w = csv.writer(f)
    for row in data:
        w.writerow([item.encode('utf8') for item in row])

考虑到兼容性，Python3的处理方法就比较简单了。

#!python3
#coding:utf8
import csv

data = [[u'American',u'美国人'],
        [u'Chinese',u'中国人']]

with open('results.csv','w',newline='',encoding='utf-8-sig') as f:
    w = csv.writer(f)
    w.writerows(data)

或者你可以使用个第三方模块unicodecsv

#!python2
#coding:utf8
import unicodecsv

data = [[u'American',u'美国人'],
        [u'Chinese',u'中国人']]

with open('results.csv','wb') as f:
    w = unicodecsv.writer(f,encoding='utf-8-sig')
    w.writerows(data)

笔者在Python2.7下亲测可用，这样在以后爬取中文网站到CSV，比如豆瓣或者链家的数据，就可以很方便的写入Excel或CSV文件了。

相关阅读:
迭代器在LinkedList上的删除
java多线程:CopyOnWriteArrayList
vs中代码编译通过，但还是有红色波浪线
vs中项目属性配置
TortoiseGit安装与配置
DC(device context)
weak_ptr 使用
C++ 中shared_ptr循环引用计数问题
for_each与lambda表达式联合使用
new 和 make_shared 在内存上的区别

原文地址：https://www.cnblogs.com/cute/p/10797470.html