python中文处理

1.多字节问题必须要全部转成unicode再处理，否则就会有问题，比如中文gbk编码的"和珅"，其中的珅的后半字节和|的一样的，所以在处理的时候会有问题，如下我们用re.split来分割：

#用正则分隔某个字符串
def split(str, patternlist):
	unicodestr = str.decode('gbk') 
	result = []
	for i in patternlist:
		unicodei = i.decode('gbk') 
		outlist = re.split(unicodei, unicodestr)
		for j in outlist :
			gbk = j.encode('gbk')
			if str != gbk :
				result.append(gbk)
	return result

　注意输入|时必须要输入|，因为|本身是正则表达式的一个符号。

相关阅读:
基于android的远程视频监控系统——实现Camera预览
安卓巴士移动开发者周刊第十三期
【图片处理工具】Android游戏开发的好帮手
[No0000112]ComputerInfo,C#获取计算机信息（cpu使用率，内存占用率，硬盘，网络信息）
【笔记】Eclipse and Java for Total Beginners—013
【笔记】Eclipse and Java for Total Beginners—003
【笔记】Stanford OpenCourse—CS106A：Programming Methodology—002
【笔记】Stanford OpenCourse—CS106A：Programming Methodology—005
【笔记】Eclipse and Java for Total Beginners—008
【笔记】Eclipse and Java for Total Beginners—004

原文地址：https://www.cnblogs.com/pigerhan/p/3441527.html