u/U:表示unicode字符串
不是仅仅是针对中文, 可以针对任何的字符串,代表是对字符串进行unicode编码。
一般英文字符在使用各种编码下, 基本都可以正常解析, 所以一般不带u;但是中文, 必须表明所需编码, 否则一旦编码转换就会出现乱码。
建议所有编码方式采用utf8
r/R:非转义的原始字符串
与普通字符相比,其他相对特殊的字符,其中可能包含转义字符,即那些,反斜杠加上对应字母,表示对应的特殊含义的,比如最常见的”
”表示换行,” ”表示Tab等。而如果是以r开头,那么说明后面的字符,都是普通的字符了,即如果是“
”那么表示一个反斜杠字符,一个字母n,而不是表示换行了。
以r开头的字符,常用于正则表达式,对应着re模块。
b:bytes
python3.x里默认的str是(py2.x里的)unicode, bytes是(py2.x)的str, b”“前缀代表的就是bytes
python2.x里, b前缀没什么具体意义, 只是为了兼容python3.x的这种写法
参考:http://blog.csdn.net/zhangxinrun/article/details/8124333
http://www.oschina.net/question/437227_106832
文件头声明编码
关于python文件头部分知识的讲解
顶部的:# -*- coding: utf-8 -*-或者# coding: utf-8目前有三个作用
- 如果代码中有中文注释,就需要此声明。
- 比较高级的编辑器(比如我的emacs),会根据头部声明,将此作为代码文件的格式。
- 程序会通过头部声明,解码初始化 u"人生苦短",这样的unicode对象,(所以头部声明和代码的存储格式要一致)。
https://blog.csdn.net/pipisorry/article/details/44136297?utm_source=copy
遇到的错误:
在sublime中运行同样的程序乱码:
./mjorcen.normal.exp0.jpg 66873 200 b'{"birthday":"","address":"xe5x8cx97xe4xbaxacxe5xb8x82xe4xb8x9cxe5x9fx8exe5x8cxbaxe6x99xafxe5xb1xb1xe5x89x8dxe8xa1x974xe5x8fxb7","gender":"","nationality":"xe6xb1x89","issuing_authority":"","valid_to":"","name":"xe9x9fxa6xe5xb0x8fxe5xaex9d","valid_from":"","id":"","uuid":"62233f8758b053955178e9198fa45228","status":"OK"}' {"birthday":"","address":"�����ж�������ɽǰ��4��","gender":"","nationality":"��","issuing_authority":"","valid_to":"","name":"ΤС��","valid_from":"","id":"","uuid":"62233f8758b053955178e9198fa45228","status":"OK"}
之后,只要将其放在powershell中执行即可;
./mjorcen.normal.exp0.jpg 66873 200 b'{"birthday":"","address":"xe5x8cx97xe4xbaxacxe5xb8x82xe4xb8x9cxe5x9fx8exe5x8cxbaxe6x99xafxe5xb1xb1xe5x89x8dxe8xa1x974xe5x8fxb7","gender":"","nationality":"xe6xb1x89","issuing_authority":"","valid_to":"","name":"xe9x9fxa6xe5xb0x8fxe5xaex9d","valid_from":"","id":"","uuid":"62233f8758b053955178e9198fa45228","status":"OK"}' {"birthday":"","address":"北京市东城区景山前街4号","gender":"","nationality":"汉","issuing_authority":"","valid_to":"","name":"韦小宝","valid_from":"","id":"","uuid":"62233f8758b053955178e9198fa45228","status":"OK"}