u/U:表示unicode字符串
不是仅仅是针对中文, 可以针对任何的字符串,代表是对字符串进行unicode编码。
一般英文字符在使用各种编码下, 基本都可以正常解析, 所以一般不带u;但是中文, 必须表明所需编码, 否则一旦编码转换就会出现乱码。 建议所有编码方式采用utf8。在python3中,字符串默认创建即以Unicode编码存储,可以存储中文。
例子一:
u"我是含有中文字符组成的字符串。"
作用:
后面字符串以 Unicode 格式 进行编码,一般用在中文字符串前面,防止因为源码储存格式问题,导致再次使用时出现乱码。
例子二:
string = 'a' 等效于 string = u'a'
Unicode中通常每个字符由2个字节表示。
u'a' 即 u'u0061' 实际内存中为 [0000 0000] [0110 0001]
r/R:表示非转义的原始字符串。
与普通字符相比,其他相对特殊的字符,其中可能包含转义字符,即那些反斜杠加上对应字母,表示对应的特殊含义的,比如最常见的”
”表示换行,” ”表示Tab等。而如果是以r开头,那么说明后面的字符,都是普通的字符了,即如果是“
”那么表示一个反斜杠字符,一个字母n,而不是表示换行了。
以r开头的字符,常用于正则表达式,对应着re模块。
例:r"
” # 表示一个普通生字符串
,而不表示换行了。
作用:
去掉反斜杠的转移机制。(特殊字符:即那些,反斜杠加上对应字母,表示对应的特殊含义的,比如最常见的”
”表示换行,” ”表示Tab等。 )
应用:
常用于正则表达式,对应着re模块。
b:表示bytes类型字符串
python3.x里,默认的str是(py2.x里的)unicode,bytes是(py2.x)的str,b”“前缀代表的就是bytes。
python2.x里,b前缀没什么具体意义, 只是为了兼容python3.x的这种写法。
**例子一: **
response = b'<h1>Hello World!</h1>' # b' ' 表示这是一个 bytes 对象
作用:
b" "前缀表示:后面字符串是bytes 类型。
用处:
网络编程中,服务器和浏览器只认bytes 类型数据。如:send 函数的参数和 recv 函数的返回值都是 bytes 类型。
例子二:
字符串存储为Ascll码,无法存储中文。
result = b'你好20190101'
编译会报如下错误:
SyntaxError: bytes can only contain ASCII literal characters.
每个字符由1个字节表示(8位)
b'a'即b'x61' 实际内存中位 [0110 0001]
附:
在 Python3 中,bytes 和 str 的互相转换方式是
str.encode('utf-8')
bytes.decode('utf-8')
print(r'A A') 结果为A A
print(b'A A') 结果为b'A A'
print(u'A A') 结果为A A
注意:b'A A' 打印结果中自带一个b'',表示该字符串是一个字节数组。