• Python3 字符串前面加u,r,b的含义



    u/U:表示unicode字符串

    不是仅仅是针对中文, 可以针对任何的字符串,代表是对字符串进行unicode编码。
    一般英文字符在使用各种编码下, 基本都可以正常解析, 所以一般不带u;但是中文, 必须表明所需编码, 否则一旦编码转换就会出现乱码。 建议所有编码方式采用utf8。在python3中,字符串默认创建即以Unicode编码存储,可以存储中文。

    例子一:
    u"我是含有中文字符组成的字符串。"

    作用:
    后面字符串以 Unicode 格式 进行编码,一般用在中文字符串前面,防止因为源码储存格式问题,导致再次使用时出现乱码。

    例子二:
    string = 'a' 等效于 string = u'a'

    Unicode中通常每个字符由2个字节表示。
    u'a' 即 u'u0061' 实际内存中为 [0000 0000] [0110 0001]


    r/R:表示非转义的原始字符串。

    与普通字符相比,其他相对特殊的字符,其中可能包含转义字符,即那些反斜杠加上对应字母,表示对应的特殊含义的,比如最常见的” ”表示换行,” ”表示Tab等。而如果是以r开头,那么说明后面的字符,都是普通的字符了,即如果是“ ”那么表示一个反斜杠字符,一个字母n,而不是表示换行了。
    以r开头的字符,常用于正则表达式,对应着re模块。
    例:r" ”  # 表示一个普通生字符串 ,而不表示换行了。

    作用:
    去掉反斜杠的转移机制。(特殊字符:即那些,反斜杠加上对应字母,表示对应的特殊含义的,比如最常见的” ”表示换行,” ”表示Tab等。 )

    应用:
    常用于正则表达式,对应着re模块。


    b:表示bytes类型字符串

    python3.x里,默认的str是(py2.x里的)unicode,bytes是(py2.x)的str,b”“前缀代表的就是bytes。
    python2.x里,b前缀没什么具体意义, 只是为了兼容python3.x的这种写法。

    **例子一: **

    response = b'<h1>Hello World!</h1>'     # b' ' 表示这是一个 bytes 对象
    

    作用:
    b" "前缀表示:后面字符串是bytes 类型。

    用处:
    网络编程中,服务器和浏览器只认bytes 类型数据。如:send 函数的参数和 recv 函数的返回值都是 bytes 类型。

    例子二:
    字符串存储为Ascll码,无法存储中文。

    result = b'你好20190101'
    

    编译会报如下错误:
    SyntaxError: bytes can only contain ASCII literal characters.

    每个字符由1个字节表示(8位)
    b'a'即b'x61' 实际内存中位 [0110 0001]

    附:
    在 Python3 中,bytes 和 str 的互相转换方式是
    str.encode('utf-8')
    bytes.decode('utf-8')


    print(r'A	A')        结果为A	A
    print(b'A	A')         结果为b'A	A'
    print(u'A	A')         结果为A     A
    

    注意:b'A A' 打印结果中自带一个b'',表示该字符串是一个字节数组。

  • 相关阅读:
    宁要捧杀,不许真言?
    (已加马赛克)10 行代码判定色*情*图片——Python 也可以系列之二
    推荐几个好玩又有难度的编程网站
    自己动手写算法.Sort.QuickSort
    自己动手写算法.Sort.Bubble
    [Python]五分钟理解元类(Metaclasses)
    [招聘]我司求 python 或 flex 程序员各一名
    Debian的软件包管理工具命令不完全列表
    EdtiPlus最好用的文本编辑器+使用技巧集萃
    为什么美国Microsoft盗版少?
  • 原文地址:https://www.cnblogs.com/eustoma/p/10204370.html
Copyright © 2020-2023  润新知