• python中文处理之encode/decode函数


    python中文处理相信迷惑过不少同学。下面说说python2/3的encode和decode函数。

    python2中,使用decode()和encode()来进行解码和编码,以unicode类型作为中间类型。即
        decode             encode
    str ---------> unicode --------->str

    示例(注意encode和decode的编码必须保持一致):

    u = u'中文'                       #unicode对象u
    gb2312_str = u.encode('gb2312')           #gb2312编码字符串
    gbk_str = u.encode('gbk')               #gbk编码字符串
    utf8_str = u.encode('utf-8')              #utf-8编码字符串
    gb2312_u = gb2312_str.decode('gb2312')     #gb2312编码的unicode
    utf8_u = gb2312_str.decode('utf-8')        #utf-8编码的unicode,此处因为编解码方法不一致将导致无法还原原unicode类型

    python2编解码处理给人的感觉是较复杂。于是在python3中取消了unicode类型,代替以unicode编码的字符串类型str。str和bytes关系如下:
        encode              decode
    str ---------> bytes --------->str

  • 相关阅读:
    103. 二叉树的锯齿形层次遍历
    102. 二叉树的层次遍历
    94. 二叉树的中序遍历
    Redis和数据库 数据同步问题
    203. 移除链表元素
    19. 删除链表的倒数第N个节点
    237. 删除链表中的节点
    141. 环形链表
    2. 两数相加
    143. 重排链表
  • 原文地址:https://www.cnblogs.com/tudas/p/python-encode-decode.html
Copyright © 2020-2023  润新知