• python编码:gbk编码与解码


    从RF输入的中文会进行unicode编码:u'u6587u4ef6u5230u8fbeu6210u529f'

    从orc数据库查询到的中文会进行gbk编码得到ASCII:'xcexc4xbcxfexb5xbdxb4xefxb3xc9xb9xa6'

    ASCII编码数据进行decode('gbk')后得到unicode编码的数据;

    unicode编码的数据encode('gbk')后得到gbk编码数据ASCII;

     更详细的内容见:http://www.2cto.com/kf/201407/317866.html

    gbk编码与解码:

    >>> a='xcexc4xbcxfexb5xbdxb4xefxb3xc9xb9xa6' 
    >>> a
    'xcexc4xbcxfexb5xbdxb4xefxb3xc9xb9xa6'
    >>> b=a.decode('gbk') #gbk解码,得到的是unicode对象
    >>> b
    u'u6587u4ef6u5230u8fbeu6210u529f'
    >>> print u'u6587u4ef6u5230u8fbeu6210u529f'
    文件到达成功
    >>> c=b.encode('gbk') #gbk编码,得到的是ASCII对象
    >>> c
    'xcexc4xbcxfexb5xbdxb4xefxb3xc9xb9xa6'
    >>> a==c
    True
    >>> print c
    文件到达成功
    >>>
    >>> print a.decode('utf-8')

    Traceback (most recent call last):
      File "<pyshell#5>", line 1, in <module>
        print a.decode('utf-8')
      File "D:Python27libencodingsutf_8.py", line 16, in decode
        return codecs.utf_8_decode(input, errors, True)
    UnicodeDecodeError: 'utf8' codec can't decode byte 0xce in position 0: invalid continuation byte

     utf8编码与解码:

    >>> a=u'10'
    >>> b=10
    >>> a
    u'10'
    >>> b
    10
    >>> c='10'
    >>> c
    '10'
    >>> b==c
    False
    >>> a==c
    True
    >>> a==b
    False
    >>> aint=int(a)
    >>> aint
    10
    >>> astr=a.encode('utf8')
    >>> astr
    '10'
    >>> 
  • 相关阅读:
    让我们面向切面吧~大话开篇
    成功人士,默默做的30件事 (46)
    使用javassist框架进行动态的更改Class类
    CSS Tools: Reset CSS
    JAVA生成MD5校验码及算法实现
    如何恢复word默认设置
    java md5 3
    js Arrays
    自己写的java md
    java md5 2
  • 原文地址:https://www.cnblogs.com/apple2016/p/5756058.html
Copyright © 2020-2023  润新知