• 在python2中的编码


    在python2中的编码

    #_author:star
    #date:2019/10/29
    '''
    字符编码:
    ASCII:只能存英文和拉丁字符,
    gb2312:只能6700中文,1980年
    gbk1.0:存了20000多字符,1995年
    gb18030:2000年,27000中文

    unicode:UTF_32一个字符占4个字节
    unicode:UTF_16一个字符占2个字节或两个以上,65535
    unicode:UTF_8一个英文用ASCII来存,一个中文占3个字节
    (1)在 python2 中UTF-8先解码到Unicode
    然后Unicode在编码到GBK
    (2)在 python2 中GBK先解码到Unicode
    然后Unicode在编码到UTF—8
    (3)在 python3中的encode()和python2 中的encode()不同,python2里的encode()只是单纯的编码。
    python3中的encode()在编码的同时还要将其转为bytes类型,decode()在解码的同时还要将bytes类型转为字符串
    '''
    s='特斯拉'
    s_to_unicode=s.decode('UTF-8')#(1)在 python2 中UTF-8先解码到Unicode
    unicode_to_gbk=s_to_unicode.encode("gbk")#,然后Unicode在编码到GBK
    print(s)#utf-8 乱码
    print('unicode:',s_to_unicode)#unicode
    print('gbk:',unicode_to_gbk)#gbk

    gbk_to_unicode=unicode_to_gbk.decode('gbk')
    unicode_to_utf8=gbk_to_unicode.encode('utf-8')
    print(gbk_to_unicode)
    print(unicode_to_utf8)
  • 相关阅读:
    Django请求的生命周期图解及流程
    Django中请求的生命周期
    127.0.0.1和0.0.0.0和本机IP的区别
    Linux中errno的含义
    wireshark 过滤表达式
    GDB调试
    【LinuxShell】grep用法详解
    Linux下 tftp 服务器的安装与使用
    设备掐断重启
    GDB disassemble
  • 原文地址:https://www.cnblogs.com/startl/p/11759912.html
Copyright © 2020-2023  润新知