• 码位(code position/point)Unicode 编码与 Python 2/3 编码兼容性问题


    Unicode HOWTO

    0. 码位(code position/point)

    一个码位由某个数值表示,全部码位共同构成其码值空间(code space)。

    • ASCII,0~7Fhex(128)
    • 拓展 ASCII,0~FFhex(256)
    • Unicode,0~10FFFFhex
      • 1, 114, 112,17×216(17 个平面

    2. python 下的编码

    • bytes.decode() str.encode()

    3. UnicodeDecodeError: ‘utf8’ codec can’t decode byte 0x9c

    比如在读取 œ 时,便会造成 UnicodeDecodeError。

    >> b'x9c'.decode('cp1252')
    'œ'

  • 相关阅读:
    hibernate入门
    struts文件上传
    Struts的增删改查
    struts入门
    Maven配置以及环境搭配
    layui增删改查
    easyui三
    A
    C. Permutation Cycle
    E
  • 原文地址:https://www.cnblogs.com/mtcnn/p/9421216.html
Copyright © 2020-2023  润新知