• ALT+数字,可输入汉字或拉丁字母 good


    各种编码查询表:http://bm.kdd.cc/

    输入 ALT + 50385 就出 难 字了,原因是它的十六进制ANSI编码是C4D1=50385

    同理:

    汉=BABA=47802
    字=D7D6=55254
    中=D6D0=54992
    文=CEC4=52932
    国=B9FA=47610
    华=BBAA=48042
    夏=CFC4=53188
    吴=CEE2=52962
    难=C4D1=50385

    但不知这种方法只支持GB2312,还是支持GBK,估计是GBK(即当前的ANSI编码)

    这种方法还可输入ANSI和扩展ANSI:
    A=65
    €=128
    À=192
    æ=230


    同时查得Unicode编码:
    汉=FFFE49=16776777,输出结果却是:蘒
    字=6C575B=7100251,输出结果却是:W
    可见的这种输入方法不支持Unicode

    GBK的存储方式是大头存储,但Unicode是小头存储,参考:
    http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html

    ----------------------------------------------------------
    GBK定义之字符较CP936多出95字,皆为其时未收入ISO 10646 / Unicode之符号。CP936中的这95字分配到了Unicode的私有区域,现已全部收于新版Unicode。
    因此,现在GBK的所有字符已经全部收录于Unicode中。

    UTF-8作为Unicode的一种编码方法,可以表述所有的Unicode字符。
    结论:UTF-8可以表述所有的GBK字符。

    ----------------------------------------------------------
    GBK对应的code page是CP936。
    微软也为GB18030定义了code page:CP54936

    GBK是GB2312的扩展,除了兼容GB2312外,它还能显示繁体中文,还有日文的假名。
    在简体中文windows系统下,ANSI编码代表GBK/GB2312编码,ANSI通常使用0x80~0xFF范围的2个字节来表示1个中文字符。0x00~0x7F之间的字符,依旧是1个字节代表1个字符。Unicode(UTF-16)编码则所有字符都用2个字节表示。

    ----------------------------------------------------------

    Alt + 0233 = é (正统方式,查表就可以明白)

    http://lorem-ipsum.studiovitamine.com/caracteres-speciaux,287,fr.html

    http://www.blogdumoderateur.com/raccourcis-clavier-alt-caractere-special/

    Alt + 130 = é (快捷方式,估计是Windows刻意设置的)

    http://init92.blogspot.fr/p/comment-afficher-des-caracteres.html

    http://www.starr.net/is/type/altnum-fr.html

  • 相关阅读:
    导出api文档
    Webservice测试从头来
    Java8新特性【转】
    spring获取bean的时候严格区分大小写
    java static 方法使用笔记
    maven Spring获取不到配置文件
    4月22日
    4月21日
    9月20日
    9月18日
  • 原文地址:https://www.cnblogs.com/findumars/p/4539094.html
Copyright © 2020-2023  润新知