各种编码查询表:http://bm.kdd.cc/
输入 ALT + 50385 就出 难 字了,原因是它的十六进制ANSI编码是C4D1=50385
同理:
汉=BABA=47802
字=D7D6=55254
中=D6D0=54992
文=CEC4=52932
国=B9FA=47610
华=BBAA=48042
夏=CFC4=53188
吴=CEE2=52962
难=C4D1=50385
但不知这种方法只支持GB2312,还是支持GBK,估计是GBK(即当前的ANSI编码)
这种方法还可输入ANSI和扩展ANSI:
A=65
€=128
À=192
æ=230
同时查得Unicode编码:
汉=FFFE49=16776777,输出结果却是:蘒
字=6C575B=7100251,输出结果却是:W
可见的这种输入方法不支持Unicode
GBK的存储方式是大头存储,但Unicode是小头存储,参考:
http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html
----------------------------------------------------------
GBK定义之字符较CP936多出95字,皆为其时未收入ISO 10646 / Unicode之符号。CP936中的这95字分配到了Unicode的私有区域,现已全部收于新版Unicode。
因此,现在GBK的所有字符已经全部收录于Unicode中。
UTF-8作为Unicode的一种编码方法,可以表述所有的Unicode字符。
结论:UTF-8可以表述所有的GBK字符。
----------------------------------------------------------
GBK对应的code page是CP936。
微软也为GB18030定义了code page:CP54936
GBK是GB2312的扩展,除了兼容GB2312外,它还能显示繁体中文,还有日文的假名。
在简体中文windows系统下,ANSI编码代表GBK/GB2312编码,ANSI通常使用0x80~0xFF范围的2个字节来表示1个中文字符。0x00~0x7F之间的字符,依旧是1个字节代表1个字符。Unicode(UTF-16)编码则所有字符都用2个字节表示。
----------------------------------------------------------
Alt + 0233 = é (正统方式,查表就可以明白)
http://lorem-ipsum.studiovitamine.com/caracteres-speciaux,287,fr.html
http://www.blogdumoderateur.com/raccourcis-clavier-alt-caractere-special/
Alt + 130 = é (快捷方式,估计是Windows刻意设置的)
http://init92.blogspot.fr/p/comment-afficher-des-caracteres.html
http://www.starr.net/is/type/altnum-fr.html