Unicode:Java默认使用Unioncode编码,即不论什么语言都是一个字符占两个字节。Java中的char默认采用Unicode编码,所以Java中char占2个字节。
UTF-32:UTF-32却几乎从来不在实际中使用,因为每个字符占用 4 字节太浪费空间了。
UTF-16:UTF-16 本身是一种长度可变的编码。
UTF-8:Java的class文件编码为UTF-8,而虚拟机JVM编码为UTF-16。UTF-8编码下,一个中文占3个字节,一个英文占1个字节。
- 不同的编码方式之间是可以转换的,数据库与web页面可以有各自的编码,二者没有必然的关系。
-
”utf-8“ 中文占3字节,英文占1字节;”gbk“ 中文占2字节,英文占1字节;
- ResourceBundle 资源包,匹配本地区字符集。ResourceBundle能够按Local的不同,优先读取对应后缀的properties文件,这个是java中自带的。使用的地方很多。
常见字符的ASCII码值如下:
- 空格的ASCII码值为32;
- 数字0到9的ASCII码值分别为48到57;
- 大写字母“A”到“Z”的ASCII码值分别为65到90;
- 小写字母“a”到“z”的ASCII码值分别为97到到122。