Java 库的 java.nio 包用 Charset 类统一了对字符集的转换,支付姐建立了两个字节Unicode码元序列与使用本地字符编码方式的字节序列之间的映射,Charset类使用的时由IANA字符集注册中心标准化的字符集名称,为了兼容其他的命名惯例,每个字符集都可以拥有许多别名,可以调用 aliases 方法返回由别名构成的 Set 对象,示例代码如下:
Charset charset = Charset.forName("utf-8");
System.out.println("utf-8 charset");
Set<String> aliases = charset.aliases();
for (String a : aliases) {
System.out.println("aliase is " + a);
}
为了确定在某个特定实现中哪些字符集是可用的,可以调用静态方法 avaliableCharsets 方法,示例代码如下:
Map<String, Charset> charsetMap = Charset.availableCharsets();
for (String c : charsetMap.keySet()) {
System.out.println(c);
}
如果某个字符不能被字符集表示,他将被转换为?,一旦有了字符集就可以使用他在包含Unicode码元的Java 字符串和编码而成的字节序列之间进行转换,下面是如何编码Java 字符串的代码:
String str = "受到法律框架dsfjkl23";
// 编码字符串到Byte数组
ByteBuffer buffer = charset.encode(str);
byte[] bytes = buffer.array();
for (byte b : bytes) {
System.out.print(Integer.toHexString(b & 0xff) + " ");
}
System.out.println();
// 将Byte数组解码为字符串
ByteBuffer decodeBuffer = ByteBuffer.wrap(bytes);
CharBuffer charBuffer = charset.decode(decodeBuffer);
System.out.println(charBuffer.toString());