• Java中CharSet字符集


    java.nio.charset包中提供了Charset类,它继承了Comparable接口;还有CharsetDecoder、CharsetEncoder编码和解码的类,它们都是继承Object类。

    Java中的字符使用Unicode编码,每个字符占用两个字节,16个二进制位,向ByteBuffer中存放数据的时候需要考虑字符的编码,从中读取的时候也需要考虑字符的编码方式,也就是编码和解码。

    1.获取字符集有如下两种方式

    //返回指定的字符集CharSet
    Charset charset = Charset.forName("utf8");
    //返回虚拟机默认的字符集CharSet
    Charset charset = Charset.defaultCharset();

    2.接下来我们使用字符集CharSet创建一个编码器和一个解码器

    //编码器
    CharsetEncoder encoder = charset.newEncoder();
    //解码器
    CharsetDecoder decoder = charset.newDecoder();

    3.使用编码器和解码器解析数据

    //编码,传入CharBuffer
    ByteBuffer bytebuffer = encoder.encode(in);
    //解码,传入ByteBuffer
    CharBuffer charbuffer = decoder.decode(in);

    4.具体使用案例

        public static void main(String[] args)  {
            Charset charset = Charset.forName("utf8");
            System.out.println(charset.name()+"--"+charset.canEncode());
            //返回一个包含该字符的别名,字符集的别名是不可变的
            Set<String> set = charset.aliases();
            Iterator<String> it = set.iterator();
            while(it.hasNext()) {
                System.out.println(it.next());
            }
    
            System.out.println("----------编码----------------");
            ByteBuffer buffer = charset.encode("sdf");
            System.out.println(buffer);
    
            System.out.println("缓冲区剩余的元素数--"+buffer.remaining());
            while(buffer.hasRemaining()) {
                System.out.println((char)buffer.get());
            }
            System.out.println("缓冲区剩余的元素数--"+buffer.remaining());
            System.out.println("----------解码----------------");
            //清空缓冲区,将限制设置恢复,如果定义了标记,则将它们丢弃
            buffer.flip();
        }
  • 相关阅读:
    C++STL中的unique函数解析
    STL中erase()的用法
    刷题技巧——简易哈希表的实现
    经典面试题目——找到第n个丑数(参考《剑指offer(第二版)》面试题49)
    C++中sort函数小结
    谈谈交叉验证法(个人小结)
    数字序列中某一位数字(《剑指offer》面试题44)
    求1~n整数中1出现的次数(《剑指offer》面试题43)
    2018年美团春招(第二批)题解
    C/C++中字符串和数字互转小结
  • 原文地址:https://www.cnblogs.com/cuiqq/p/11761375.html
Copyright © 2020-2023  润新知