在网络中爬取到的数据,编码可能与当前编译器的编码不相同,而导致可能产生显示乱码的问题。那么如何将网络的编码,转换为当前编译器认可的编码(一般为UTF-8),就是个问题了。
主要使用了两个方法:
String.getBytes("编码类型"):表示将String编码转换成相应的编码。
String.getBytes():表示转换成操作系统默认的编码。
String.getBytes("utf-8"):表示将String转换成UTF-8编码。
最后使用:
new String(str,"UTF-8");表示该str以什么编码方式显示。
所以将一个GBK编码的string转换成UTF-8的步骤是:
String str = "你好" //gbk
String str = new String(str.getBytes("utf-8"),"utf-8");//就转换过来了