乱码出现的步骤
1、录制过程产生的乱码
2、运行过程编码不一致
录制的时候本机默认编码:GB2312,GBK,GB18030,而录制的网页有可能是uft-8编码
GB pk UTF-8
GB-X:2byte=16bit 2^16,65536种组合 0000 0000 0000 0000 ~ 1111 1111 1111 1111
UTF-8:3byte=24bit,2^24,16777216种组合,对全世界的文件进行统一编码,所以需要3个字节
0000 0000 0000 0000 0000 0000 ~ 1111 1111 1111 1111 1111 1111
所以产生乱码的原因,举例子:
UTF-8下的【我】24位是 1111 1111 1111 0000 0000 0000
转换为GB时只取16位是 1111 1111 1111 0000 则该字已不是【我】
1、录制过程产生的乱码的解决办法
2、运行过程编码不一致的解决办法