今天试着读取一份UTF-8格式的txt文件,内容如下
12345
但是每次读取之后转为String类型,输出字符串长度总是为6,并且第一位打印在控制台后不占任何空间。
经过debug查看字节码后发现,在读取文件后的字节流中,前三位的字节分别是
-17,-69,-65
经过查看资料才发现,这是utf-8格式所带的特殊字节。凡是utf-8格式的文件文件,都会有这三个字节。
这种情况会导致对读取后的字符串进行截取时出现问题。
比如读取日期格式时,内容为2018-09-29 00:00:00,而我想要的是2018-09-29,可以通过方法substring转换。
s.substring(0,10)
但是转换出来的结果却是:2018-09-2。
这就是因为三个特殊字节被转换为字符串后占了一行空格。