原文转自:https://www.cnblogs.com/niaonao/p/9276698.html
一、前言
有过多次,在开发项目中遇见设置文件编码格式为UTF-8,但是打开该文件出现类似u7528这样的数据,看也看不懂,也不是平常见到的乱码。这里的u7528类似的数据,其中'u'表示UNICODE编码,其实数据就是对应的UTF-8下的汉字。
二、问题处理
下面文件的编码已被设置为UTF-8,但打开这里的原文件部分内容如下:
#use 1,2 #admin_login 100001=u7528u6237u540Du6216u8005u5BC6u7801u9519u8BEF 100002=u7528u6237u540Du6216u8005u5BC6u7801u9519u8BEF 100003=u7528u6237u6B63u5904u4E8Eu767Bu9646u72B6u6001 100004=u672Au77E5u539Fu56E0,u767Bu9646u5931u8D25 100088=u767Bu9646u6210u529F #use 3,4 #user_login 300001=u7528u6237u540Du6216u8005u5BC6u7801u9519u8BEF 300002=u7528u6237u540Du6216u8005u5BC6u7801u9519u8BEF 300003=u7528u6237u5904u4E8Eu767Bu9646u72B6u6001 300004=u672Au77E5u539Fu56E0,u767Bu9646u5931u8D25 300099=u9000u51FAu6210u529F 300088=u767Bu9646u6210u529F ...
文件截图如图2-1所示
图2-1、 'u7528'数据的文件图
这里使用开发工具是IDEA,其他工具参考设置进行修改。打开IDEA的设置,找到设置编码的页面。菜单路径是File - Settings - Editor - File Encodings。
- (1)设置全局编码、工程编码、文件默认编码为UTF-8.
- (2)勾选native-to-ascii
- (3)点击按钮Apply、OK应用即可
图2-2、IDEA编码设置图
设置完成后配置文件UNICODE编码转换为UTF-8,u7528转换为对应的汉字。设置完成后效果如图2-3所示。注意如果只设置UTF-8不勾选ascii转换,则文件仍显示为u7582格式。不能正常显示为中文。
图2-3、UTF-8编码下文件正确显示汉字图