hive在查询表信息时,中文显示乱码,数字或者url显现null问题解决思路。
1、确定create hive表时指定的row format delimited fields terminated by ‘xxx’中“xxx”格式是否和原始导入表的data的行列分隔格式一致,如不一致,则会出现select结果中数字或者url显现null等问题,所以需先统一格式。
2、Windows使用的GB2312编码,大多数Linux系统支持的是UTF-8编码,而在Windows远程登陆时使用的是本地编码,实际要求客户端和服务器端都要‘UTF-8’编码。
3、SSH Secure Shell Client查询结果中文显示乱码这是该软件多年未解决的短板(网上如是说,实际上笔者并未去查证,只是实际操作确实遇到了该情况)。
4、SSH Secure Shell Client若中文有乱码可选择其他软件,如:Xshell 4等,可设置编码方式为UTF-8。
5、导入的数据可使用Notepad++等软件先设定好‘UTF-8’编码,在通过load data...等方式导入到hive表中。
以上情况检查后,基本可排除hive表查询显示乱码或者其他问题的情况。