前面已经学习了如何将数据从关系型数据库导入到Hive/HDFS,并且在Windows客户端查询导入的数据,接下来继续学习CDH,知识点:
1、Hue环境中DB Query如何使用,DB Query这个功能是在Hue这个Web界面可以直接查询其他关系型数据库的数据,Hue在默认装完后是无法直接使用DB Query的,需要配置,详细可参照http://www.cnblogs.com/qingyunzong/p/9487952.html
2、Impapa,又一个新名词,百度了一下其实这个还比较易学,只是Cloudera公司主导开发的新型查询系统而已,语法同SQL类似,可以直接直接Hive数据库中的数据,由于是和Hive共享元数据,因此需要同步元数据。
3、Pig,光说Pig会让人误会是小猪,还是叫全称吧-Apache Pig,Pig有一个Latin语言,使用该语言可以很容易实现MapReduce任务,简而言之,Pig的出现也是想让更多的人无需写代码就可以快速实现MapReduce。