LZO好处。可以对hive这种快文件进行压缩,然后做索引达到速度大幅度改进索引
先是按照这个教程(网上很多可以找找看看)
https://blog.csdn.net/Post_Yuan/article/details/54287325
安装完CDH,很多人会发现 跑的时候class no found,这时候只需要把GPLEXTRAS下的lib 拷贝到你的hadoop下就可以了,不用重启集群因为是jar路径,找得到就好了
LZO好处。可以对hive这种快文件进行压缩,然后做索引达到速度大幅度改进索引
先是按照这个教程(网上很多可以找找看看)