hive优化之小文件合并

文件数目过多，会给HDFS带来压力，并且会影响处理效率，可以通过合并Map和Reduce的结果文件来消除这样的影响：

set hive.merge.mapfiles = true ##在 map only 的任务结束时合并小文件

set hive.merge.mapredfiles = false ## true 时在 MapReduce 的任务结束时合并小文件

set hive.merge.size.per.task = 256*1000*1000 ##合并文件的大小

set mapred.max.split.size=256000000; ##每个 Map 最大分割大小

set mapred.min.split.size.per.node=1; ##一个节点上 split 的最少值

set hive.input.format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat; ##执行 Map 前进行小文件合并

相关阅读:
[React Hooks长文总结系列三]为所欲为，制作“穷人版”的redux
[React Hooks长文总结系列二]渐入佳境，性能调优与自定义钩子
[React Hooks长文总结系列一]初出茅庐，状态与副作用
EsModule VS CommonJS
[清代八股文]Promise如何实现串行执行
React Fiber基本工作原理
深入剖析setState同步异步机制
破译《碟中谍》经典画面，解密指纹验证+刷脸！
如何测试重签名的应用功能是否正常
图像处理之滤镜、图文排版的开发详解，从入门到起飞

原文地址：https://www.cnblogs.com/yfb918/p/10621567.html