map是配置mapred.max.split.size,来定义map处理文件的大小,默认是256000000字段,换算就是256M。 如果想增加map的并行度,那么就是减少map处理文件的大小即可。 即set mapred.max.split.size=xxx(更小的字节)
reduce和map是一致的,修改hive.exec.reducers.bytes.per.reducer这个参数
hive.exec.reducers.bytes.per.reducer
通过控制这个来定义一个reduce处理文件的大小。