Flink KeyBy分布不均匀问题及解决方法

问题现象

当Key数量较少时，Flink流执行KeyBy()，并且设置的并行度setParallelism()不唯一时，会出现分到不同task上的key数量不均匀的情况，即：

某些subtask没有分到数据，但是某些subtask分到了较多的key对应的数据

Key数量较大时，不容易出现这类不均匀的情况。

原因分析

在多并行度配置下，Flink会对Key进行分组，即得到Key Group，Key Group分组的实现方法可参考代码org.apache.flink.runtime.state.KeyGroupRangeAssignment。

Key Group计算公式

最终的计算公式为：

int keyToParallelOperator = MathUtils.murmurHash(key.hashCode()) % maxParallelism * parallelism / maxParallelism

其中各个参数含义如下：

keyToParallelOperator: 最终这个key对应到的subtask的ID
MathUtils.murmurHash(): Flink原生定义的一种hash散列方法，JavaDoc参考
maxParallelism: Flink KeyBy后设置的最大并行度，通过方法.setMaxParallelism()配置，默认值为1<<7，即128

     public static final int DEFAULT_LOWER_BOUND_MAX_PARALLELISM = 1 << 7;

parallelism: Flink KeyBy后设置的并行度，通过方法.setParallelism()配置

Key Group计算方法对应源码

KeyGroupRangeAssignment中的计算过程主要涉及以下三个方法

public static int assignKeyToParallelOperator(Object key, int maxParallelism, int parallelism) {
  Preconditions.checkNotNull(key, "Assigned key must not be null!");
  return computeOperatorIndexForKeyGroup(maxParallelism, parallelism, assignToKeyGroup(key, maxParallelism));
}
public static int assignToKeyGroup(Object key, int maxParallelism) {
  Preconditions.checkNotNull(key, "Assigned key must not be null!");
  return computeKeyGroupForKeyHash(key.hashCode(), maxParallelism);
}
public static int computeKeyGroupForKeyHash(int keyHash, int maxParallelism) {
  return MathUtils.murmurHash(keyHash) % maxParallelism;
}

解决方法

基于Flink Key Group计算方法，对Key值进行转换，确保每个Key能分到指定的SubTask中执行。

KeyGroup分区验证代码

首先，验证int类型key转换到分区的代码是否一致。

场景：给定5个分区，设定Key为0-4，基于上述公式，计算每个key对应的分区。

val max = 128
val p = 5
println(s"Parallelism: $p,MaxParallelism: $max")
for (i <- 0 to 4) {
    val partition = MathUtils.murmurHash(i) % max * p / max
    println(s"key: $i, partition: $partition")
}

结果如下所示，其中个分区3, 4分到了两个key，而有两个分区一个key都没有。

Parallelism: 5,MaxParallelism: 128
key: 0, partition: 3
key: 1, partition: 3
key: 2, partition: 4
key: 3, partition: 4
key: 4, partition: 0

使用以下代码验证key是否正确分配：其中设定key为0-4，并且keyBy后的process设置为Parallelism=5, MaxParallelism=128。

    env.addSource(new SourceFunction[Int] {
      override def run(ctx: SourceFunction.SourceContext[Int]): Unit = {
        for (i <- 0 to 4) {
          ctx.collect(i)
        }
      }

      override def cancel(): Unit = {

      }
    })
      .keyBy(e => e)
      .process(new KeyedProcessFunction[Int, Int, Int] {
        override def processElement(value: Int, ctx: KeyedProcessFunction[Int, Int, Int]#Context, out: Collector[Int]): Unit = {
          out.collect(value)
        }
      })
      .setParallelism(5)
      .setMaxParallelism(128)
      .addSink(new RichSinkFunction[Int] {
        override def invoke(value: Int, context: SinkFunction.Context[_]): Unit = {
          println(value)
        }

        override def close(): Unit = {
          Thread.sleep(3600 * 1000)
        }
      })

测试结果如下：subtask 3, 4分到了两个key，subtask 0分到了一个key，key的分配与上述结果一致

KeyGroup分区验证结果

实现平衡Key方法

首先构建key的转换方法：

  /**
   * 获取重平衡后key值方法
   *
   * @param parallelism    并行度设置
   * @param maxParallelism 最大并行度设置
   * @return
   */
  def getRebalancedKeyList(parallelism: Int, maxParallelism: Int = 128): Array[Int] = {
    println(s"Parallelism: $parallelism,MaxParallelism: $maxParallelism")
    var rebalancedKeyPartitionMap: Map[Int, Int] = Map()
    var i = 0
    while (rebalancedKeyPartitionMap.size < parallelism && i < 128) { // 当找到足够的key值或找了超过128次时，则停止查找
      val partition = keyToPartition(i, parallelism, maxParallelism)
      if (!rebalancedKeyPartitionMap.contains(partition)) {
        rebalancedKeyPartitionMap += ((partition, i))
      }
      i += 1
    }
    rebalancedKeyPartitionMap.values.toArray
  }

  /**
   * Flink中，key到Partition转换公式
   *
   * 参考：[[KeyGroupRangeAssignment.assignKeyToParallelOperator(KeyGroupRangeAssignment#assignKeyToParallelOperator)]]
   *
   * @param key         分区key值
   * @param parallelism 设置的并行度
   * @return 分区值
   */
  def keyToPartition(key: Int, parallelism: Int, maxParallelism: Int = 128): Int = {
    MathUtils.murmurHash(key) % maxParallelism * parallelism / maxParallelism
  }

  /**
   * Partition转换回Key值公式
   *
   * @param partition         平衡后的key值
   * @param rebalancedKeyList 平衡后的key列表
   */
  def partitionToKey(partition: Int, rebalancedKeyList: Array[Int]): Int = {
    rebalancedKeyList.indexOf(partition)
  }

将此转换方法应用于上一步测试代码，代码修改内容如下：

    // 获取RebalancedKeyList
    val rebalancedKeyList: Array[Int] = FlinkPartition.getRebalancedKeyList(5)

    env.addSource(...)
      // 对key值进行转换
      .map(rebalancedKeyList(_))
      ...

测试结果如下，每个subtask均分到了一个key，说明上述平衡key的方法有效。

平衡Key方法验证结果

总结

使用Flink的keyBy()方法时，针对key值较少的情况，可以使用上述平衡key的方法分配Flink subtask处理的key数量，以此保证每个subtask能够均匀的处理key。

进一步的，针对key数据量较大的情况或存在key的数据倾斜的情况，可参照负载均衡算法，对key进行加权分配或引用其他类似方法满足条件。

参考文档

FlinkBlog: A Deep Dive into Rescalable State in Apache Flink

stackoverflow: Unbalanced processing of KeyedStream

CSDN: flink keyby 分布不均匀问题

Flink中Key Groups与最大并行度

相关阅读:
ORA-00904:标识符无效
 SQL错误：ORA-12899
ORA-01722:无效数字
 科学记数法
 报表软件公司悬赏 BUG，100块钱1个的真实用意
 Perl--包
 Perl--正则
 Perl use strict 控制变量
 Oracle不删除用户,导入数据
 从别人的角度理解这个世界——Leo鉴书80
原文地址：https://www.cnblogs.com/felixzh/p/16336056.html