不多说,直接上干货!
https://beam.apache.org/get-started/beam-overview/
Beam SDK 提供了一个统一的编程模型,来处理任意规模的数据集,其中包括有限的数据集和无限的流数据。Apache Beam SDK 使用相同的类来表达有限和无限的数据,同样使用相同的转换方法对数据进行操作。Beam 提供了多种 SDK,你可以选择一种你熟悉的来建立数据处理管道,如下面图,我们可以知道,目前 Beam 支持 Java,Python 以及其他待开发的语言。