一、Flink是什么?
Apache Flink是一个框架和分布式处理引擎(用来计算,不是用来储存的),用于对无界和有界数据流进行状态计算。
二、为什么选择Flink?
1.低延迟
- Spark streaming,实际上还是“微”批处理,延迟是秒级
- Flink延迟是毫秒级,每秒处理数百万个事件
2.高吞吐
3.结果的准确性+良好的容错性
三、Flink的主要特点
3.1 事件驱动 Event-driven
3.2 API分层
四、Flink vs Spark Streaming
4.1 架构不同
Flink:实时流处理
Spark Streaming: 微批处理