SparkStreaming是一个对实时数据流进行高通量、容错处理的流式处理系统,
可以对多种数据源(如Kdfka、Flume、Twitter、Zero和TCP 套接字)进行类
似Map、Reduce和Join等复杂操作,并将结果保存到外部文件系统、数据库或
应用到实时仪表盘。
➢ 计算流程
➢ 容错性
➢ 实时性
➢ 扩展性与吞吐量
SparkStreaming是一个对实时数据流进行高通量、容错处理的流式处理系统,
可以对多种数据源(如Kdfka、Flume、Twitter、Zero和TCP 套接字)进行类
似Map、Reduce和Join等复杂操作,并将结果保存到外部文件系统、数据库或
应用到实时仪表盘。
➢ 计算流程
➢ 容错性
➢ 实时性
➢ 扩展性与吞吐量