spark streaming --1. 概念 - 润新知

spark streaming --1. 概念

spark streaming是基于Apache spark核心API构建的一套并发流处理库，其对实时流数据的处理具备可扩展性、高吞吐量和可容错性等特点。

spark streaming输入数据的来源既可以是kafka、flume、Twitter、zeroMQ、Kinesis等消息队列系统，也可以是传统的TCP套接字传输的原生数据。

工作机制：spark streaming接受实时的输入数据流，并将数据分割成批数据batches供spark核心系统处理，经spark系统处理数据后，得到最终的结果批数据。

spark streaming提供了一个名为离散流（Discretized Stream，简称DStream）的高级系统抽象，用于表示连续的数据流。在系统内部，DStream由一系列的RDD构成。
相关阅读:
Atitit orm 之道艾龙著 1. 一、ORM的由来 1 2. ORM的组成： 2 3. 常见的ORM框架： 3 4. 、ORM与数据持久化的关系 3 5. Atitit
Atitit 移动互联网产业维度 1. 移动互联网带来的模式变革 1 2. 从视窗到“苹果与机器人”，软件发展模式的颠覆 2 3. 第3章从X86到ARM，蚂蚁绊倒了大象 2 4. 第5
Atitit 装备工具分类 attilax总结艾龙著工具链体系武器与软件行业工具也是很近似的的。 1. 分类思维 1 1.1. 总分类：冷、热 1 1.2. 轻、重、大规模杀伤性 1
Atitit 区块链之道 attilax著艾龙著 1. 金融＝制度＋技术＋信息 1 2. 第一章可信的协议 1 3. 第二章引导未来：区块链经济七大设计原则 1 4. 第五章新商业
 Atitit 几大研发体系对比 StageGate体系 PACE与IPD体系敏捷开发体系 CMMI体系艾龙著 1. 3. 1.5：业界领先的研发管理体系简介 2 1 2. 《产品及生命周期
 Atitit 传感器之道 1. 视觉传感器摄像头 1 1.1. 一、光线传感器： 1 1.2. 二、距离传感器： 1 1.3. 第一种是震动传感器。 4 1.4. 第二种是声响传感
 Atitit 架构之道之可读性可维护性架构之道提升效率架构之道 attilax著艾龙著 1.1. Hybrid架构 1 1.2. 分层架构是使用最多的架构模式 Layers模式也称Tie
Atitit cko之道首席知识官之道 attilax著艾龙著 1. 2 2. 第 1 章知识管理到底是什么，有什么用／1 2 3. 1.1 知识管理全景／1 1.2 波士顿矩阵／3 1.2.
Atitit 提升效率降低技术难度与提升技术矛盾的解决方案 1. 问题 2 1.1. 高手喜欢技术挑战怎么办，但会提升技术难度导致新手不会用怎么办 2 2. 解决方案 2 2.1. 通过开会统
 Atitit 依赖管理之道 1. 概念依赖管理，是指在什么地方以什么形式引入外部代码。 1 1.1.1. 理解模块化和依赖管理： 1 1.2. 依赖管理，有三个层面。单一职责原则，协议对象引用，
原文地址：https://www.cnblogs.com/xl717/p/11969345.html

Copyright © 2020-2023 润新知