(1) storm是一个进程常驻内存的、分布式的,对数据实时流式处理框架,不同于MR的批处理和spark streaming的微批处理,storm实现了对数据处理的毫秒级延迟。它的数据源被称为SPOUT,数据处理流程被称为BOLT
(2)storm一般应用于对数据的处理速度特别高的场景。比如金融行业,毫秒级延迟的需求至关重要。一些需要实时处理数据的场景也可以应用Storm,比如根据用户行为产生的日志文件进行实时分析,对用户进行商品的实时推荐等。(1) storm是一个进程常驻内存的、分布式的,对数据实时流式处理框架,不同于MR的批处理和spark streaming的微批处理,storm实现了对数据处理的毫秒级延迟。它的数据源被称为SPOUT,数据处理流程被称为BOLT
(2)storm一般应用于对数据的处理速度特别高的场景。比如金融行业,毫秒级延迟的需求至关重要。一些需要实时处理数据的场景也可以应用Storm,比如根据用户行为产生的日志文件进行实时分析,对用户进行商品的实时推荐等。