大数据的两种处理方式

       大数据的处理方式有两种：基于内存的流式处理和基于硬盘的存储处理。
       流式处理就好象是在经过的数据面前建一道水闸。数据流过这里，经过闸门的时候，就进行筛选过滤，分析出有价值的内容，然后丢弃，以后也不再使用。
       存储处理则是建一个储水池。数据先放进入储水池存起来，需要的时候，再进到储水池里，在里面筛选分析，找到那些有价值的内容。这个过程中，因为水还在储水池里，没放掉，所以可以供下次继续使用。
       存储模式的数据处理是可以重复的，用完再用，反复使用。但是因为硬盘本身的机械特性问题，导致它处理速度慢，速率不高。不过现在也还是有一些针对硬盘的优化措施。
       流式处理因为数据的处理过程在内存里进行，内存的处理性能是硬盘的数个量级，所以它的处理速率比存储模式高很多。但是也因为数据驻留在内存里，内存的特性是掉电即失的，只能一次性使用。所以流式处理通常是用完即弃，象卫生巾。
       大数据产品里，Spark是流式处理，Laxcus、Hadoop是存储处理。

相关阅读:
人生苦短我学Java-1-Helloword
python-51-MySQLdb查询返回dict格式
IDEA/PyCharm等系列-会了这些设置编码舒服而效率又提高了一截
jacoco-2-jenkins集成代码测试覆盖率
jacoco-1-java代码测试覆盖率之本地环境初体验
wordpress 安装提示 Error Establishing a Database Connection
mysql 8.0 重置 root 账户密码
Ubuntu 20.04 卸载 snapd
VSCode 扩展选择快捷键插件 Quick and Simple Text Selection
Swagger 响应数据 response 里包含动态变化的对象 key 的方法

原文地址：https://www.cnblogs.com/laxcus/p/5303526.html