Spark学习 RDD持久化

持久化：

　　在Spark中，RDD采用惰性求值的机制，每次遇到行动操作，都会从头开始执行计算。每次调用行动操作，都会触发一次从头开始的计算。这对于迭代计算而言，代价是很大的，迭代计算经常需要多次重复使用同一组数据。例如：

可以通过持久化(缓存）机制避免这种重复计算的开销，可以使用persist()方法对一个RDD标记为持久化
之所以说“标记为持久化”，是因为出现persist)语句的地方，并不会马上计算生成RDD并把它持久化，而是要等到遇到第一个行动操作触发真正计算以后,才会把计算结果进行持久化
持久化后的RDD将会被保留在计算节点的内存中被后面的行动操作重复使用

persist(的圆括号中包含的是持久化级别参数

相关阅读:
python3-file的修改实现类似shell中sed的功能
python3-字典的循环
python3-file文件操作
python3-字典的增删改查
python3-字典中存储列表
python3-字典中的一些常用方法
python3-字典中包含字典
报错调试和工具使用
(三)、Struts第三天
struts体系结构

原文地址：https://www.cnblogs.com/fengchuiguobanxia/p/15947846.html