通过wordCount实战详解Spark RDD创建 -- （视频笔记）

通过wordCount实战详解Spark RDD创建 -- （视频笔记）

DAG图（RDD 依赖关系图，有向图，无环图）

shuffledRDD为宽依赖

在spark shell的页面上查看具体的job执行情况

我们实际操作save

》》》 val cache = sc.textFile("hdfs://hadoop-1:9000/data/test/test.dat").flatMap(_.split(" ")).map(word=>(word,1)).reduceByKey(_+_).cache

》》》cache.saveAsTextFile("/out/cache/wordcache.dat")

》》》cache.saveAsTextFile("/out/cache/wordcache1.dat")

第一次操作

第二次操作

通过两张图对比可以明显看到，第二次save是用缓存中执行的。
相关阅读:
机器人能都返回原点
 解码字母
 学习W3C
字符重排
 字符串相加
 ARC107F Sum of Abs
6830. 【2020.10.25提高组模拟】排列
 6828. 【2020.10.25提高组模拟】幂
 CF1434D Roads and Ramen
2020 计蒜之道线上决赛 C 攀登山峰
原文地址：https://www.cnblogs.com/isenhome/p/5085800.html