003.windows下启动运行spark-spark-shell.cmd

003.windows下启动运行spark-spark-shell.cmd

解压文件

D:igdataspark2.1.0spark-2.1.0-bin-hadoop2.7in

创建文件

spark scala
hadoop scala
scala spark
hive hadoop

bin目录下

spark-shell.cmd

读文件处理文件

scala> sc.textFile("file:///D:/bigdata/spark2.1.0/spark-2.1.0-bin-hadoop2.7/bin/input/word.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).collect
res5: Array[(String, Int)] = Array((scala,3), (hive,1), (spark,1), (hadoop,2), (saprk,1))
相关阅读:
linux 查看父进程号
 gitlab
诺基亚C6常识详解
 C#.net书籍列表
 表链接
 Limu：JavaScript的那些书（转载）
Oracle 多行记录合并/连接/聚合字符串的几种方法
 关于有锁iPhone的常识（转载）
not in与not exists性能比较
 多表连接查询
原文地址：https://www.cnblogs.com/star521/p/15217073.html