启动spark shell详解

spark-shell是Spark自带的交互式Shell程序，方便用户进行交互式编程，用户可以在该命令行下用scala编写spark程序。

启动spark shell:

/usr/local/spark-2.1.0-bin-hadoop2.6/bin/spark-shell --master spark://L1:7077,L2:7077  --executor-memory 2g  --total-executor-cores 2

1

参数说明：

--master spark://L1:7077,L2:7077     指定Master的地址
--executor-memory 2g 指定每个worker可用内存为2G
--total-executor-cores 2 指定整个集群使用的cup核数为2个

1
2
3

注意

如果启动spark shell时没有指定master地址，但是也可以正常启动spark shell和执行spark shell中的程序，其实是启动了spark的local模式，该模式仅在本机启动一个进程，没有与集群建立联系。

/usr/local/spark-2.1.0-bin-hadoop2.6/bin/spark-shell 
--master spark://L1:7077,L2:7077  
--executor-memory 2g  
--total-executor-cores 2
这样启动spark shell，指定了master的地址，那么就会将任务提交到集群，开始时sparkSubmit(客户端)
要连接Master，并申请计算资源（内存和核数），Master进行资源调度（就是让那些Worker启动Executor），
在准备工作时，这些进程都已经创建好了。

1
2
3
4
5
6
7

启动spark shell后，查看UI管理界面，会发现Application ID多了一个正在运行的spark shell进程。

在这里插入图片描述

相关阅读:
标志寄存器和跳转指令
js中top、clientTop、scrollTop、offsetTop的区别文字详细说明版【转】
关于mysql的级联删除（之前好多人咨询过我）
用DIV画个漂亮的Table，根本看不出是div画的
最简单的Ajax局部提交整体form，无刷新页面
themeleaf中使用javascript时，字符“&&”的转义问题。
Mysql 进行sequence的新建，同时建立计划每日重置。
动态给H5页面绑定数据，基本万能无错误！
手风琴效果简单实现，修改bootstrap内部事件接口并且自由定义。
JQuery实现追加表格，不使用拼接html方式

原文地址：https://www.cnblogs.com/ExMan/p/14308621.html