1.安装scala
- 从http://www.scala-lang.org下载scala-2.11.7.tgz并解压缩
- 将解压缩的文件夹用mv指令移动到/usr/local/share
mv [scalapath] /usr/local/share
- 修改/etc/profile文件权限.
sudo vim /etc/profile
添加path: 把下面的一行代码加入到profile文件末尾
export PATH="$PATH:/usr/local/share/scala-2.11.7/bin"
- 测试: 重启终端,输入scala,出现:
Welcome to Scala version 2.11.7 (Java HotSpot(TM) 64-Bit Server VM, Java 1.8.0_60). Type in expressions to have them evaluated. Type :help for more information.
2.安装scala ide: IntelliJ IDEA 15 CE
从官网http://www.jetbrains.com/idea/下载.dmg并安装即可。
3.安装spark
从官网 http://spark.apache.org/downloads.html下下来解压缩就可以用了。这里有篇笔记很好,我转下,原地址 http://www.jianshu.com/p/3720656a390d.
还有一个standalone模式详细的使用例子:http://www.cnblogs.com/zhangqingping/p/4352977.html
安装流程:
1. 在“Download Spark”的三个下拉框里选择。(我分别选的当时最新的1.3.1,Pre-build for 2.6, Direct Download)
2. 点击“4. Download Spark: xxxxx” 的链接就可以下载了(200多M)。
3. 解压下载好的tgz文件,并将这个文件夹(spark-1.3.1-bin-hadoop2.6)放到你想存放的地方(比如“/Users/username/IDE/spark-1.3.1-bin-hadoop2.6”)。
4. 然后这就算装好了,你敢信!
不信咱就跑跑看。
1. [启动主机]点开官方简介传送门,聚焦标题“Starting a Cluster Manually”。 你可以看到主机启动命令,复制它:
./sbin/start-master.sh
2. 回到Finder,右键点击刚才解压并移动过的文件夹,点击最下面的“New Tab Terminal at Folder”. 在命令框里黏贴上面那条命令。回车。出来2,3行路径。这时候主机已经开始运行了。
3. 打开浏览器。 输入下面的默认端口就能看见主机运行情况了。
http://localhost:8080
4. [加子嗣]现在的主机是个光杆司令,要给他派兵啊。
在官方简介“Starting a Cluster Manually”下复制命令
./bin/spark-class org.apache.spark.deploy.worker.Worker spark://IP:PORT
回到terminal命令行,点击右上角的“+”号。打开一个拥有同样路径的新界面。黏贴复制的命令,按后退键删除掉 spark://IP:PORT (别急着回车!我们要贴上自己的主机地址。)
回到浏览器的“http://localhost:8080/”页面
复制第二行黑体字URL:后面的部分,“spark://xxxx:xxxx”也就是你的主机地址。前四个x是一串字符,冒号后的四个x是四个数字。(这里我们是在同一个电脑上创建主机和子嗣。如果你是把别的电脑当作子嗣加入主机,那么要求主机和子嗣是在同一个网络中。同样,需要在spark文件夹路径下打开terminal输入相应的命令)
URL:spark://xxxx:xxxx
5. 这样整条命令就变成“./bin/spark-class org.apache.spark.deploy.worker.Worker spark://xxxx:xxxx” 安心的拍下回车吧!
6. 刷刷几页信息跳过后,这个窗口就像死了机一样了。别担心,这是因为这个命令端已经作为子嗣为你刚建立的主机开始卖命了。不信的话你刷新一下主机信息网页。
http://localhost:8080
在“Workers”列表下赫然出现了你的第一个子嗣。其状态State为ALIVE。表示它正在运作。这时候你需要记住,当前Terminal的窗口对应就是那个刚加入的Worker Id。
7. [删除子嗣]工作干完了,把小崽子们放出去玩吧。只需要在那个看似死机了teminal里按下“Ctrl + C”就行了。
这时候命令行回复工作,而主机信息网页刷新后会将对应子嗣的state改成DEAD。说明和子嗣的联系切断了。此信息回保留一段时间,然后会被完全删除。
8. [关闭主机]
和启动主机一样,在主文件夹路径下输入相应命令即可。
./sbin/stop-master.sh
这时http://localhost:8080/ 刷新后就是空网页了。
如果你有没有关闭的子嗣。在其terminal窗口中会显示其试图重连主机的信息。如果你再次打开主机(而且port号没变的话),没关的子嗣会重新连上去。
==============================
小结 Sum up:
0.知道怎么在Mac上装Spark。(就是解压缩嘛!)
1.知道怎么建立和关闭主机。(一个命令)
2.知道怎么建立子嗣连上主机。(查好主机URL然后一个命令)
3.知道怎么关闭子嗣。(在相应terminal中拍“Ctrl+C”)