[Spark]

环境：centos6.0 虚拟机搭建单机版本的spark 前提条件：搭建好hadoop环境

1. 下载scala进行安装

　　只需要设置环境变量SCALA_HOME和PATH即可

　　export SCALA_HOME=/home/hadoop/bigdater/scala

　　export PATH=$PATH:$SCALA_HOME/bin

2. 修改hadoop的core-site.xml文件，添加用户代理控制

　　hadoop.proxyuser.sparkuser.hosts=*

　　hadoop.proxyuser.sparkuser.groups=*

　　spearuser指的是安装spark的用户名

3. 下载spark安装文件

　　wget http://archive.cloudera.com/cdh5/cdh/5/spark-1.2.0-cdh5.3.6-src.tar.gz

4. 解压压缩文件，编辑conf/spark-env.sh文件

　　export SCALA_HOME=/home/hadoop/bigdater/scala

　　export SPARK_WORKER_MEMORY=1g

　　export SPARK_MASTER_IP=hh

　　export MASTER=spark://hh:7077

5. 配置slaves文件,加入worker节点的hostname

　　hh

6. 启动

　　start-all.sh # 启动hadoop

　　$SPARK_HOME/sbin/start-all.sj # 启动spark

相关阅读:
转：C/C++基本数据类型所占字节数
转：为什么C++中空类和空结构体大小为1？
转：内存字节对齐
转：100层楼扔两个鸡蛋的问题
移动互联网
辗转相除法
斐波那契数列
error C2783: 无法为“T”推导模板参数
创新工场和海豚浏览器宣讲会启示
转：快速排序的一个小问题没想明白，求助各位

原文地址：https://www.cnblogs.com/liuming1992/p/5164265.html