centos7中Spark集群的安装与配置（Hadoop2.6.5+spark2.3.3）

centos7中Spark集群的安装与配置（Hadoop2.6.5+spark2.3.3）
Hadoop2.6.5+spark2.3.3+jdk1.8.0+Scala2.11.8

配置spark集群之前，要先安装好jdk和Scala

这里只做简要说明（这两个的安装和配置都类似，大概步骤如下）：

1、下载对应的压缩包上传至Linux系统；

2、到对应的目录下解压压缩包

3、配置环境变量

4、使用如下命令查看是否安装配置成功
```
java -version

scala -version
```
spark集群的配置部署

1、spark的获取

下载地址https://archive.apache.org/dist/spark/

2、上传安装包到虚拟机的/opt/spark/目录下（事先建好的目录）

3、到该目录下解压压缩包
```
tar -zxvf spark-2.3.3-bin-hadoop2.6.tgz
```
4、修改/etc/profile配置文件
```
vim /etc/profile
```
加入以下的内容
```
export SPARK_HOME=/opt/spark/spark-2.3.3-bin-hadoop2.6

export PATH=$PATH:$SPARK_HOME/bin
```
保存后，执行以下命令生效配置
```
source /etc/profile
```
5、进入conf目录

将spark-env.sh.template复制一份spark-env.sh，对spark-env.sh进行修改

6、vim spark-env.sh

在该文件中加入以下内容
```
export JAVA_HOME=/usr/lib/jvm/java #自己的jdk路径
export SPARK_MASTER_IP=master1 #注：这里是当前机器的域名或者IP
export SPARK_MASTER_PORT=7077
```
7、配置slaves文件
```
cp slaves.template slaves

vim slaves
```
在slaves文件中加入从节点的主机名或者IP地址

8、将配置同步至Slave1和Slave2

在Master的/opt/目录下使用如下命令
```
scp -r ./spark/ root@Slave1:$PWD

scp -r ./spark/ root@Slave2:$PWD
```
9、启动集群

在Master主机执行命令
```
cd /opt/spark/spark-2.3.3-bin-hadoop2.6/sbin

./start-all.sh
```
使用jps查看启动情况主节点出现Master代表启动成功
我们再看看从节点，里面出现Worker代表启动成功。

关闭防火墙
```
systemctl stop firewalld.service
```
浏览器访问http://192.168.152.131:8001（默认端口8080，我这里修改过）

启动成功！

2021-02-03 14:11:48
相关阅读:
从零开始Windows环境下安装python+tensorflow
Opencv调用深度学习模型
 python tensorflow 安装
 OpenCV3 Ref SVM ： cv::ml::SVM Class Reference
OpenCV3编程入门笔记（一）
Tensorflow学习教程变量
 opencv3.0机器学习算法使用
 Tensorflow学习教程Fetch and Feed
multilayer perceptrons, MLP）模型，CvANN_MLP。
域的安装配置介绍
原文地址：https://www.cnblogs.com/zrs123/p/14366759.html

centos7中Spark集群的安装与配置（Hadoop2.6.5+spark2.3.3）

Hadoop2.6.5+spark2.3.3+jdk1.8.0+Scala2.11.8

配置spark集群之前，要先安装好jdk和Scala

spark集群的配置部署