本篇将在阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建的基础上搭建。
1 环境介绍
- 一台阿里云ECS服务器:master
- 操作系统:CentOS 7.3
- Hadoop:hadoop-2.7.3.tar.gz
- Java: jdk-8u77-linux-x64.tar.gz
- Pig: pig-0.17.0.tar.gz
2 Pig 下载
下载 pig-0.17.0.tar.gz 并在合适的位置解压缩,笔者这里解压缩的路径为:
/usr/local
将解压得到的目录改名为 hbase
1 cd /usr/local 2 mv pig-0.17.0/ pig/
3 添加 Pig 环境变量
在"/etc/profile"中添加内容:
1 export PIG_HOME=/usr/local/pig 2 export PATH=$PATH:$PIG_HOME/bin
重新加载环境:
source /etc/profile
4 启动 Pig
4.1 验证是否安装成功
pig -help
4.2 本地模式执行
若操作的是 Linux 系统下的文件,则运行下面的命令。
pig -x local
4.3 MapReduce 模式执行(Pig 默认模式)
需要确保已启动 HDFS 和 YARN, 再运行下面的命令。
pig
5 安装完成
阿里云ECS服务器部署HADOOP集群系列: