Windows 10 x64 下编译 Hadoop 源码
环境准备
Hadoop并没有提供官方的 Windows 10 下的安装包,所以需要自己手动来编译,官方文档中 BUILDING.txt 文件中说明了编译源码需要的软件环境:
1. 具体如下:
- [x] Hadoop源码
- [x] Windows 系统
- [x] JDK 1.8+
- [x] Maven 3.0 or later
- [x] Findbugs 1.3.9 (可省略)
- [x] ProtocolBuffer 2.5.0
- [x] CMake 2.6 or newer
- [x] Windows SDK or Visual Studio 2010 Professional
- [x] Cygwin: 为了使用 sh, mkdir, rm, cp, tar, gzip 等命令
- [x] zlib
- [x] 电脑需要联网
2. Hadoop源码下载可以
地址 @https://archive.apache.org/dist/hadoop/common
选择具体版本即可
3. JDK
JAVA_HOME=JDK目录
CLASSPATH=.;%JAVA_HOME%lib;%JAVA_HOME%libjrelib;
PATH=%JAVA_HOME%in;%JAVA_HOME%jrein;
注意:Hadoop2.7.0 及之后最好使用JDK1.7及1.8以上版本进行编译,我使用的版本如下
C:UsershaoBo>java -version
java version "1.8.0_181"
Java(TM) SE Runtime Environment (build 1.8.0_181-b13)
Java HotSpot(TM) 64-Bit Server VM (build 25.181-b13, mixed mode)
4. Maven
下载地址:@http://maven.apache.org/download.cgi,配置如下:
M2_HOME=maven目录
PATH=%M2_HOME%in;
我使用的版本是3.6.0:
C:UsershaoBo>mvn -version
Apache Maven 3.6.0 (97c98ec64a1fdfee7767ce5ffb20918da4f719f3; 2018-10-25T02:41:47+08:00)
Maven home: D:apache-maven-3.6.0in..
Java version: 1.8.0_181, vendor: Oracle Corporation, runtime: C:jdkjdk1.8.0_181jre
Default locale: zh_CN, platform encoding: GBK
OS name: "windows 10", version: "10.0", arch: "amd64", family: "windows"
5. ProtocolBuffer
下载地址:@https://github.com/google/protobuf/releases/tag/v2.5.0,选择 protoc-2.5.0-win32.zip 版本, 解压到安装目录,并添加到PAHT,如下:
PATH=C:javaprotoc-2.5.0-win32;
测试:
C:UsershaoBo>protoc --version
libprotoc 2.5.0
6. CMake
要求 CMake 2.6+ 的版本,下载地址:@https://cmake.org/download/, 下载并解压到安装目录,并添加bin目录到PATH,由于cygwin中也带了个cmake, 所以在Path中,cmake 的bin目录得加在cygwin的bin 目录之前:
CMAKE_HOME=cmake目录
PATH=%CMAKE_HOME%in;
测试:
C:UsershaoBo>cmake --version
cmake version 3.14.3
CMake suite maintained and supported by Kitware (kitware.com/cmake).
7. Visual Studio
VS的版本选择有两种,第一使用推荐的VS2010企业版,使用这个版本比较简单方便,或者使用最新的VS2015版,需要升级一些文件。 我选择的是 Visual Studio Community 2015 with Update 3 – Free 的 IOS 版本, 地址:@https://www.visualstudio.com/downloads/。 安装完毕之后,如果使用的是VS2015版本需要升级相关的文件:
hadoop-common-projecthadoop-commonsrcmainwinutilswinutils.sln
hadoop-common-projecthadoop-commonsrcmain ative ative.sln
使用VS2015分别打开上述文件,提示升级的时候进行确认即可。升级成功的提示信息如下:
正在升级项目“native”...
配置“Release|x64”: 将平台工具集更改为“v140”(之前为“v100”)。
重定目标结束: 1 个已完成,0 个未通过,0 个已跳过
正在升级项目“winutils”...
配置“Debug|x64”: 将平台工具集更改为“v140”(之前为“v100”)。
配置“Release|x64”: 将平台工具集更改为“v140”(之前为“v100”)。
正在升级项目“libwinutils”...
配置“Debug|x64”: 将平台工具集更改为“v140”(之前为“v100”)。
配置“Release|x64”: 将平台工具集更改为“v140”(之前为“v100”)。
重定目标结束: 2 个已完成,0 个未通过,0 个已跳过
另外需要修改下面的文件:
hadoop-hdfs-projecthadoop-hdfspom.xml
将 “Visual Studio 10” 改成 “Visual Studio 14”,保存后退出。
8. Cygwin
下载地址:@https://cygwin.com/install.html,安装并添加bin目录到PATH:
CYGWIN_HOME=cygwin安装目录
PATH=%CYGWIN_HOME%in;
9. Zlib
ZLIB_HOME=zlib目录
PATH=%ZLIB_HOME%in;
10.其他
Platform=x64
VCTargetsPath=C:Program Files (x86)MSBuildMicrosoft.Cppv4.0V140
MSBUILD_HOME=C:Program Files (x86)MSBuild14.0Bin
PATH=%MSBUILD_HOME%;
编译
一般指令如下所示:
mvn clean package -Pdist,native-win -DskipTests -Dtar
指令中加入 -Dmaven.javadoc.skip=true 参数,可以剔除指令文档的编译,如果使用的是JDK1.8,那么必须加入此参数才能编译通过:
mvn clean package -Pdist,native-win -DskipTests -Dtar -Dmaven.javadoc.skip=true
编译成功大概需要半小时,机器好的话可能更快,如果省略说明文档的编译也会提高速度, 编译成功之后的目录为 C:dfs265hadoop-dist arget