在windows下通过安装cygwin模拟linux环境。然后再安装hadoop。是一种简单方便的方式。为hadoop准备的windows下cygwin环境安装步骤例如以下:
- 下载安装文件
最新的cygwin安装文件setup.exe下载地址在这里:http://cygwin.com/install.html。用最新版本号的cygwin就能够,我用的是2.774版本号的安装程序。
- 安装cygwin
在上一步下载的setup.exe文件实际上仅仅是一个引导安装和下载过程的运行文件。真正的下载安装过程是通过网络进行的,以下让我们将下载的setup.exe运行起来。
点击下一步进入安装模式引导界面。
这里面的三个选项是“从网络下载并安装”、“仅仅下载不安装”、“从本地下载文件安装”,简单粗暴地选择第一个“从网络下载并安装”,点击下一步后进入选择安装文件夹界面。
既然cygwin贴心地帮我选择了一个简单明了的c盘文件夹,那就用它吧,以下的同意那些用户使用,就用默认的全部本机用户都能使用。点击下一步进入下载文件存放文件夹选择界面。
鄙人稍有文件洁癖。选择让下载文件放到经常使用的暂时文件文件夹下,点击下一步(假设输入的是一个不存在的文件夹。程序会提示你是否要创建这个文件夹。选yes就ok)。进入网络链接选择界面。
Cygwin的安装眼下还没有翻墙的须要,假设没有特别的速度的考虑,就选Direct Connection直接连接就好了,点击下一步后会有一个下载安装文件镜像server列表的短暂过程,然后会出现选择安装文件镜像server的界面。
按说选择第一个163的server应该是最快的,可是我选择后出现了setup文件下载出错的情况,导致安装不能完毕。后来选择了第二个box-soft.comserver。方才顺利完毕安装,下载速度也还能够,能稳定在100k左右。
点击下一步后,仍然会有一个短暂的从所选server下载安装组件列表的过程,然后出现选择安装组件的界面。
选择安装组件的步骤比較重要。须要细致选择下面组件(:
* Base组件的所有。操作方法是点击Base后面的Default,变为Install)
* Devel组件下的subversion及其它将来开发须要用到的组件。比如autoconf等,操作方法是展开Devel组件,点击各个小组件前的Keep文字,变为对应的版本。
* Net组件下的openssh和openssl组件,用于hadoop须要的ssh訪问。操作方法同上。
* System组件下的util-linux组件,用于使用一些经常使用的more等功能进行调试,操作方法同上。
* 其它一些可能用到的组件,我还单独选择了Perl、Python、Ruby、Science等组件。
选择组件完毕后。点击下一步即開始进行下载、安装等自己主动步骤。一路选择下一步就可以。
- 配置cygwin的ssh服务
Cygwin安装完毕后。须要对ssh服务进行配置。以执行hadoop环境进行ssh无password登录。步骤例如以下:
* 使用安装后生成的cygwin启动快捷方式。启动cygwin环境。
* 运行cygwin的ssh-host-config。
在第一步询问“Should privilege separation be used?(yes/no)”时。输入yes;
在第二步询问“(Say "no" if it is alreadyinstalled as a service) (yes/no)”时,输入yes;
在第三步询问“Enter the value of CYGWIN for thedaemon: []”,直接回车。
看到“Host configuration finished. Have fun!”后此步即完毕。
* 使用windows的管理工具中的服务管理,将“CYGWIN sshd”服务启动。
* 回到cygwin环境,运行 ssh localhost命令。
在第一步询问中输入yes。在第二步要求输入password时,输入用户password。
* 在cygwin中输入ssh-keygen。一路回车就可以。
* 然后在cygwin下依次运行例如以下命令:
cd ~/.ssh
cp id_rsa.pub authorized_keys
完毕后一路exit退出cygwin环境,再打开cygwin环境,运行ssh localhost。发现例如以下图不须要password就可以进入。就代表成功了。
至此。我们为hadoop准备的cygwin环境即已搭建完毕,能够说是成功迈出了西行征途的第一步,不算太费劲地在五指山收服了cygwin这个孙猴子,有了它的帮助。后面等待我们的九九八十一难也就不显得那么可怕了。