一、下载安装包:
http://mahout.apache.org/general/downloads.html
二、解压:
将下载的安装包解压到需要的目录下
三、配置环境变量:
export MAHOUT_HOME=/Users/iris/Downloads/apache-mahout-distribution-0.10.1
export MAHOUT_CONF_DIR=$MAHOUT_HOME/conf
export PATH=$MAHOUT_HOME/conf:$MAHOUT_HOME/bin:$PATH
若不使用hadoop,只在本机运行则设置mahout_local变量:
export MAHOUT_LOCAL=true
四、验证安装mahout是否成功:
执行命令mahout,若安装成功,则出现如图所示的一些算法:
五、接下来,需要结合maven和eclipes构建mahout的开发环境。具体步骤参见博客 http://blog.fens.me/hadoop-mahout-maven-eclipse/
其中由于这篇博客里面的pom.xml是针对mahout 0.6版本写的,而现在用的0.10.1版本变化较大,所以pom.xml也要作相应变化。否则就会在运行mvn clean install的最后失败:Could not find artifact org.apache.mahout:mahout-core:jar:0.10.1 in central (https://repo.maven.apache.org/maven2)。
新pom文件的修改方法依据官网http://mahout.apache.org/general/downloads.html,只要在原来新建项目下的pom文件中添加官网中的两个dependency就可以了。具体可以看这个http://f.dataguru.cn/thread-516316-1-1.html
如果程序中需要用到org.apache.mahout.cf.taste的包的话,还需要添加:
<dependency> <groupId>org.apache.mahout</groupId> <artifactId>mahout-mr</artifactId> <version>0.10.1</version> </dependency>