一、概述
用Python来编写机器学习方面的代码是相当简单的,因为Python下有很多关于机器学习的库。其中下面三个库numpy,scipy,matplotlib,scikit-learn是常用组合,分别是科学计算包,科学工具集,画图工具包,机器学习工具集。
numpy :主要用来做一些科学运算,主要是矩阵的运算。NumPy为Python带来了真正的多维数组功能,并且提供了丰富的函数库处理这些数组。它将常用的数学函数都进行数组化,使得这些数学函数能够直接对数组进行操作,将本来需要在Python级别进行的循环,放到C语言的运算中,明显地提高了程序的运算速度。【1】
scipy:主要是一些科学工具集,信号处理工具集(如线性代数使用LAPACK库,快速傅立叶变换使用FFTPACK库)及数值计算的一些工具(常微分方程求解使用ODEPACK库,非线性方程组求解以及最小值求解等)【1】。
scikit-learn:里面有很多机器学习相关的算法(如聚类算法,SVM等)。【2】
matplotlib:是一个画图工具和Matlab中的画图工程类似。
二.安装
切换到root管理员用户,知行下面命令安装:
yum -y install gcc gcc-c++ numpy python-devel scipy
yum install python-matplotlib
yum install python-pip
pip install -U scikit-learn