安装Python算法库
主要包括用NumPy和SciPy来处理数据,用Matplotlib来实现数据可视化。为了适应处理大规模数据的需求,python在此基础上开发了Scikit-Learn机器学习算法库(网址:http://scikit-learn.org/stable/ ),同时还提供了深度学习算法库Theano(网址:http://deeplearning.net/software/theano ),并支持GPU运算。
除此之外,python还提供了大量的常用程序库,如数据库APT(MysqlDB),GUI图形界面库(WxPython),高并发协程序(gevent),中文分词库(jieba)等外部库,所有这些库都可以在下面两个网址查询到:
1) 官方下载地址:https://pypi.python.org/pypi/.
2) 非官方下载地址:http://www.lfd.uci.edu/~gohlke/pythonlibs/
算法库的安装命令十分简单,执行“C:Python64Scriptspip install 库名”命令即可。
Python算法库的安装顺序:NumPy->SciPy->Matplotlib->Scikit-Learn
Installing Python Modules:
https://docs.python.org/3.6/installing/index.html
Anaconda
官网:https://www.continuum.io/downloads
安装Anaconda,就相当于安装了Python、IPython、集成开发环境Spyder、一些包等等。
其实安装完Anaconda后,基本上就把我们常用的部分包安装好了,但是毕竟只是安装了一小部分(我们可以去官网查看安装了哪些包),还有一部分需要我们自己来安装。
查看已经安装的包我们可以在命令提示符中输入pip list或者用anaconda自带的包管理器conda(conda list)。conda和pip的用法基本上一致。但是我们使用conda安装的时候不仅会安装当前你要安装的包还会提示更新其他已经安装过的包,所以基本上都是直接用pip安装。
比如: pip install jieba / pip3 install jieba
pip或conda不能安装的话,我们就下载文件安装,比如exe文件(双击安装)或者whl文件(pip安装)等等。
import numpy as np
from numpy import *
import matplotlib.pyplot as plt
dataset = [[-0.0111,14.1],[-1.222,4.134],[-1.342,4.6789],[-0.7234,6.578],[-1.989,7.1245],[1.892,3.789],[1.453,3.783],[-1.98,2.456]]
dataMat = mat(dataset).T #将数据集转换为NumPy矩阵,并转置
plt.scatter(dataMat[0],dataMat[1],c='red',marker='o') #绘制数据集散点图
x = np.linspace(-2,2,100) #产生直线数据集
y=2.8*x+9
plt.plot(x,y) #绘制直线图
plt.show() #显示绘制后的结果