常用库简介
Numpy 基础科学计算库
Scipy 强大的科学计算工具集
Pandas 数据分析的利器
Matplotlib 画出优美的图形
Scikit-learn 机器学习库
Numpy
【sklearn使用numpy数组形式的数据进行处理,所以需要把数据转换为numpy数组形式,其中的多维数组也是numpy的核心功能之一】
import numpy
i = numpy.array([[520,13,14],[25,9,178]])
print("i:
{}".format(i))
给变量i复制为一个数组
i是一个典型的numpy数组
结果:
sklearn需要使用scipy来对算法进行执行
sparse函数,用来生成稀疏矩阵,而稀疏矩阵用来存储那些大部分数组为0的np数组 【常用】
sparse函数,用来生成稀疏矩阵,而稀疏矩阵用来存储那些大部分数组为0的np数组 【常用】
sparse用法:
import numpy as np
from scipy import sparse
matrix = np.eye(6)
#用eye函数生成一个6*6对角矩阵
#矩阵中对角线上的元素数值为1,其余都是0
sparse_matrix = sparse.csr_matrix(matrix)
#这一行把np数组转化为CSR格式的scripy稀疏矩阵(sparse matrix)
#sparse函数只会存储非0元素
print("对角矩阵: {}".format(matrix))
print(" sparse存储的矩阵: {}".format(sparse_matrix))
from scipy import sparse
matrix = np.eye(6)
#用eye函数生成一个6*6对角矩阵
#矩阵中对角线上的元素数值为1,其余都是0
sparse_matrix = sparse.csr_matrix(matrix)
#这一行把np数组转化为CSR格式的scripy稀疏矩阵(sparse matrix)
#sparse函数只会存储非0元素
print("对角矩阵: {}".format(matrix))
print(" sparse存储的矩阵: {}".format(sparse_matrix))
结果:
显示的结果:将对角矩阵中的数值为1点的位置(x,y)输出
pandas
生成类似excel格式的数据表,还可以对数据表进行修改操作,还可以从多种类的数据库中提取数据
还支持在不同的列中使用不同类型的数据
import pandas
data = {
"name":["jike","kime","mike"],
"age":["1","2","3"],
"height":["12","13","14"]
还支持在不同的列中使用不同类型的数据
import pandas
data = {
"name":["jike","kime","mike"],
"age":["1","2","3"],
"height":["12","13","14"]
}
data_frame = pandas.DataFrame(data)
display(data_frame)
会得到一个数据表:
display(data_frame)
会得到一个数据表:
还可以查询:
display(data_frame[data_frame.name != "mike"])
数据可视化
%matplotlib inline
#激活maplotlib
import matplotlib.pyplot as plt
#先生成一个-20到20,元素数是10的等差数列
x = np.linspace(-20,20,10)
y = x**3 + 2*x**2+6*x + 5
#画出曲线
plt.plot(x,y,marker = "o")
#激活maplotlib
import matplotlib.pyplot as plt
#先生成一个-20到20,元素数是10的等差数列
x = np.linspace(-20,20,10)
y = x**3 + 2*x**2+6*x + 5
#画出曲线
plt.plot(x,y,marker = "o")
代码开头的%matplotlib inline,允许jupyter notebook进行内置实时绘图
如果不写,需要在最后一行plt.show() 才会将图形显示出来