- 机器学习介绍
- 线性回归
- 线性回归实战准备
- 单因子线性回归实战
安装scikit-learn工具包:
第一步:
第二步:终端输入:
pip install scikit-learn -i https://pypi.tuna.tsinghua.edu.cn/simple/
数据表格:
单因子线性回归实战:
- 多因子线性回归实战
数据文件来自 kaggle 网站:https://www.kaggle.com/
调用多因子进行预测:建立模型>>模型训练>>模型预测>>模型评估>>模型可视化展示
1 #在jupyter中展示出来 2 %matplotlib inline 3 from matplotlib import pyplot as plt 4 fig = plt.figure(figsize=(10,10))#画图且设置尺寸 5 6 fig1 = plt.subplot(231)#两行三列的第一张图 7 plt.scatter(data.loc[:,'Avg. Area Income'],data.loc[:,'Price'])#根据地区收入与房屋价格制作散点图 8 plt.title('Price VS Income')#设置标题 9 10 fig2 = plt.subplot(232)#两行三列的第二张图 11 plt.scatter(data.loc[:,'Avg. Area House Age'],data.loc[:,'Price']) 12 plt.title('Price VS House Age')#设置标题 13 14 fig3 = plt.subplot(233)#两行三列的第三张图 15 plt.scatter(data.loc[:,'Avg. Area Number of Rooms'],data.loc[:,'Price']) 16 plt.title('Price VS Number of Rooms')#设置标题 17 18 fig4 = plt.subplot(234)#两行三列的第四张图 19 plt.scatter(data.loc[:,'Avg. Area Number of Bedrooms'],data.loc[:,'Price']) 20 plt.title('Price VS Number of Bedrooms')#设置标题 21 22 fig5 = plt.subplot(235)#两行三列的第五张图 23 plt.scatter(data.loc[:,'Area Population'],data.loc[:,'Price']) 24 plt.title('Price VS Population')#设置标题 25 26 plt.show()#显示