几天没写过博客了,一重开就给自己挖了这么一个大坑……(希望能好好填坑)
最近一段时间看了《机器学习实战》这本书,感觉写得不错,认真看了看。关于这本书的书评及购买事宜请移步豆瓣、京东、亚马逊等网站,这里不多说。不过有一点,感觉这本书有个很好的地方是给出了各个算法的Python实现代码和讲解,要求不高的话可以拿来用了(懒)。在这里想好好写写从这本书中学到的东西,文中的代码和主要内容也将均来自这本书。
同时本系列部分文章继承自 qwertWZ 学长,万分感谢!
目录
第一部分 分类
第1章 机器学习基础
第2章 k-近邻算法
第3章 决策树
第4章 基于概率论的分类方法:朴素贝叶斯
第5章 Logistic回归
第6章 支持向量机
第7章 利用 Adaboost元算法提高分类性能
第二部分 利用回归预测数值型数据
第8章 预测数值型数据:回归
第9章 树回归
第三部分 无监督学习
第10章 利用K-均值聚类算法对未标注数据分组
第11章 使用Apriori算法进行关联分析
第12章 使用FP-growth算法来高效发现频繁项集
第四部分 其他工具
第13章 利用PCA来简化数据
第14章 利用SVD简化数据
第15章 大数据与MapReduce
本书的主页:https://www.manning.com/books/machine-learning-in-action
书中的代码和所使用的数据集可以在主页或者这里(作者的GitHub版本库)找到。
书中有的代码均使用Python 2.7,并广泛使用了 NumPy
模块,若干章中还使用了 Matplotlib
模块进行绘图。可以安装 Python 2.7
的官方发行版,然后依次安装 NumPy
和 Matplotlib
模块(需要解决依赖)。
但针对社区对 Python 2.X 版本的不再支持,所以博主推荐安装 Python 3.X 版本 or Anaconda 来编程。
在这里推荐直接安装Python发行版 Anaconda,已经内置了很多科学计算所需的模块,可直接使用。