《机器学习实战》读书笔记
转载请注明地址:https://www.cnblogs.com/pengsky2016/p/10153958.html
这段时间将学习《机器学习实战》,这本书抛开了繁杂的数学公式和证明,通过大量的示例,以及完整清晰的代码,以程序员更能够理解的方式来讲解这些机器学习的算法。由于本书使用的是Python语言讲解,因此大量的使用了NumPy和Matplotlib等Python机器学习中常用的第三方库。这里需要读者对这2个库的一些基本知识有一定熟悉。在这里记录下从这本书中学到的东西,文中的代码和主要内容也将均来自这本书,另外也会增加额外的一些知识点。
1.书籍信息
书名:Machine Learning in Action
译名:《机器学习实战》
作者:Peter Harrington
译者:李锐 李鹏 曲亚东 王斌
出版社:人民邮电出版社
ISBN:978-7-115-31795-7
页数:332
2.纸张、印刷与排版
正常的16开本,纸张白色。
字体大小、行段间距正常。代码等特殊模块区分度较高。
3.勘误
本书勘误页(图灵社区):http://www.ituring.com.cn/book/1021
译者勘误页:http://ir.ict.ac.cn/~wangbin/mli-book
4.目录
第一部分 分类
第1章 机器学习基础
第2章 k-近邻算法
第3章 决策树
第4章 基于概率论的分类方法:朴素贝叶斯
第5章 Logistic回归
第6章 支持向量机
第7章 利用Adaboost元算法提高分类性能
第二部分 利用回归预测数值型数据
第8章 预测数值型数据:回归
第9章 树回归
第三部分 无监督学习
第10章 利用K-均值聚类算法对未标注数据分组
第11章 使用Apriori算法进行关联分析
第12章 使用FP-growth算法来高效发现频繁项集
第四部分 其他工具
第13章 利用PCA来简化数据
第14章 利用SVD简化数据
第15章 大数据与MapReduce
英文原版https://www.manning.com/books/machine-learning-in-action
书中的代码和所使用的数据集可以在主页或者这里(作者的GitHub版本库)找到。
书中有的代码均使用Python 2.7,并广泛使用了NumPy模块,若干章中还使用了Matplotlib模块进行绘图。可以安装Python 2.7的官方发行版,然后依次安装NumPy和Matplotlib模块(需要解决依赖)。现在比较流行的是Python3,所以在Python3环境下对书中的代码做了修改,可以直接运行,希望大家支持,觉得不错的话就鼓励一下吧。