作为机器学习基础学习的开篇,记录一下自己对于机器学习基础的认识和实践选择。
参考书目:
机器学习实战
这里也给出电子版本的中英文pdf文件和code:here(azkx) 我不会告诉你Ctrl+A会有其它发现~
1、基础
对于机器学习的相关方法,最直观的认识是可以将其分为有监督和无监督两大类,可以使用思维导图来直观表示:
(使用MindNode来绘制的思维导图,源文件在这里)
其实在实际使用中,分类的方法和回归的方法的分界并不明显,有时还会结合起来使用的。
具体的开发步骤大致有这些过程:
①、收集获取数据
②、准备输入数据
③、分析预处理输入数据
④、训练算法-->无监督算法无需训练过程,核心内容集中在⑤
⑤、测试算法
⑥、使用算法
2、实践
目前机器学习的很多实践都是在Python上实现的,所以选择Python是理所当然的。
可能会使用到的Python第三方库有:
Numpy、Scipy、Matplotlib、Pandas、StatsModels、Scikit-Learn、Keras、Gensim等。