初学机器学习时,你可能对于机器学习是什么,什么是机器学习不甚了解。
结合机器学习中文的概念以及我个人的理解,我个人觉得。机器学习就是指利用计算机从一大推数据中发现可用规则。并对该规则加以应用的过程。所以机器学习的重点是怎样发现规则以及怎样应用规则。
假设你常常阅读英文的机器学习资料,你会发现有这么一句话"A computer program is said to learn experieces E with respect to some class of tasks T and performance measure P,if its performance at tasks in T,and measured by P,improves with experience E. "是老外对于机器学习的解释。不论什么高深的事务的本质事实上就是简单规则的应用。
那么了解了机器学习的概念后。怎样更加深入的了解她呢?
主流社会将她分为三种类型:
第一种,监督学习类型,即给你的一大堆数据都是人为确定了类型的,对于学习效果是能够做出评价的,常见的类型就是回归分析和统计分类。
另外一种,无监督学习类型。可想而知。就是有别于监督学习的,未对数据标记类型信息,常见的类型就是聚类。
第三中,半监督学习类型,那就是监督与无监督学习的灵活运用了,介于两者之间的一种类型。
眼下。已经成熟的机器学习算法主要有一下几种:
一、构造条件概率:回归分析和统计分类
1、人工神经网络
2、决策树
3、高斯过程回归
4、线性判别分析
5、近期邻居法
6、感知器
7、径向基函数核
8、支持向量机
二、通过再生模型构造概率密度函数
1、最大期望算法
2、Graphical model:包含贝叶斯网和马尔科夫随机场
3、Generative Topographic Mapping
三、近似判断技术
1、马尔科夫链蒙特卡罗方法
2、变分法
当你了解完上述的全部算法的提出背景之后,你就掀起了她脸上的轻纱,见其惊世面容了。