简述
机器学习是人工智能的一种实现方式;深度学习是一种实现机器学习的技术,或者说是一种特殊的机器学习方法,可以说广义上的机器学习也包括了深度学习,三者的关系如下图所示:
从判别垃圾邮件到无人驾驶技术,机器学习在众多领域都有着广泛的应用,机器学习成就了今天的人工智能。
机器学习的本质
在以往的工程项目中,我们认为计算机程序只能严格执行我们让它做的事情——输入数据,输出计算结果。为了得出正确的结果,需要在程序中写大量的循环和判断,但是对于某些问题,这种方式将无法处理,比如如何判断一张照片中有没有大树?
对于人类来讲,可能在会走路的时候就认识了大树,然而我们并没有试图给小孩子灌输大树的定义,实际上大多数人都不能准确定义什么是大树,但是我们依然能够分辨:“哦,这就是大树”。联想小孩子学习的过程,是经过家长无数次的教导,告诉他:“嘿,宝贝,这一棵大树”,然后他慢慢学会了:“哦,这种东西就是大树”。当然,这种方式有时可能会出错,比如我的小孩在最近才能分清老虎和猫咪。
机器学习的本质就是让计算机模拟上述过程,让计算机“学习”,从而获得某种认知,通过这种认知判断新的事物。这种认知称为模型,用数学表示将是一个函数。
上述过程可以简述为:输入一堆相关数据,让计算机自行学习,得到一个可以判断新事物的模型:
使用机器学习时需要考虑三点:
- 必须存在一个模型;
- 这个存在的模型无法正确写出;
- 手里有足够多的关于这个模型的数据。
举例来说:
- 预测刚会走路的小孩会往哪个方向前进(不存在模型,前进方向不可预测)
- 计算加减乘除混合运算(可以正确写出模型)
- 外星人是否来袭(没有足够多的数据提供参考)
- 判断一个人的信誉是否优良以便对其发放信用卡(可以使用机器学习)
需要注意的是,除了第三点外,即使1,2都不是机器学习的必要条件,只是此时机器学习不是最佳实现方案。
在机器学习开始时,我们应当掌握多少数据?理论上,数据量应当能够恰好完美的得到某个模型;然而实际上可能只有很少的数据,但这并不妨碍开始机器学习。所以问题的答案只能是“具体情况具体分析”。
机器学习的种类
通常,机器学习可分为监督学习、非监督学习和强化学习。
监督学习
数据集中的每个样本有相应的“正确答案”,根据训练集得出模型,从而预测新数据。对于连续型数据的预测称为回归,对于离散型数据的预测称为分类。
非监督学习
给出一堆数据,我也不知道要预测什么,总之你自己预测吧,祝你好运。
强化学习
不断尝试新输入,对输出进行评分,每次都选取最高分,渐渐地,机器会只给出高分的答案。这和处于探索阶段的小孩子一样,碰到了仙人球,知道了坏的结果,从此将远离仙人球,然后不断尝试碰触新东西,逐渐知道很多东西不能碰。
出处:微信公众号 "我是8位的"
本文以学习、研究和分享为主,如需转载,请联系本人,标明作者和出处,非商业用途!
扫描二维码关注作者公众号“我是8位的”