很多人很疑惑为什么AI,机器学习,深度学习这么火,很多人搞却不知道都是什么,特意抽了些时间写了这个博文,带你了解一下科研的前沿阵地。
前言
人工智能的浪潮正在席卷全球,诸多词汇时刻萦绕在我们耳边:人工智能(Artificial Intelligence)、机器学习(Machine Learning)、深度学习(Deep Learning)。
在下文人工智能和AI可能会交替使用,但是意思是一样对的。
不少人对这些高频词汇的含义及其背后的关系总是似懂非懂、一知半解。为了帮助大家更好地理解这些概念,在这篇文章中我讲尽量用最简单的语言解释了这些词汇的含义,理清它们之间的关系,希望对兴趣爱好者或者刚入门的同行有所帮助。
概述
AI是未来,是科幻小说,是我们日常生活的一部分。所有论断都是正确的,只是要看你所谈到的AI到底是什么。
例如,2015年11月9日,Google发布人工智能系统TensorFlow并宣布开源。这两年在不管在国内还是在国外,人工智能、机器学习和深度学习仿佛一夜之前传遍大街小巷。机器学习作为人工智能的一种类型,可以让软件根据大量的数据来对未来的情况进行阐述或预判。如今,领先的科技巨头无不在机器学习下予以极大投入。Facebook、苹果、微软,甚至国内的百度,Google 自然也在其中。
例如,去年早些时候,当谷歌 DeepMind 开发的 AlphaGo 程序在举世瞩目的围棋比赛中打败韩国职业围棋高手 Lee Se-dol ,媒体在描述 DeepMind 的胜利时用到了人工智能、机器学习、深度学习等术语,来解释 DeepMind 获胜的原因,并将它们混为一谈。AlphaGo 之所以打败 Lee Se-dol ,这三项技术都立下了汗马功劳,但是三者其实不是一回事。
要搞清它们的关系,最直观的表述方式就是同心圆,最先出现的是理念,然后是机器学习,当机器学习繁荣之后就出现了深度学习,今天的AI大爆发是由深度学习驱动的。
区别与联系
本文借助 Michael Copeland 的讲解,让我们根据人工智能、机器学习和深度学习的概念,深入理解它们的关系和区别。为了搞清三者关系,我们来看一张图:
如图所示:人工智能最大,此概念也最先问世;然后是机器学习,出现的稍晚;最后才是深度学习。
从低潮到繁荣
自从 1956 年计算机科学家们在达特茅斯会议(Dartmouth Conferences)上确认人工智能这个术语以来,AI由此诞生,在随后的日子里,AI成为实验室的“幻想对象”,研究人员也在不遗余力地研究。在此后的几十年间,人们对AI的看法不断改变,有时会认为AI是预兆,是未来人类文明的关键;有时认为AI只是技术垃圾,只是一个轻率的概念,野心过大,注定要失败。坦白来讲,直到2012年AI仍然同时具有这两种特点。
总结来说,AI先是被捧为人类文明光明未来的钥匙,后又被当作过于自大的异想天开而抛弃。
但是在过去几年中,AI出现了爆炸式的发展,尤其是 2015 年之后。大部分原因,要归功于图形处理器(GPU)的广泛应用,使得并行处理更快、更便宜、更强大。另外,AI的发展还得益于几乎无限的存储空间和海量数据的出现(大数据运动):图像、文本、交易数据、地图数据,应有尽有。
据领英发布的《全球AI领域人才报告》显示,截至2017年一季度,基于领英平台的全球AI领域技术人才数量超过190万,仅国内AI人才缺口达到500多万。
人工智能的研究领域也在不断扩大,下图中展示了人工智能研究的各个分支,包括专家系统、机器学习、进化计算、模糊逻辑、计算机视觉、自然语言处理、推荐系统等。
下面我们从发展的历程中来一一展开对人工智能、机器学习和深度学习的深度学习。
AI:让机器展现出人类智力
回到1956年夏天,AI先驱们在达特茅斯开会时,心中的梦想是希望通过当时新兴的计算机,打造拥有相当于人类智能的复杂机器。这就是我们所说的强人工智能(General AI)概念,拥有人类五感(甚至还可以超越人类感知)、推理能力以及人类思维方式的神奇机器。在电影中我们已经看过无数这样的机器人:对人类友好的 C-3PO,以及人类的敌人终结者。强人工智能机器至今只存在于电影和科幻小说里,理由很简单:我们还实现不了,至少目前为止。
还有一个概念弱人工智能(Narrow AI),简单来说,就是我们力所能及的:执行特定任务的水平与人类相当,甚至超越人类的技术。现实中有很多弱人工智能的例子如:Pinterest 服务用 AI 给图片分类,Facebook 用 AI 识别脸部,这就是弱人工智能。这些技术有人类智能的一面。
但是它们是如何做到的?智能来自哪里?带着问题我们深入理解,就来到下一个圆圈,它就是机器学习。
机器学习:抵达AI目标的一条路径
机器学习是实现人工智能的一种方法。
大体来讲,机器学习就是用算法真正解析数据,不断学习,然后对世界中发生的事做出判断和预测。此时,研究人员不会亲手编写软件、确定特殊指令集、然后让程序完成特殊任务,相反,研究人员会用大量数据和算法“训练”机器,让机器学会如何执行任务。
机器学习的概念来自早期的人工智能研究者,在过去几年里,机器学习出现了许多算法方法,已经研究出的算法包括<font color#0099ff size=4 >决策树学习、归纳逻辑编程、增强学习和贝叶斯网络等。正如大家所知的,没有人真正达到强人工智能的终极目标,采用早期机器学习方法,我们连弱人工智能的目标也远没有达到。
在过去许多年里,计算机视觉一直是机器学习最佳的领用领域之一,尽管要实现计算机视觉,研究人员仍然需要手动编写大量代码才能完成任务。研究者会手动编写一些分类器(classifier),如边缘检测筛选器,帮助程序辨别物体的边界;图形检测分类器,判断物体是否有八个面;以及识别“S-T-O-P”的分类器。在这些手动编写的分类器的基础上,研究人员可以开发出算法识别有意义的形象,然后学会下判断,确定它不是一个停止标志。
但是由于计算机视觉和图像检测技术的滞后,经常容易出错。如果是在雾天,当标志的能见度比较低,或者一棵树挡住了标志的一部分,它的识别能力就会下降。
传统的机器学习算法在指纹识别、基于Haar的人脸检测、基于HoG特征的物体检测等领域的应用基本达到了商业化的要求或者特定场景的商业化水平,但每前进一步都异常艰难,直到深度学习算法的出现。
深度学习:实现机器学习的技术
深度学习是实现机器学习的一种技术。
早期机器学习研究者中还开发了一种叫人工神经网络的算法,但是发明之后数十年都默默无闻。神经网络是受人类大脑的启发而来的:神经元之间的相互连接关系。但是,人类大脑中的神经元可以与特定范围内的任意神经元连接,而人工神经网络中数据传播要经历独立的层、连接,还有数据传播方向。
举个例子,你你可能会抽取一张图片,将它剪成许多块,然后植入到神经网络的第一层。第一层独立神经元会将数据传输到第二层,第二层神经元也有自己的使命,一直持续下去,直到最后一层,并生成最终结果。
每个神经元都会对输入的信息进行权衡,确定权重,搞清它与所执行任务的关系:相对于执行的任务该神经元的正确和错误程度。最终的输出由所有的权重共同决定。因此,我们再来看看上面提到的停止标志示例。一张停止标志图像的属性,被一一细分,然后被神经元“检查”:八角形形状、红色颜色、与众不同的字符、交通标志大小和是否运动、手势等。神经网络的任务是判断这是否是一个停止标志。它将给出一个“概率向量”(probability vector),这其实是基于权重做出的猜测结果。在本示例中,系统可能会有 86% 的把握认定图像是一个停止标志,7% 的把握认为是一个限速标志,有5%的信心确定它是一支风筝卡在树上,等等。然后网络架构会告知神经网络其判断是否正确。
不过,即使只是这么简单的一件事也是很超前的,不久前,AI研究社区还在回避神经网络。在AI发展初期就已经存在神经网络,但是它并没有形成多少“智力”。问题在于即使是最基础的神经网络也要耗费巨大的计算资源,因此当时不算是一个可行的方法,也就无法成为一种实际的方法。不过,尽管如此,还是有少数研究团队勇往直前,以多伦多大学 Geoffrey Hinton 教授为首的一小批狂热研究者们坚持采用这种方法,最终让超级计算机能够并行执行该算法,并证明该算法的作用。
如果我们回到停止标志那个例子,神经网络很有可能受训练的影响,给出错误的答案;如果我们对网络进行训练,用大量的错误答案训练网络,调整网络,结果就会更好;这说明网络还需要不断的训练。
研究人员需要做的就是训练,他们需要收集成千上万张图片,甚至数百万张图片来训练,直到神经元输入的权重调整到非常精确,几乎每次都能够给出正确答案——不管是有雾还是没雾,是阳光明媚还是下雨都不受影响。这时神经网络就可以自己“教”自己,搞清停止标志的到底是怎样的;Facebook 利用神经网络识别人脸图像;吴恩达(Andrew Ng)2012 年在谷歌实现了让神经网络识别猫。
如今,深度学习可以摧枯拉朽般地实现了各种任务。比如在某些情况下,在某些场景中,通过深度学习训练过的机器在图像识别上表现优于人类,这包括识别猫、识别血液中的癌细胞特征、识别MRI扫描图片中的肿瘤。谷歌的 AlphaGo 学会了围棋,并为比赛进行了大量的训练:不断的和自己下围棋并从中学习。
总结与展望
有了 深度学习, 机器学习才有了许多实际的应用,它还拓展了 人工智能的整体范围。 深度学习将任务分拆,使得各种类型的机器辅助变成可能。 而人工智能的根本在于智能,机器学习则是部署支持人工智能的计算方法。
随着机器翻译、无人驾驶汽车、卫生保健、网络安全、营销个性化、金融交易等行业,要么已经出现,要么即将出现。AI既是现在,也是未来。也许有一天智能家居是每个人的必须品,科幻小说中的一切都是生活的常态,也许未来就在眼前。
思考
目前,业界有一种错误的较为普遍的意识,即“深度学习最终可能会淘汰掉其他所有机器学习算法”。这种意识的产生主要是因为,当下 深度学习在计算机视觉、自然语言处理领域的应用远超过传统的机器学习方法,并且媒体对 深度学习进行了大肆夸大的报道。
深度学习大佬 Yoshua Bengio 在 Quora 上回答一个类似的问题时,有一段话讲得特别好,这里引用一下,以回答上述问题:
Science is NOT a battle, it is a collaboration. We all build on each other’s ideas. Science is an act of love, not war. Love for the beauty in the world that surrounds us and love to share and build something together. That makes science a highly satisfying activity, emotionally speaking!
这段话的大致意思是:
科学不是战争而是合作,任何学科的发展从来都不是一条路走到黑,而是同行之间互相学习、互相借鉴、博采众长、相得益彰,站在巨人的肩膀上不断前行。科学是热爱和 love 的行为而不是战争。爱我们周围世界的美丽,爱分享和建立在一起的东西。从情感上来说,科学是一项非常令人满意的活动!
机器学习的研究也是一样,你死我活那是邪教,开放包容才是正道。
结合机器学习2000年以来的发展,再来看Bengio的这段话,深有感触。进入21世纪,纵观机器学习发展历程,研究热点可以简单总结为2000-2006年的流形学习、2006年-2011年的稀疏学习、2012年至今的深度学习。未来哪种机器学习算法会成为热点呢?深度学习巨头之一吴恩达曾表示,“在继深度学习之后,迁移学习将引领下一波机器学习技术”。但最终机器学习的下一个热点是什么,谁又能说得准呢。
AI课程推荐