2020 年 3 月,清华大学计算机系唐杰教授在中科院“先导杯”并行计算应用大奖赛启动仪式带来《人工智能下一个十年》的主题报告。介绍了认知图谱,核心概念为知识图谱+认知推理+逻辑表达
PPT下载链接: https://pan.baidu.com/s/18jvujS5EM351h4Vus-uhSg 提取码: 14w3
近年来,人工智能掀起了第三次浪潮,各个国家纷纷制订了人工智能的发展战略。在这个时代背景下,我们需要考虑人工智能未来十年会怎样发展。
深入分析 AI 近十年的发展,会看到一个重要的标志:人工智能在感知方面取得重要成果。人工智能在语音识别、文本识别、视频识别等方面已经超越了人类,可以说 AI 在感知方面已经逐渐接近人类的水平。从未来的趋势来看,人工智能将会有一个从感知到认知逐步发展的基本趋势。
可以把深度学习算法归类为这四个脉络,而这四个方面都取得了快速的进展。最上面浅紫色部分的内容是以前向网络为代表的深度学习算法。第二层淡绿色部分的内容表示一个以自学习、自编码为代表的学习时代。第三层橘色部分的内容代表自循环神经网络(概率图模型的发展)的算法。最下面粉色部分是以增强学习为代表的发展脉络。
如果再深入追溯最近几年最重要的发展,会发现 BERT 是一个典型代表。以 BERT 为代表的预训练算法得到了快速的发展,基本上所有的算法都采用了预训练+微调+ Fine tune 的方法。BERT 在 2018 年年底通过预训练打败了 NLP 上 11 个任务的经典算法;XLNet 在 2019 年提出来通过双向网络的方法超过了 BERT。再后来,ALBERT 又超过了 XLNet 和原始的 BERT。整个 BERT 的发展引发了后续一系列的工作。
DeepMind 又把代表性的关联关系生成到 graph_net 中,于是在网络中可以实现一定的推理。最近,Facebook 的何恺明提出了以 contrastive learning 为基础的 MoCo 及 MoCo2,在很多无监督学习(Unsupervised learning)的结果上超过了监督学习(Supervised learning),这是一个非常重要的进展,这也标志着预训练达到了一个新的高度。Hinton等人利用 SimCLR,通过简化版的 contrastive learning 超过了 MoCo,后来 MoCo2 又宣称超过了 SimCLR。总体来看,在算法的时代,预训练算法取得了快速的进展。那么未来十年,AI 将何去何从?
这里引用下张钹院士提出来的第三代人工智能的理论体系,核心思想为:(1)建立可解释、鲁棒性的人工智能理论和方法。(2)发展安全、可靠、可信及可扩展的人工智能技术。(3)推动人工智能创新应用。
其中具体实施的路线图如下:(1)与脑科学融合,发展脑启发的人工智能理论。(2)数据与知识融合的人工智能理论与方法。
在这个思想框架下,我们做了一定的深入研究,我们称之为认知图谱(Cognitive Graph)。其核心概念是知识图谱+认知推理+逻辑表达。
知识图谱大家很熟悉,是谷歌在 2012 年提出来的。这其中有两个重磅的图灵奖获得者:一个是爱德华·费根鲍姆(1994 年图灵奖得主),他在 20 世界 60 年代就提出来了知识库的一些理论体系和框架;另一个是 1994 年蒂姆·伯纳斯·李(2016 年图灵奖得主、WWW 的创始人、语义网络的创始人)。这里面除了知识工程、专家系统,还有一个代表性的系统 CYC,CYC 可以说是历史上持续时间最长的项目,从 1985 年开始,这个项目直到现在还一直在持续。
下面介绍一下认知图谱,这里举一个例子来说明一下。假如我们要解决一个问题“找到一个 2003 年在洛杉矶的 Quality 咖啡馆拍过电影的导演(Who is the director of the 2003 film which has scenes in it filmed at The Quality Cafe in Los Angeles)”。如果是人来解决这个问题的话,可能是先追溯相关的文档,如 Quality 咖啡馆的介绍文档,洛杉矶的维基百科页面等,我们可能会从中找到相关的电影,如 Old School ,在这个电影的介绍文档里面,我们可能会进一步找到该电影的导演 Todd Phillips,经过比对电影的拍摄时间是 2003 年,最终确定答案是 Todd Phillips。
当我们用传统算法(如 BIDAF, BERT, XLNet)进行解决的时候,计算机可能只会找到局部的片段,仍然缺乏一个在知识层面上的推理能力,这是计算机很欠缺的。人在这方面具有优势,而计算机缺乏类似的能力。
人在解决上述问题的过程中存在推理路径、推理节点,并且能理解整个过程,而 AI 系统,特别是在当下的 AI 系统中,深度学习算法将大部分这类问题都看作是一个黑盒子。
怎么办呢?对此,我们提出了“认知图谱”这个概念,希望用知识表示、推理和决策,包括人的认知来解决上述问题。
这个基本的思想是结合认知科学中的双通道理论。在人脑的认知系统中存在两个系统:System 1 和 System 2,如下图所示。System 1 是一个直觉系统,它可以通过人对相关信息的一个直觉匹配寻找答案,它是非常快速、简单的;而 System 2 是一个分析系统,它通过一定的推理、逻辑找到答案。
在 NIPS 2019 上,图灵奖获得者 Bengio 在大会的 Keynote 也提到,System 1 到 System 2 的认知是深度学习未来发展的重要的方向。
因此,我们大概用这个思路构建了这个新的、我们称为认知图谱的这样一个方法。在 System 1 中我们主要做知识的扩展,在 System 2 中我们做逻辑推理和决策
可以看到,我们在 System 1 中做知识的扩展,比如说针对前面的问题,我们首先找到相关的影片,然后用 System 2 来做决策。如果是标准答案,就结束整个推理的过程。如果不是标准答案,而相应的信息又有用,我们就把它作为一个有用信息提供给 System 1,System 1 继续做知识的扩展,System 2 再来做决策,直到最终找到答案。
现在,在这两个系统中,System 1 是一个直觉系统,我们用 BERT 来实现,实现了以后,我们就可以做相关的信息的匹配;System 2 就用一个图卷积网络来实现,在图卷积网络中可以做一定的推理和决策。通过这个思路,我们就可以实现一定的推理+决策。
这是一个总体的思路,要真正实现知识和推理,其实还需要万亿级的常识知识库的支持,如下图所示。也就是说,四五十年前费根鲍姆做过的事情,也许我们现在要重做一遍,但是我们要做到更大规模的常识知识图谱,并且用这样的方法,用这样的常识知识图谱来支撑上面的深度学习的计算,这样才能真正实现未来的 AI。
所以说,这一代人工智能浪潮也许到终点还是没有推理能力,没有可解释能力。而下一波人工智能浪潮的兴起,就是实现具有推理、具有可解释性、具有认知的人工智能,我们认为这是 AI 下一个 10 年要发展、也一定会发展的一个重要方向。