知识图谱(Knowledge Graph kg)
--------------------------------
1.KG概念的演化
语义网络--->本体论--->Web--->the semantic Web--->链接数据--->知识图谱
2.KG辅助搜索
Web的理想是万物的链接,搜索的理想是事物的搜索,搜索的理想是事物的搜索
3.KG辅助问答
机器人以及loT设备的只能化:给万物都挂接一个知识背景库,对话式的获取更加需要精准度和可靠度,知识图谱对于提升用户体验更加必不可少
知识图谱(Knowage Graph,kg)
-----------------------------------------------
0.KG概念演化
语义网络(1960)--->本体论(1980)--->Web(1989)--->The Semantic Web(1998)--->链接数据(2006)--->知识图谱(2006)
在这个过程中,人工智能研究者陆续提出了大量的知识表示方法,如框架系统、产生式规则、逻辑描述等
知识图谱得益于Web的发展(更多的是数据层面),有着来源于KR、NLP、Web、AI等多个方面的基因
语义网:从链接文本到链接数据
谷歌知识图谱:Things not strings
1.KG辅助搜索:Web的理想是万物的链接,搜索的理想是事物的搜索
2.KG辅助问答:机器人以及loT设备的智能化,给万物都挂接一个背景知识库,对话式的信息获取更加需要提高精准度和可靠度,知识图谱对于用户体验的提升不可缺少
3.KG辅助决策:
4.KG辅助AI:常识的推理
当一个人听到一句话的时候,他使用自己所有的知识和智能去理解。这不仅包括语法,也包括它的词汇知识、上下文知识,更重要的,是对相关事务的理解
5.KG本质
------------------------------------
Web视角:像建立文本之间的超链接一样,建立数据之间的语义链接,并支持语义
nlp视角:怎么从文本中抽取语义和结构化数据
KR视角:怎么利用计算机符号来表示和处理知识
AI视角:怎么利用知识库来辅助理解人的语言
DB视角:用图的方式存储知识
做好KG要兼容并蓄,综合利用好KR、NLP、Web、ML、DB等多方面的方法和技术
6.各种知识图谱的项目。
6.1CYC
(1)CYC是在1984年由Douglas Lenat开始创建。最初的目的是建立人类最大的常识知识库。典型的常识知识如"Every tree is a plant","Plant die eventaully"等等
(2)CYC知识库主要由术语Terms和断言Assertions组成。Terms包含概念、关系和实体的定义。Assertions用来建立Terms之间的关系,这既包括了事实Fact描述,也包含了规则Rule的描述
(3)最新的CYC知识库包含了50万条Terms和700万条Assertions。CYC的主要特点是基于形式化的知识表示方法来刻画知识。形式化的优势是可以支持复杂的推理。但是过于形式化也会导致
知识库的扩展性和应用的灵活性不够。CYC提供开放版本OpenCyc.
6.2Wordnet
(1)Wordnet是最著名的词典知识库,主要用于词义的消歧
(2)Wordnet组要定义了名词、动词、形容词和副词之间的语义关系。例如名词之间的上下位关系(如:“猫科动物”是“猫”的上位词),动词之间的蕴含关系(如:“打鼾”蕴含着“睡眠”)等
(3)Wordnet3.0已经包含了15万个词和20万个语义关系
6.3zhishi.
6.4cnSchema:开放的中文知识图谱,
6.1cnSchema.org是一个基于社区维护的开放的知识图谱Schema标准。cnSchema分类,数据类型的词汇集包括了上千种概念pes、属性和关系等常用概念定义,以支持只是土偶的通用性、复用性和流动性
6.2结合中文的特点。我们复用、链接并扩展了Schema.org,Wikidata,Wikidata等已有的知识图谱Schema标准,为中文领域的开放知识图谱、聊天汲取人、搜索引擎的优化等提供了参考和扩展的数据描述和接口的定义标准
7.指示图的技术体系
KG Data更加规范的数据表达,更强的数据关联,主要急速包括:知识抽取,知识表示,知识问答,语义搜索,可视化,知识链接,知识推理,只是众包以及知识融合等。
8.RDF:Triple based Assertion modle知识表示三元组
Subject(主语)---Predicate(谓语)--->Object(宾语)
如:人工智能之父是图灵
9.SPARQL简介:
RDF的查询语言:基于RDF数据模型
可以对不同的数据集撰写复杂的连接
由所有主流的图数据库支持
Select ? name
WHERE{
?m <bornln> ?city. ?m <hasName> ?name.
?m<bornOnData> ?bd. ?city <foundingYear> ''1718''.
FILTER(regix(str(?bd),''1976''))
}
10.JSON-LD:数据格式交换
入语义数据和Resful Web Service
{
"@context":"http://json-ld.org/contexts/person.jsonld",
"@id":"http://dbpedia.org/resource/john_Lenon"
"name":"John Lennon",
"born":"1940-10-09"
"spouse":"http://dbpedia.org/resource/Cynthia_Lenon"
}
11.知识图谱的分布式表示-KG Embedding:在保留语义的同时,将知识图谱中的实体和关系映射到连续的稠密的低维向量空间
第二部分:典型案例的简介