• 知识图谱学习笔记(1)


    知识图谱(Knowledge Graph kg)

    --------------------------------

      1.KG概念的演化

    语义网络--->本体论--->Web--->the semantic Web--->链接数据--->知识图谱

      2.KG辅助搜索

     Web的理想是万物的链接,搜索的理想是事物的搜索,搜索的理想是事物的搜索

        3.KG辅助问答

      机器人以及loT设备的只能化:给万物都挂接一个知识背景库,对话式的获取更加需要精准度和可靠度,知识图谱对于提升用户体验更加必不可少

    知识图谱(Knowage Graph,kg)
    -----------------------------------------------
    0.KG概念演化
    语义网络(1960)--->本体论(1980)--->Web(1989)--->The Semantic Web(1998)--->链接数据(2006)--->知识图谱(2006)
    在这个过程中,人工智能研究者陆续提出了大量的知识表示方法,如框架系统、产生式规则、逻辑描述等
    知识图谱得益于Web的发展(更多的是数据层面),有着来源于KR、NLP、Web、AI等多个方面的基因

    语义网:从链接文本到链接数据
    谷歌知识图谱:Things not strings

    1.KG辅助搜索:Web的理想是万物的链接,搜索的理想是事物的搜索
    2.KG辅助问答:机器人以及loT设备的智能化,给万物都挂接一个背景知识库,对话式的信息获取更加需要提高精准度和可靠度,知识图谱对于用户体验的提升不可缺少
    3.KG辅助决策:
    4.KG辅助AI:常识的推理
    当一个人听到一句话的时候,他使用自己所有的知识和智能去理解。这不仅包括语法,也包括它的词汇知识、上下文知识,更重要的,是对相关事务的理解

    5.KG本质
    ------------------------------------
    Web视角:像建立文本之间的超链接一样,建立数据之间的语义链接,并支持语义
    nlp视角:怎么从文本中抽取语义和结构化数据
    KR视角:怎么利用计算机符号来表示和处理知识
    AI视角:怎么利用知识库来辅助理解人的语言
    DB视角:用图的方式存储知识
    做好KG要兼容并蓄,综合利用好KR、NLP、Web、ML、DB等多方面的方法和技术

    6.各种知识图谱的项目。
    6.1CYC
    (1)CYC是在1984年由Douglas Lenat开始创建。最初的目的是建立人类最大的常识知识库。典型的常识知识如"Every tree is a plant","Plant die eventaully"等等
    (2)CYC知识库主要由术语Terms和断言Assertions组成。Terms包含概念、关系和实体的定义。Assertions用来建立Terms之间的关系,这既包括了事实Fact描述,也包含了规则Rule的描述
    (3)最新的CYC知识库包含了50万条Terms和700万条Assertions。CYC的主要特点是基于形式化的知识表示方法来刻画知识。形式化的优势是可以支持复杂的推理。但是过于形式化也会导致
    知识库的扩展性和应用的灵活性不够。CYC提供开放版本OpenCyc.
    6.2Wordnet
    (1)Wordnet是最著名的词典知识库,主要用于词义的消歧
    (2)Wordnet组要定义了名词、动词、形容词和副词之间的语义关系。例如名词之间的上下位关系(如:“猫科动物”是“猫”的上位词),动词之间的蕴含关系(如:“打鼾”蕴含着“睡眠”)等
    (3)Wordnet3.0已经包含了15万个词和20万个语义关系
    6.3zhishi.
    6.4cnSchema:开放的中文知识图谱,
    6.1cnSchema.org是一个基于社区维护的开放的知识图谱Schema标准。cnSchema分类,数据类型的词汇集包括了上千种概念pes、属性和关系等常用概念定义,以支持只是土偶的通用性、复用性和流动性
    6.2结合中文的特点。我们复用、链接并扩展了Schema.org,Wikidata,Wikidata等已有的知识图谱Schema标准,为中文领域的开放知识图谱、聊天汲取人、搜索引擎的优化等提供了参考和扩展的数据描述和接口的定义标准
    7.指示图的技术体系


    KG Data更加规范的数据表达,更强的数据关联,主要急速包括:知识抽取,知识表示,知识问答,语义搜索,可视化,知识链接,知识推理,只是众包以及知识融合等。
    8.RDF:Triple based Assertion modle知识表示三元组

    Subject(主语)---Predicate(谓语)--->Object(宾语)
    如:人工智能之父是图灵

    9.SPARQL简介:
    RDF的查询语言:基于RDF数据模型
    可以对不同的数据集撰写复杂的连接
    由所有主流的图数据库支持

    Select ? name
    WHERE{
    ?m <bornln> ?city. ?m <hasName> ?name.
    ?m<bornOnData> ?bd. ?city <foundingYear> ''1718''.
    FILTER(regix(str(?bd),''1976''))
    }
    10.JSON-LD:数据格式交换
    入语义数据和Resful Web Service
    {
    "@context":"http://json-ld.org/contexts/person.jsonld",
    "@id":"http://dbpedia.org/resource/john_Lenon"
    "name":"John Lennon",
    "born":"1940-10-09"
    "spouse":"http://dbpedia.org/resource/Cynthia_Lenon"


    }
    11.知识图谱的分布式表示-KG Embedding:在保留语义的同时,将知识图谱中的实体和关系映射到连续的稠密的低维向量空间

    第二部分:典型案例的简介

  • 相关阅读:
    【转载】兼容php5,php7的cURL文件上传示例
    解决CURL 请求本地超时
    PHP 二维数组根据某个字段排序
    JS监听输入框值变化兼容 onpropertychange、oninput
    PHP AES的加密解密-----【弃用】
    PHP 开发API接口签名验证
    Python 逐行修改txt每条记录的内容
    Python 修改电脑DNS
    带小数点时间分钟转换
    Python 判断字符串是否为数字
  • 原文地址:https://www.cnblogs.com/bigdata-stone/p/9606590.html
Copyright © 2020-2023  润新知