• 将上下文融入知识图谱以进行常识推理


    将上下文融入知识图谱以进行常识推理

    Fusing Context Into Knowledge Graph for Commonsense Reasoning 论文阅读笔记

    背景:很多方法结合了预训练模型和知识图谱,但是图谱缺乏上下文,对概念和关系理解不够准确。

    想法:利用外部实体描述来为图谱实体提供上下文信息。对于 CommonsenseQA 任务,主要步骤如下:

    1. 提取问题和选项中的概念,并找到与这些概念相关的三元组。
    2. Wkitionary 中提取这些概念的描述,将它作为三元组的附加的输入喂给预训练模型。

    Introduction

    仅通过图谱描述和相邻信息推理还是不充分,但是可以直接从外部源得到准确的定义。

    为了产生能无缝地整合到预训练模型的结构数据,我们需要提供每个概念在图谱中的全局视角,包括邻接概念、它们的关系以及一个明确的描述。为此作者提出了模型 DEKCOR:

    DEKCOR: DE-scriptive Knowledge for COmmonsense Reasoning

    1. 提取包含的概念;

    2. 从 ConceptNet 中提取问题概念选择概念之间的边;

      如果上述的边不存在,则为每个包括选择概念的三元组计算相关分数,取分数最高的一个。

    3. 通过多种文本匹配准则,从 Wkitionary取出这些概念的定义。

    4. 将问题、选项、选择的三元组和定义喂入 Albert,相关分数在后续的注意力和 softmax 层生成。

    Method

    问题定义:$$G = (V, E), Q, c_1, ..., c_n$$

    image-20201222200524963

    1 Knowledge Retrieval

    KCR 方法找 $$e_q$$ 到 $$e_c$$ 的边,如果存在直接的边则直接选择;否则取出 N 个包含 $$e_c$$ 的三元组,对每个三元组评分:

    三元组权重 $$w_j$$ ( 由 ConceptNet 提供 ),关系类型权重 $$t_{r_j}$$。关系类型权重 $$t_{r_j} = frac{N}{N_{r_j}}$$,即所有三元组的数量和这种关系三元组的数量之比。

    2 Contextual Information

    对于每个向量,选择其在 Wkitionary 的第一个结果的定义。

    通过如下顺序进行匹配:a) 原始形式,b) lemma form by Spacy, c) base word

    e.g. takes notes 找不到,但是 lemma 形式 take notes 在里面有,如此便得到其描述 To make a record of what one hears or observes for future reference.

    我们找到了所有实体的描述,问题和选择的概念的描述用 $$d_q$$ 和 $$d_c$$ 描述。

    最后,以 $$[CLS]Qc_i[SEP]e_q:d_q[SEP]e_c:d_c[SEP]triple$$ 格式输入 Albert。

    3 Reasoning

    在 Albert 的输出($$x_0,...,x_m$$)后面接上一个基于注意力的权重求和以及一个 softmax 层来生成 question-choice 对的相关分数。

    [q_i = u^TWx_i$$ $$alpha_i=softmax(q_i)$$ $$v=sum_{i=0}^{m}alpha_ix_i$$,其中 $$u$$ 和 $$W$$ 是参数。 ## Related Work Scalable multi-hop relational reasoning for knowledge-aware question answering. Unifiedqa: Crossing format boundaries with a single qa system. Connecting the dots: A knowledgeable path generator for commonsense question answering. Graph-based reasoning over heterogeneous external knowledge for commonsense question answering. Conceptnet—a practical commonsense reasoning tool-kit. Towards generalizable neuro-symbolic systems for commonsense question answering. Knowledge guided text retrieval and reading for open domain question answering. Atomic: An atlas of machine commonsense for if-then reasoning. Jaket: Joint pre-training of knowledge graph and language understanding Representation learning of knowledge graphs with entity descriptions.]

    原文发表于快刀切草莓君的个人网站 http://zrawberry.com
  • 相关阅读:
    网络流24题-运输问题
    ASP.NET API
    面向对象理解
    冒泡排序
    HTTP Header 缓存
    HTTP Header
    Flask学习笔记07之模板渲染
    Flask学习笔记06之@before_request请求之前执行
    Flask报错:AssertionError: View function mapping is overwriting an existing endpoint function: inner
    装饰器03之多个装饰器的执行顺序
  • 原文地址:https://www.cnblogs.com/Zaaachary/p/14175356.html
Copyright © 2020-2023  润新知