• 论文阅读笔记:《Generating Question-Answer Hierarchies》


    题目:

    《Generating Question-Answer Hierarchies》

    作者:

    Kalpesh Krishna & Mohit Iyyer

    What:

    1.SQUASH(specificity-controlled Question-Answer Hierarchies)

    2.将输入文本转化成为具有一般、具体标签的层级问答对(自上而下的树形结构),用户可以点击一般问题进而展开得到具体的问题。

    3.用于解决SQUASH的流水线系统以及用于评估它的众包方法

    HOW:

    1.问题分类:将问题分为三个粗糙的标签:GENERAL、SPECIFIC、YES-NO,根据问题的特殊性对SQuAD、QuAC和CoQA 中的问题进行分类。不满足任何模板或规则的问题,手动标注1000条数据用CNN分类,最终将所有问题都运行了基于规则的方法,并将分类器应用于规则未涵盖的问题。

    2.生成QA对

    将段落中的每个句子作为潜在的答案范围,以及所有实体和数字(作为具体问题的答案)

    手动删除一些笼统的问题

    使用两层的biL-STM编码器和单层的LSTM解码器来生成问题,将解码器的特殊性级别设置为“一般”,“具体”和“是-否”。每个答案范围生成十三个候选问题。

    3.生成有层次的QA对

    为每一个具体问题泛化一个父问题,使每个一般问题的预测答案与预测答案的重叠(词级精度)最大化。如果没有与特定问题的答案重叠的一般问题的答案,将其映射到最接近的一般问题(要求其答案在特定问题的答案之前)。

    4.模型评估

    生成问题评估:使用众包实验在QuAC开发集的文档上评估了SQUASH流程

    结构正确性评估

    5.缺点:

    数据集存在缺陷、信息冗余、缺乏常识性知识、对于一个段落生成了多个QA对

    阅读过程中产生的疑问:

    1. 为什么使用top-10抽样方法?

    2. 问题是如何生成的?

    3. 为什么要以每个段落为一个范围进行问题的生成?若是用很多段论述同一个问题要如何解决?

  • 相关阅读:
    C++第11课 迭代器与仿函数 (二)
    C++第11课 迭代器与仿函数 (一)
    Python语法的应用
    Python面试
    02_Python之基础编程
    01_Python之_学前准备
    Sorting It All Out (拓扑排序) poj1094
    Codeforces Global Round 13 Editorial补题
    今天做题做到了并查集相关的内容~简单介绍一下关于并查集的东西
    留言板
  • 原文地址:https://www.cnblogs.com/lelezuimei/p/11871421.html
Copyright © 2020-2023  润新知