• 【NLP-2019-SA】解读A Unified Model for Opinion Target Extraction and Target Sentiment Prediction(AAAI)


    目录

    1. 研究背景
    2. 论文思路
    3. 实验结果
    4. 附件

    专业术语列表

    一、研究背景

    1.1 涉及领域,前人工作等

    本文主要涉及什么内容,那些人已经做了研究,目前遇到什么问题:

    本文主要涉及基于目标的情绪分析(Target-Based Sentiment Analysis (TBSA) ),前人已经基于目标的情感分析包括意见目标提取和目标情感分类。然而,现有的研究大多是单独研究这两个子任务中的一个子任务。第一个子任务:意见目标提取的目的是检测文本中提到的意见目标,近期研究有( Li et al. 2018b; Xu et al. 2018).第二个子任务:即目标情绪分类,可以预测给定意见目标的情绪极性,从而提高提取的目标提及的有用性。近期研究( Chen et al. 2017; He et al. 2018; Li et al. 2019)两个任务拆分不利于实际应用当然也有做融合的,后面对比再展开,效果不是很理想

    1.2 中心思想

    最好50字左右(目的、表征手段、解决啥问题、主要结论)本文为了解决什么问题,在这个基础上,使用了什么方法:

    本文在前人基础上,提出具有统一的标注方案。该框架的基本结构包括两个堆叠的LSTMs,分别用于执行辅助目标边界检测和完成TBSA任务。在基本模型的基础上,设计了两个组件,利用辅助任务中的目标边界信息,保持同一目标内词的情感一致性。以确保在边界信息的质量方面,采用了一个基于辅助意见的目标词检测组件来细化预测的目标边界。最终统一输出两个子任务结果,并且取得了较好的结果。

    二、论文思路

    2.1 框架图和重要部分

    文章主要框架图

    主要组成构建有:

    统一标签:Y^S={B-POS,I-POS,E-POS,S-POS,B-NEG,I-NEG,E-NEG,S-NEG,B-NEU,I-NEU,E-NEU,S-NEU,O}

    2LSTM^T预测辅助任务:

    3LSTM^s预测统一标签作为输出

    4、边界引导(Boundary Guidance BG)组件:利用辅助任务提供的边界信息,指导LSTM^s更准确地预测统一标签。

    5、情感一致性(Sentiment Consistency SC)组件:被赋予一个门机制,将前一个词的特征显式地集成到当前预测中,目的是在多个词的意见目标中保持情感的一致性。为了提供更高质量的边界信息。

    6、观点增强(Opinion-Enhanced OE)目标词检测组件:遵循"意见目标和意见词总是同时出现"的原则,执行另一个辅助的二进制分类任务,以确定当前词是否为目标词。

       

    我们将这两个LSTM层连接起来,使得LSTM^T生成的隐藏表示可以直接作为指导信息输入LSTM^S

    同时通过实验证明了后面三个组件的效果和作用。

    2.2 论文技术特点(对比文献)

    创新点有:

    (Zhang, Zhang, and Vo 2015)通过在CRF模型的解码步骤中添加硬边界约束,将这些边界信息合并。然而,他们的预测结果并不乐观。一个原因是他们的模型采用了一个硬约束,该约束容易传播边界检测任务标记器的错误,从而降低了TBSA标记器的性能。与施加硬约束的方式不同,我们提出的BG组件可以通过边界引导转换来自动吸收边界信息根据目标边界标记器的置信度确定其在最终标记决策中的比例。

    (Mitchell et al. 2013)使用条件随机场(CRF)和手工制作的语言特征来检测目标提及的边界并预测情感极性。(Zhang,Zhang,and Vo 2015)通过引入一个完全连接层来巩固语言特征和单词嵌入,进一步改进了基于CRF的方法的性能。然而,他们发现,在没有联合训练和统一模型的情况下,pipeline方法可以超越模型。在本文中,我们重新检查了该任务,并提出了一个新的统一解决方案,该解决方案执行了所有以前报告的方法。

    三、实验结果

    最终达到的效果和对比图,简单阐述

    四、附件

    4.1 Li X , Bing L , Li P , et al. A Unified Model for Opinion Target Extraction and Target Sentiment Prediction[J]. 2018.

    基于目标的情绪分析涉及意见目标的提取和目标情绪的分类。但是,大多数现有作品通常仅研究这两个子任务之一,这阻碍了它们的实际使用。本文旨在以端到端的方式解决基于目标的情感分析的全部任务,并提出了一种采用统一标记方案的新型统一模型。我们的框架涉及两个堆叠的递归神经网络:上层神经网络预测统一的标签,以产生基于目标的主要情感分析的最终输出结果;下层执行辅助目标边界预测,旨在指导上层网络以改善主要任务的性能。为了探索任务间的依赖性,我们建议对从目标边界到目标情感极性的约束转变进行显式建模。我们还建议通过门机制来维持观点目标内的情感一致性,该机制对当前单词和上一个单词的特征之间的关系进行建模。我们对三个基准数据集进行了广泛的实验,并且我们的框架始终如一地取得了优异的结果。

       

    参考文献:

    【1】论文下载: https://arxiv.org/abs/1811.05082?context=cs

    【2】论文的github地址 :https://github.com/lixin4ever/E2E-TBSA

  • 相关阅读:
    Python 描述符(descriptor) 杂记
    Celery 使用简介
    异步任务神器 Celery 简明笔记
    高性能框架gevent和gunicorn在web上的应用及性能测试
    Flask + Gunicorn + Nginx 部署
    Mysql查看最大连接数和修改最大连接数
    配置 influxDB 鉴权及 HTTP API 写数据的方法
    Java 字符串拼接 五种方法的性能比较分析 从执行100次到90万次
    linux端口开放指定端口的两种方法
    java自带的监控工具VisualVM一
  • 原文地址:https://www.cnblogs.com/yifanrensheng/p/13510875.html
Copyright © 2020-2023  润新知