• 论文阅读(8)PDTB-style Discourse Annotation of Chinese Text(2012)


    PDTB-style Discourse Annotation of Chinese Text(2012)

    1h,科普

    Activation

    • 描述了一个汉语语篇标注方案,采用了词汇基础法(受PDTB启发);

    • 同时,它根据中文文本的语言和统计特征进行改编。

    • 提供了一个更广阔的视角,来研究 广义词汇基础方法,如何在 跨语言的篇章关系注释 的语境中充实自己。

    PDTB注释方案

    Annotation of sense:Class,Type,Subtype

    解决方案:Adapted scheme for Chinese

    3.1 Key characteristics of Chinese text

    • 中英文的差异


    • 汉语中,它们不仅仅以逗号分隔,而且没有连接它们的连接词

    • 汉语句子中 的 篇章关系在标注汉语时会丢失,而汉语句子中的 篇章关系 会在英语句子中按照程序被捕获。

    • 为了确保合理的覆盖率,我们需要在注释中文文本时考虑逗号分隔的句内隐含关系。

    3.2 Systematic adaptations(系统合成)

    3.2.1 Procedural division between explicit and implicit discourse relation(显性和隐性话语关系之间的程序划分)

    3.2.2 Annotation of implicit discourse relations(隐性篇章关系标注)

    3.2.3 Definition of Arg1 and Arg2

    没有意义,中文使用平行连接池。

    实验

    结论

    • 根据汉语特点改编,篇章关系是涉及两个论元的预测。谓语可以是隐性的或显性的,词汇化为篇章连接词(显性)。

    • 对篇章关系的Senses(不仅是连接词)进行注释,并且在篇章关系的两个论元在语义上被定义,使得 sense structure 更general,更少依赖连接词。

  • 相关阅读:
    Visual Studio IDE 背景色该为保护眼睛色
    搭建windows server 2008 r2 FTP 后 开启防火墙无法访问的解决办法
    Div+CSS展示物流跟踪轨迹信息
    如何删除打印队列中的任务
    用SoapUI进行Webservice的性能压力测试
    C# httpwebrequest post 传输百分号‘%’
    在线转换工具
    JSON数据转换到POCO的代码
    后端接口的幂等性(转)
    全局流水ID号生成的几种方法
  • 原文地址:https://www.cnblogs.com/douzujun/p/13832942.html
Copyright © 2020-2023  润新知