参考文章:推断速度达seq2seq模型的100倍,谷歌开源文本生成新方法LaserTagger
论文地址:https://research.google/pubs/pub48542/
开源地址:http://lasertagger.page.link/code
@inproceedings{48542,
title = {Encode, Tag, Realize: High-Precision Text Editing},
author = {Eric Malmi and Sebastian Krause and Sascha Rothe and Daniil Mirylenka and Aliaksei Severyn},
year = {2019},
URL = {https://arxiv.org/pdf/1909.01187.pdf},
booktitle = {Proc. EMNLP-IJCNLP 2019}
}
解决的问题:
- 生成的输出不受输入文本支持
- 需要大量数据才能提高速度
- 模型通常逐词生成输出,推断速度较慢
实验
模型在 WikiSplit 数据集上的结果,模型执行的任务是将一个长句子改述为两个连贯的短句。