期刊:ACL2018
类型:通过emoji为情感标签进行对话生成
特点:数据集无需人工标注情感
本文带来Xianda Zhou, William Yang Wang共同创作的文章
生成情感语言是构建具有同理心的自然语言处理代理的关键一步。然而,这一研究方向的一个主要挑战是缺乏大规模的标记训练数据,而之前的研究仅限于少量的人类注释情感标签。此外,明确控制生成文本的情绪和情绪也很困难。在本文中,我们采取了一种更激进的方法:我们利用利用自然标记为表情符号的 Twitter 数据的想法。
我们收集了大量 Twitter 对话语料库,其中包括响应中的表情符号,并假设表情符号传达了句子的潜在情感。我们研究了几个对这些对话进行训练的条件变分自动编码器,这使我们能够使用表情符号来控制生成文本的情绪。通过实验,我们在定量和定性分析中表明,所提出的模型可以根据指定的情绪成功地生成高质量的抽象对话响应。