人工智能对自然语言的理解有了新的突破,美国密歇根大学和谷歌大脑的数据科学家研发了一种机器学习架构,不仅能够生成给定样本的句子,而且能在保留其原意的同时改变原始文本的语气、时态,甚至情绪。
这一成果被描述在蒙特利尔 NeurIPS 2018 会议接受的一篇论文——《内容保留文本生成与属性控制》中。在转述、翻译和会话系统上,它将大有用处。还可以增强微软研究院去年 11 月演示的那些系统,这些系统利用复杂的自然语言处理技术,对弱结构化文本中的关系进行推理。
“在这项研究中,我们解决了修改句子文本属性的问题,”研究人员写道。“……我们演示了首个机器学习在没有并行数据的情况下修改给定句子的多个文本属性的实例。”
研究团队首先解决了情绪控制的问题。他们分别从一个餐馆评论数据集(Yelp 评论数据集过滤版本)和一个 IMDB 电影评论的大集合中分别获取了 44.7 万句和 30 万句的评论,并用这些评论来训练系统。
在训练结束后,研究人员利用一个包含 12.8 万个餐馆评论和 3.6 万个电影评论的测试数据集,试图从带有负面情绪的句子中生成带有正面情绪的文本片段,反之亦然。
根据在 BLEU(“双语评估替补”的英文缩写,是评估机器翻译文本的标准指标)上进行的评估,AI 系统能够超越目前两种领先的文本生成方法。此外,它始终能生成与输入句子相关的语法正确的句子——以至于亚马逊 Mechanical Turk 上的研究参与者认为它的输出比以前的方法更真实。
生成的句子出人意料地连贯。例如,“柜台后面的人一点也不友好”变成了“柜台后面的人非常友好,乐于助人”。在另一个例子中,这个模型反过来将“这是这部电影的另一个有趣的方面”,变成了“这部电影没有可取之处”。
更令人惊讶的是,在另一项测试中,研究人员使用该系统同时控制句子的多个属性——包括语气、时态、声调和情绪。在用来自多伦多图书语料库的 200 万段文本片段数据集进行训练后,该模型能够将句子从未来时态的指示性语气(“约翰无法在营地生存”)翻译成条件时态的虚拟语气(“约翰不能住在营地”)。
“我们证明,我们的模型通过各种实验和指标有效地反映了条件信息,”研究人员写道。“虽然之前的工作集中在控制单个属性和在两种风格之间传递,但是所提出的模型很容易扩展到多个属性场景。在这个框架中考虑具有连续值的属性以及更大的语义和语法属性集将是一项有趣的未来工作。”
【数字叙事 Lighting】