OpenAI 能够撰写新闻故事,仿写小说,这意味着人工智能已经具备了一定水平的理解和处理自然语言的能力。由 Facebook AI、洛林研究实验室和伦敦大学的研究人员组成的研究团队现在又将 AI 的智能提升了一个台阶:玩基于文字的幻想游戏。这一研究结果表明 AI 已经获得了情境化的能力,未来或可建模一个完整的世界。
研究团队发表在预印本服务器 Arxiv.org 上的论文《在一个幻想性文字冒险游戏中学习说话和行动》,描述了他们如何创建文本游戏来研究 AI 说话和行动。
他们特别研究了基础对话对 AI 智能体理解周围虚拟世界的影响。基础对话是两个角色之间交流所必需的知识、信念和假设的集合。为此,他们以大规模、众包文本冒险游戏(《LIGHT》)的形式建立了一个研究环境,其中 AI 系统和人类作为玩家角色进行互动。
“目前的技术仅使用语言数据的统计规律,无法明确理解语言所描述的世界。”论文写道,“我们的框架允许从行动和对话中学习,希望《LIGHT》可以为人类互动带来乐趣,使我们在未来能够与模型互动。《LIGHT》中所有的话语都是由人类注释者产生的,从而继承了自然语言的模糊性和能指性等特性,是一个具有挑战性的语言和行为基础学习平台。”
人类注释员的任务是创建背景故事、地点名称、人物类别,以及人物列表、描述、角色和财产。然后,研究人员将不同的众包对象和相应的描述以及一系列动作(“得到”、“放下”、“放”、“给予”)和表情(“鼓掌”、“脸红”、“哭泣”、“皱眉”))分开。经过这些努力,《LIGHT》拥有了基于一系列区域和生物群落(如“乡村”、“森林”和“墓地”)的 663 个地点以及 3462 个物体和 1755 个角色的自然语言描述。
随着游戏世界边界的建立,研究团队开始编译“角色驱动”的交互数据集。他们让两个人类控制的角色在一个随机的位置上——每个角色都有分配给所在位置的对象和他们的人——轮流进行一个动作和说一件事。研究人员总共记录了 10777 个关于动作、表情和对话的片段,用来训练几个人工智能模型。
研究人员使用 PyTorch 机器学习框架(对话人工智能研究的框架),首先设计了一个人工智能模型,它可以为每个句子从基础信息(背景、人物、对象)和嵌入语境中生成单独的表示,从而为最有希望的候选词打分。他们建立了两个系统:一个叫 bi-ranker,他们将之描述为“快速”和“实用”的模式,另一个名为 cross-ranker 的较慢的模型,允许更多的互相关和响应之间的语境。最后,他们使用另一组人工智能模型来编码语境特性(如对话、角色和设置)并生成操作。
那么 AI 玩家的表现如何呢?相当出色。他们擅长依靠过去的对话,并根据游戏世界不断变化的状态调整自己的预测,而基于当地环境细节的对话——例如描述、对象和角色——能够让 AI 控制的代理更好地预测行为。
研究人员指出,这些模型都没有在性能上超过人类,但那些增加了更多基础信息(如过去的行为、角色或背景描述)的实验得到了显著改善。事实上,对于像对话预测这样的任务,AI 显示出即使对话和角色没有变化,也有产生适合给定设置的输出的能力,这表明它们已经获得了情境化的能力。
“我们希望这项工作能够使未来的研究扎根于语言学习,并进一步提高代理人共同建模一个完整世界的能力。”研究人员写道。(编译自 venturebeat.com)
【数字叙事 Lighting】