对话能力对人工智能很重要,这是为什么?

从历史上看,产业技术一直是关于功能和特性的。工程师和产品设计师会设想他们认为人们想要的新东西,弄清楚如何让它们运转,并据此制造新的和改进的产品。结果弄出了许多令人抓狂的东西。

当唐·诺曼(Don Norman)出版了他的经典著作《日常用品的设计》,并介绍了一些概念,比如“主导设计”、“可供性”和“自然映射”到工业设计中,这种情况才开始发生变化。这本书在很大程度上被认为是以用户为中心的设计运动的先驱。如今,用户体验已经成为一个欣欣向荣的领域。

然而,人工智能带来了新的挑战。我们说话或输入,并期望机器做出适当的响应。通常它们不这样做。随着像亚马逊 Alexa 和 Google Home 这样的智能语音助理越来越受欢迎,我们迫切需要明确人工智能交互原则。IBM 的两位研究人员已经开始了这方面的工作。

对话科学

20 世纪 80 年代末,鲍勃·摩尔(Bob Moore)作为一名本科生第一次接触到对话分析,他对此非常感兴趣,后来凭借在该领域的工作获得了博士学位。对于任何看过《宋飞正传》或《抑制热情》的人来说,对话的核心问题是众所周知的,我们的对话中充斥着复杂的不成文的规则,这些规则并不总是显而易见的。

例如,每一次对话都有一个未阐明的目标,无论是交换信息还是激发一种情绪。然而,我们的对话也受到了语境的影响。例如,对于一对朋友、老板和下属之间或在法庭、医生办公室的对话,不成文的规定将是不同的。

摩尔对我说:“对话分析基本上试图揭示的是人们在交谈时遵循的不成文的规则。”他很快发现,科技行业也开始提出类似的问题。于是,在 2012 年进入 IBM 之前,他先后在施乐帕克研究中心和雅虎任职。

在 IBM 正努力将沃森系统与其他行业的应用整合在一起时,他开始与备受赞誉的视觉设计师和用户体验专家拉斐尔·阿拉尔(Raphael Arar)合作。两人开始意识到,他们的兴趣奇怪地交织在一起,并形成了一种合作关系,为机器设计更好的对话。

制定参与规则

通常,我们使用自然语言界面,包括语音和文本,就像搜索框一样。我们宣布我们的意图是通过说“Hey Siri”或“Hey Alexa”来寻求信息,然后是一个简单的查询,比如“最近的星巴克在哪里”。这可能是有用的,特别是在开车或走在街上的时候,但也相当有限,尤其是对于更复杂的任务。

更有趣的——并且可能是更有用的——是能够将自然语言界面与其他界面(比如屏幕)结合起来使用。这就是对话分析和用户体验的结合变得重要的地方,因为它将帮助我们构建更复杂的人机交互的约定。

“我们想要提出一套明确的原则,来说明界面的各个方面是如何相互关联的。” 阿拉尔告诉我。“当有人点击一个按钮来启动一个动作时,对话会发生什么?”让这一切变得如此复杂的是,不同的对话必然会有不同的背景。

例如,当我们在手机上搜索一家餐厅时,屏幕是否会显示出地图、价格信息、食物图片、用户评分或某些组合?当我们在找医生、水管工或旅行目的地时,规则应该如何改变?

通过保存语境来获得意义

对话的另一个方面是,它们高度依赖于语境,它可以随着时间的推移而改变和发展。举个例子,如果我们问附近的餐馆,他们会问一个问题来缩小选择范围,比如“你在找什么样的食物?”如果我们回答“墨西哥人”,我们会希望那个人知道我们仍然对餐馆感兴趣,而不是墨西哥的经济或文化。

另一个问题是,当我们遵循一个特定的逻辑链时,我们经常会发现一些不合格的因素。例如,一个医生可能正在为他的病人寻找一个临床试验,找到一个看起来很有希望的,然后发现那个特别的研究已经结束。通常情况下,他必须重回溯他的步骤,才能找到其他的选择。

“一个真正的对话界面允许我们在交互的多个回合中保存语境,”摩尔说。“如果我们成功了,这台机器将能够适应用户的能力水平,有效地为专家服务,同时也能让新手通过系统,根据需要解释自己。”

这就是与计算机进行更自然对话的能力的真正潜力。就像和人类一起工作一样,我们越能交流,我们就越能从我们的关系中获得更多的价值。

使界面消失

在 web 可用性的早期,用户体验和设计之间存在着一种持续的紧张关系。媒体设计师们努力做到原创。另一方面,用户体验工程师则试图依照惯例。在 web 页面的右上角放置一个搜索框可能不是很有创意,但用户习惯在这里搜索内容。

然而,最终形成了一种富有成效的伙伴关系,如今大多数网站似乎都相当直观。我们大多知道事情应该在什么地方,并且可以很容易地驾驭事物。现在的挑战是为人工智能构建同样的体验,这样我们与技术的关系就变得更加自然和有效。

“就像 20 年前我们开始使用传统网站的用户体验一样,我们希望用户界面消失。” 阿拉尔说。因为当我们不与界面搏斗,无需不断地重复自己或者弄清楚如何重新表述我们的问题时,我们可以使我们的互动更有效率和富有成果。

正如摩尔对我说的,“今天的系统大部分价值都被锁定在数据中,而且,这些数据每年都在增加,潜力也随之逐年增大。然而,我们从这些数据中获得价值的能力受到用户界面有效性的限制。我们越能让界面变得智能,并在很大程度上使其消失,我们能解锁的价值就越高。”

【数字叙事 原作:Greg Satell;编译:Lighting】

有问题和想法?与数字诗人讨论、交流,以获得更多的信息、意见。

赞赏
lighting
lighting
笛卡尔的“思”正在进入明斯基的“情感机器”
本文系数字叙事原创(编译)内容,未经授权,不得用于商业目的,非商业转载须注明来源并加回链。

订阅

受欢迎的

相关文章
Related