人工智能在自然语言理解和处理上为什么发展缓慢?认知科学家 Gary Marcus 和纽约大学教授 Ernest Davis 在他们的新书《重启 AI》中指出,主要原因在于 AI 研究太过注重数学表达,而对创建认知模型却探究不多,错误地企图用统计数据来替代对现实世界的理解。
“深度学习在理解诸如句子之类的对象与它们的各个部分(如单词和短语)之间的关系时遇到了困难,”他们在书中写道。“为什么?它缺少语言学家所称的组合性:一种从其部分含义来构造复杂句子含义的方法。”
两位科学家指出,目前的深度学习模型没有对背景知识的理解,而是仅从训练示例中学习相关性。在处理简单的计算机视觉任务(例如,对图像进行分类和检测对象)时,这不会带来太大的问题。同样,在语言中,深度学习可以回答问题,而其答案直接包含在其文本语料库中。但是,当涉及到理解隐含和复杂的意义时,由于无法通过大量的示例进行训练,深度学习模型往往表现出怪异的行为。
目前,大多数 AI 研究人员一直在寻求通过获得更大的数据集和计算资源来解决问题。在他们看来,有了更多的数据,他们的 AI 最终将能够应对所有可能的极端情况。但是 Marcus 和 Davis 在《重启 AI 》指出:“统计数据无法替代对现实世界的理解。问题不仅在于到处都是随机错误,还在于满足翻译要求的统计分析与系统真正理解它们所需要的认知模型构建之间存在根本的不匹配。”
Marcus 和 Davis 在书中强调,如果这一状况没有根本性的改变,书籍将继续是人工智能的禁区。“没有强大的认知模型就不会有阅读。”他们说。
《重启 AI》讨论了创建强大的人工智能的可能途径,这种智能可以解决常识问题,不需要数百万个训练实例。这本书提供了大量关于我们如何从人类大脑的功能中学习来改变 AI 研究方法的细节。
【数字叙事 黎雾】