OpenAI新AI模型能对上千页的书籍进行自动摘要和概述

简单的文本摘要和文本内容简介的自动创建已在诸多领域使用,OpenAI 正在研发的一种新的 AI 模型能满足更高的需求——对上千页的书籍进行自动摘要和概述。

新 AI 模型使用的是文本 AI 模型 GPT-3 的一个专门的变体,该变体已经可以创建基本摘要。对于新书 AI,OpenAI 依赖于扩展的训练方法和迭代的文字处理过程。

事实上,在推出 GPT-2 之后,OpenAI 即开始尝试书籍摘要。2019 年 10 月,Open AI 展示了经过人工反馈训练的 GPT-2 版本。这种强化学习的变体使用将近 60,000 条人工对生成的摘要的反馈作为训练信号。大约一年后,出现了另一个版本,该版本的 AI 模型从人类反馈中学习,然后作为 GPT-2 的训练信号。

对于新模型的 AI 训练,OpenAI 再次依靠人类反馈的强化学习。然而,对书籍内容摘要或概述的质量评估的要求要高得多,因为人们需要完整地阅读这本书。因此 OpenAI 使用了一个迭代过程,其中 AI 模型首先将整本书分成几部分进行总结,然后从创建的部分摘要或概述中创建整本书的摘要或概述。这样做,还绕过了 GPT-3 等互感器模型的上下文限制。

对于 AI 训练和后续测试,OpenAI 仅使用了《爱丽丝梦游仙境》或《罗密欧与朱丽叶》等叙事作品。各部分的个人摘要和最终结果由人们评估并用作训练信号。

除了强化学习之外,OpenAI 还测试了其他学习方法,并且分别训练了两个具有 1750 亿和 60 亿参数的变体。然而,这些方法的表现要差得多。【本文最初发布于反讽机器

有问题和想法?与数字诗人讨论、交流,以获得更多的信息、意见。

赞赏
黎雾
黎雾
技术一直以来都是艺术不可或缺的因素
本文系数字叙事原创(编译)内容,未经授权,不得用于商业目的,非商业转载须注明来源并加回链。

订阅

受欢迎的

相关文章
Related