AI写作系统GPT2可深度造假,研发者决定暂不发布

非营利研究公司 OpenAI 研发出一种革命性的人工智能写作系统,可以撰写以假乱真的新闻故事和仿写名家小说作品。该系统被描述为“文本深度造假”(deepfake for text)工具。由于被恶意使用的风险非常高,创造者们决定暂不向公众发布完整的研究成果,以便有更多的时间来讨论技术突破所带来的影响。

该系统名为 GPT2,核心是一个文本生成器。输入从几个单词到一整页的文本,它会根据对未来的预测写出接下来的句子。从产出的质量看,该系统可能会被广泛用于潜在的造假,因为它能够编写与给定的样式和主题相匹配的似是而非的文章。

输入乔治·奥威尔的《一九八四》的开场白——“这是四月的一天,天气晴朗而寒冷,钟敲了十三下”——系统识别出模糊的未来主义基调和小说风格,并继续写道:“我在去西雅图找新工作的路上开着车。我把汽油放进去,把钥匙放进去,然后让它跑。我只是想象着那天会是什么样子。一百年后的今天。2045 年,我在中国农村的一所学校教书。我从中国历史和科学史开始。“

将《卫报》的一篇有关英国退欧报道的前几段就提供给它,它的输出是貌似可信的报纸文章,充斥着杰里米·科尔宾(Jeremy Corbyn)的引语、并提及爱尔兰边境,以及首相发言人的回答。其中一个段落写道:“需要澄清这些报道,梅的一位发言人说:‘首相已经明确表示,她的意图是尽快脱离欧盟……’”

据 OpenAI 研究主管达里奥·阿莫代(Dario Amodei)介绍,GPT2 的开创性主要在它的规模上。其模型“比之前最先进的人工智能模型大 12 倍,数据集大 15 倍,范围更广”。它是在一个包含约 1000 万篇文章的数据集上进行训练的,这些文章是通过搜罗社交新闻网站 Reddit 来挑选的。这个庞大的文本集合达 40GB,足够存储大约 35000 本《白鲸》。

【数字叙事 Lighting】

有问题和想法?与数字诗人讨论、交流,以获得更多的信息、意见。

赞赏
lighting
lighting
笛卡尔的“思”正在进入明斯基的“情感机器”
本文系数字叙事原创(编译)内容,未经授权,不得用于商业目的,非商业转载须注明来源并加回链。

6 评论

  1. […] 2019 年 2 月,OpenAI 公布GPT-2时曾表示,由于被恶意使用的风险非常高,暂不向公众发布完整的代码,以便有更多的时间来讨论技术突破所带来的影响。当年,该机构先后向公众免费发布了 GPT-2 的几个缩减版本。2019 年 8 月发布的版本包含 7.74 亿个参数,但仍不是完整版本,完整的模型包含大约 15 亿个参数。 […]

  2. […] OpenAI 的 GPT-2被视为世界上最好的文本生成器,你输入一个句子或一页文本,它会生成后续的内容,并遵循同一主题。由于它被用来制造假新闻的可能性很大,OpenAI 未向公众发布完整的代码,希望有更多的时间来讨论技术突破所带来的影响。现在,华盛顿大学的研究人员使用与 GPT-2 相同的 AI 技术,创建了 AI 模型 Grover,可以识别 GPT-2 等文本生成工具制造的假新闻。 […]

  3. […] 我们曾说过,自动写作对于人工智能研究者和开发者来说是个巨大的诱惑,如果是喜欢文学的研发者,这诱惑会更大:莎士比亚写了一堆喜剧、悲剧,还有诗歌,他不用写这些,他只要写个莎士比亚——可能比他更出色。研发者的努力和成就已经验证这一诱惑下的作为并不是胡闹。目前,AI 已经能够写出简短的诗句和散文,甚至能生成小说。 […]

订阅

受欢迎的

相关文章
Related