一种新的AI系统可以根据语言描述来生成图像

一种新的 AI 系统可以根据语言描述来生成图像。该 AI 系统名为 RetrieveGAN，由谷歌、加利福尼亚大学、默塞德大学和延世大学的研究人员创建，可用于艺术、设计或市场营销等领域。RetrieveGAN 的工作分为三个步骤进行：理解描述、搜索匹配的图像块和生成图像。此技术才刚刚起步，未来可能会彻底改变我们与媒体打交道的方式。

类似的 AI 已经存在，如微软研究院、京东人工智能研究院和奥尔巴尼大学的研究人员创建的机器学习框架ObjGAN，可以理解文字，草图布局，并根据确切的措辞来构建场景。但是 RetrieveGAN 的开发者承诺会有更好的结果，因为这一 AI 可以学习选择匹配的图像。

研究人员举了个运动场上运动员的例子：描述可能未清楚交代是足球运动员还是棒球运动员。较早的系统可能会犯下将两种运动的运动员填满棒球场的错误，而 RetrieveGAN 学会观察场景中不同对象之间的关系，从而提供连贯的图像。该 AI 用两个图像数据集 COC-Stuff 和 Visual Genome 进行了训练，能够 AI 选择一个又一个对象，并确保内容彼此匹配以及每个步骤中的指令得到执行。

图像通常仍然会模糊、扭曲或充满几何荒谬。但是，很明显，图像符合原始描述。研究人员写道，与老方法相比，RetrieveGAN 性能更好。

随着 AI 技术的发展，RetrieveGAN 会不断得到改进。下一步，研究人员希望通过增加图像的选择和改进学习过程来取得进步。【数字叙事黎雾】

构建了一个充满可能性的世界，《Freeland》抢...

领域

媒介

专题

文类

发现

一种新的AI系统可以根据语言描述来生成图像

发表评论取消回复

订阅

Carrie Able：一位创作混合现实艺术的“混...

《Corpus Misty》导演谈这部既抽象又真切...

《Age of Sail》：与VR的结合会拯救电影...

PanoMoments是一种沉浸式即时叙事媒介，被...

Dramatron：一个可以创作电影和戏剧剧本的A...

相关文章
Related

构建了一个充满可能性的世界，《Freeland》抢...

VR生存大作《Into The Radius》PS...

VR模组将热门科幻游戏《System Shock》...

MR游戏《Starship Home》9月26日在...

关于我们

文类

最新

构建了一个充满可能性的世界，《Freeland》抢...

VR生存大作《Into The Radius》PS...

VR模组将热门科幻游戏《System Shock》...

订阅

领域

媒介

专题

文类

发现

一种新的AI系统可以根据语言描述来生成图像

发表评论 取消回复

订阅

相关文章Related

关于我们

文类

最新

订阅

发表评论取消回复

相关文章
Related