口音和语调依然是我的,但声音听起来却像一个年轻女人那样清亮。这是由 Modulate 创建的“声音模板”带来的效果。美国马萨诸塞州剑桥市的这家公司使用机器学习以一种新的方式来建模和操纵声音的特性。
这项技术远远超越了像 Kylo Ren 之类的简单的语音过滤器。使用这种方法,您将可以实时地拥有您想要的任何年龄、性别和音色的声音。
人工智能已经可以用来对视频中的人物进行换脸,Modulate.ai 的声音建模进一步展现了机器学习的进步对数字现实的改变。它使用生成对抗网络(GAN)来捕获和建模语音信号的音频属性。
Modulate.ai 在其网站上展示了巴拉克·奥巴马等名人的声音模板。其联合创始人兼首席执行官迈克·帕帕斯表示,只要有足够的培训数据,就可以创建任何人的声音模板。但他补充说,公司不会在未经所有者许可的情况下提供名人语音模板。他还坚持认为欺骗不是问题的关键。
“这不是为了模仿别人而设计的技术,”帕帕斯说,“它的建立是为了给您新的机会。”
Modulate 针对的《堡垒之夜》、《使命召唤》等网络游戏,玩家可以通过麦克风与陌生人聊天,这可以增强游戏的玩法。
“当我们想要在网上交流并获得真正深刻的体验时,声音是至关重要的。”帕帕斯说,“但有些人不愿意暴露自己的声音。在某些情况下,也许我们只是想保持匿名性。另外,我们也担心会暴露自己的年龄或性别,并因此受到骚扰。”
纽约大学信息传播学教授查尔斯·塞菲说,人工智能现操纵视频和音频的方式有可能从根本上改变媒体。“我们必须开始思考什么构成了现实。”他说。
这一技术有被误用的可能。Modulate 表示,它将寻求保证,任何复制他人声音的客户都必须得到此人的许可。它还开发了一种音频水印技术,可以用来检测复制的声音。例如,如果有人在电话中使用假声音,系统就会发出警告。
【数字叙事 黎雾】