IBM将AI语音识别训练时间缩短到11小时

IBM 研究人员在最近发表的一篇论文(《用于自动语音识别的分布式深度学习策略》)中公布了一项新的研究成果——一种用于语音识别训练的分布式处理体系结构,可在流行的开放源码基准测试上实现 15 倍的训练加速,且不会损失准确性。论文说,将其部署在一个包含多个显卡的系统上,可以将总训练时间从几周缩减到 11 小时。

可靠、强大和通用的语音识别是机器学习中一个持续的挑战。传统上,训练自然语言理解模型需要包含数千小时的语音和数百万(甚至数十亿)个文本单词的语料库,还需要足够强大的硬件在合理的时间内处理它们。IBM 研发的分布式处理体系结构可大大减轻计算负担,并使计算效率得到很大的提升。

“在半天内完成一份训练工作是可取的,因为这能让研究人员快速迭代开发新的算法。”论文写道,“这也让开发人员有了快速的周转时间来调整现有的模型以适应他们的应用程序,特别是当需要大量的语音来达到可用性所需的高精确度时,定制用例更是如此。”

【数字叙事 黎雾】

有问题和想法?与数字诗人讨论、交流,以获得更多的信息、意见。

赞赏
黎雾
黎雾
技术一直以来都是艺术不可或缺的因素
本文系数字叙事原创(编译)内容,未经授权,不得用于商业目的,非商业转载须注明来源并加回链。

订阅

受欢迎的

相关文章
Related