使用 AI 将语音翻译为主要口语 | 元

使用 AI 将语音翻译为主要口语 | 元

人工智能语音翻译主要集中在书面语言上,但近 3,500 种生活语言主要是口语,没有广泛使用的书写系统。 这使得使用标准技术构建机器翻译工具变得不可能,这需要大量的书面文本才能训练 AI 模型。

为了应对这一挑战,我们为闽南语构建了第一个由人工智能驱动的语音到语音翻译系统,闽南语是一种主要在海外华人中广泛使用的口头语言,但缺乏标准的书面形式。 我们正在开源我们的闽南语翻译模型、评估数据集和研究论文,以便其他人可以复制和构建我们的工作。

一张图表,显示世界各地讲闽南语的人数。

翻译系统是我们的一部分 通用语音翻译器 该项目正在开发新的人工智能方法,我们希望最终能够实现跨多种语言的实时语音到语音翻译。 我们相信口头交流可以将人们聚集在一起,无论他们身在何处——即使在 元节.

一种新的建模方法

许多语音翻译系统依赖于转录。 但是,由于主要是口头语言没有标准的书面形式,因此无法将转录文本作为翻译输出。 因此,我们专注于语音到语音的翻译。

为此,我们开发了多种方法,例如使用语音到单元的翻译将输入语音翻译成一系列声学声音,并从中生成波形或依赖相关语言(在本例中为普通话)的文本。

UnitY语音翻译系统的模型架构图。

展望翻译的未来

虽然闽南语翻译模式仍在进行中,一次只能翻译一个完整的句子,但它朝着未来可以实现语言同声翻译的方向迈出了一步。 我们开创的技术可以扩展到许多其他书面和非书面语言。

我们还发布了 SpeechMatrix,它是通过我们创新的自然语言处理工具包开发的大量语音到语音翻译的集合 称为激光. 这些工具将使其他研究人员能够创建自己的语音到语音翻译系统,并以我们的工作为基础。 我们在研究人员所说的无监督学习方面取得的进展证明了在没有任何人工注释的情况下构建高质量语音到语音翻译模型的可行性。 这将有助于扩展这些模型,使其适用于没有任何可用于训练系统的标记训练数据的语言。

我们的人工智能研究正在帮助打破物理世界和虚拟世界中的语言障碍,以鼓励联系和相互理解。 我们期待着扩大我们的研究,并在未来将这项技术带给更多的人。

了解更多关于我们的 人工智能驱动的语音翻译.


#使用 #将语音翻译为主要口语 #元

Leave a Reply

Your email address will not be published. Required fields are marked *

研究人员“几乎在我们的后院”发现了新的怪物黑洞 Previous post 研究人员“几乎在我们的后院”发现了新的怪物黑洞
美国宇航局的补给任务将科学实验带到空间站——抛物线 Next post 在盐中储存氢的新方法“可能导致大规模储存”