能把英语音频翻译出来的软件英语语音翻译器( 三 ) _云知道

文本数据非常重要，但不足以构建满足所有人需求的翻译工具。语音翻译基准数据以前可用于少数几种语言，所以团队创建了：
CoVoST 2：涵盖22种语言和36个不同资源条件的语言方向VoxPopuli：包含23种语言的40万小时语音，可用于语音识别和语音翻译等语音应用的大规模半监督和自监督学习。
3. 构建跨多种语言和不同模式的模型
除了为机器翻译系统的训练提供更多数据，并将其提供给其他研究人员之外，Meta同时在努力提高模型的能力，从而能够处理更广泛语言之间的翻译。如今，机器翻译系统通常在单一模态中工作。如果模型太小，无法代表多种语言，其性能可能会受到影响，从而导致文本和语音翻译的不准确。建模方面的创新将帮助我们创造这样一个未来：翻译将能快速、无缝地支持多种语言的不同模式，例如语音到文本，文本到语音，文本到文本或语音到语音。
为了提高机器翻译模型的性能，Meta投入巨资创建了能够在大容量情况下高效训练的模型。为了将基于文本的机器翻译扩展到101种语言，团队创建了第一个非以英语为中心的多语言文本翻译系统。
双语系统通常是先从源语言翻译成英语，然后再从英语翻译成目标语言。为了令系统更高效、更高质量，团队取消了英语作为媒介，这样语言就可以直接翻译成其他语言，无需通过英语。当然，尽管消除英语提高了模型的容量，但多语言模型无法达到定制双语系统的质量水平。然而，随着性能的提升，Meta的多语言翻译系统赢得了Workshop on Machine Translation competition，甚至超过最好的双语模特。
Meta的目标是提高技术的包容性：它应该支持书面语言和没有标准书写系统的语言。考虑到这一点，团队正在开发一个语音到语音，不依赖于在推理过程中生成中间文本表示的翻译系统。这种方法已证明比传统的级联系统更快。凭借更高的效率和更简单的架构，直接语音翻译可以为未来的设备开启实时翻译。最后，为了创建能够保留每个人讲话中的表达能力和特点的口语翻译，团队正在努力在生成的音频翻译中包括输入音频的特定方面，例如语调。
4. 衡量数百种语言的成功
开发能够在多种语言之间转换的模型带来了一个重要的问题：如何确定是否开发出了一个更好的模型呢？评估一个大规模、多语言模型的性能是一件棘手的事情，尤其是因为它要求我们具备模型所涵盖的所有语言的专业知识。这是一项耗时、资源密集且往往不切实际的挑战。
针对这一点，Meta开发了第一个涵盖101种语言的多语言翻译评估数据集 FLORES-101，以便研究人员能够快速测试和改进多语言翻译模型。与现有的数据集不同，FLORES-101允许研究人员通过任何语言方向量化系统的性能，不仅仅只是翻译成英语和从英语翻译成其他语言。对于操着几十种官方语言的全球范围而言，这将能够创建满足重要现实世界需求的翻译系统。
利用FLORES-101，Meta正在与人工智能研究业界合作，并期待着继续将FLORES扩展到数百种语言。
Meta进一步指出，未来将致力于负责任地开展这项工作。团队正在与语言学家合作，以理解创造准确数据集所面临的挑战。团队同时与评估人员网络合作，以确保翻译的准确性。这家公司表示，实现长期的翻译目标不仅需要人工智能方面的专业知识，同时需要来自世界各地的众多专家、研究人员和个人的持续投入。
5. 未来
如果No Language Left Behind（不落下任何语言）和Universal Speech Translator能够成功，再加上机器翻译研究业界的努力，这将能以前所未有的方式融合数字世界和物理世界。

能把英语音频翻译出来的软件英语语音翻译器( 三 )

推荐阅读

黑米打豆浆要泡吗

驾校学车撞车要赔钱吗

冬天可以吃西洋参吗西洋参吃法有哪些

菲亚特菲跃和道奇酷威怎么样？

蟹爪兰不开花什么原因蟹爪兰开花用什么肥

速冻豆角怎么冻才好吃窍门

关于神奇的大自然资料有关大自然的资料

乌鲁木齐注销户口办理指南

侄子叫舅舅的老婆怎么称呼舅舅的老婆怎么称呼

羽丝绒和中空棉的区别在哪里

普通单相电表介绍,单相全电子电度表

戴森哪个国家买最便宜,出境游最便宜的国家是哪里

科目二多少分及格科目二考80分算过吗

净身出户协议书怎么写

奔腾x40dlife怎么用不了

怎么拍桌子上的水杯好看怎么拍小孩坐在茶杯上写字

能把英语音频翻译出来的软件 英语语音翻译器( 三 )

推荐阅读

能把英语音频翻译出来的软件英语语音翻译器( 三 )