Meta发布 AI 模型SeamlessM4T，可转录和翻译近100种语言

菜单

专栏专题教育文化经济民生社会快讯滚动综合

当前位置 : 首页 > 民生 >

Meta发布 AI 模型SeamlessM4T，可转录和翻译近100种语言｜钛快讯

来源：钛媒体APP 时间：2023-08-26 02:05:58

（图片来源@视觉中国）

(资料图片)

钛媒体App获悉，当地时间8月22日，科技巨头Facebook母公司Meta 对外发布了一款最新人工智能（AI）翻译引擎SeamlessM4T，可以更轻松地跨文本语音翻译和转录近100种语言。

同时，Meta还公布了新的开源翻译数据集 SeamlessAlign，将44.3万小时的语音与文本、2.9万小时的语音转录数据进行对齐，教会SeamlessM4T如何将语音转录为文本、翻译文本、从文本生成语音。

Meta表示，SeamlessM4T将与SeamlessAlign一同开源。SeamlessM4T代表了 AI 技术驱动的“语音到语音”和“语音到文本”领域的“重大突破”。

据悉，作为最早投资AI的大型科技企业之一，Meta于2013年成立了 AI 基础研究实验室，聘请了AI领域的顶级学者，有大量社交与元宇宙算法，推出Pytorch框架、Zion等软硬件产品。不过，虽然Meta在AI领域也取得了一些进展，但它落后于OpenAI、微软、谷歌等公司。

随着ChatGPT风靡全球，Meta AI团队正在加紧追赶，以及重新组合其关于语言、对话等领域与大模型相关的研究。

去年底之后，Meta陆续发布No Language Left Behind（不留语言）文本到文本的机器翻译模型，支持200种语言，以及开发多语言数据集SpeechMatrix、生成文本到声音的AudioCraft等。另外在今年7月，Meta还发布开源对话大模型Llama 2，引发广泛讨论和关注。

此次公布的SeamlessM4T，建立在Meta AI翻译模型的技术能力基础上，并重新设计Fairseq序列建模工具包，以创建更轻量级的模型和处理更多信息。Meta表示，SeamlessM4T从“爬取的网页数据的公开可用存储库中”收集了400万小时的“原始音频”，该模型可以在近100种语言之间进行文本到语音的翻译，并支持35种语言的完全语音到语音翻译。

对于安全性和脱敏性，Meta表示，在开发SeamlessM4T时，团队构建了一个可以识别敏感词系统，目标是能够过滤了训练数据中不平衡的数据信息，从而检测和输出正确的翻译内容。而且，Meta研究人员还尝试清理误译一些脏话的数据集，以便更准确地检测何时使用。

Meta研究科学家负责人Paco Guzman表示，SeamlessM4T的一大突破是它不依赖中间模型来产生结果，这使得它更加灵活，甚至支持动态更改语言。这将促进更多人使用其进行日程对话。

不过，Meta建议不要使用SeamlessM4T进行长篇翻译，政府专用的认证翻译，以及不鼓励出于医疗或法律目的部署该模型，原因或与专业领域的翻译准确度有关。科技网站《对话》（theconversation）最近表示，AI 翻译有许多缺陷，包括不同形式的性别错误和偏见、语音识别算法偏差等。

据报道称，Meta后续将把这些翻译和转录方面的 AI 进展，整合到Facebook、Instagram、WhatsApp、Messenger和Threads等产品当中。

（本文首发钛媒体App，作者｜林志佳，编辑｜马金男）

上一篇：润雨石自主设计的首根百米级高载流高温超导集束缆线下线

下一篇：最后一页

热门推荐

Meta发布 AI 模型SeamlessM4T，可转录和翻译近100种语言｜钛快讯

Meta发布 AI 模型SeamlessM4T，可转录和翻译近100种语言｜钛快讯

润雨石自主设计的首根百米级高载流高温超导集束缆线下线

中报业绩亮眼，各业务稳步推进，前景可期

鸿博股份今日涨停一机构净卖出1842.08万元

重庆载客去上海男子被立案调查详情曝光男子非注册出租车司机具体是啥状况呢

28岁确诊癌症！小伙崩溃痛哭：放纵的代价太大

光明与深圳外国语学校合作办学打造基础教育名校

金昌市西坡调蓄水池周边区域概念性规划方案编制项目中标（成交）结果公告

花旗：予国药控股(01099)“买入”评级目标价28港元

房贷20年多少年还完最划算

道指两连跌银行股全线走低

鸿博股份：算力出租业务占公司营业收入比重较小

黄燕铭：股市以横盘为主，顺周期股难持续，抓住“科技成长”牛鼻子

警惕月经异常隐藏疾病信号

【考前5道题】中级会计实务考前必做5道题（2）

Meta发布 AI 模型SeamlessM4T，可转录和翻译近100种语言｜钛快讯

Meta发布 AI 模型SeamlessM4T，可转录和翻译近100种语言｜钛快讯

润雨石自主设计的首根百米级高载流高温超导集束缆线下线

中报业绩亮眼，各业务稳步推进，前景可期

鸿博股份今日涨停 一机构净卖出1842.08万元

重庆载客去上海男子被立案调查详情曝光男子非注册出租车司机 具体是啥状况呢

28岁确诊癌症！小伙崩溃痛哭：放纵的代价太大

光明与深圳外国语学校合作办学 打造基础教育名校

金昌市西坡调蓄水池周边区域概念性规划方案编制项目中标（成交）结果公告

花旗：予国药控股(01099)“买入”评级 目标价28港元

房贷20年多少年还完最划算

道指两连跌 银行股全线走低

鸿博股份：算力出租业务占公司营业收入比重较小

黄燕铭：股市以横盘为主，顺周期股难持续，抓住“科技成长”牛鼻子

警惕月经异常隐藏疾病信号

【考前5道题】中级会计实务考前必做5道题（2）

鸿博股份今日涨停一机构净卖出1842.08万元

重庆载客去上海男子被立案调查详情曝光男子非注册出租车司机具体是啥状况呢

光明与深圳外国语学校合作办学打造基础教育名校

花旗：予国药控股(01099)“买入”评级目标价28港元

道指两连跌银行股全线走低