分享好友 最新资讯首页 最新资讯分类 切换频道
字节推出中英同传模型,延误及准确率接近真人
2025-07-28 16:20

日前,字节跳动Seed团队正式推出端到端同声传译模型Seed LiveInterpret 2.0。

据了解,该模型基于全双工端到端语音生成理解框架,支持中英互译,可实时处理多人语音输入。在 CT(Continual Training)过程中,Seed团队利用平行和非平行语音数据促使语音和文本信息对齐,并使用不同语言的语音、文本、语音到语音、文本到文本等多任务翻译数据进行持续训练,以提升模型的语音理解准确度以及语音复刻等生成能力。此后该团队使用高质量人工标注数据进行监督微调(SFT,Supervised Fine-tuning),让模型学会了更准确的翻译时机和翻译准确性,显著提升了同传效果。

图片

据Seed团队方面介绍,Seed LiveInterpret 2.0是“首个延迟&准确率接近人类水平的产品级中英语音同传系统”,在中英同传翻译质量达到业界SOTA的同时,还实现了极低的语音延迟水平。据其所公布的相关数据显示,Seed LiveInterpret 2.0在多人会议等复杂场景中英双向翻译准确率超70%,单人演讲翻译准确率超80%,翻译延迟可低至2-3 秒、较传统机器同传系统降低超60%。

值得一提的是,Seed LiveInterpret 2.0还支持0样本声音复刻,只需采样实时语音信号便能提取声音特征,用说话人的音色特质实时 “说出” 外语,提升交流的沉浸感和亲和力。

此外,Seed LiveInterpret 2.0还能够智能平衡翻译质量、延迟和语音输出节奏。当输入语音流畅、清晰、标准,该模型会以极快的响应速度传译;当输入语音不流畅,出现改口、重复表达时,则会选择听到合适内容后再开始传译,保证更高的翻译准确率。

据了解,目前Seed LiveInterpret 2.0已基于火山引擎对外开放。此外字节跳动方面透露,Ola Friend耳机将于8月底接入Seed LiveInterpret 2.0,成为首个支持该模型的智能硬件设备。

【本文图片来自网络】

最新文章
世界杯八强诞生 摩洛哥成最大黑马
“我去过摩洛哥,那里的足球很纯粹。”,某位解说员当年的这一经典解说一语成谶。“纯粹”的摩洛哥用他们纯粹的足球挺进了8强!
三友知策 | 浅析特定关系人抢注情形之“特定关系”的判定以及在商标案件中的适用
前  言在市场经济高速发展的当今社会,商标作为企业重要的无形资产,其保护受到了企业的高度重视。在实践中,特定关系人恶意抢
“教”无涯 “研”不尽 | 九一小学南中环校区组织数学教研活动
10月24日,太原市小店区九一小学南中环校区数学组的教研活动在如火如荼地进行中。此次活动特邀太原市教科研中心王国萍老师莅临指
株洲男子因外国学历认证之事数次状告教育部败诉
红网株洲分站3月30日讯(分站记者 龙琦)由于自己的外国学位证书不予认证,家住湖南省株洲市荷塘区红旗村的刘远东一纸诉状,将中
“好品山东”装上“智慧脑”产业树起风向标
2020年,枣庄市5G石榴大数据分析平台落户中国石榴种质资源圃。作为枣庄最具特色、最有影响力的农业产业品牌,“峄城石榴”将数字
逼近9.4万美元,谁在左右比特币价格?
在美国股票和美元持续波动之下,更多投资者转而投向黄金与比特币文|成孟琦编辑|杨秀红4月22日,避险情绪消退下,传统避险资产
@全网最有情怀的微电影爱好者,美丽湘村邀你来记录
(来源/红网作者/汪衡)带着一份情怀我们走近一片田野用诗意的语言温暖的镜头记录着这里所发生的一切以光影为媒赋予乡村“诗和远方
两种方式投注福彩快乐8游戏,中奖获赠票
  辞旧迎新,广州福彩为您送上新年第一份好运!为真情回馈广大购彩者对中国福利彩票的支持,广州市福利彩票发行中心自2024年12
26000点了,A股缺什么?
9月10日,教师节,祝天下老师们节日快乐。首先关注大盘指数,上证指数如今在3920点压力线下横盘整理,逡巡不进,但金钱永不眠,
新学期,新气象:晋源区第八实验小学再启新征程
2月17日, 晋源区第八实验小学全体领导干部、教师齐聚校园,开启新学期的工作。及早谋划抓开局,提前部署求实效。晋源区第八实验
推荐文章