Seed LiveInterpret 2.0 是字节跳动Seed团队推出的端到端同声传译模型,支持中英双向翻译。具备接近真人水平的翻译准确率和极低的延迟,能实现“边听边说”的实时翻译。模型基于全双工语音生成理解框架,支持多人语音输入,可实时复刻说话人的音色,无需提前采集声音样本。在复杂场景下,翻译准确率超70%,单人演讲时超80%。平均语音到语音延迟仅2-3秒,较传统系统降低60%以上。Seed LiveInterpret 2.0 能智能平衡翻译质量和延迟,适应不同语音输入条件。模型已通过火山引擎对外开放。

Seed LiveInterpret 2.0 – 字节跳动Seed推出的同声传译模型  第1张
(图片来源网络,侵删)
Seed LiveInterpret 2.0 – 字节跳动Seed推出的同声传译模型  第2张
(图片来源网络,侵删)