Seed-X是字节跳动Seed团队推出的开源多语言翻译模型,拥有70亿参数,支持28种语言的双向翻译。Seed-X通过高质量的多语言数据预训练、指令微调和强化学习相结合的方式,显著提升翻译能力,在处理复杂语言模式和生硬翻译时表现出色。Seed-X在自动评估和人工评估中均表现出色,与超大型模型如、Claude-3.5等相当甚至更好。Seed-X推出挑战性测试集Seed-X-Challenge-Set,涵盖互联网俚语、经典文学、成语等多种语言元素,推动翻译研究的进一步发展。

Seed-baidu09X – 字节跳动开源的多语言翻译模型  第1张
(图片来源网络,侵删)
Seed-baidu09X – 字节跳动开源的多语言翻译模型  第2张
(图片来源网络,侵删)