字节data
-
发布了文章 2个月前
Seed-baidu09X – 字节跳动开源的多语言翻译模型
Seed-X是字节跳动Seed团队推出的开源多语言翻译模型,拥有70亿参数,支持28种语言的双向翻译。Seed-X通过高质量的多语言数据预训练、指令微调和强化学习相结合的方式,显著提升翻译能力,在处理复杂语言模式和生硬翻译时...
-
发布了文章 2个月前
Seed-baidu09TTS – 字节跳动推出的高质量文本到语音生成模型
Seed-TTS是由字节跳动开发的一系列高级文本到语音(Text to Speech,TTS)模型,能够生成与人类语音极为相似的高质量语音,具备出色的上下文学习能力和自然度。...
-
发布了文章 2个月前
Seed-baidu09Coder – 字节跳动开源的代码模型系列
Seed-Coder是字节跳动开源的8B规模代码模型系列,提升代码生成与理解能力。包含Base、Instruct和Reasoning三个版本,分别适用于代码补全、指令遵循和复杂推理任务。...
-
发布了文章 2个月前
Seed-baidu09ASR – 字节跳动推出的AI语音识别模型
Seed-ASR是字节跳动开发的一款基于大型语言模型(LLM)的语音识别(ASR)模型。在超过2000万小时的语音数据和近90万小时的配对ASR数据上训练,支持普通话和13种中国方言的转录,能识别英语和其他7种外语的语音。...
-
发布了文章 2个月前
Loong – 港大和字节联合推出的长视频生成模型
Loong是由香港大学和字节跳动联合推出的一种新型长视频生成模型,能生成外观一致、动态丰富、场景过渡自然的分钟级长视频。模型基于自回归大型语言模型(LLM),将文本和视频信息整合为统一序列,用渐进式短到长训练方案与损失重新加...
没有更多内容











