AI工具
发布文章-
发布了文章 2个月前
Seedance 1.0 lite – 火山引擎推出的视频生成模型
Seedance 1.0 lite是火山引擎推出的豆包视频生成模型的小参数量版本,支持文生视频和图生视频两种生成方式,支持生成5秒或10秒、480p或720p分辨率的视频。...
-
发布了文章 2个月前
SeedVR2 – 字节跳动推出的视频修复模型
SeedVR2是字节跳动推出的新型单步视频修复(Video Restoration, VR)模型,基于扩散模型和对抗性后训练(Adversarial Post-Training, APT)技术。模型基于自适应窗口注意力机制和...
-
发布了文章 2个月前
SeedVR – 南洋理工和字节跳动推出的扩散变换器模型,实现通用视频修复
SeedVR是南洋理工大学和字节跳动推出的扩散变换器模型,能实现高质量的通用视频修复。SeedVR基于引入移位窗口注意力机制,采用大尺寸(64×64)窗口和边界处的可变大小窗口,有效处理任意长度和分辨率的视频,克服传统方法在...
-
发布了文章 2个月前
SeedFoley – 字节推出的端到端视频音效生成模型
SeedFoley 是字节跳动豆包大模型语音团队开发的端到端视频音效生成模型,为视频创作提供智能音效生成服务。通过融合时空视频特征与扩散生成模型,实现音效与视频的高度同步。模型采用快慢特征组合的视频编码器,提取视频的时空特征...
-
发布了文章 2个月前
SeedEdit – 字节豆包团队推出的AI图像编辑模型
SeedEdit是字节跳动豆包大模型团队推出的通用图像编辑模型,基于简单的自然语言指令编辑图像,包括修图、换装、美化、风格转换及在指定区域添加或删除元素等。SeedEdit的核心优势为在维持原始图像和生成新图像之间找到最佳平...
-
发布了文章 2个月前
SeedEdit 3.0 – 字节跳动推出的图像编辑模型
SeedEdit 3.0 是字节跳动Seed团队推出的图像编辑模型,支持用自然语言指令实现对图像的快速、高质量编辑。模型依托强大的文生图模型 Seedream 3.0,能精准理解用户指令,完成包括风格转换、细节调整、文字修改...
-
发布了文章 2个月前
Seed1.6 – 字节跳动推出的通用模型系列
Seed1.6是字节跳动Seed团队推出的通用模型系列,融合多模态能力,支持256K长上下文深度推理。Seed1.6沿用Seed1.5稀疏MoE探索成果,经纯文本预训练、多模态混合持续训练、长上下文持续训练三阶段,提升文本和...
-
发布了文章 2个月前
Seed1.5-baidu09VL – 字节跳动Seed推出的视觉语言多模态大模型
Seed1.5-VL 是字节跳动 Seed 团队最新发布的视觉-语言多模态大模型,具备强大的通用多模态理解和推理能力,推理成本显著降低。模型由一个 532M 参数的视觉编码器和一个 20B 活动参数的混合专家(MoE)LLM...
-
发布了文章 2个月前
Seed1.5-baidu09Embedding – 字节跳动 Seed 团队推出的向量模型
Seed1.5-Embedding 是字节跳动 Seed 团队最新发布的向量模型,基于 Seed1.5 (Doubao-1.5-pro 进一步训练。模型在权威测评榜单 MTEB 上达到了中英文 SOTA 效果,在推理密集型...
-
发布了文章 2个月前
Seed-baidu09X – 字节跳动开源的多语言翻译模型
Seed-X是字节跳动Seed团队推出的开源多语言翻译模型,拥有70亿参数,支持28种语言的双向翻译。Seed-X通过高质量的多语言数据预训练、指令微调和强化学习相结合的方式,显著提升翻译能力,在处理复杂语言模式和生硬翻译时...
-
发布了文章 2个月前
Seed-baidu09VC – 零样本实现声音克隆和转换的技术
Seed-VC 是一种零样本声音转换技术,基于上下文学习实现高质量的音频输出和音色相似度。用户无需进行特定训练,只需提供1到30秒的参考语音样本,实现声音的克隆和转换。...
-
发布了文章 2个月前
Seed-baidu09Thinking-baidu09v1.5 – 字节跳动推出的最新思考模型
Seed-Thinking-v1.5 是字节跳动推出的推理智能模型,采用混合专家(MoE)架构,总参数量为 200B,每次激活 20B 参数。模型在多个基准测试中表现出色,如在 AIME 2024 测试中获得 86.7 分,...
-
发布了文章 2个月前
Seed-baidu09TTS – 字节跳动推出的高质量文本到语音生成模型
Seed-TTS是由字节跳动开发的一系列高级文本到语音(Text to Speech,TTS)模型,能够生成与人类语音极为相似的高质量语音,具备出色的上下文学习能力和自然度。...
-
发布了文章 2个月前
Seed-baidu09OSS – 字节跳动开源的大语言系列模型
Seed-OSS 是字节跳动 Seed 团队开源的系列大型语言模型,专注于长文本处理、推理和智能代理能力。模型包含多个版本,如 Seed-OSS-36B-Base 和 Seed-OSS-36B-Instruct,分别在通用能...
-
发布了文章 2个月前
Seed-baidu09Music – 字节跳动推出的AI音乐生成大模型
Seed-Music是字节跳动推出的AI音乐生成大模型,将用户录制的 10 秒音频转化为完整的音乐作品。通过自回归语言模型和扩散方法,根据用户的多模态输入(如风格描述、音频参考、乐谱和声音提示)生成高质量、风格可控的音乐。...




























