首页 > dan abramov字节跳动

dan abramov字节跳动

baidu09_com

发布了文章 2个月前

X-baidu09Portrait 2 – 字节跳动推出的单图驱动视频生成模型

X-Portrait 2是字节跳动智能创作团队推出的单图视频驱动技术，基于一张静态照片和一段驱动视频生成高质量、电影级视频。X-Portrait 2保留原图身份特征，准确捕捉细微表情和情绪，实现跨风格动作迁移，适用于写实人像...
AI工具

0 44 0
baidu09_com

发布了文章 2个月前

VeOmni – 字节跳动开源的全模态PyTorch原生训练框架

VeOmni 是字节跳动 Seed 团队开源的全模态分布式训练框架，基于 PyTorch 设计。VeOmni 以模型为中心，将分布式并行逻辑与模型计算解耦，支持灵活组合多种并行策略（如 FSDP、SP、EP），能高效扩展至超...
AI工具

0 47 0
baidu09_com

发布了文章 2个月前

Mogao – 字节跳动Seed团队推出的多模态理解与生成统一架构

Mogao是字节跳动Seed团队推出的交错多模态生成全基础模型。在架构上采用了双视觉编码器，结合变分自编码器（VAE）和视觉变换器（ViT），能更好地进行视觉理解并改善图像生成的上下文对齐。...
AI工具

0 38 0
baidu09_com

发布了文章 2个月前

Loopy – 字节跳动推出的音频驱动的AI视频生成模型

Loopy是字节跳动推出的音频驱动的AI视频生成模型，用户可以让一张静态照片动起来，照片中的人物根据给定的音频文件进行面部表情和头部动作的同步，生成逼真的动态视频。Loopy基于先进的扩散模型技术，无需额外的空间信号或条件，...
AI工具

0 42 0
baidu09_com

发布了文章 2个月前

BAGEL – 字节跳动开源的多模态基础模型

BAGEL是字节跳动开源的多模态基础模型，拥有140亿参数，其中70亿为活跃参数。采用混合变换器专家架构（MoT），通过两个独立编码器分别捕捉图像的像素级和语义级特征。BAGEL遵循“下一个标记组预测”范式进行训练，使用海量...
AI工具

0 38 0

没有更多内容