字节跳动pangle
-
发布了文章 2个月前
Phantom – 字节跳动推出的主体一致视频生成框架
Phantom是字节跳动智能创作团队推出的用在主体一致视频生成(Subject-to-Video, S2V)的框架。基于跨模态对齐技术,结合文本和图像提示,从参考图像中提取主体元素并生成与文本描述一致的视频内容。...
-
发布了文章 2个月前
PersonaTalk – 字节跳动推出的实现高保真和个性化视觉配音框架
PersonaTalk是字节跳动推出的基于注意力机制的两阶段框架,用在实现高保真度和个性化的视觉配音。PersonaTalk能在合成与目标音频精准唇形同步的视频的同时,保留说话者的独特说话风格和面部细节。...
-
发布了文章 2个月前
PaSa – 字节跳动推出的学术论文检索智能体
PaSa是字节跳动研究团队(ByteDance Research)推出的基于强化学习的学术论文检索智能体。能模仿人类研究者的行为,自动调用搜索引擎、浏览相关论文并追踪引文网络,为用户提供精准、全面的学术论文检索结果。...
-
发布了文章 2个月前
Loopy – 字节跳动推出的音频驱动的AI视频生成模型
Loopy是字节跳动推出的音频驱动的AI视频生成模型,用户可以让一张静态照片动起来,照片中的人物根据给定的音频文件进行面部表情和头部动作的同步,生成逼真的动态视频。Loopy基于先进的扩散模型技术,无需额外的空间信号或条件,...
-
发布了文章 2个月前
HeadGAP – 字节跳动推出的3D头像生成模型
HeadGAP是字节跳动和上海科技大学共同推出的3D头像生成模型,仅用少量图片快速生成逼真的3D头像。采用先验学习和个性化创建阶段的框架,基于大规模多视角动态数据集导出的3D头部先验信息。通过高斯Splatting自动解码网...
没有更多内容











