首页 / AI工具 / JoyHallo – 京东推出的音频驱动视频生成AI数字人模型

AI工具

JoyHallo – 京东推出的音频驱动视频生成AI数字人模型

baidu09_com 2025-08-29 37 0

JoyHallo 是京东开源的模型，专为普通话设计，能根据音频生成逼真的说话视频。特别适合处理普通话的复杂口型和语调，具有跨语言生成视频的能力。JoyHallo 提供了一个开源的数据集和模型训练方法，使用户可以生成普通话和英语的说话人视频。项目基于中文wav2vec2模型进行音频特征嵌入，采用半解耦结构来提升推理速度，提高了14.3%。

JoyHallo – 京东推出的音频驱动视频生成AI数字人模型第1张

（图片来源网络，侵删）

JoyHallo – 京东推出的音频驱动视频生成AI数字人模型第2张

（图片来源网络，侵删）

京东joy studio 京东joy什么意思京东joy meeting 京东joy联名款京东joy活动怎么进去京东joy活动京东的joy是啥

本文由 @baidu09_com 发布在拜读未来科技摆渡人生，如有疑问，请联系我们。
文章链接：https://www.baidu09.com/news/13992.html

baidu09_com管理员

上一篇

边缘AI盒子技术解析：ASIC FPGA GPU芯片及边缘-云端协同与自适应推理

下一篇

国产机油和进口的差别，进口机油为什么便宜

全部评论

留言在路上...

留言在赶来的路上...

发表评论取消回复

关灯返回顶部