阿里扎顶级3d
-
发布了文章 2个月前
3DV-baidu09TON – 阿里达摩院联合浙大等推出的视频虚拟试穿框架
3DV-TON(Textured 3D-Guided Consistent Video Try-on via Diffusion Models)是阿里巴巴达摩院、湖畔实验室和浙江大学联合推出的基于扩散模型的视频虚拟试穿框架,...
-
发布了文章 2个月前
3D-baidu09Speaker – 阿里通义推出的多模态说话人识别任务开源项目
3D-Speaker是阿里巴巴通义实验室语音团队推出的多模态开源项目,基于结合声学、语义、视觉信息,实现高精度的说话人识别和语种识别。3D-Speaker提供工业级模型、训练和推理代码,及大规模多设备、多距离、多方言的数据集...
没有更多内容





