fil 阿里
-
发布了文章 2个月前
FantasyTalking – 阿里联合北邮推出静态肖像生成可控数字人的框架
FantasyTalking 是阿里巴巴 AMAP 团队和北京邮电大学联合提出的新型框架,用于从单张静态肖像生成逼真的可动画化虚拟形象。基于预训练的视频扩散变换器模型,采用双阶段视听对齐策略,第一阶段通过片段级训练方案建立连...
-
发布了文章 2个月前
FLUX-baidu09Text – 阿里推出的多语言场景文本编辑框架
FLUX-Text 是阿里推出的新型的多语言场景文本编辑框架,基于扩散模型(Diffusion Model)和轻量级字形嵌入模块。框架基于注入字形条件信息,提升复杂场景下文本生成的准确性和保真度,在处理非拉丁字符(如中文)时...
没有更多内容





