联合pr
-
发布了文章 2个月前
VQAScore – CMU联合Meta推出的文本到视觉图像生成评估方法
VQAScore是CMU和Meta联合推出的评估方法,基于视觉问答(VQA)模型衡量由文本提示生成的图像质量。VQAScore用计算模型对“Does this figure show {text}?”这一问题回答“是”的概率...
-
发布了文章 2个月前
LinGen – Meta联合普林斯顿大学推出的文本到视频生成框架
LinGen是普林斯顿大学和Meta共同推出的新型文本到视频生成框架。框架基于线性复杂度的MATE模块(包含MA-branch和TE-branch),替换传统Diffusion Transformers中的二次复杂度的自注意...
没有更多内容





