文本驱动模式
-
发布了文章 2个月前
2D图像作中介,零训练实现3D场景生成SOTA:英伟达&康奈尔提出文本驱动新流程
2D图像作中介,零训练实现3D场景生成SOTA:英伟达&康奈尔提出文本驱动新流程 想象一下,你是一位游戏设计师,正在为一个奇幻 RPG 游戏搭建场景。你需要创建一个 "精灵族树屋村落"—— 参天古木和树屋、发光...
-
发布了文章 2个月前
OutofFocus – 文本驱动图像生成或编辑的AI工具
OutofFocus是一个基于AI技术的图像编辑工具,基于Gradio平台为用户提供一个直观的界面操作和编辑图片。工具的核心功能是接受用户的文本提示,运用自然语言处理(NLP)技术理解提示,结合扩散逆过程重建技术修改图像。...
-
发布了文章 2个月前
MotionClone – 文本驱动的AI视频动作克隆框架
MotionClone是文本驱动的AI视频动作克隆框架,通过时间注意力机制从参考视频中克隆动作,结合文本提示词生成新视频。能处理复杂的全局相机运动和精细的局部肢体动作,实现高度逼真和控制性强的视频内容创作。...
-
发布了文章 2个月前
MoMask – 文本驱动生成高质量3D人体动作的模型
MoMask是创新的3D人体动作生成工具,通过生成式掩码建模技术,能根据文本描述生成高质量的3D人体动作。MoMask采用分层量化方案,将人体运动表示为多层离散的运动标记,结合掩码Transformer和残差Transfor...
-
发布了文章 2个月前
GPTEngineer – 文本驱动生成Web网页的开源工具,AI自动写代码
GptEngineer 是一个基于 AI 技术通过简单的文本提示快速生成网页应用原型的开源工具。用户只需描述需求,AI 能自动编写并执行代码,支持与 GitHub 同步和一键部署。...
没有更多内容















