AI工具
发布文章-
发布了文章 2个月前
IFAdapter – 腾讯和新加坡国立大学联合推出的文本到图像生成模型
IFAdapter是一种新型的文本到图像生成模型,由腾讯和新加坡国立大学共同推出。提升生成含有多个实例的图像时的位置和特征准确性。传统模型在处理多实例图像时常常面临定位和特征准确性的挑战,IFAdapter通过引入两个关键组...
-
发布了文章 2个月前
IDM-baidu09VTON – 逼真的开源AI虚拟试穿框架
IDM-VTON是由韩国科学技术院和OMNIOUS.AI的研究人员提出的一种先进的AI虚拟试穿技术,通过改进扩散模型来生成逼真的人物穿戴图像,实现更真实的虚拟试穿效果。...
-
发布了文章 2个月前
IDIFY – 开源的在线AI证件照生成工具,本地浏览器自动处理图片
IDIFY是一款免费开源的在线证件照生成工具,通过AI技术实现自动抠图,帮助用户快速生成符合标准的证件照。用户只需在浏览器中上传照片,选择尺寸和背景色,可下载高清证件照。...
-
发布了文章 2个月前
ID-baidu09Animator – 腾讯等推出的个性化人物视频生成框架
ID-Animator是由来自腾讯光子工作室、中科大和中科院合肥物质科学研究院的研究人员推出的一种零样本(zero-shot)人类视频生成技术,能够根据单张参考面部图像生成个性化视频,同时保留图像中的人物身份特征,并能够根据...
-
发布了文章 2个月前
ICEdit – 浙江大学联合哈佛大学推出的指令式图像编辑框架
ICEdit(In-Context Edit)是浙江大学和哈佛大学推出的指令式图像编辑框架。基于大规模扩散变换器(Diffusion Transformer)的强大生成能力和上下文感知能力,用自然语言指令对图像进行精准编辑。...
-
发布了文章 2个月前
IC-baidu09Portrait – ETH联合浙大等推出的个性化肖像生成框架
IC-Portrait是新型的个性化肖像生成框架,解决用户资料图像多样性(如外观和光照条件差异)带来的挑战。通过将肖像生成任务分解为“光照感知拼接”和“视角一致性适应”两个子任务来实现高保真的身份保留和视角一致性。...
-
发布了文章 2个月前
IC-baidu09Light – ControlNet作者开源的AI图片打光工具
IC-Light是一款由ControlNet作者张吕敏开发的AI图像打光处理工具,可以对图片进行光源操纵和光影重构,实现与不同背景的完美融合。用户只需上传图片,选择光源方向并输入提示词,IC-Light便能自动抠图并生成融合...
-
发布了文章 2个月前
I2VEdit – AI视频编辑技术,基于扩散模型实现首帧编辑引导
I2VEdit是一个先进的视频编辑框架,通过图像到视频的扩散模型实现首帧引导的视频编辑。用户只需编辑视频的第一帧,I2VEdit能自动将编辑效果应用到整个视频。...
-
发布了文章 2个月前
I2V3D – 香港城市大学联合微软推出的图像到视频生成框架
I2V3D是香港城市大学和微软 GenAI创新的图像到视频生成框架,支持将静态图像转换为动态视频,基于3D几何引导实现精确的动画控制。I2V3D结合传统计算机图形学(CG)管线的精确控制能力和生成式AI模型的视觉保真度,用两...
-
发布了文章 2个月前
I2V-baidu0901-baidu09Live – 海螺AI推出的图生视频模型,将静态图像转化为动态视频
I2V-01-Live是海螺AI推出的图生视频模型,能将静态二维图像转化为动态视频。模型基于深度学习技术,增强动作的流畅度和生动性,让人物或对象的动作更加自然和真实。I2V-01-Live支持多种艺术风格,优化稳定性和细腻的...
-
发布了文章 2个月前
Hyper-baidu09SD – 字节跳动推出的高效的图像合成框架
Hyper-SD是由字节跳动的研究人员推出的一种高效的图像生成框架,通过轨迹分割一致性蒸馏(TSCD)技术,结合人类反馈学习和分数蒸馏,显著提升了扩散模型在少步骤推理下的图像合成性能。...
-
发布了文章 2个月前
HybridRAG – 黑石联合英伟达推出的混合检索增强生成架构
HybridRAG 是黑石联合英伟达推出的混合检索增强生成架构,结合了检索增强生成(Retrieval-Augmented Generation)模型的机器学习架构。模型通过检索系统寻找与输入相关的信息,然后将这些信息与输入...
-
发布了文章 2个月前
HunyuanVideo-baidu09Avatar – 腾讯混元推出的语音数字人模型
HunyuanVideo-Avatar是腾讯混元团队与腾讯音乐天琴实验室联合研发的语音数字人模型,基于多模态扩散Transformer架构,能生成动态、情感可控以及多角色对话视频。模型具有角色图像注入模块,可消除训练与推理间...
-
发布了文章 2个月前
HunyuanVideo – 腾讯推出的开源视频生成模型,参数高达130亿
HunyuanVideo是腾讯开源的视频生成模型,拥有130亿参数,是目前参数量最大的开源视频模型之一。HunyuanVideo具备物理模拟、高文本语义还原度、动作一致性和电影级画质等特性,并能生成带有背景音乐的视频。...
-
发布了文章 2个月前
HunyuanPortrait – 腾讯混元联合清华等机构推出的肖像动画生成框架
HunyuanPortrait 是腾讯 Hunyuan 团队联合清华大学、中山大学和香港科技大学等机构共同推出的基于扩散模型的框架,用在生成高度可控且逼真的肖像动画。基于给定一张肖像图片作为外观参考和视频片段作为驱动模板,根...































