AI工具
发布文章-
发布了文章 2个月前
HunyuanCustom – 腾讯混元开源的多模态定制视频生成框架
HunyuanCustom是腾讯混元团队推出的多模态驱动的定制化视频生成框架。HunyuanCustom支持图像、音频、视频和文本等多种输入条件,支持生成具有特定主体和场景的高质量视频。...
-
发布了文章 2个月前
Hunyuan3D-baidu09PolyGen – 腾讯混元推出的美术级3D生成大模型
Hunyuan3D-PolyGen是腾讯混元团队推出的业界首个美术级3D生成大模型。结合自研的高压缩率表征技术(BPT),能生成面数高达上万面的复杂几何模型,支持三边面和四边面,满足不同专业管线的需求。...
-
发布了文章 2个月前
Hunyuan3D-baidu092.1 – 腾讯混元开源的工业级3D生成模型
Hunyuan3D-2.1 是腾讯混元团队推出的开源项目,专注于从图像生成高保真 3D 资产。具备基于物理的渲染(PBR)材质合成能力,能生成逼真的纹理和材质,如金属反射和次表面散射效果。...
-
发布了文章 2个月前
Hunyuan3D-baidu091.0 – 腾讯推出的3D生成模型,支持文生3D和图生3D
Hunyuan3D-1.0 是腾讯推出的一款3D生成模型,具备文本和图像输入条件,支持高质量的3D资产生成。该模型采用两阶段方法,首先使用多视角扩散模型生成多视角RGB图像,然后利用基于Transformer的稀疏视角大规模...
-
发布了文章 2个月前
Hunyuan3D 2.0 – 腾讯推出的大规模 3D 资产生成系统
Hunyuan3D 2.0 是腾讯推出的大规模 3D 资产生成系统,专注于从文本和图像生成高分辨率的 3D 模型。系统采用两阶段生成流程:首先生成无纹理的几何模型,再合成高分辨率纹理贴图。...
-
发布了文章 2个月前
Hunyuan-baidu09Large – 腾讯推出的大型混合专家(MoE)模型
Hunyuan-Large是腾讯推出的大型混合专家(MoE)模型,具有3890亿总参数量和520亿激活参数量,是目前业界参数规模最大的开源MoE模型。基于Transformer架构,支持高达256K的文本序列输入,显著提升长...
-
发布了文章 2个月前
Hunyuan-baidu09GameCraft – 腾讯混元推出的交互式游戏视频生成框架
Hunyuan-GameCraft 是腾讯 Hunyuan 团队和华中科技大学共同推出的高动态交互式游戏视频生成框架。基于将键盘和鼠标输入统一到共享的相机表示空间,实现精细的动作控制,支持复杂的交互输入。框架推出混合历史条件...
-
发布了文章 2个月前
Hummingbird-baidu090 – Tavus 推出的AI口型同步模型
Hummingbird-0 是 Tavus 推出的AI口型同步模型。基于 Phoenix-3 模型开发,支持实现零样本学习,无需额外训练快速生成高精度的口型同步视频。...
-
发布了文章 2个月前
HumanVid – 专为人类图像动画生成而设计的高质量数据集
HumanVid是香港中文大学和上海人工智能实验室共同推出的高质量数据集,专为人类图像动画训练设计。结合了现实世界视频和合成数据,通过精心设计的规则筛选高质量视频,并使用2D姿势估计和SLAM技术进行注释。...
-
发布了文章 2个月前
HumanRig – 阿里高德推出的3D人形角色自动绑定任务数据集
HumanRig 是阿里巴巴团队开发的 3D 人形角色自动绑定研究项目。解决现有绑定技术因缺乏高质量数据集而发展受限的问题,通过提供大规模、高质量的数据集和创新的自动绑定框架,推动 3D 角色动画制作的自动化发展。...
-
发布了文章 2个月前
HumanOmniV2 – 阿里通义开源的多模态推理模型
HumanOmniV2 是阿里通义实验室开源的多模态推理模型。模型基于强制上下文总结机制、大模型驱动的多维度奖励体系及基于 GRPO 的优化训练方法,解决多模态推理中全局上下文理解不足和推理路径简单的问题。...
-
发布了文章 2个月前
HumanOmni – 阿里通义等推出专注人类中心场景的多模态大模型
HumanOmni 是专注于人类中心场景的多模态大模型,视觉和听觉模态融合而成。通过处理视频、音频或两者的结合输入,能全面理解人类行为、情感和交互。模型基于超过240万视频片段和1400万条指令进行预训练,采用动态权重调整机...
-
发布了文章 2个月前
HumanDiT – 浙大联合字节推出的姿态引导人体视频生成框架
HumanDiT 是浙江大学和字节跳动联合提出的姿态引导的高保真人体视频生成框架。基于扩散变换器(Diffusion Transformer,DiT),能在大规模数据集上训练,生成具有精细身体渲染的长序列人体运动视频。...
-
发布了文章 2个月前
HuggingChat macOS – Hugging Face开源的macOS聊天应用程序
HuggingChat macOS是Hugging Face推出的开源聊天应用程序,专为macOS用户设计,基于强大的开源语言模型,将先进的AI对话能力直接带到用户的桌面上。应用支持多种顶尖的开源大语言模型,如Qwen 2....
-
发布了文章 2个月前
HuatuoGPT-baidu09o1 – 港中文联合深圳大数据研究院开源的医学高级推理大模型
HuatuoGPT-o1是香港中文大学(深圳)和深圳大数据研究院联合推出的,针对医学领域开发的复杂推理模型,基于复杂的推理能力提高解决医学问题的性能。模型用两个阶段的训练方法实现:首先,用医学验证器引导搜索正确的推理路径来微...




























