首页 > AI工具第99页

AI工具

发布文章

今日：0| 一周：0| 文章：2

新窗

baidu09_com

发布了文章 2个月前

HouseCrafter – 东北大学和 Stability AI推出2D转换3D室内场景的技术

HouseCrafter 是由东北大学和 Stability AI 推出的先进技术，将二维平面图自动转换成三维室内场景。基于一个网络规模图像训练的2D扩散模型，生成一致的多视图彩色（RGB）和深度（D）图像。图像自回归地批量...
AI工具

0 38 0
baidu09_com

发布了文章 2个月前

HourVideo – 李飞飞和吴佳俊团队推出的长视频理解基准数据集

HourVideo是斯坦福大学李飞飞和吴佳俊团队推出的长视频理解基准数据集，包含500个第一人称视角视频，时长20至120分钟，覆盖77种日常活动，能评估多模态模型对长视频的理解能力。...
AI工具

0 41 0
baidu09_com

发布了文章 2个月前

HoloTime – 北大联合鹏城实验室推出的全景4D场景生成框架

HoloTime 是北京大学深圳研究生院和鹏城实验室推出的全景 4D 场景生成框架，基于视频扩散模型将单张全景图像转化为具有真实动态效果的全景视频，进一步重建为沉浸式的 4D 场景。...
AI工具

0 41 0
baidu09_com

发布了文章 2个月前

HoloPart – 港大联合 VAST 开源生成完整可编辑部件的 3D 模型

HoloPart 是香港大学、VAST 团队推出的新型扩散模型，支持将 3D 物体分解为完整、可编辑的语义部件，即使部件被遮挡。...
AI工具

0 42 0
baidu09_com

发布了文章 2个月前

HoloDrive – 商汤联合上海AI Lab等机构推出的2D-baidu093D多模态街道场景生成框架

HoloDrive 是商汤和上海人工智能实验室等机构提出的用于自动驾驶的整体2D-3D多模态街道场景生成框架。框架联合生成相机图像和激光雷达点云，填补自动驾驶中2D-3D多模态联合生成的空白。...
AI工具

0 40 0
baidu09_com

发布了文章 2个月前

HoloDreamer – AI文本驱动3D场景生成框架

HoloDreamer是北京大学联合鹏城实验室推出的AI文本驱动3D场景生成框架。通过两个核心模块：风格化全景图生成和增强两阶段全景图重建，从文本描述中快速生成沉浸式、视角一致的全封闭3D场景。...
AI工具

0 36 0
baidu09_com

发布了文章 2个月前

HivisionIDPhotos – 免费开源的AI证件照制作工具

HivisionIDPhoto 是一款基于 AI 的轻量级证件照制作工具，它能智能识别和抠图，快速生成符合多种规格的证件照。支持自定义背景色和尺寸，未来还将推出美颜和智能换正装功能。...

AI工具

0 35 0
baidu09_com

发布了文章 2个月前

HiveChat – 开源 AI 聊天机器人，支持Deepseek等主流 AI 模型

HiveChat 是为中小团队设计的 AI 聊天应用，支持多种主流 AI 模型，如 OpenAI、Claude、Gemini 和 Deepseek 等。HiveChat具备 LaTeX 和 Markdown 渲染、图像理解、...
AI工具

0 44 0
baidu09_com

发布了文章 2个月前

HistAgent – 普林斯顿联合复旦推出的AI历史研究助手

HistAgent 是普林斯顿大学 AI 实验室与复旦大学历史学系联合推出的专为历史研究设计的人工智能助手系统。解决历史研究中多模态信息处理、跨语言分析和复杂推理等难题。...
AI工具

0 38 0
baidu09_com

发布了文章 2个月前

HippoRAG 2 – 俄亥俄州立大学推出的检索增强生成框架

HippoRAG 2是俄亥俄州立大学推出的检索增强生成（RAG）框架，解决现有RAG系统在模拟人类长期记忆动态性和关联性方面的局限性。HippoRAG 2基于个性化PageRank算法，将深度段落整合和更有效的在线LLM（大...
AI工具

0 33 0
baidu09_com

发布了文章 2个月前

Higgs Audio V2 – 开源语音大模型，能模拟多人互动场景

Higgs Audio V2 是李沐及其团队 Boson AI 开发的开源语音大模型。基于超过1000万小时的音频数据训练而成，具备多语言对话生成、自动韵律调整、语音克隆和歌声合成等功能。模型能模拟自然流畅的多人对话，自动匹...
AI工具

0 34 0
baidu09_com

发布了文章 2个月前

Hibiki – Kyutai Labs 推出的实时语音翻译模型

Hibiki是Kyutai Labs开源的用在同时语音翻译的解码器模型，能实时将一种语言的语音翻译成另一种语言的语音或文本。Hibiki基于多流语言模型架构，同步处理源语音和目标语音，联合生成文本和音频标记，实现语音到语音（...
AI工具

0 39 0
baidu09_com

发布了文章 2个月前

HiFiVFS – 腾讯联合VIVO推出的高保真视频换脸框架

HiFiVFS（High Fidelity Video Face Swapping）是腾讯和VIVO公司推出的高保真视频换脸框架，HiFiVFS基于Stable Video Diffusion（SVD）框架，用多帧输入和时间...
AI工具

0 38 0
baidu09_com

发布了文章 2个月前

HiDream-baidu09I1 – 智象未来开源的AI图像生成模型

HiDream-I1是 HiDream.ai 团队推出的开源AI图像生成模型，拥有17亿参数，采用MIT许可证。模型在图像生成质量、提示词遵循能力等方面表现出色，支持逼真、卡通、艺术等多种风格，适用于艺术创作、商业设计、教育...
AI工具

0 37 0
baidu09_com

发布了文章 2个月前

HiCo – 360 AI研究院推出的布局可控AI绘画模型

HiCo是360 AI研究院推出的基于扩散模型的层次化可控布局到图像生成模型，HiCo基于多分支结构设计，实现对对象位置和文本描述的精确控制。HiCo的关键特点在于进行空间解耦，有效地处理复杂布局，减少对象缺失和视角冲突等问...
AI工具

0 42 0

95 96 97 98 99 100 101 102 103 104

关灯返回顶部