AI工具
发布文章-
发布了文章 2个月前
InftyThink – 浙大联合北大推出的无限深度推理范式
InftyThink是创新的大模型推理范式,突破传统模型在长推理任务中的局限性。通过分段迭代的方式,将复杂的推理过程分解为多个短片段,在每个片段后生成中间总结,实现分块式思考。...
-
发布了文章 2个月前
Infinity-baidu09MM – 智源推出的千万级多模态指令数据集
Infinity-MM是智源研究院推出的千万级多模态指令数据集,包含4300万条样本,数据量达10TB。数据集经过质量过滤和去重,确保高质量和多样性,能提升开源视觉-语言模型(VLMs)的性能。智源推出基于开源VLMs的合成...
-
发布了文章 2个月前
Infinity – 字节跳动推出的高分辨率图像生成模型
Infinity是字节跳动推出的基于位级自回归建模的视觉生成模型,能根据语言指令生成高分辨率、逼真的图像。Infinity通过无限词汇量的标记器、分类器和位自纠正机制,显著提升图像生成的细节和质量,超越现有的顶级扩散模型,生...
-
发布了文章 2个月前
InfiniteYou – 字节跳动开源的身份保持图像生成框架
InfiniteYou(InfU)是字节跳动智能创作团队推出的基于扩散变换器(Diffusion Transformers,如 FLUX)的身份保持图像生成框架。基于 InfuseNet 将身份特征注入扩散模型,增强身份相似...
-
发布了文章 2个月前
Infinite Mobility – 上海 AI Lab 推出的可交互物体生成模型
Infinite Mobility 是上海AI Lab推出的可交互物体生成模型,基于程序化生成技术,高效生成高质量的可交互物体数据资产。Infinite Mobility支持22类常见可交互物体的生成,单个物体生成仅需约1秒...
-
发布了文章 2个月前
InfiMM-baidu09WebMath-baidu0940B – 字节联合中科院开源的超大规模多模态数据集
InfiMM-WebMath-40B 是字节跳动和中国科学院联合开源的超大规模多模态数据集,旨在提升多模态模型的图文混合推理能力,在数学领域。数据集从 Common Crawl 中提取,经过严格的筛选、清洗和标注,包含 24...
-
发布了文章 2个月前
Inf-baidu09DiT – 清华联合智谱 AI 推出的超高分辨率图像生成模型
Inf-DiT 是清华大学、智谱AI 推出基于扩散模型的图像上采样方法,能生成超高分辨率图像。Inf-DiT引入单向块注意力机制(UniBA),将生成过程中的空间复杂度从 O(N^2 降低到 O(N ,有效解决传统扩散模型...
-
发布了文章 2个月前
Indic Parler-baidu09TTS – 开源多语言TTS模型,专注于合成印度语和英语
Indic Parler-TTS 是 Hugging Face 和 AI4Bharat 团队合作推出的多语言文本到语音(TTS)模型,专门用于印度语言和英语的语音合成。Indic Parler-TTS 是 Parler-TT...
-
发布了文章 2个月前
IndexTTS – B 站推出的文本转语音模型,支持拼音纠正汉字发音
IndexTTS 是 B 站推出的工业级可控文本转语音(TTS)系统。基于 XTTS 和 Tortoise 模型开发,结合了 GPT 风格的生成技术,能将文本高效转化为自然流畅的语音。IndexTTS 的优势是对中文文本的处...
-
发布了文章 2个月前
Index-baidu09AniSora – B站开源的动漫视频生成模型
Index-AniSora 是哔哩哔哩开源的先进动漫视频生成模型,模型支持一键生成多种动漫风格的视频,涵盖番剧片段、国创动画、VTuber 内容等。模型包含超过 1000 万高质量的文本视频对,基于时空掩码模块实现图像到视频...
-
发布了文章 2个月前
In-baidu09Context LoRA – 阿里通义推出的基于DiTs的图像生成框架
In-Context LoRA是阿里巴巴通义实验室推出的基于扩散变换器(DiTs)的图像生成框架,用模型的内在上下文学习能力,最小化调整激活模型的上下文生成能力。这种方法无需修改原始模型架构,只需对训练数据进行微调,就能适应...
-
发布了文章 2个月前
ImmerseGen – 字节跳动联合浙大推出的3D世界生成框架
ImmerseGen是字节跳动的PICO团队和浙江大学联合推出的创新3D世界生成框架。框架根据用户输入的文字提示,基于Agent引导的资产设计和排列,生成带有alpha纹理的紧凑Agent,创建全景3D世界。...
-
发布了文章 2个月前
Imagine Yourself – Meta公司推出的个性化AI图像生成模型
Imagine Yourself 是Meta公司推出的个性化AI图像生成模型,突破了传统方法的局限,无需对每个用户进行单独调整,通过单一模式即可满足不同用户需求。模型采用合成配对数据生成和并行注意力架构,有效提高图像质量和多...
-
发布了文章 2个月前
Imagen 4 – 谷歌推出的最新图像生成AI模型
Imagen 4是谷歌发布的最新图像生成AI模型。支持高达2K分辨率的图像生成,细节呈现逼真,可清晰呈现复杂织物纹理、水滴折射及动物毛发质感等。在文本渲染方面,Imagen 4也有重大突破,能生成清晰准确的文字,适合广告、漫...
-
发布了文章 2个月前
Imagen 3 – Google推出的AI图像生成模型
Imagen 3是Google推出的AI图像生成模型,可以生成高质量、逼真的图像。Imagen 3对提示词理解更好,可捕捉更多细节,生成更广泛的视觉风格。基于谷歌的文生图模型Imagen 3的产品ImageFX,现已开放使用...































