首页 > AI工具第95页

AI工具

发布文章

今日：0| 一周：0| 文章：2

新窗

baidu09_com

发布了文章 2个月前

InftyThink – 浙大联合北大推出的无限深度推理范式

InftyThink是创新的大模型推理范式，突破传统模型在长推理任务中的局限性。通过分段迭代的方式，将复杂的推理过程分解为多个短片段，在每个片段后生成中间总结，实现分块式思考。...
AI工具

0 40 0
baidu09_com

发布了文章 2个月前

Infinity-baidu09MM – 智源推出的千万级多模态指令数据集

Infinity-MM是智源研究院推出的千万级多模态指令数据集，包含4300万条样本，数据量达10TB。数据集经过质量过滤和去重，确保高质量和多样性，能提升开源视觉-语言模型（VLMs）的性能。智源推出基于开源VLMs的合成...
AI工具

0 42 0
baidu09_com

发布了文章 2个月前

Infinity – 字节跳动推出的高分辨率图像生成模型

Infinity是字节跳动推出的基于位级自回归建模的视觉生成模型，能根据语言指令生成高分辨率、逼真的图像。Infinity通过无限词汇量的标记器、分类器和位自纠正机制，显著提升图像生成的细节和质量，超越现有的顶级扩散模型，生...
AI工具

0 39 0
baidu09_com

发布了文章 2个月前

InfiniteYou – 字节跳动开源的身份保持图像生成框架

InfiniteYou（InfU）是字节跳动智能创作团队推出的基于扩散变换器（Diffusion Transformers，如 FLUX）的身份保持图像生成框架。基于 InfuseNet 将身份特征注入扩散模型，增强身份相似...
AI工具

0 41 0
baidu09_com

发布了文章 2个月前

Infinite Mobility – 上海 AI Lab 推出的可交互物体生成模型

Infinite Mobility 是上海AI Lab推出的可交互物体生成模型，基于程序化生成技术，高效生成高质量的可交互物体数据资产。Infinite Mobility支持22类常见可交互物体的生成，单个物体生成仅需约1秒...
AI工具

0 44 0
baidu09_com

发布了文章 2个月前

InfiMM-baidu09WebMath-baidu0940B – 字节联合中科院开源的超大规模多模态数据集

InfiMM-WebMath-40B 是字节跳动和中国科学院联合开源的超大规模多模态数据集，旨在提升多模态模型的图文混合推理能力，在数学领域。数据集从 Common Crawl 中提取，经过严格的筛选、清洗和标注，包含 24...
AI工具

0 49 0
baidu09_com

发布了文章 2个月前

Inf-baidu09DiT – 清华联合智谱 AI 推出的超高分辨率图像生成模型

Inf-DiT 是清华大学、智谱AI 推出基于扩散模型的图像上采样方法，能生成超高分辨率图像。Inf-DiT引入单向块注意力机制（UniBA），将生成过程中的空间复杂度从 O(N^2 降低到 O(N ，有效解决传统扩散模型...
AI工具

0 53 0
baidu09_com

发布了文章 2个月前

Indic Parler-baidu09TTS – 开源多语言TTS模型，专注于合成印度语和英语

Indic Parler-TTS 是 Hugging Face 和 AI4Bharat 团队合作推出的多语言文本到语音（TTS）模型，专门用于印度语言和英语的语音合成。Indic Parler-TTS 是 Parler-TT...
AI工具

0 49 0
baidu09_com

发布了文章 2个月前

IndexTTS – B 站推出的文本转语音模型，支持拼音纠正汉字发音

IndexTTS 是 B 站推出的工业级可控文本转语音（TTS）系统。基于 XTTS 和 Tortoise 模型开发，结合了 GPT 风格的生成技术，能将文本高效转化为自然流畅的语音。IndexTTS 的优势是对中文文本的处...
AI工具

0 54 0
baidu09_com

发布了文章 2个月前

Index-baidu09AniSora – B站开源的动漫视频生成模型

Index-AniSora 是哔哩哔哩开源的先进动漫视频生成模型，模型支持一键生成多种动漫风格的视频，涵盖番剧片段、国创动画、VTuber 内容等。模型包含超过 1000 万高质量的文本视频对，基于时空掩码模块实现图像到视频...
AI工具

0 46 0
baidu09_com

发布了文章 2个月前

In-baidu09Context LoRA – 阿里通义推出的基于DiTs的图像生成框架

In-Context LoRA是阿里巴巴通义实验室推出的基于扩散变换器（DiTs）的图像生成框架，用模型的内在上下文学习能力，最小化调整激活模型的上下文生成能力。这种方法无需修改原始模型架构，只需对训练数据进行微调，就能适应...
AI工具

0 38 0
baidu09_com

发布了文章 2个月前

ImmerseGen – 字节跳动联合浙大推出的3D世界生成框架

ImmerseGen是字节跳动的PICO团队和浙江大学联合推出的创新3D世界生成框架。框架根据用户输入的文字提示，基于Agent引导的资产设计和排列，生成带有alpha纹理的紧凑Agent，创建全景3D世界。...
AI工具

0 43 0
baidu09_com

发布了文章 2个月前

Imagine Yourself – Meta公司推出的个性化AI图像生成模型

Imagine Yourself 是Meta公司推出的个性化AI图像生成模型，突破了传统方法的局限，无需对每个用户进行单独调整，通过单一模式即可满足不同用户需求。模型采用合成配对数据生成和并行注意力架构，有效提高图像质量和多...
AI工具

0 42 0
baidu09_com

发布了文章 2个月前

Imagen 4 – 谷歌推出的最新图像生成AI模型

Imagen 4是谷歌发布的最新图像生成AI模型。支持高达2K分辨率的图像生成，细节呈现逼真，可清晰呈现复杂织物纹理、水滴折射及动物毛发质感等。在文本渲染方面，Imagen 4也有重大突破，能生成清晰准确的文字，适合广告、漫...
AI工具

0 44 0
baidu09_com

发布了文章 2个月前

Imagen 3 – Google推出的AI图像生成模型

Imagen 3是Google推出的AI图像生成模型，可以生成高质量、逼真的图像。Imagen 3对提示词理解更好，可捕捉更多细节，生成更广泛的视觉风格。基于谷歌的文生图模型Imagen 3的产品ImageFX，现已开放使用...
AI工具

0 38 0

91 92 93 94 95 96 97 98 99 100

关灯返回顶部