AI工具
发布文章-
发布了文章 2个月前
SPDL – Meta AI 推出的开源高性能AI模型数据加载解决方案
SPDL(Scalable and Performant Data Loading)是 Meta AI 推出的开源数据加载工具,能提高 AI 模型训练效率。基于多线程技术,实现高吞吐量数据加载,减少计算资源消耗。与传统基于进...
-
发布了文章 2个月前
SPAR3D – Stability AI等机构推出的单试图重建 3D 网络模型
SPAR3D是Stability AI和伊利诺伊大学香槟分校推出的,先进的单图生成3D模型方法,能从单张图像中高效重建出高质量的3D对象。SPAR3D基于两阶段设计,第一阶段用点扩散模型生成稀疏的3D点云,第二阶段结合采样的...
-
发布了文章 2个月前
SPAR – 智谱团队推出的自我博弈训练框架
SPAR是智谱团队推出的自我博弈框架,能增强大型语言模型在遵循指令方面的能力。框架基于内部的生成者和完善者两个角色进行互动,生成者执行指令生成回复,完善者对回复进行分析和改进。SPAR基于树搜索技术精细化和优化回复,排除无关...
-
发布了文章 2个月前
SOLAMI – 南洋理工推出的VR端3D角色扮演AI系统
SOLAMI是创新的VR端3D角色扮演AI系统,是南洋理工大学研究团队推出的。支持用户用语音和肢体语言与虚拟角色进行沉浸式互动,基于社交视觉-语言-行为模型,提供超越传统文本和语音交互的自然交流体验。...
-
发布了文章 2个月前
SNOOPI – AI文本到图像生成框架,提升单步扩散模型的效率和性能
SNOOPI是创新的文本到图像生成框架,基于增强单步扩散模型的指导提升模型性能和控制力。SNOOPI包括PG-SB(适当指导 - SwiftBrush)和NASA(负向远离转向注意力)两种技术。PG-SB用随机尺度的无分类器...
-
发布了文章 2个月前
SHMT – 阿里达摩院联合武汉理工等机构推出的自监督化妆转移技术
SHMT(Self-supervised Hierarchical Makeup Transfer)是阿里巴巴达摩院与武汉理工大学等机构联合研发的先进自监督化妆转移技术。技术通过潜在扩散模型实现,能在无需成对训练数据的情况下...
-
发布了文章 2个月前
SFR-baidu09RAG – 专注于上下文理解和检索增强生成的语言模型
SFR-RAG是由Salesforce AI Research推出的一款大型语言模型,专注于提升机器在理解和生成文本方面的应用能力。模型特别强调对上下文的忠实理解,在检索增强生成领域进行优化。...
-
发布了文章 2个月前
SEMIKONG – 专为半导体领域设计的大型语言模型
SEMIKONG是专门为半导体行业定制的大型语言模型(LLM),是Aitomatic、FPT Software和东京电子有限公司联合推出的。基于深入的领域知识,解决半导体制造和设计中的独特挑战,如复杂的物理和化学问题。...
-
发布了文章 2个月前
SEED-baidu09Story – 腾讯推出的多模态故事生成模型
SEED-Story是腾讯联合香港科技大学、香港中文大学推出的多模态故事生成模型。基于多模态大语言模型(MLLM),能预测文本和视觉token,通过视觉de-tokenizer生成风格一致的图像。SEED-Story引入了多...
-
发布了文章 2个月前
SDXL-baidu09Lightning – 字节跳动推出的文本到图像生成模型
SDXL-Lightning是由字节跳动的研究团队推出的一种基于扩散模型的文本到图像生成技术,旨在解决传统扩散模型在图像生成速度和计算成本上的局限性。该模型基于 SDXL(Stable Diffusion XL)架构,通过结...
-
发布了文章 2个月前
SDXL-baidu09EcomID – 阿里推出的单个参考图像生成定制的个性图像框架
SDXL-EcomID是阿里妈妈推出的开源项目,从单个参考图像生成定制的个性图像。融合PuLID和InstantID的优点,优化背景一致性、面部关键点控制和面部真实性,提高生成图像的相似度。SDXL-EcomID在200万张...
-
发布了文章 2个月前
SCoRe – 谷歌DeepMind推出的多轮强化学习方法
SCoRe(Self-Correction via Reinforcement Learning)是谷歌DeepMind推出的一种创新的多轮强化学习方法,旨在提高大型语言模型(LLM)的自我纠错能力。通过在模型生成的数据上进...
-
发布了文章 2个月前
SANA 1.5 – 英伟联合MIT、清北等机构推出的文生图新框架
SANA 1.5 是英伟达联合MIT、清华、北大等机构推出的新型高效的线性扩散变换器(Linear Diffusion Transformer),用于文本到图像生成任务。在 SANA 1.0 的基础上进行了改进,提出了三大创...
-
发布了文章 2个月前
SAM2Point – 基于SAM2的零样本3D分割技术,增强3D分割精确度
SAM2Point是基于SAM2的3D分割技术,无需额外训练或 2D-3D 投影,直接对任意3D数据进行零样本分割。通过将3D数据体素化,模拟为多方向视频流,基于SAM2实现精确的空间分割。...
-
发布了文章 2个月前
SAM 2.1 – Meta 开源的视觉分割模型
SAM 2.1(全称Segment Anything Model 2.1)是Meta(Facebook的母公司)推出的先进视觉分割模型,用于图像和视频。基于简单的Transformer架构和流式记忆设计,实现实时视频处理。S...






























