AI工具
发布文章-
发布了文章 2个月前
SongCreator – AI音乐模型,能理解、生成和编辑歌曲
SongCreator是清华大学深圳国际研究生院、香港中文大学等机构推出的AI音乐生成模型,能从歌词出发生成包含声乐和伴奏的完整歌曲。...
-
发布了文章 2个月前
SocraticLM – 中科大和科大讯飞共同推出的苏格拉底教学大模型
SocraticLM 是通过苏格拉底式的教学法来教授数学的创新人工智能模型,模型由中科大和科大讯飞共同开发,采用了“Thought-Provoking”教学范式,通过提问引导学生主动思考和解决问题。SocraticLM 在名...
-
发布了文章 2个月前
SocioVerse – 复旦大学联合小红书等机构开源的社会模拟世界模型
SocioVerse(众生) 是复旦大学、上海创智学院、罗切斯特大学和小红书联合推出的社会模拟世界模型。基于大语言模型(LLM)驱动的智能体和包含1000万真实用户的数据池,构建与现实世界“对齐”的大规模社会模拟框架。...
-
发布了文章 2个月前
Social Media Agent – AI社交媒体内容管理工具,输入URL自动生成帖子
Social Media Agent是智能的社交媒体内容管理工具,基于输入的URL内容生成Twitter和LinkedIn帖子。Social Media Agent用人机交互 流程,处理社交媒体平台认证,支持用户修改或接受/...
-
发布了文章 2个月前
SnapGen – Snap联合港科大等机构推出的移动端文生图模型
SnapGen是Snap Inc、香港科技大学、墨尔本大学等机构联合推出的文本到图像(T2I)扩散模型,能在移动设备上快速生成高分辨率(1024x1024像素)的图像,且只需1.4秒。模型用379M参数实现这一性能,显著减少...
-
发布了文章 2个月前
Snap Video – Snapchat公司推出的AI视频生成模型
Snap Video是由Snap公司的研究团队开发的一个AI视频生成模型,目标是通过文本描述来合成视频,即用户可以输入一段描述性的文本,模型能够根据这段文本生成相应的视频内容。由于视频内容具有高度的冗余性和复杂性,Snap...
-
发布了文章 2个月前
SmoothCache – Roblox 和女王大学推出用于DiT的通用推理加速技术
SmoothCache 是用在Diffusion Transformers (DiT)模型的通用推理加速技术,是 Roblox 和女王大学的研究团队推出。基于分析相邻扩散时间步的层输出相似性,自适应地缓存和重用关键特征,减少...
-
发布了文章 2个月前
SmolVLM – Hugging Face推出的轻量级视觉语言模型
SmolVLM是Hugging Face推出的轻量级视觉语言模型,专为设备端推理设计。以20亿参数量,实现了高效内存占用和快速处理速度。SmolVLM提供了三个版本以满足不同需求:SmolVLM-Base:适用于下游任务的微...
-
发布了文章 2个月前
SmolVLA – Hugging Face开源的轻量级机器人模型
SmolVLA 是 Hugging Face 开源的轻量级视觉-语言-行动(VLA)模型,专为经济高效的机器人设计。拥有4.5亿参数,模型小巧,可在CPU上运行,单个消费级GPU即可训练,能在MacBook上部署。...
-
发布了文章 2个月前
SmolLM2 – Hugging Face推出的紧凑型大语言模型
SmolLLM2是Hugging Face推出用在设备端应用的紧凑型大型语言模型,提供1.7B、360M、135M三个不同参数级别的模型,适应不同的应用场景和资源限制。模型在理解和执行指令、进行知识推理及解决数学问题方面表现...
-
发布了文章 2个月前
SmolDocling – 轻量级的多模态文档处理模型
SmolDocling(SmolDocling-256M-preview )是高效轻量级的多模态文档处理模型。能将文档图像端到端地转换为结构化文本,支持文本、公式、图表等多种元素识别,适用于学术论文、技术报告等多类型文档。...
-
发布了文章 2个月前
SmartEraser – 中科大与微软亚洲研究院推出的图像对象移除技术
SmartEraser是中国科学技术大学与微软亚洲研究院推出的图像编辑技术,专门用在从图像中移除用户指定的对象。SmartEraser基于创新的“掩码区域引导”(Masked-Region Guidance)范式,与传统的“...
-
发布了文章 2个月前
Smallpond – DeepSeek开源的轻量级数据处理框架
Smallpond是DeepSeek推出的基于 DuckDB 和 3FS 构建的轻量级数据处理框架,专为高性能和大规模数据处理设计。Smallpond支持处理 PB 级数据集,借助 DuckDB 的高性能分析能力和 3FS...
-
发布了文章 2个月前
SlowFast-baidu09LLaVA-baidu091.5 – 苹果推出的多模态长视频理解模型
SlowFast-LLaVA-1.5(简称SF-LLaVA-1.5)是专为长视频理解设计的高效视频大语言模型。基于双流(SlowFast)机制,平衡处理更多输入帧与减少每帧令牌数量之间的关系,能捕捉详细的空间特征,且能高效地...
-
发布了文章 2个月前
Slidev – 开源AI PPT制作工具,支持Markdown秒变幻灯片
Slidev 是开源的幻灯片制作工具,基于 Markdown + Vue 技术栈实现。工具支持用简单的 Markdown 语法创建幻灯片,支持代码高亮、实时编码演示、数学公式渲染、图表生成等功能,提供丰富的主题和样式选项。...






























