AI工具
发布文章-
发布了文章 2个月前
SwiftBrush V2 – 文本到图像的单步扩散模型,性能与多步模型相媲美
SwiftBrush V2 是文本到图像的单步扩散模型,通过改进训练方法和模型融合技术,实现与多步Stable Diffusion扩散模型相媲美的性能。模型通过更好的权重初始化、高效的LoRA训练,引入一种新颖的夹紧CLIP...
-
发布了文章 2个月前
Swarm – OpenA推出的轻量级多智能体编排框架
Swarm是由OpenAI推出的一个实验性框架,旨在构建、编排和部署多智能体系统。基于轻量级的Agent和handoff机制,简化智能体之间的协调和执行过程,让控制更加精细,测试更加便捷。...
-
发布了文章 2个月前
Surya – 开源的OCR工具包,支持90+语言、布局分析等识别
Surya是一款功能强大的开源OCR(光学字符识别)工具包,专门设计用在文档识别,支持超过90种语言的识别。Surya能准确识别出文档中的文本,分析文本的阅读顺序,检测文档中的布局元素,如表格、图片和标题,及识别和解析表格内...
-
发布了文章 2个月前
SurveyX – 人民大学联合悉尼大学等推出自动化生成学术综述的系统
SurveyX 是基于大型语言模型(LLMs)自动化生成学术综述的系统,是中国人民大学、悉尼大学和中国东北大学联合推出的。基于用户提供论文标题和关键词,快速生成高质量、特定领域的学术综述或论文。SurveyX系统用先进的语言...
-
发布了文章 2个月前
SurveyGO卷姬 – 清华联合面壁智能开源的AI论文写作工具
SurveyGO(卷姬) 是面壁智能团队开源的AI论文写作工具。支持根据用户输入的论文主题和描述,快速生成结构清晰、内容丰富的综述文章,帮助科研人员和学生高效完成文献综述部分。...
-
发布了文章 2个月前
SurveyForge – AI自动化学术综述生成框架
SurveyForge是上海AI Lab联合复旦大学、上海交通大学等机构推出的创新框架,用在自动化生成高质量学术综述。框架基于两阶段设计,大纲生成和内容生成。在大纲生成阶段,基于双数据库协同驱动(研究论文数据库和综述大纲数据...
-
发布了文章 2个月前
SurfSense – 开源AI研究助手,个人知识库与全球数据源无缝链接
SurfSense 是开源的 AI 研究工具,类似于 NotebookLM 和 Perplexity,具备更强的扩展性。工具能与多种外部数据源(如搜索引擎、Slack、Notion、YouTube、GitHub 等)集成,支...
-
发布了文章 2个月前
SuperGPQA – 豆包大模型联合 M-baidu09A-baidu09P 开源的知识推理基准测试集
SuperGPQA 是字节跳动豆包大模型团队联合 M-A-P 推出的全面覆盖 285 个研究生级学科、包含 26529 道专业题目的知识推理基准测试集。解决传统评测基准学科覆盖不全、题目质量存疑和评测维度单一的问题,基于专家...
-
发布了文章 2个月前
SuperEdit – 字节跳动等机构推出的图像编辑方法
SuperEdit是字节跳动智能创作团队和佛罗里达中央大学计算机视觉研究中心联合推出的指令引导图像编辑方法,基于优化监督信号提高图像编辑的精度和效果。SuperEdit基于纠正编辑指令,与原始图像和编辑图像对更准确地对齐,引...
-
发布了文章 2个月前
SuperDesign – 开源AI设计Agent,并行生成多个设计选项
SuperDesign 是开源AI设计Agent,帮助设计师和开发者在 IDE 中直接生成 UI 原型、组件和线框图。工具支持自然语言输入,能并行生成多个设计选项,方便用户快速探索不同创意。...
-
发布了文章 2个月前
Suna – Kortix推出的全球首款通用型 AI Agent 开源项目
Suna 是Kortix推出的全球首款通用型 AI Agent 开源项目,支持高效解决现实场景中的各类任务。基于自然流畅的对话交互,Suna 支持智能辅助研究分析、数据处理及日常事务,化身专属数字伙伴。Suna 具备强大的功...
-
发布了文章 2个月前
StyleStudio – 文本驱动的风格迁移模型,能将参考图像的风格与文本提示内容融合
StyleStudio是西湖大学AI实验室、复旦大学、南洋理工大学和香港科技大学(广州)联合推出的,文本驱动的风格迁移模型,能将参考图像的风格与文本提示的内容融合。StyleStudio基于三种策略解决风格过拟合、控制限制和...
-
发布了文章 2个月前
StyleShot – 开源的AI图像风格迁移模型
StyleShot 是开源的AI图像风格迁移模型,无需额外训练即可实现任意风格到任意内容的迁移。通过风格感知编码器提取风格特征,基于内容融合编码器加强风格与内容的整合。StyleShot 能捕捉从基本元素到复杂细节的多种风格...
-
发布了文章 2个月前
StreamingT2V – PicsArt推出的可生成长达2分钟视频的模型
StreamingT2V是由PicsArt AI研究团队推出的一个文本到视频的生成模型,旨在解决现有模型仅能生成16帧或24帧的高质量短视频,在生成长视频时则会遇到如视频质量下降、场景转换不一致和视频停滞等问题的挑战。...
-
发布了文章 2个月前
StreamMultiDiffusion – 实时生成和编辑图像的交互式框架
StreamMultiDiffusion是一个实时交互式的图像生成框架,结合了扩散模型的高质量图像合成能力和区域控制的灵活性,可根据用户指定的区域文本提示生成实时、交互式、多文本到图像。该框架的目的是提高图像生成的速度和用户...































