AI工具
发布文章-
发布了文章 2个月前
ObjectMover – 港大联合 Adobe 推出的新型图像编辑模型
ObjectMover 是香港大学和 Adobe Research 联合提出的新型图像编辑模型,解决图像中物体移动、插入和移除时出现的光照、阴影不协调以及物体失真等问题。将物体移动视为两帧视频的特殊案例,利用预训练视频生成模...
-
发布了文章 2个月前
Oasis – Decart联合Etched推出首款AI实时生成的游戏系统
Oasis是世界上首款AI实时生成的游戏,由Decart和Etched联合推出。游戏能以每秒20帧的速度实时渲染交互式视频内容,无需游戏引擎,通过AI模型直接生成。玩家可以自由移动、跳跃、拾取物品,体验由AI实时塑造的游戏世...
-
发布了文章 2个月前
OWL – 开源多智能体协作系统,动态交互实现任务自动化
OWL(Optimized Workforce Learning)是基于CAMEL-AI框架开发的多智能体协作系统,通过智能体之间的动态交互实现高效的任务自动化。通过角色分配和任务分解,让多个智能体协同完成复杂任务,例如文件...
-
发布了文章 2个月前
OThink-baidu09MR1 – OPPO联合港科大推出的多模态语言模型优化框架
OThink-MR1是OPPO研究院和香港科技大学(广州)联合推出的多模态语言模型优化框架。基于动态调整Kullback-Leibler(KL)散度策略(GRPO-D)和奖励模型,提升多模态模型在复杂任务中的泛化推理能力。...
-
发布了文章 2个月前
OSUM – 西北工业大学开源的语音理解模型
OSUM(Open Speech Understanding Model)是西北工业大学计算机学院音频、语音与语言处理研究组推出的开源语音理解模型。OSUM结合Whisper编码器和Qwen2 LLM,支持语音识别(ASR)...
-
发布了文章 2个月前
OSAID 1.0 – OSI发布的全球首个开源 AI 官方标准1.0版本
OSAID 1.0(The Open Source AI Definition – 1.0)是Open Source Initiative(OSI)发布的官方标准,用在明确AI系统成为开放源代码的条件。参与制定OSAID 1...
-
发布了文章 2个月前
ORMBG – 开源的AI图像分割工具
ORMBG是开源的AI图像分割工具,由开发者schirrmacher在GitHub上发起。ORMBG专注于从图片中准确去除背景,用先进的图像处理技术,实现对图像中前景和背景的精确区分,常用于照片编辑、图像合成和自动化图像处理...
-
发布了文章 2个月前
OOTDiffusion – 开源AI虚拟试衣工具,智能适配性别和体型自动调整衣物
OOTDiffusion是开源的AI虚拟试衣工具,能智能适配不同性别和体型,自动调整衣物尺寸和形状,生成自然贴合的试穿效果。OOTDiffusion支持半身和全身试穿模式,用户上传自己的模特和服装图片,实现高度自定义的试穿体...
-
发布了文章 2个月前
OOMOL – 基于 VSCode 的 AI 工作流集成开发环境
OOMOL (悟墨)是基于 VSCode 打造的现代化集成开发环境(IDE),专为工作流自动化而设计。通过拖拽式图形化界面,让用户能直观地搭建复杂的工作流,无需编程基础。核心优势在于预装的 Python 和 Node.js...
-
发布了文章 2个月前
OMNE Multiagent – 天桥脑科学研究院推出的大模型多智能体框架
OMNE Multiagent是天桥脑科学研究院(Tianqiao and Chrissy Chen Institute,TCCI)推出的大模型多智能体框架。基于长期记忆(Long Term Memory, LTM)构建,每...
-
发布了文章 2个月前
OLMoE – 完全开源的大语言模型,基于混合专家(MoE)架构
OLMoE(Open Mixture-of-Experts Language Models)是一个完全开源的大型语言模型,基于混合专家(MoE)架构。OLMoE基于5万亿个token进行预训练,拥有70亿总参数和10亿活跃参...
-
发布了文章 2个月前
OLMo – 艾伦AI研究所开源的完全开放的大语言模型框架
OLMo(Open Language Model)是由Allen AI(AI2,艾伦AI研究所)开发的一个完全开源开放的大型语言模型(LLM)框架,设计初衷是为了通过开放研究,促进学术界和研究人员共同研究语言模型的科学。OL...
-
发布了文章 2个月前
OLMo 2 32B – Ai2 推出的最新开源语言模型
OLMo 2 32B 是 Allen Institute for AI(Ai2)推出的最新开源语言模型,是 OLMo 2 系列的重要成果。拥有 320 亿参数,是首个在多技能学术基准测试中超越 GPT-3.5-Turbo 和...
-
发布了文章 2个月前
OCode – 终端原生AI编程助手,直接在shell环境中运行
OCode 是终端原生 AI 编程助手,为开发者提供深度代码库智能和自动任务执行功能。与本地 Ollama 模型无缝集成,将企业级 AI 辅助直接融入开发流程中。终端原生工作流,能直接在你的 shell 环境中运行...
-
发布了文章 2个月前
OCTAVE – Hume AI推出的语音语言模型
OCTAVE(Omni-Capable Text and Voice Engine)是Hume AI推出的新一代语音语言模型,结合EVI 2模型和OpenAI、Elevenlab、Google Deepmind等系统的能力。...






























