AI工具
发布文章-
发布了文章 2个月前
PDF to Podcast – 英伟达推出的 PDF 转音频内容 AI 工具
PDF to Podcast是NVIDIA推出的PDF转音频的AI工具,基于NVIDIA NIM微服务架构的,能将PDF文档转换为生动的音频内容,如播客。基于大型语言模型(LLM)、文本到语音(TTS)技术以及NVIDIA的...
-
发布了文章 2个月前
PC Agent-baidu09E – 上海交大联合SII推出的智能体训练框架
PC Agent-E是上海交通大学和SII联合推出的高效智能体训练框架。框架用312条人类标注的计算机使用轨迹,基于Claude 3.7 Sonnet模型合成多样化的行动决策,显著提升数据质量。...
-
发布了文章 2个月前
PC Agent – 上海交大联合 GAIR 推出的电脑智能体AI系统
PC Agent是上海交通大学和Generative AI Research Lab (GAIR 联合推出的先进AI系统。系统基于模拟人类认知过程,执行如组织研究材料、起草报告和创建演示文稿等复杂数字工作。PC Agent集...
-
发布了文章 2个月前
OxyGent – 京东零售开源的多智能体协作框架
OxyGent是京东零售Oxygen团队开源的多智能体协作框架,能帮助开发者高效组装多智能体系统。OxyGent将工具、模型和智能体抽象为可插拔的模块(Oxy),支持像搭积木一样灵活组合,具备极致可扩展性和全链路决策追溯能力...
-
发布了文章 2个月前
Ovis2 – 阿里国际推出的多模态大语言系列模型
Ovis2 是阿里巴巴国际团队推出的新型多模态大语言模型,基于结构化嵌入对齐解决视觉与文本模态间的差异。Ovis2继承、优化了 Ovis 系列架构,强化小规模模型的能力密度,基于指令微调和偏好学习显著提升了思维链(CoT)推...
-
发布了文章 2个月前
Ovis1.6 – 阿里国际AI团队推出的多模态大模型,超过闭源GPT-baidu094o-baidu09mini
Ovis1.6是阿里国际AI团队推出的多模态大模型,在多模态权威综合评测基准OpenCompass上取得了优异的成绩,特别是在30亿参数以下的模型中综合得分排名第一,超越了其他主流模型。Ovis1.6模型在数学推理、视觉理解...
-
发布了文章 2个月前
Ovis-baidu09U1 – 阿里推出的多模态统一模型
Ovis-U1是阿里巴巴集团Ovis团队推出的多模态统一模型,拥有30亿参数。模型集成多模态理解、文本到图像生成和图像编辑三种核心能力,基于先进的架构和协同统一训练方式,实现高保真图像合成和高效的文本视觉交互。...
-
发布了文章 2个月前
OutofFocus – 文本驱动图像生成或编辑的AI工具
OutofFocus是一个基于AI技术的图像编辑工具,基于Gradio平台为用户提供一个直观的界面操作和编辑图片。工具的核心功能是接受用户的文本提示,运用自然语言处理(NLP)技术理解提示,结合扩散逆过程重建技术修改图像。...
-
发布了文章 2个月前
OuteTTS – 开源的文本到语音合成项目,基于纯语言建模方法生成语音
OuteTTS是开源的文本到语音(TTS)项目,基于纯语言建模的方法生成语音。OuteTTS项目基于LLaMa架构,用Oute3-350M-DEV基础模型,拥有3.5亿参数。OuteTTS具备音频标记化、CTC强制对齐技术和...
-
发布了文章 2个月前
Oumi – 开源 AI 平台,支持 1000 万到 4050 亿参数模型训练
Oumi 是完全开源的 AI 平台,简化从数据准备、模型训练到评估和部署的整个生命周期。支持从 1000 万到 4050 亿参数的模型训练,涵盖文本和多模态模型(如 Llama、Qwen 等),提供零样板代码(Zero Bo...
-
发布了文章 2个月前
Oryx – 腾讯联合清华和南洋理工大学推出的多模态大语言模型
Oryx是由清华大学、腾讯和南洋理工大学联合推出的多模态大型语言模型(MLLM),基于两项核心创新来处理视觉数据,预训练的OryxViT模型和动态压缩模块。OryxViT将任意分辨率的图像编码为适合LLM的视觉表示,动态压缩...
-
发布了文章 2个月前
Orpheus TTS – 开源AI语音合成系统,支持多种语音风格
Orpheus TTS 是基于 Llama-3b 架构的开源文本到语音(TTS)系统。Orpheus TTS 支持生成自然、富有情感且接近人类水平的语音,具备零样本语音克隆能力,无需预训练,模仿特定语音。Orpheus TT...
-
发布了文章 2个月前
OptoChat AI – 南智光电联合南大推出的光子芯片领域专用大模型
OptoChat AI是南智光电与南京大学共同推出的国内首款光子专用大模型。模型聚焦光子领域全产业链,集成超过30万条光子芯片相关专利、文献和行业数据资源,具备强大的数据分析与智能算法能力。...
-
发布了文章 2个月前
Optimus-baidu091 – 哈工大联合鹏城实验室推出的智能体框架
Optimus-1是哈尔滨工业大学(深圳)和鹏城实验室推出的智能体框架,能解决在开放世界环境中完成长期任务的挑战。框架结合结构化知识和多模态经验,让智能体更好地执行复杂任务。...
-
发布了文章 2个月前
Optima – 清华联合北邮推出优化通信效率和任务有效性的训练框架
Optima是清华大学推出的优化基于大型语言模型(LLM)的多智能体系统(MAS)的框架。基于一个迭代的生成、排名、选择和训练范式,显著提高通信效率和任务效果。Optima平衡了任务性能、令牌效率和通信可读性,探索了多种强化...




























