首页 > AI工具第58页

AI工具

发布文章

今日：0| 一周：0| 文章：2

新窗

baidu09_com

发布了文章 2个月前

PDF to Podcast – 英伟达推出的 PDF 转音频内容 AI 工具

PDF to Podcast是NVIDIA推出的PDF转音频的AI工具，基于NVIDIA NIM微服务架构的，能将PDF文档转换为生动的音频内容，如播客。基于大型语言模型（LLM）、文本到语音（TTS）技术以及NVIDIA的...

AI工具

0 35 0
baidu09_com

发布了文章 2个月前

PC Agent-baidu09E – 上海交大联合SII推出的智能体训练框架

PC Agent-E是上海交通大学和SII联合推出的高效智能体训练框架。框架用312条人类标注的计算机使用轨迹，基于Claude 3.7 Sonnet模型合成多样化的行动决策，显著提升数据质量。...
AI工具

0 38 0
baidu09_com

发布了文章 2个月前

PC Agent – 上海交大联合 GAIR 推出的电脑智能体AI系统

PC Agent是上海交通大学和Generative AI Research Lab (GAIR 联合推出的先进AI系统。系统基于模拟人类认知过程，执行如组织研究材料、起草报告和创建演示文稿等复杂数字工作。PC Agent集...

AI工具

0 38 0
baidu09_com

发布了文章 2个月前

OxyGent – 京东零售开源的多智能体协作框架

OxyGent是京东零售Oxygen团队开源的多智能体协作框架，能帮助开发者高效组装多智能体系统。OxyGent将工具、模型和智能体抽象为可插拔的模块（Oxy），支持像搭积木一样灵活组合，具备极致可扩展性和全链路决策追溯能力...
AI工具

0 36 0
baidu09_com

发布了文章 2个月前

Ovis2 – 阿里国际推出的多模态大语言系列模型

Ovis2 是阿里巴巴国际团队推出的新型多模态大语言模型，基于结构化嵌入对齐解决视觉与文本模态间的差异。Ovis2继承、优化了 Ovis 系列架构，强化小规模模型的能力密度，基于指令微调和偏好学习显著提升了思维链（CoT）推...
AI工具

0 48 0
baidu09_com

发布了文章 2个月前

Ovis1.6 – 阿里国际AI团队推出的多模态大模型，超过闭源GPT-baidu094o-baidu09mini

Ovis1.6是阿里国际AI团队推出的多模态大模型，在多模态权威综合评测基准OpenCompass上取得了优异的成绩，特别是在30亿参数以下的模型中综合得分排名第一，超越了其他主流模型。Ovis1.6模型在数学推理、视觉理解...
AI工具

0 39 0
baidu09_com

发布了文章 2个月前

Ovis-baidu09U1 – 阿里推出的多模态统一模型

Ovis-U1是阿里巴巴集团Ovis团队推出的多模态统一模型，拥有30亿参数。模型集成多模态理解、文本到图像生成和图像编辑三种核心能力，基于先进的架构和协同统一训练方式，实现高保真图像合成和高效的文本视觉交互。...
AI工具

0 40 0
baidu09_com

发布了文章 2个月前

OutofFocus – 文本驱动图像生成或编辑的AI工具

OutofFocus是一个基于AI技术的图像编辑工具，基于Gradio平台为用户提供一个直观的界面操作和编辑图片。工具的核心功能是接受用户的文本提示，运用自然语言处理（NLP）技术理解提示，结合扩散逆过程重建技术修改图像。...
AI工具

0 36 0
baidu09_com

发布了文章 2个月前

OuteTTS – 开源的文本到语音合成项目，基于纯语言建模方法生成语音

OuteTTS是开源的文本到语音（TTS）项目，基于纯语言建模的方法生成语音。OuteTTS项目基于LLaMa架构，用Oute3-350M-DEV基础模型，拥有3.5亿参数。OuteTTS具备音频标记化、CTC强制对齐技术和...
AI工具

0 41 0
baidu09_com

发布了文章 2个月前

Oumi – 开源 AI 平台，支持 1000 万到 4050 亿参数模型训练

Oumi 是完全开源的 AI 平台，简化从数据准备、模型训练到评估和部署的整个生命周期。支持从 1000 万到 4050 亿参数的模型训练，涵盖文本和多模态模型（如 Llama、Qwen 等），提供零样板代码（Zero Bo...
AI工具

0 37 0
baidu09_com

发布了文章 2个月前

Oryx – 腾讯联合清华和南洋理工大学推出的多模态大语言模型

Oryx是由清华大学、腾讯和南洋理工大学联合推出的多模态大型语言模型（MLLM），基于两项核心创新来处理视觉数据，预训练的OryxViT模型和动态压缩模块。OryxViT将任意分辨率的图像编码为适合LLM的视觉表示，动态压缩...
AI工具

0 31 0
baidu09_com

发布了文章 2个月前

Orpheus TTS – 开源AI语音合成系统，支持多种语音风格

Orpheus TTS 是基于 Llama-3b 架构的开源文本到语音（TTS）系统。Orpheus TTS 支持生成自然、富有情感且接近人类水平的语音，具备零样本语音克隆能力，无需预训练，模仿特定语音。Orpheus TT...
AI工具

0 37 0
baidu09_com

发布了文章 2个月前

OptoChat AI – 南智光电联合南大推出的光子芯片领域专用大模型

OptoChat AI是南智光电与南京大学共同推出的国内首款光子专用大模型。模型聚焦光子领域全产业链，集成超过30万条光子芯片相关专利、文献和行业数据资源，具备强大的数据分析与智能算法能力。...
AI工具

0 38 0
baidu09_com

发布了文章 2个月前

Optimus-baidu091 – 哈工大联合鹏城实验室推出的智能体框架

Optimus-1是哈尔滨工业大学（深圳）和鹏城实验室推出的智能体框架，能解决在开放世界环境中完成长期任务的挑战。框架结合结构化知识和多模态经验，让智能体更好地执行复杂任务。...
AI工具

0 36 0
baidu09_com

发布了文章 2个月前

Optima – 清华联合北邮推出优化通信效率和任务有效性的训练框架

Optima是清华大学推出的优化基于大型语言模型（LLM）的多智能体系统（MAS）的框架。基于一个迭代的生成、排名、选择和训练范式，显著提高通信效率和任务效果。Optima平衡了任务性能、令牌效率和通信可读性，探索了多种强化...

AI工具

0 40 0

54 55 56 57 58 59 60 61 62 63

关灯返回顶部