AI工具
发布文章-
发布了文章 2个月前
OCRmyPDF – 专为 PDF 文件转换为可搜索、可复制的文档AI工具
OCRmyPDF 是开源的命令行工具,专为将扫描的 PDF 文件转换为可搜索、可复制的文档。通过添加 OCR 文本层,将无法直接编辑的扫描 PDF 文件能被搜索和编辑。工具支持超过 100 种语言,基于 Tesseract...
-
发布了文章 2个月前
OAgents – OPPO开源的基础Agent框架
OAgents 是OPPO PersonalAI Lab推出的开源基础Agent框架。框架基于标准化的评估协议和模块化设计,推动Agent框架的研究。OAgents基于系统实证研究,分析关键Agent组件(如规划、工具使用、...
-
发布了文章 2个月前
O1-baidu09CODER – 北交大推出的O1代码版开源项目,专注于编码任务
O1-CODER是北京交通大学研究团队推出的开源项目,旨在复制OpenAI的O1模型,专注于编码任务。O1-CODER结合强化学习(RL)和蒙特卡洛树搜索(MCTS)技术,提升模型的System-2思维能力,更谨慎、逻辑和逐...
-
发布了文章 2个月前
NutWorld – 新加坡国立、南洋理工和Skywork AI推出的视频处理框架
NutWorld是新加坡国立大学、南洋理工大学和Skywork AI推出的视频处理框架,能将日常单目视频高效地转换为动态3D高斯表示(Gaussian Splatting)。NutWorld基于时空对齐高斯(STAG)表示法...
-
发布了文章 2个月前
Nova Sonic – 亚马逊推出的新型生成式 AI 语音模型
Nova Sonic 是亚马逊推出的新型生成式 AI 语音模型。将语音理解与生成能力整合到一个模型中,能根据说话者的语调、风格等声学上下文调整生成的语音响应,对话更自然。Nova Sonic 支持多语言,目前对美国英语和英国...
-
发布了文章 2个月前
NotesGPT – 开源的AI语音笔记工具,实时转录文本自动生成行动项
NotesGPT是一款开源的AI驱动语音笔记工具,能将用户的语音笔记快速转录成文本,自动生成行动项。工具基于包括Convex数据库、Next.js框架、Together推理模型、Replicate的Whisper转录服务等先...
-
发布了文章 2个月前
NotebookMLX – 将PDF文档转换成音频博客开源版的NotebookLM
NotebookMLX是开源版本的NotebookLM,集成NotebookLlama的功能,能将PDF文档转换成易于理解和分享的音频播客形式。项目基于MLX技术实现自然语言处理功能,包括PDF预处理、制作播客文本、文本重写...
-
发布了文章 2个月前
NotebookLlama – Meta推出的PDF转播客内容的开源项目
NotebookLlama是Meta推出的将PDF文档转换成播客内容的开源项目。项目基于一系列自动化步骤实现,用LLaMa模型进行PDF预处理、生成播客脚本、增加戏剧化元素及文本转语音合成。整个过程无需人工干预,产出专业水准...
-
发布了文章 2个月前
NoteLLM – 小红书推出的笔记推荐多模态大模型框架
NoteLLM 是小红书推出的针对笔记推荐的多模态大型语言模型框架。NoteLLM 基于生成笔记的压缩嵌入和自动生成标签类别,用大型语言模型(LLM)的强大语义理解能力,结合对比学习和指令微调技术,提升笔记推荐的准确性和相关...
-
发布了文章 2个月前
NotaGen – 中央音乐学院联合北航、清华等推出的音乐生成模型
NotaGen 是中央音乐学院、北京航空航天大学、清华大学等机构推出的音乐生成模型,基于模仿大型语言模型(LLM)的训练范式生成高质量的古典乐谱。NotaGen 基于预训练、微调和强化学习相结合的方法,预训练阶段用超过160...
-
发布了文章 2个月前
NodeTool – AI工作流可视化构建器,拖放节点设计复杂工作流
NodeTool是开源的AI工作流可视化构建器。NodeTool集成广泛的AI工具和模型,基于简单、可视化的界面,让用户无需编码即可快速原型设计和测试。NodeTool支持在本地GPU上运行AI模型,并与Hugging Fa...
-
发布了文章 2个月前
NodeRAG – 开源基于异构图的智能检索与生成系统
NodeRAG 是基于异构图的检索增强生成(Retrieval-Augmented Generation,RAG)系统。通过构建包含多种节点类型的异构图,将文档信息和语言模型生成的见解整合在一起,支持多跳检索和细粒度信息提取...
-
发布了文章 2个月前
NobodyWho – AI游戏引擎插件,本地运行 LLM 实现互动小说创作
NobodyWho是为 Godot 游戏引擎设计的插件,通过本地运行的大型语言模型(LLM)实现互动小说创作。支持 Windows、Linux 和 macOS 平台,用户无需联网即可使用高性能的 LLM 功能,如对话交互和文...
-
发布了文章 2个月前
Nexus-baidu09Gen – 魔搭联合华东师范等机构开源的全模态图像生成模型
Nexus-Gen 是魔搭团队、华东师范大学等机构推出的开源全能图像生成模型,支持同时完成图像理解、生成和编辑任务。Nexus-Gen融合强大的语言模型与扩散模型的能力,基于预填充自回归策略解决传统方法中图像嵌入误差累积的问...
-
发布了文章 2个月前
NextGenAI – OpenAI 推出的教育联盟,联合15家顶尖大学和机构
NextGenAI是OpenAI推出的全球性联盟,基于AI技术推动教育和研究的进步。NextGenAI联合包括哈佛大学、麻省理工学院、牛津大学等在内的15所顶尖大学和机构,OpenAI为其提供5000万美元的资金支持、计算资...






























