AI工具
发布文章-
发布了文章 2个月前
Open NotebookLM – 开源的PDF转播客AI工具,能自定义语气
Open NotebookLM 是一个开源的AI工具,基于最新的开源AI模型,如Llama 3.1 405B、MeloTTS和Bark,将PDF文档转换成播客形式的音频内容。工具适合将书面信息转换成听觉格式的用户,例如学生、...
-
发布了文章 2个月前
Open Notebook – 开源 AI 笔记工具,自动将多格式笔记转换成博客
Open Notebook是开源、注重隐私的谷歌NotebookLM替代工具,能帮助用户管理研究工作流程,生成AI辅助笔记,并与内容互动。Open Notebook支持多笔记本、多模型,包括Open AI、Anthropic...
-
发布了文章 2个月前
Open Materials 2024 – Meta 开源的大型开放数据集和配套预训练模型
Open Materials 2024 (OMat24 是Meta推出的包含超过1.1亿个结构的密度泛函理论(DFT 计算的大型开放数据集,专注于无机材料的结构和成分多样性。附带预训练的图神经网络模型EquiformerV...
-
发布了文章 2个月前
Open Deep Research – Deep Research开源复现版智能体,支持切换多种语言模型
Open Deep Research 是开源的 AI 智能体,是Deep Research开源复现项目,基于推理大量网络数据完成复杂的多步骤研究任务。Open Deep Research使用 Firecrawl 的搜索和提取...
-
发布了文章 2个月前
Open Computer Agent – Hugging Face 推出的免费云端 AI Agent 工具
Open Computer Agent 是 Hugging Face 推出的免费云端 AI Agent 工具。支持在 Linux 虚拟机中运行,基于预装的程序(如 Firefox)完成用户指定的任务,例如用 Google M...
-
发布了文章 2个月前
Open Code Reasoning – 英伟达开源的代码推理AI模型
Open Code Reasoning(OCR)是英伟达开源的代码推理AI模型,基于Nemotron架构,专为提升代码推理和生成能力设计。OCR包含32B、14B和7B三种模型版本,分别适用于高性能推理、平衡计算需求以及资源...
-
发布了文章 2个月前
Open Avatar Chat – 阿里开源的实时数字人对话系统
Open Avatar Chat 是阿里开源的模块化的实时数字人对话系统,支持在单台电脑上运行完整的功能。Open Avatar Chat 支持低延迟的实时对话(平均响应延迟约2.2秒),兼容多模态语言模型,包括文本、音频和...
-
发布了文章 2个月前
Onit – 开源的 Mac 桌面 AI 聊天助手
Onit是为Mac设计的AI聊天助手,支持停靠在任何应用程序中。Onit支持高亮文本自动加载,用户只需选择文本,Onit能自动作为上下文打开,无需复制粘贴。...
-
发布了文章 2个月前
OneRec – 快手推出的端到端生成式推荐系统
OneRec 是快手推出的新型端到端生成式推荐系统。采用编码器-解码器架构,通过稀疏 Mixture-of-Experts(MoE)技术提升模型容量,保持高效的计算性能。与传统级联推荐系统不同,OneRec 使用会话式生成方...
-
发布了文章 2个月前
OneDiffusion – 无缝支持双向图像合成和理解的开源扩散模型
OneDiffusion是AI2推出的多功能大规模扩散模型,能无缝支持双向图像合成和理解,涵盖文本到图像生成、条件图像生成、图像理解等多种任务。基于将所有条件和目标图像建模为序列“视图”训练,实现在推理时任意帧作为条件图像的...
-
发布了文章 2个月前
One Shot, One Talk – 中科大联合香港理工推出的动态图像生成技术
One Shot, One Talk是先进的图像生成技术,能从单张图片中生成具有个性化细节的全身动态说话头像,支持逼真的动画效果,包括自然的表情变化和生动的身体动作。One Shot, One Talk是中国科学技术大学和香...
-
发布了文章 2个月前
Omnitool – 开源 AI 桌面,支持多种主流AI平台和服务
Omnitool是开源的AI桌面环境,为用户提供统一的交互界面,能快速接入和使用多种AI模型。Omnitool支持本地运行,能在Mac、Windows或Linux设备上安装,数据存储在本地,保障隐私安全。基于集成OpenAI...
-
发布了文章 2个月前
OmniVision – 专为边缘设备优化的最小参数多模态模型
OmniVision是紧凑的多模态模型,拥有968M参数,专为边缘设备优化。OmniVision能处理视觉和文本输入,基于LLaVA架构改进,显著减少图像token数量,降低延迟和计算成本。基于可信数据进行DPO训练,Omn...
-
发布了文章 2个月前
OmniThink – 浙大联合阿里通义实验室推出的深度思考机器写作框架
OmniThink是浙江大学和阿里巴巴通义实验室联合开发的创新的机器写作框架,通过模拟人类的迭代扩展和反思过程,突破大型语言模型在机器写作中的知识边界。框架通过信息树和概念池的结构化组织,逐步深化对主题的理解,生成高质量的长...
-
发布了文章 2个月前
OmniTalker – 阿里推出的实时文本驱动说话头像生成框架
OmniTalker 是阿里巴巴发布的实时文本驱动的说话头像生成技术,能同时处理文本、图像、音频和视频等多种模态输入,以流式方式生成自然语音响应。核心架构为 Thinker-Talker 架构,Thinker 负责处理多模态...



























