AI工具
发布文章-
发布了文章 2个月前
Morphik – 开源的多模态检索增强生成工具
Morphik 是开源的多模态检索增强生成(RAG)工具,专为处理高技术性和视觉内容丰富的文档设计。支持对图像、PDF、视频等多种格式的文档进行搜索,采用 ColPali 等技术,能理解文档中的视觉内容。...
-
发布了文章 2个月前
Mora – 微软等推出的可生成12秒视频的多AI智能体框架
Mora是由来自微软和理海大学的研究人员推出的一个多智能体(AI Agents)框架,专门用于通用视频生成任务,目标是模拟并扩展OpenAI的Sora视频生成模型。该框架的核心理念是通过多个视觉智能体的协作来生成高质量的视频...
-
发布了文章 2个月前
Moonshine – 实时转录场景、低延时高准确的语音识别模型
Moonshine是专为资源受限设备优化的语音识别模型,提供快速且准确的实时语音转文本服务。适于需要即时响应的应用场景,例如现场转录和语音命令识别。Moonshine基于先进的编码器-解码器架构和旋转位置嵌入技术,提高模型在...
-
发布了文章 2个月前
Moonlight-baidu0916B-baidu09A3B – 月之暗面开源的 MoE 模型
Moonlight-16B-A3B 是 Moonshot AI 推出的新型 Mixture-of-Expert (MoE 模型,具有 160 亿总参数和 30 亿激活参数。模型使用了优化后的 Muon 优化器进行训练,计算...
-
发布了文章 2个月前
Moondream – 开源的轻量级AI视觉语言模型,可在本地快速运行
Moondream是一个免费开源的小型的人工智能视觉语言模型,虽然参数量小但可以提供高性能的视觉处理能力,可在本地计算机甚至移动设备或 Raspberry Pi 上运行,能够快速理解和处理输入的图像信息。...
-
发布了文章 2个月前
Mooncake – 月之暗面Kimi联合清华等机构推出的大模型推理架构
Mooncake是月之暗面Kimi联合清华大学等机构共同开源的大模型推理架构。采用以KVCache为中心的分布式架构,通过分离预填充和解码集群,充分利用GPU集群中未充分利用的CPU、DRAM和SSD资源,实现高效的KVCa...
-
发布了文章 2个月前
MoonCast – 零样本AI播客生成项目,合成自然的播客风格
MoonCast 是零样本AI播客生成项目,从纯文本源合成自然的播客风格语音。通过长上下文语言模型和大规模语音数据训练,能生成几分钟长的播客音频,支持中文和英文。...
-
发布了文章 2个月前
MooER – 摩尔线程推出的业界首个音频理解大模型
MooER是摩尔线程推出的业界首个基于国产全功能GPU训练的开源音频理解大模型。不仅能进行中文和英文的语音识别,还具备中译英的语音翻译能力。...
-
发布了文章 2个月前
MonkeyOCR – 华中科技联合金山办公推出的文档解析模型
MonkeyOCR 是华中科技大学联合金山办公(Kingsoft Office)推出的文档解析模型,模型支持高效地将非结构化文档内容转换为结构化信息。基于精确的布局分析、内容识别和逻辑排序,显著提升文档解析的准确性和效率。...
-
发布了文章 2个月前
MonkeyCode – 开源的企业级本地AI编程助手
MonkeyCode 是开源的企业级 AI 编程助手,支持私有化部署和离线使用,保障代码隐私与安全。MonkeyCode 兼容多种本地化大模型,具备代码补全、自然语言编程、代码安全扫描等功能,配备企业级管理面板,支持对 AI...
-
发布了文章 2个月前
MoneyPrinterTurbo – 开源的AI短视频生成工具
MoneyPrinterTurbo是开源的AI短视频生成工具,能自动化地根据用户提供的视频主题或关键词生成视频文案、素材、字幕和背景音乐,合成高清短视频。工具支持API和Web界面操作,具备自定义文案、多种视频尺寸、批量视频...
-
发布了文章 2个月前
Molmo 72B – 开源的多模态AI模型,基于Qwen2-baidu0972B模型,超越Llama 3.2
Molmo 72B是由艾伦人工智能研究所(Ai2)推出的一个开源多模态AI模型,专门设计用于处理和理解图像和文本数据。基于Qwen2-72B模型,使用OpenAI的CLIP作为视觉编码器。Molmo 72B在多个学术基准测试...
-
发布了文章 2个月前
Mogao – 字节跳动Seed团队推出的多模态理解与生成统一架构
Mogao是字节跳动Seed团队推出的交错多模态生成全基础模型。在架构上采用了双视觉编码器,结合变分自编码器(VAE)和视觉变换器(ViT),能更好地进行视觉理解并改善图像生成的上下文对齐。...
-
发布了文章 2个月前
Moffee – 开源的Markdown转PPT工具
Moffee是开源的Markdown转PPT工具,支持用户使用Markdown语法快速创建专业的幻灯片。Moffee自动处理布局、分页和样式,支持实时预览和导出为PDF或HTML格式。...
-
发布了文章 2个月前
ModernBERT – 英伟达和 HuggingFace 等机构联合开源的新一代编码器模型
ModernBERT是Answer.AI、LightOn、约翰斯·霍普金斯大学、英伟达和HuggingFace联合推出的现代编码器-only Transformer模型,是对经典BERT模型的一次重大升级。ModernBER...





























