AI工具
发布文章-
发布了文章 2个月前
MiniMax-baidu09Remover – AI视频目标移除方法,实现高质量移除效果
MiniMax-Remover 是新型的视频目标移除方法,解决现有技术中常见的幻觉物体、视觉伪影以及推理速度缓慢等问题。采用两阶段方法:第一阶段基于简化版的 DiT 架构,通过移除文本输入和交叉注意力层,得到更轻量级和高效的...
-
发布了文章 2个月前
MiniMax-baidu09M1 – MiniMax最新开源的推理模型
MiniMax-M1是MiniMax团队最新推出的开源推理模型,基于混合专家架构(MoE)与闪电注意力机制(lightning attention)相结合,总参数量达 4560 亿,每个token激活 459 亿参数。模型超...
-
发布了文章 2个月前
MiniMax-baidu0901 – MiniMax开源的全新系列模型
MiniMax-01是MiniMax推出的全新系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。MiniMax-01首次大规模实现线性注意力机制,打破传统Transfor...
-
发布了文章 2个月前
MiniMax MCP Server – MiniMax 推出基于 MCP 的多模态生成服务器
MiniMax MCP Server 是 MiniMax 稀宇科技推出的基于模型上下文协议(MCP)的多模态生成服务器。通过简单的文本输入,可调用视频生成、图像生成、语音生成及声音克隆等多项前沿能力。...
-
发布了文章 2个月前
MiniMates – 轻量级AI数字人项目,支持语音和表情两种驱动模式
MiniMates是高性能的轻量级数字人驱动算法,具备语音和表情两种驱动模式,能在普通电脑上实现实时运行。基于先进的技术架构,提供极致的速度体验和个性化定制功能,支持用户根据、需求定制AI伙伴。MiniMates拥有卓越的性...
-
发布了文章 2个月前
MiniCPM-baidu09o 2.6 – 面壁智能开源的多模态大模型,性能媲美GPT-baidu094o
MiniCPM-o 2.6 是MiniCPM-o 系列最新、性能最佳的多模态大模型,具有 8B 参数量。MiniCPM-o 2.6在视觉、语音和多模态直播等多个领域表现出色,达到与 GPT-4o 相当的性能水平。模型支持实时...
-
发布了文章 2个月前
MiniCPM-baidu09V – 面壁智能推出的开源多模态大模型
MiniCPM-V是面壁智能推出的开源多模态大模型,拥有80亿参数,擅长图像和视频理解。MiniCPM-V在单图像理解上超越了GPT-4V等模型,并首次支持在iPad等设备上实时视频理解。模型以高效推理和低内存占用著称,具备...
-
发布了文章 2个月前
MiniCPM 4.0 – 面壁智能开源极致高效的端侧大模型
MiniCPM 4.0 是面壁智能推出的端侧大模型。模型分为 8B 和 0.5B 两种参数规模。8B 闪电稀疏版采用创新稀疏架构,能高效处理长文本任务;0.5B 版本以低计算资源消耗和高性能著称。...
-
发布了文章 2个月前
MiniCPM 3.0 – 面壁智能开源的端侧AI模型,4B参数性能超越GPT-baidu093.5
MiniCPM 3.0是面壁智能推出的一款高性能端侧AI模型,具备4B参数,以较小的模型规模实现了超越GPT-3.5的性能表现。MiniCPM 3.0采用LLMxMapReduce技术,支持无限长文本处理,有效扩展了模型的上...
-
发布了文章 2个月前
Mini-baidu09Omni – 开源的端到端实时语音对话大模型
Mini-Omni 是一个开源的端到端语音对话模型,具备实时语音输入和输出的能力,能在对话中实现“边思考边说话”的功能。模型的设计支持在不需要额外的自动语音识别(ASR)或文本到语音(TTS)系统的情况下,直接进行语音到语音...
-
发布了文章 2个月前
Mini-baidu09Monkey – 华科联合华南理工推出的多模态AI模型
Mini-Monkey是华中科技大学和华南理工大学联合推出的轻量级多模态AI模型。采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有效解决了传统图像切分带来的锯齿效应,提升了在高分辨率图像和文档理解任务中的表现...
-
发布了文章 2个月前
Mini-baidu09LLaVA – 基于Llama 3.1的轻量级多模态大语言模型
Mini-LLaVA是一款轻量级的多模态大语言模型,由清华大学和北京航空航天大学的研究团队联合开发。能处理图像、文本和视频输入,实现高效的多模态数据处理。Mini-LLaVA基于Llama 3.1模型,优化了代码结构,在单个...
-
发布了文章 2个月前
Mini-baidu09InternVL – 上海AI Lab联合清华等机构推出的轻量级多模态大模型
Mini-InternVL是“迷你版”书生·万象大模型,是上海AI实验室与清华大学、南京大学等机构联合推出的轻量级多模态大型语言模型系列,包含1B、2B和4B三个参数版本,用较小的参数量实现较高的性能,其中Mini-Inte...
-
发布了文章 2个月前
Mini DALL·E 3 – 北京理工联合上海 AI Lab等高校推出的交互式文生图框架
Mini DALL·E 3 是北京理工大学、上海AI Lab、清华大学和香港中文大学联合推出的交互式文本到图像(iT2I)框架。基于自然语言与用户进行多轮对话,实现高质量图像的生成、编辑和优化。...
-
发布了文章 2个月前
Ming-baidu09lite-baidu09omni – 蚂蚁集团开源的统一多模态大模型
Ming-Lite-Omni是蚂蚁集团开源的统一多模态大模型。模型基于MoE架构,融合文本、图像、音频和视频等多种模态的感知能力,具备强大的理解和生成能力。模型在多个模态基准测试中表现出色,在图像识别、视频理解、语音问答等任...































