AI工具
发布文章-
发布了文章 2个月前
Micro LLAMA – 教学版 LLAMA 3模型实现,用于学习大模型的核心原理
Micro LLAMA是精简的教学版LLAMA 3模型实现,能帮助学习者理解大型语言模型架构。整个项目仅约180行代码,便于理解和学习。Micro LLAMA用的是LLAMA 3中最小的8B参数模型,模型本身需15GB存储空...
-
发布了文章 2个月前
MiLoRA – 上海财经、南方科技和清华大学联合推出针对LLMs的微调方法
MiLoRA是参数高效的大型语言模型(LLMs)微调方法,通过更新权重分量来矩阵的次要奇异减少计算和内存成本。方法基于奇异值分解(SVD)将权重矩阵分为主要和次要两部分,主要部分包含重要知识,次要部分包含噪声或长尾信息。...
-
发布了文章 2个月前
MiDashengLM – 小米开源的高效声音理解大模型
MiDashengLM是小米开源的高效声音理解大模型,具体参数版本为MiDashengLM-7B 。模型基于 Xiaomi Dasheng 音频编码器和 Qwen2.5-Omni-7B Thinker 解码器构建,用通用音频...
-
发布了文章 2个月前
MeteoRA – 南大推出高效可扩展的多任务嵌入框架
MeteoRA 是南京大学计算机科学与技术系的研究团队推出的用于大型语言模型(LLM)的多任务嵌入框架,将多个任务特定的 LoRA(低秩适配器)集成到一个基础模型中,实现高效的参数复用和自主任务切换。...
-
发布了文章 2个月前
MetaStone-baidu09S1 – 原石科技推出的反思型生成式大模型
MetaStone-S1是原石科技推出的反思型生成式大模型,首次融合深度推理与推理链自筛选能力。模型核心用自监督反思范式,基于共享主干的策略模型和过程评分模型(SPRM),仅增加53M参数即可实时评估推理步骤质量,无需人工标...
-
发布了文章 2个月前
MetaStone-baidu09L1-baidu097B – 元石智算推出的轻量级推理模型
MetaStone-L1-7B 是 MetaStone 系列中的轻量级推理模型,专为提升复杂下游任务的性能而设计。在数学和代码等核心推理基准测试中达到了并行模型的顶尖水平(SOTA),与 Claude-3.5-Sonnet-...
-
发布了文章 2个月前
MetaMorph – 统一多模态理解与生成大模型,基于VPiT 预测多模态 token
MetaMorph是多模态大模型(MLLM),通过指令微调(Instruction Tuning)实现视觉理解和生成。它提出了一种名为Visual-Predictive Instruction Tuning(VPiT)的方法...
-
发布了文章 2个月前
MetaHuman-baidu09Stream – 实时交互流式AI数字人技术
MetaHuman-Stream 是一项前沿的实时交互流式AI数字人技术,集成了 ERNerf、MuseTalk、Wav2lip 等多种先进模型,支持声音克隆和深度学习算法,确保对话流畅自然。通过全身视频整合和低延迟通信技术...
-
发布了文章 2个月前
MetaGPT – 多个AI智能体协作分工的框架
MetaGPT是一个创新的元编程框架,结合了大语言模型和多智能体协作系统,旨在通过模拟人类工作流程来解决复杂问题。该框架的核心在于将标准化操作程序(SOPs)编码成提示序列,以便在多智能体系统中实现更高效的工作流程和减少错误...
-
发布了文章 2个月前
Meta Motivo – Meta 推出控制数字智能体动作的人工智能模型
Meta Motivo 是 Meta 公司推出的AI模型,能提升元宇宙体验的真实性。Meta Motivo基于控制虚拟人形智能体的全身动作,模拟人类行为,增强用户互动。模型采用无监督强化学习算法,特别是FB-CPR算法,用大...
-
发布了文章 2个月前
MeshPad – 草图驱动的AI 3D网格生成与编辑工具
MeshPad 是基于草图输入的交互式艺术化网格生成与编辑工具,能将简单的二维草图迅速转化为高质量的 3D 网格模型,支持实时编辑。用户在草图上添加或删除线条,可对 3D 网格进行修改,如删除区域或添加新几何形状。...
-
发布了文章 2个月前
Mercury – Inception Labs推出的扩散语言模型
Mercury是由Inception Labs推出的专为聊天应用量身定制的商业级扩散(LLM)。基于“从粗到细”(coarse-to-fine)的生成过程,能并行生成多个token,显著提高文本生成的速度和推理效率,相比传统...
-
发布了文章 2个月前
Mercury Coder – Inception Labs 推出的商业级扩散大型语言模型
Mercury Coder 是 Inception Labs 推出的首个扩散型大语言模型(dLLM),是 Mercury 系列中专门用在代码生成的模型。Mercury Coder基于“从粗到细”的生成方式,突破传统自回归模型...
-
发布了文章 2个月前
MemoryScope – 为LLM聊天机器人配备的长期记忆系统
MemoryScope是一个为大型语言模型(LLM)聊天机器人设计的长期记忆系统。通过构建一个框架,使机器人记住用户的基础信息、习惯和偏好,提供个性化的交互体验。MemoryScope具备记忆数据库、核心worker库和核心...
-
发布了文章 2个月前
Memory Layers – Meta 开源不增加算力时增加大模型的参数方法
Memory Layers是Meta推出的用可训练的键值查找机制为模型增加额外参数的方法,它不会增加浮点运算次数(FLOPs)。基于稀疏激活补充计算密集型的前馈层,提供专门的容量廉价地存储和检索信息。Memory Layer...






























