AI工具
发布文章-
发布了文章 2个月前
MMedAgent – 专为医疗领域设计的多模态AI智能体,管理多种医疗任务
MMedAgent是专为医疗领域设计的多模态AI智能体,通过整合各种开源医疗模型来管理多种医疗任务。系统包括一个指令调整的多模态大型语言模型(MLLM),作为行动规划器和结果聚合器,以及一套为代理量身定制的医疗工具集合,每个...
-
发布了文章 2个月前
MMaDA – 字节联合普林斯顿大学等推出的多模态扩散模型
MMaDA(Multimodal Large Diffusion Language Models)是普林斯顿大学、清华大学、北京大学和字节跳动推出的多模态扩散模型,支持跨文本推理、多模态理解和文本到图像生成等多个领域实现卓越...
-
发布了文章 2个月前
MMSearch – 评估大型多模态AI搜索引擎能力的基准测试工具
MMSearch是一个用于评估大型多模态模型(LMMs)作为AI搜索引擎能力的基准测试。包括一个MMSearch-Engine框架和MMSearch测试集,后者包含300个问题,涵盖14个子领域。MMSearch-Engin...
-
发布了文章 2个月前
MMRole – AI多模态角色扮演智能体(MRPA)框架
MMRole是由中国人民大学高瓴人工智能学院研究团队推出的的一种多模态角色扮演智能体(MRPA)框架。通过结合图像和文本,使智能体以特定角色进行更自然和沉浸式的对话。...
-
发布了文章 2个月前
MMMLU – OpenAI推出的多语言大规模多任务语言理解数据集
MMMLU(多语言大规模多任务语言理解)是由OpenAI推出的一个开源数据集,旨在评估和提升人工智能模型在不同语言、认知和文化背景下的性能而设计。MMMLU建立在广受欢迎的大规模多任务语言理解(MMLU)基准的基础上,数据集...
-
发布了文章 2个月前
MME-baidu09CoT – 港中文等机构推出评估视觉推理能力的基准框架
MME-CoT 是香港中文大学(深圳)、香港中文大学、字节跳动、南京大学、上海人工智能实验室、宾夕法尼亚大学、清华大学等机构共同推出的用于评估大型多模态模型(LMMs)链式思维(Chain-of-Thought, CoT)推...
-
发布了文章 2个月前
MMBench-baidu09Video – 上海AI Lab联合多所高校推出的长视频理解基准测试
MMBench-Video是新颖的长视频多题问答基准测试,是浙江大学、上海人工智能实验室、上海交通大学和香港中文大学联合推出的。MMBench-Video能全面评估大型视觉语言模型(LVLMs)在视频理解方面的能力,用包含丰...
-
发布了文章 2个月前
MMAudio – 基于多模态联合训练实现高质量 AI 音频合成项目
MMAudio是先进视频到音频合成技术,基于多模态联合训练,让模型能在广泛的视听和音频文本数据集上进行训练。技术的核心是同步模块,确保生成的音频与视频帧精确匹配,实现高度同步。...
-
发布了文章 2个月前
MM1.5 – 苹果推出的升级版多模态大模型
MM1.5是苹果公司推出的多模态大型语言模型,旨在增强文本丰富图像理解、视觉指代和定位以及多图像推理能力。模型基于数据为中心的训练方法,在大规模预训练、高分辨率OCR数据持续预训练及优化的视觉指令微调,实现从1B到30B参数...
-
发布了文章 2个月前
MM-baidu09StoryAgent – 上海交大联合阿里开源的多智能体故事绘本视频生成框架
MM-StoryAgent 是上海交通大学X-LANCE实验室和阿里巴巴集团联合推出的开源、多模态、多智能体框架,用在生成沉浸式的有声故事绘本视频。基于结合大型语言模型(LLMs)和多种模态的生成工具(如文本、图像、音频),...
-
发布了文章 2个月前
MM-baidu09Eureka – 上海AI Lab联合上交大等推出的多模态推理模型
MM-Eureka 是上海人工智能实验室、上海创智学院、上海交通大学和香港大学的研究人员共同开发的多模态推理模型。模型通过基于规则的大规模强化学习(RL),将单模态推理中的关键特性(如稳定的回答长度增长、准确率奖励以及视觉顿...
-
发布了文章 2个月前
MLE-baidu09bench – OpenAI推出AI代理性能评估的基准测试工具
MLE-bench 是 OpenAI 推出的一个基准测试工具,旨在衡量AI代理(AI Agent)在机器学习工程任务中的表现。测试包含75个来自 Kaggle 的竞赛任务,覆盖自然语言处理、计算机视觉和信号处理等多个领域。A...
-
发布了文章 2个月前
MLE-baidu09Agent – 工程师的AI智能助手,自动创建基线模型
MLE-Agent 是一款专为机器学习工程师和研究人员设计的智能助手,通过自动化基线创建、集成最新研究资源、智能调试、文件系统和工具集成,以及交互式命令行聊天界面,提供无缝的AI工程和研究体验。...
-
发布了文章 2个月前
ML-baidu09Master – 上海交大推出的AI专家Agent
ML-Master是上海交通大学人工智能学院Agents团队推出AI专家智能体。在OpenAI的权威基准测试MLE-bench中表现出色,以29.3%的平均奖牌率位居榜首,超越了微软的RD-Agent和OpenAI的AIDE...
-
发布了文章 2个月前
MIP-baidu09Adapter – 阿里开源多参考图像融合的个性化图像生成技术
MIP-Adapter是一种个性化图像生成技术,由阿里巴巴集团推出并开源。基于IP-Adapter模型,进一步扩展其能力,支持同时处理多个参考图像,生成更准确和高质量的定制化图像。MIP-Adapter通过为每个参考图像分配...





























