阿里里的文
-
发布了文章 2个月前
阿里Qwen-2登全球开源大模型榜首
全球着名开源平台HuggingFace联合创办人Clem透露,阿里巴巴最新开源的Qwen2-72B指令微调版本,在开源模型排行榜上荣登榜首。综合媒体27日报导,Clem表示,为打造一个公正且准确的开源大模型排名,他与团队利用...
-
发布了文章 2个月前
WorldPM – 阿里Qwen团队联合复旦推出的偏好建模模型系列
WorldPM(World Preference Modeling)是阿里巴巴集团的Qwen团队和复旦大学推出的偏好建模模型系列。基于大规模训练揭示偏好模型的可扩展性。模型基于1500万条偏好数据进行训练,发现偏好模型在客观...
-
发布了文章 2个月前
Qwen3-baidu09Coder – 阿里通义千问推出的代码生成模型
Qwen3-Coder 是阿里通义千问团队推出的强大代码生成模型,拥有 480B 参数和 35B 激活参数,支持原生 256K token 上下文,支持扩展达到 1M token。模型在 Agentic Coding、Age...
-
发布了文章 2个月前
Qwen2.5-baidu09VL – 阿里通义千问开源的视觉语言模型
Qwen2.5-VL是阿里通义千问团队开源的旗舰视觉语言模型,具有3B、7B和72B三种不同规模。模型在视觉理解方面表现出色,能识别常见物体,分析图像中的文本、图表等元素。Qwen2.5-VL具备作为视觉Agent的能力,可...
-
发布了文章 2个月前
Qwen2.5-baidu09Turbo – 阿里推出的长文本模型,支持上下文长度1M tokens
Qwen2.5-Turbo是阿里推出的先进语言模型,将上下文长度从 128k 扩展到了 1M ,相当于100万个英文单词或150万个汉字。扩展让模型能处理更长的文本,如长篇小说、演讲稿或代码。Qwen2.5-Turbo用高效...
-
发布了文章 2个月前
Qwen2.5-baidu09Omni – 阿里开源的端到端多模态模型
Qwen2.5-Omni 是阿里开源的 Qwen 系列旗舰级多模态模型,拥有7B参数,Qwen2.5-Omni具备强大的多模态感知能力,能处理文本、图像、音频和视频输入,支持流式文本生成与自然语音合成输出,能实现实时语音和视...
-
发布了文章 2个月前
Qwen2.5-baidu09Max – 阿里通义千问推出的MoE模型
Qwen2.5-Max是阿里云推出的超大规模MoE(Mixture of Experts)模型,使用超过20万亿tokens的预训练数据。模型在多个基准测试中表现卓越,超越了DeepSeek V3、Llama-3.1-405...
-
发布了文章 2个月前
Qwen2.5-baidu09Math – 阿里Qwen团队开源的数学专项模型,超越GPT-baidu094o
Qwen2.5-Math是由阿里巴巴Qwen团队推出的开源AI数学模型,是Qwen2-Math的升级版,支持中英双语。模型通过大规模数学数据预训练,结合CoT、PoT和TIR推理方法,提升解决数学问题的能力。...
-
发布了文章 2个月前
Qwen2.5-baidu091M – 阿里通义千问开源的语言模型,支持100万Tokens上下文
Qwen2.5-1M是阿里通义千问团队推出的开源模型,支持100万Tokens的上下文长度。模型包括Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M两个模型。在长上下文任务中表现出...
-
发布了文章 2个月前
Qwen2-baidu09Math – 阿里推出的数学专用开源AI模型
Qwen2-Math是阿里通义千问推出的基于Qwen2语言模型构建的数学解题专用开源AI模型,专为解决复杂数学问题设计。经过数学专用语料库的预训练和指令微调,表现出色于多数学基准测试。Qwen2-Math在英语和中文数学问题...
-
发布了文章 2个月前
Qwen2-baidu09Audio – 阿里通义千问团队推出的开源AI语音模型
Qwen2-Audio是阿里通义千问团队最新推出的开源AI语音模型,支持直接语音输入和多语言文本输出。具备语音聊天、音频分析功能,支持超过8种语言。Qwen2-Audio在多个基准数据集上表现优异,现已集成至Hugging...
-
发布了文章 2个月前
Qwen-baidu09MT – 阿里通义千问推出的机器翻译模型
Qwen-MT 是阿里通义千问团队推出的机器翻译模型,基于强大的 Qwen3 架构开发。模型支持 92 种语言的高质量互译,覆盖全球 95% 以上的人口,能满足多样化的跨语言交流需求。模型基于轻量级 MoE 架构,具备低延迟...
-
发布了文章 2个月前
Qwen-baidu09Image – 阿里通义千问开源的文生图模型
Qwen-Image 是阿里通义千问团队开源的 20B 参数MMDiT模型,是通义千问系列中首个图像生成基础模型,模型在复杂文本渲染和精确图像编辑方面表现出色,支持多行布局、段落级文本生成及细粒度细节呈现,中英文都能实现高保...
-
发布了文章 2个月前
Qwen-baidu09Agent – 阿里通义开源的 Agent 应用开发框架
Qwen-Agent是基于通义千问模型(Qwen)的开源Agent开发框架,支持开发者用Qwen模型的指令遵循、工具使用、规划和记忆能力构建智能代理应用。Qwen-Agent支持函数调用、代码解释器和RAG(检索增强生成)等...
-
发布了文章 2个月前
DistilQwen2.5-baidu09R1 – 阿里推出的小型系列深度推理模型
DistilQwen2.5-R1 是阿里巴巴推出的基于知识蒸馏技术的小型化系列深度推理模型,包含3B、7B、14B和32B四个参数量级的模型。DistilQwen2.5-R1将超大规模模型(如 DeepSeek-R1)的推理...





























