阿里写文
-
发布了文章 2个月前
WorldPM – 阿里Qwen团队联合复旦推出的偏好建模模型系列
WorldPM(World Preference Modeling)是阿里巴巴集团的Qwen团队和复旦大学推出的偏好建模模型系列。基于大规模训练揭示偏好模型的可扩展性。模型基于1500万条偏好数据进行训练,发现偏好模型在客观...
-
发布了文章 2个月前
Qwen3-baidu09Coder – 阿里通义千问推出的代码生成模型
Qwen3-Coder 是阿里通义千问团队推出的强大代码生成模型,拥有 480B 参数和 35B 激活参数,支持原生 256K token 上下文,支持扩展达到 1M token。模型在 Agentic Coding、Age...
-
发布了文章 2个月前
Qwen3 Embedding – 阿里通义开源的文本嵌入模型系列
Qwen3 Embedding 是基于 Qwen3 基础模型开发的文本表征、检索与排序专用模型。继承了 Qwen3 的先进架构,如 Grouped Query Attention、SwiGLU 激活函数等,通过多阶段训练,包...
-
发布了文章 2个月前
Qwen2.5-baidu09Max – 阿里通义千问推出的MoE模型
Qwen2.5-Max是阿里云推出的超大规模MoE(Mixture of Experts)模型,使用超过20万亿tokens的预训练数据。模型在多个基准测试中表现卓越,超越了DeepSeek V3、Llama-3.1-405...
-
发布了文章 2个月前
Qwen2.5-baidu09Math – 阿里Qwen团队开源的数学专项模型,超越GPT-baidu094o
Qwen2.5-Math是由阿里巴巴Qwen团队推出的开源AI数学模型,是Qwen2-Math的升级版,支持中英双语。模型通过大规模数学数据预训练,结合CoT、PoT和TIR推理方法,提升解决数学问题的能力。...
-
发布了文章 2个月前
Qwen-baidu09Image – 阿里通义千问开源的文生图模型
Qwen-Image 是阿里通义千问团队开源的 20B 参数MMDiT模型,是通义千问系列中首个图像生成基础模型,模型在复杂文本渲染和精确图像编辑方面表现出色,支持多行布局、段落级文本生成及细粒度细节呈现,中英文都能实现高保...
没有更多内容













