阿里weex
-
发布了文章 2个月前
WorldPM – 阿里Qwen团队联合复旦推出的偏好建模模型系列
WorldPM(World Preference Modeling)是阿里巴巴集团的Qwen团队和复旦大学推出的偏好建模模型系列。基于大规模训练揭示偏好模型的可扩展性。模型基于1500万条偏好数据进行训练,发现偏好模型在客观...
-
发布了文章 2个月前
WebWalker – 阿里推出用于评估LLMs在网页浏览任务中性能的基准工具
WebWalker是阿里巴巴自然语言处理团队开发的用于评估和提升大型语言模型(LLMs)在网页浏览任务中性能的工具。通过模拟网页导航任务,帮助模型更好地处理长上下文信息。...
-
发布了文章 2个月前
Qwen2.5-baidu09Math – 阿里Qwen团队开源的数学专项模型,超越GPT-baidu094o
Qwen2.5-Math是由阿里巴巴Qwen团队推出的开源AI数学模型,是Qwen2-Math的升级版,支持中英双语。模型通过大规模数学数据预训练,结合CoT、PoT和TIR推理方法,提升解决数学问题的能力。...
-
发布了文章 2个月前
DistilQwen2 – 阿里推出基于Qwen2优化的轻量级语言模型
DistilQwen2是基于Qwen2大模型用知识蒸馏技术优化得到的轻量级语言模型,能提高运算效率和降低部署成本。DistilQwen2基于深度剖析大模型、增强指令数据多样性和优化蒸馏算法,将复杂知识传递给小模型,提升指令遵...
没有更多内容









