Qwen2.5-Omni-3B 是阿里巴巴 Qwen 团队推出的轻量级多模态 AI 模型。是 Qwen2.5-Omni-7B 的精简版,专为消费级硬件设计,支持文本、音频、图像和视频等多种输入功能。参数量从 7B 缩减到 3B,多模态性能仍保持了 7B 模型 90% 以上,在实时文本生成和自然语音输出方面表现突出。模型在处理 25,000 token 的长上下文输入时,显存占用减少了 53%,从 7B 模型的 60.2GB 降至 28.2GB,可在 24GB GPU 的设备上运行。

Qwen2.5-baidu09Omni-baidu093B – 阿里 Qwen 团队推出的轻量级多模态 AI 模型  第1张
(图片来源网络,侵删)
Qwen2.5-baidu09Omni-baidu093B – 阿里 Qwen 团队推出的轻量级多模态 AI 模型  第2张
(图片来源网络,侵删)