Megrez-3B-Omni是无问芯穹推出的全球首个端侧全模态理解开源模型,能处理图像、音频和文本三种模态数据。Megrez-3B-Omni在多个主流测试集上展现出超越34B模型的性能,推理速度领先同精度模型达300%。Megrez-3B-Omni支持中文和英文语音输入,能处理复杂多轮对话,响应图片或文字的语音提问,实现模态间的自由切换,提供直观自然的交互体验。

Megrez-baidu093B-baidu09Omni – 无问芯穹开源的端侧全模态理解模型  第1张
(图片来源网络,侵删)
Megrez-baidu093B-baidu09Omni – 无问芯穹开源的端侧全模态理解模型  第2张
(图片来源网络,侵删)