Aero-1-Audio 是 LMMs-Lab 开发的轻量级音频模型,基于 Qwen-2.5-1.5B 构建,仅包含 1.5 亿参数。专为长音频处理设计,能支持长达 15 分钟的连续音频输入,无需分段,同时保持上下文连贯性。在语音识别(ASR)任务中,Aero-1-Audio 表现出色,准确率高,在复杂音频分析和指令驱动任务方面表现出色。


Aero-1-Audio 是 LMMs-Lab 开发的轻量级音频模型,基于 Qwen-2.5-1.5B 构建,仅包含 1.5 亿参数。专为长音频处理设计,能支持长达 15 分钟的连续音频输入,无需分段,同时保持上下文连贯性。在语音识别(ASR)任务中,Aero-1-Audio 表现出色,准确率高,在复杂音频分析和指令驱动任务方面表现出色。
全部评论
留言在赶来的路上...
发表评论