首页 > 阿里player

阿里player

baidu09_com

发布了文章 2个月前

Qwen2-baidu09Audio – 阿里通义千问团队推出的开源AI语音模型

Qwen2-Audio是阿里通义千问团队最新推出的开源AI语音模型，支持直接语音输入和多语言文本输出。具备语音聊天、音频分析功能，支持超过8种语言。Qwen2-Audio在多个基准数据集上表现优异，现已集成至Hugging...
AI工具

0 37 0
baidu09_com

发布了文章 2个月前

3D-baidu09Speaker – 阿里通义推出的多模态说话人识别任务开源项目

3D-Speaker是阿里巴巴通义实验室语音团队推出的多模态开源项目，基于结合声学、语义、视觉信息，实现高精度的说话人识别和语种识别。3D-Speaker提供工业级模型、训练和推理代码，及大规模多设备、多距离、多方言的数据集...
AI工具

0 35 0

没有更多内容

关灯返回顶部