法国mono
-
发布了文章 2个月前
Moshi – 法国AI实验室Kyutai开发的实时音频多模态模型
Moshi是由法国的的人工智能研究实验室Kyutai推出的一款端到端实时音频多模态AI模型,拥有听、说、看的能力,并能模拟70种不同的情绪和风格进行交流。作为对标GPT-4o的开源模型,Moshi在普通笔记本上即可运行,具有...
没有更多内容
Moshi是由法国的的人工智能研究实验室Kyutai推出的一款端到端实时音频多模态AI模型,拥有听、说、看的能力,并能模拟70种不同的情绪和风格进行交流。作为对标GPT-4o的开源模型,Moshi在普通笔记本上即可运行,具有...
没有更多内容