首页 > cimoc开源

cimoc开源

baidu09_com

发布了文章 2个月前

MoshiVis – Kyutai 开源的多模态实时语音模型

MoshiVis 是 Kyutai 推出的开源多模态语音模型，基于 Moshi 实时对话语音模型开发，增加了视觉输入功能。能实现图像的自然、实时语音交互，将语音和视觉信息相结合，让用户可以通过语音与模型交流图像内容。...
AI工具

0 39 0

没有更多内容

关灯返回顶部