开源wiki 推荐mediawiki
-
发布了文章 2个月前
VoiceCanvas – 开源AI语音合成平台,支持多语言、多音色、声音克隆服务
VoiceCanvas 是开源的多语言语音合成平台。基于 AI 技术提供高质量的文字转语音服务,支持超过 50 种语言,集成 OpenAI TTS、AWS Polly 和 MiniMax 等多种语音服务。VoiceCanva...
-
发布了文章 2个月前
VideoLLaMB – 开源的多模态长视频理解框架
VideoLLaMB 是一种创新的长视频理解框架,通过引入记忆桥接层和递归记忆令牌来处理视频数据,确保在分析时不丢失关键视觉信息。模型特别设计用于理解长时间视频内容,保持语义连续性,并在多种任务中表现出色,如视频问答、自我中...
没有更多内容





