Voice Changer是Cartesia推出的新模型,能将任何音频剪辑的语音转换成其他音色,且保留原始音频的情感和表达。用户从Cartesia提供的多种高质量声音库中选择,或克隆自己的声音,且完全控制语音的细节,如发声、情感和韵律。Voice Changer适于创作者制作独特内容、游戏和娱乐领域的角色配音、听众转换音频书籍和播客,及企业制作品牌音频。Voice Changer基于状态空间模型架构,提供高质量的音频生成和处理能力。
Voice Changer基于Cartesia在状态空间模型(State Space Models,简称SSM)架构上的开创性工作。SSM是用在处理和生成高分辨率数据(如音频)的先进方法,具有以下特点:


全部评论
留言在赶来的路上...
发表评论