Audio-SDS是NVIDIA AI研究团队推出的创新技术,将Score Distillation Sampling(SDS)技术扩展至文本条件音频扩散模型,为音频处理领域带来了重大突破。无需重新训练模型,可将任意预训练音频扩散模型转化为多功能工具,广泛应用于音效生成、音源分离、FM合成及语音增强等任务。Audio-SDS通过文本提示引导音频生成,支持高度定制化,满足创意和工业需求。

Audio-baidu09SDS – NVIDIA推出的扩展文本条件音频扩散模型  第1张
(图片来源网络,侵删)
Audio-baidu09SDS – NVIDIA推出的扩展文本条件音频扩散模型  第2张
(图片来源网络,侵删)