joytop清华大学
-
发布了文章 2个月前
Dolphin – 清华联合海天瑞声推出的语音识别大模型
Dolphin是清华大学电子工程系语音与音频技术实验室联合海天瑞声共同推出的面向东方语言的语音大模型。支持40个东方语种的语音识别,中文语种涵盖22种方言(含普通话),能精准识别不同地区的语言特点。...
-
发布了文章 2个月前
DanceFusion – 清华大学推出音频驱动舞蹈动作重建与生成的开源框架
DanceFusion是清华大学推出的开源框架,专注于音频驱动的舞蹈动作重建与生成。DanceFusion结合分层时空Transformer-VAE和扩散模型,能处理社交媒体上的不完整和嘈杂骨骼数据,生成与音乐同步的逼真舞蹈...
没有更多内容





