香港科技大学unsuccessful
-
发布了文章 2个月前
VideoVAE+ – 香港科技大学推出的先进跨模态视频变分自编码器
VideoVAE+(VideoVAE Plus)是香港科技大学团队推出的先进的跨模态视频变分自编码器(Video VAE),通过引入新的时空分离压缩机制和文本指导,实现了对大幅运动视频的高效压缩与精准重建,同时保持了良好的时...
-
发布了文章 2个月前
Llasa TTS – 香港科技大学开源的文本转语音模型
Llasa TTS 是香港科技大学基于 LLaMA 架构推出的开源文本转语音(TTS)模型,支持高质量语音合成和克隆。Llasa TTS 基于单层向量量化(VQ)编解码器和单个 Transformer 架构,与标准 LLaM...
-
发布了文章 2个月前
GameGen-baidu09X – 香港科技大学联合多所机构推出的交互式开放世界游戏生成算法
GameGen-X是香港科技大学、中国科学技术大学等机构研究人员推出的扩散变换器模型,用在生成和交互控制开放世界游戏视频。模型能模拟游戏引擎功能,如创新角色、动态环境、复杂动作和多样化事件,支持用户用文本指令和键盘控制等多模...
没有更多内容







