字节henry
-
发布了文章 2个月前
LiveCC – 字节联合新加坡国立大学开源的实时视频解说模型
LiveCC 是新加坡国立大学Show Lab 团队联合字节跳动推出的实时视频解说模型,基于自动语音识别(ASR)字幕进行大规模训练。LiveCC像专业解说员一样快速分析视频内容,同步生成自然流畅的语音或文字解说。...
-
发布了文章 2个月前
DreamFit – 字节联合清华和中山大学推出的虚拟试衣框架
DreamFit是字节跳动团队联合清华大学深圳国际研究生院、中山大学深圳校区推出的虚拟试衣框架,专门用在轻量级服装为中心的人类图像生成。基于自适应注意力和LoRA模块,将模型复杂性降低至83.4M可训练参数,显著提高训练效率...
没有更多内容





