首页 / AI工具 / LiveCC – 字节联合新加坡国立大学开源的实时视频解说模型

AI工具

LiveCC – 字节联合新加坡国立大学开源的实时视频解说模型

baidu09_com 2025-08-29 39 0

LiveCC 是新加坡国立大学Show Lab 团队联合字节跳动推出的实时视频解说模型，基于自动语音识别（ASR）字幕进行大规模训练。LiveCC像专业解说员一样快速分析视频内容，同步生成自然流畅的语音或文字解说。LiveCC 推出 Live-CC-5M 数据集用在预训练，和 Live-WhisperX-526K 数据集用在高质量的监督微调。LiveCC 设计了 LiveSports-3K 基准测试，用在评估模型的实时视频评论能力。实验表明，LiveCC 在实时视频评论和视频问答任务上表现出色，展现出低延迟和高质量的生成能力。

LiveCC – 字节联合新加坡国立大学开源的实时视频解说模型第1张

（图片来源网络，侵删）

LiveCC – 字节联合新加坡国立大学开源的实时视频解说模型第2张

（图片来源网络，侵删）

字节联动字节联动网络科技字节vanessa 字节 client infra 字节henry 字节enrich life 字节 all hands

本文由 @baidu09_com 发布在拜读未来科技摆渡人生，如有疑问，请联系我们。
文章链接：https://www.baidu09.com/news/14095.html

baidu09_com管理员

上一篇

12个最佳AI抄袭检查器来检测ChatGPT生成内容

下一篇

机油标号5w-40什么意思

全部评论

留言在路上...

留言在赶来的路上...

发表评论取消回复

关灯返回顶部