STIV – 苹果公司推出的视频生成大模型

baidu09_com 2025-08-30 41 0

STIV（Scalable Text and Image Conditioned Video Generation）是苹果公司推出的大模型。STIV拥有8.7亿参数，能处理文本到视频（T2V）和文本图像到视频（TI2V）任务，基于联合图像-文本分类器自由引导（JIT-CFG）提升视频生成质量。STIV模型基于PixArt-Alpha架构，融合时空注意力机制、旋转位置编码（RoPE）和流匹配训练目标，增强视频生成的稳定性和效率。STIV支持多种下游应用，如视频预测、帧插值和长视频生成等。

（图片来源网络，侵删）

（图片来源网络，侵删）

本文由 @baidu09_com 发布在拜读未来科技摆渡人生，如有疑问，请联系我们。
文章链接：https://www.baidu09.com/news/14744.html

baidu09_com管理员

2025年CAPAS精准把握行业脉搏，推动西南汽车产业稳步前行

全部评论

留言在赶来的路上...

STIV – 苹果公司推出的视频生成大模型

baidu09_com管理员

2025年CAPAS精准把握行业脉搏，推动西南汽车产业稳步前行

圣菲尼科机油怎么样？圣菲尼科机油是哪个国家的

全部评论

发表评论取消回复

STIV – 苹果公司推出的视频生成大模型

baidu09_com管理员

2025年CAPAS精准把握行业脉搏，推动西南汽车产业稳步前行

圣菲尼科机油怎么样？圣菲尼科机油是哪个国家的

全部评论

发表评论取消回复

猜你喜欢