StoryDiffusion是一个先进的AI图像和视频生成框架,用于从文本描述生成具有一致性的图像和视频序列。基于Consistent Self-Attention机制增强图像间的一致性,生成的内容在身份和服饰等细节上保持连贯。StoryDiffusion引入Semantic Motion Predictor模块,在语义空间中预测图像间的运动转换,生成平滑且连贯的视频。StoryDiffusion将文本故事转化为视觉内容,包括漫画和视频形式,提高用户用文本提示控制生成内容的能力。StoryDiffusion推动视觉故事生成领域的研究,为内容创作提供新的可能性。

StoryDiffusion – 生成一致性图像和视频序列的开源AI框架  第1张
(图片来源网络,侵删)
StoryDiffusion – 生成一致性图像和视频序列的开源AI框架  第2张
(图片来源网络,侵删)