StoryDiffusion – 生成一致性图像和视频序列的开源AI框架

baidu09_com 2025-08-31 38 0

StoryDiffusion是一个先进的AI图像和视频生成框架，用于从文本描述生成具有一致性的图像和视频序列。基于Consistent Self-Attention机制增强图像间的一致性，生成的内容在身份和服饰等细节上保持连贯。StoryDiffusion引入Semantic Motion Predictor模块，在语义空间中预测图像间的运动转换，生成平滑且连贯的视频。StoryDiffusion将文本故事转化为视觉内容，包括漫画和视频形式，提高用户用文本提示控制生成内容的能力。StoryDiffusion推动视觉故事生成领域的研究，为内容创作提供新的可能性。