字节跳动inspire creativity
-
发布了文章 2个月前
SuperEdit – 字节跳动等机构推出的图像编辑方法
SuperEdit是字节跳动智能创作团队和佛罗里达中央大学计算机视觉研究中心联合推出的指令引导图像编辑方法,基于优化监督信号提高图像编辑的精度和效果。SuperEdit基于纠正编辑指令,与原始图像和编辑图像对更准确地对齐,引...
-
发布了文章 2个月前
Infinity – 字节跳动推出的高分辨率图像生成模型
Infinity是字节跳动推出的基于位级自回归建模的视觉生成模型,能根据语言指令生成高分辨率、逼真的图像。Infinity通过无限词汇量的标记器、分类器和位自纠正机制,显著提升图像生成的细节和质量,超越现有的顶级扩散模型,生...
-
发布了文章 2个月前
InfiniteYou – 字节跳动开源的身份保持图像生成框架
InfiniteYou(InfU)是字节跳动智能创作团队推出的基于扩散变换器(Diffusion Transformers,如 FLUX)的身份保持图像生成框架。基于 InfuseNet 将身份特征注入扩散模型,增强身份相似...
-
发布了文章 2个月前
ImmerseGen – 字节跳动联合浙大推出的3D世界生成框架
ImmerseGen是字节跳动的PICO团队和浙江大学联合推出的创新3D世界生成框架。框架根据用户输入的文字提示,基于Agent引导的资产设计和排列,生成带有alpha纹理的紧凑Agent,创建全景3D世界。...
-
发布了文章 2个月前
Dolphin – 字节跳动开源的文档解析大模型
Dolphin 是字节跳动开源的轻量级、高效的文档解析大模型。基于先解析结构后解析内容的两阶段方法,第一阶段生成文档布局元素序列,第二阶段用元素作为锚点并行解析内容。...
-
发布了文章 2个月前
ContentV – 字节跳动开源的文生视频模型框架
ContentV是字节跳动开源的80亿参数文生视频模型框架。将Stable Diffusion 3.5 Large的2D-VAE替换为3D-VAE并引入3D位置编码,使图像模型快速获得视频生成能力。...
没有更多内容













