北大联合大学
-
发布了文章 2个月前
HoloTime – 北大联合鹏城实验室推出的全景4D场景生成框架
HoloTime 是北京大学深圳研究生院和鹏城实验室推出的全景 4D 场景生成框架,基于视频扩散模型将单张全景图像转化为具有真实动态效果的全景视频,进一步重建为沉浸式的 4D 场景。...
-
发布了文章 2个月前
Dive3D – 北大联合小红书推出的文本到3D生成框架
Dive3D是北京大学和小红书公司合作推出的文本到3D生成框架。框架基于分数的匹配(Score Implicit Matching,SIM)损失替代传统的KL散度目标,有效避免模式坍塌问题,显著提升3D生成内容的多样性。...
-
发布了文章 2个月前
DiffSplat – 北大联合字节推出的 3D 生成框架
DiffSplat是新型的 3D 生成方法,从文本提示和单视图图像快速生成 3D 高斯点阵(Gaussian Splats)。通过微调预训练的文本到图像扩散模型,基于强大的 2D 先验知识,引入 3D 渲染损失来确保生成的...
-
发布了文章 2个月前
DiffEditor – 北大联合腾讯推出的细粒度图像编辑工具
DiffEditor是北京大学深圳研究生院与腾讯PCG的研究团队提出的基于扩散模型(Diffusion Model)的图像编辑工具,通过引入图像提示(image prompts)和文本提示,结合区域随机微分方程(Region...
-
发布了文章 2个月前
ConsisID – 北大联合鹏城实验室等机构推出的文本到视频生成模型
ConsisID是北京大学和鹏城实验室等机构推出的文本到视频(Text-to-Video, IPT2V)生成模型,基于频率分解技术保持视频中人物身份的一致性。模型用免调优(tuning-free)的Diffusion Tra...
没有更多内容











