字节 mentor
-
发布了文章 2个月前
TextHarmony – 字节联合华东师范推出的多模态生成模型
TextHarmony是华东师范大学和字节跳动共同推出的多模态生成模型,擅长理解和生成视觉文本。模型基于Slide-LoRA技术,动态聚合特定于模态和模态无关的LoRA专家,部分解耦多模态生成空间,在单一模型实例中协调视觉和...
-
发布了文章 2个月前
DreamFit – 字节联合清华和中山大学推出的虚拟试衣框架
DreamFit是字节跳动团队联合清华大学深圳国际研究生院、中山大学深圳校区推出的虚拟试衣框架,专门用在轻量级服装为中心的人类图像生成。基于自适应注意力和LoRA模块,将模型复杂性降低至83.4M可训练参数,显著提高训练效率...
-
发布了文章 2个月前
COMET – 字节开源的通信优化系统
COMET是字节跳动推出的针对Mixture-of-Experts(MoE)模型的优化系统,能解决分布式训练中通信开销过大的问题。基于细粒度的计算-通信重叠技术,COMET将通信与计算操作深度融合,消除传统方法中因粒度不匹配...
-
发布了文章 2个月前
Boximator – 字节推出的控制视频生成中对象运动的框架
Boximator是有字节跳动的研究团队开发的一种视频合成技术,旨在生成丰富且可控的运动,以增强视频合成的质量和控制性。该技术通过引入两种类型的约束框(硬框和软框)来实现对视频中对象位置、形状或运动路径的精细控制。...
没有更多内容








