字节m0
-
发布了文章 2个月前
UltraMem – 字节豆包大模型团队推出的全新超稀疏模型架构
UltraMem 是字节跳动豆包大模型团队提出的全新超稀疏模型架构,解决传统 MoE 架构在推理时的高额访存问题。架构通过优化内存访问和计算效率,显著降低推理成本,推理速度较 MoE 提升了2-6倍,成本最高可降低83%。...
-
发布了文章 2个月前
MARS – 字节推出优化大模型训练效率的框架
MARS(Make vAriance Reduction Shine)是字节跳动推出的创新的优化框架,提升大型模型训练的效率。MARS融合预条件梯度方法与方差减少技术,基于缩放随机递归动量技术优化梯度估计。MARS框架灵活,...
没有更多内容





