sideshow终结者
-
发布了文章 1个月前
Transformer终结者!谷歌DeepMind全新MoR架构问世,新一代魔王来了
Transformer终结者!谷歌DeepMind全新MoR架构问世,新一代魔王来了 Transformer杀手来了?KAIST、谷歌DeepMind等机构刚刚发布的MoR架构,推理速度翻倍、内存减半,直接重塑了LLM...
-
发布了文章 2个月前
Scaling Laws终结,量化无用,AI大佬都在审视这篇论文
Scaling Laws终结,量化无用,AI大佬都在审视这篇论文 研究表明,你训练的 token 越多,你需要的精度就越高。最近几天,AI 社区都在讨论同一篇论文。...
没有更多内容













