成本模型公式
-
发布了文章 2个月前
5%参数比肩DeepSeek满血R1!北大“小”模型靠分合蒸馏,打破推理成本下限
5%参数比肩DeepSeek满血R1!北大“小”模型靠分合蒸馏,打破推理成本下限 只用5%的参数,数学和代码能力竟然超越满血DeepSeek?北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一项新成果——F...
-
发布了文章 2个月前
成本不到150元!李飞飞等26分钟训出个推理模型,媲美o1和R1,秘诀:用蒸馏
成本不到150元!李飞飞等26分钟训出个推理模型,媲美o1和R1,秘诀:用蒸馏 成本不到150元,训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型?!这不是洋葱新闻,而是AI教母李飞飞、斯坦福大学、华...
没有更多内容










