karpathy split
-
发布了文章 1个月前
Karpathy新实验火了!一个「表情」占53个token,DeepSeek-R1苦思10分解谜失败
Karpathy新实验火了!一个「表情」占53个token,DeepSeek-R1苦思10分解谜失败 一个简单的笑脸😀可能远不止这么简单?最近,AI大神Karpathy发现,一个😀竟然占用了多达53个token!这背后...
-
发布了文章 2个月前
Karpathy 4小时AI大课上线,小白看了都会从零构建GPT-2!
Karpathy 4小时AI大课上线,小白看了都会从零构建GPT-2! 距上次Karpathy AI大课更新之后,又有了1个多月的时间。这次他带了超详细的4小时课程——从零开始实现1.24亿参数规模的GPT-2模型。...
-
发布了文章 2个月前
Karpathy新教程爆火,网友抢着送他H100:从头复现GPT-2训练
Karpathy新教程爆火,网友抢着送他H100:从头复现GPT-2训练 大神Karpathy已经不满足于用C语言造Llama了!他给自己的最新挑战:复现OpenAI经典成果,从基础版GPT-2开始。挑战成功本身并不...
没有更多内容



















