deepspeech
-
发布了文章 1个月前
靠DeepSeek赚到钱的人,分享了这些真相
靠DeepSeek赚到钱的人,分享了这些真相 从春节至今,DeepSeek的热度还在走高。1月20日,DeepSeek公司发布R1模型;1月27日,DeepSeek在美国苹果应用商店下载量超过ChatGPT并排名第一;...
-
发布了文章 2个月前
DeepSeek刚提到FP8,英伟达就把FP4精度推向预训练,更快、更便宜
DeepSeek刚提到FP8,英伟达就把FP4精度推向预训练,更快、更便宜 前些天,DeepSeek 在发布 DeepSeek V3.1 的文章评论区中,提及了...
-
发布了文章 2个月前
DeepSeek的GRPO会导致模型崩溃?看下Qwen3新范式GSPO
DeepSeek的GRPO会导致模型崩溃?看下Qwen3新范式GSPO 众所周知,大型语言模型的训练通常分为两个阶段。第一阶段是「预训练」,开发者利用大规模文本数据集训练模型,让它学会预测句子中的下一个词。第二阶段是「...
没有更多内容



















