deepkey
-
发布了文章 1个月前
靠DeepSeek赚到钱的人,分享了这些真相
靠DeepSeek赚到钱的人,分享了这些真相 从春节至今,DeepSeek的热度还在走高。1月20日,DeepSeek公司发布R1模型;1月27日,DeepSeek在美国苹果应用商店下载量超过ChatGPT并排名第一;...
-
发布了文章 2个月前
DeepSeek的MLA,任意大模型都能轻松迁移了
DeepSeek的MLA,任意大模型都能轻松迁移了 复旦 NLP 实验室博士后纪焘是这篇文章的第一作者,研究方向为大模型高效推理、多模态大模型,近期代表工作为首个NoPE外推HeadScale、注意力分块外推LongH...
-
发布了文章 2个月前
刚刚,DeepSeek 开源 DeepSeek-Prover-V2-671B 新模型
刚刚,DeepSeek 开源 DeepSeek-Prover-V2-671B 新模型 就在刚刚,DeepSeek 在全球最大 AI 开源社区 Hugging Face 发布了一个名为 DeepSeek-Prover-V...
-
发布了文章 2个月前
DeepSeek爆火一个月,豆包、Kimi们怎么样了?
DeepSeek爆火一个月,豆包、Kimi们怎么样了? 1月20日,前后相隔仅几小时的时间里,深度求索与月之暗面先后发布了技术路径相似的DeepSeek-R1及Kimi K1.5多模态思考模型。后来,OpenAI在论文...
-
发布了文章 2个月前
DeepSeek终于丢了开源第一王座,但继任者依然来自中国
DeepSeek终于丢了开源第一王座,但继任者依然来自中国 几千人盲投,Kimi K2超越DeepSeek拿下全球开源第一!歪果网友们直接炸了,评论区秒变夸夸打卡现场:...
-
发布了文章 2个月前
DeepSeek新模型霸榜,代码能力与OpenAI o1相当且确认开源,网友:今年编程只剩Tab键
DeepSeek新模型霸榜,代码能力与OpenAI o1相当且确认开源,网友:今年编程只剩Tab键 DeepSeek版o1,有消息了。还未正式发布,已在代码基准测试LiveCodeBench霸榜前三,表现与OpenAI...
-
发布了文章 2个月前
DeepSeek用的GRPO占用大量内存?有人给出了些破解方法
DeepSeek用的GRPO占用大量内存?有人给出了些破解方法 RTX 3080 移动版能训练哪种大模型?本文为那些 GPU 资源有限时使用 GRPO 训练的开发者提供了宝贵的指导。自 DeepSeek-R1 发布以来...
-
发布了文章 2个月前
「DeepSeek二代」来袭!数学暴击o3,英伟达开源LLM登顶
「DeepSeek二代」来袭!数学暴击o3,英伟达开源LLM登顶...
-
发布了文章 2个月前
DeepSeek-V3巧取捷径?
DeepSeek-V3巧取捷径?...
-
发布了文章 2个月前
刚刚,DeepSeek能看懂猫片了!腾讯混元加持
刚刚,DeepSeek能看懂猫片了!腾讯混元加持 DeepSeek能看懂图片了!今天,腾讯AI助手“腾讯元宝”再次上新——所接入的DeepSeek能够理解图片信息了。在此之前,DeepSeek主要支持扫描图片中的文字。...
-
发布了文章 2个月前
DeepSeek用的GRPO有那么特别吗?万字长文分析四篇精品论文
DeepSeek用的GRPO有那么特别吗?万字长文分析四篇精品论文 本文详细解读了 Kimi k1.5、OpenReasonerZero、DAPO 和 Dr. GRPO 四篇论文中的创新点,读完会对 GRPO 及其改进...
-
发布了文章 2个月前
DeepGEMM – DeepSeek 开源的 FP8 通用矩阵乘法库
DeepGEMM是DeepSeek开源的为高效简洁的FP8矩阵乘法(GEMM)设计的库,目前仅支持NVIDIA Hopper张量核心。DeepGEMM支持普通和混合专家(MoE)分组的GEMM操作,基于即时编译(JIT)技术...
-
发布了文章 2个月前
NVIDIA Blackwell GPU优化DeepSeek-R1性能 打破DeepSeek-R1在最小延迟场景中的性能纪录
本文将探讨 NVIDIA TensorRT-LLM 如何基于 8 个 NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在最小延迟场景中的性能纪录:在 GTC 2025 前将 67 token...
-
发布了文章 2个月前
Deepseek进入业务深水区,为什么需要昇腾大EP?
行业智能化的高铁,由昇腾大EP+DeepSeek的双轨铺成...
-
发布了文章 2个月前
Deepseek背后的伙伴-晶振担当什么角色?
作为DeepSeek智能系统的核心时序引擎,晶振以卓越的时间管理能力,支撑着AI模型的推理、训练与实时响应。在数字世界的交响乐中,每一个音符的精准节拍都离不开隐于幕后的指挥家——晶振。...



































































