deep sequence
-
发布了文章 2个月前
DeepSeek的MLA,任意大模型都能轻松迁移了
DeepSeek的MLA,任意大模型都能轻松迁移了 复旦 NLP 实验室博士后纪焘是这篇文章的第一作者,研究方向为大模型高效推理、多模态大模型,近期代表工作为首个NoPE外推HeadScale、注意力分块外推LongH...
-
发布了文章 2个月前
DeepSeek新模型霸榜,代码能力与OpenAI o1相当且确认开源,网友:今年编程只剩Tab键
DeepSeek新模型霸榜,代码能力与OpenAI o1相当且确认开源,网友:今年编程只剩Tab键 DeepSeek版o1,有消息了。还未正式发布,已在代码基准测试LiveCodeBench霸榜前三,表现与OpenAI...
-
发布了文章 2个月前
刚刚,DeepSeek能看懂猫片了!腾讯混元加持
刚刚,DeepSeek能看懂猫片了!腾讯混元加持 DeepSeek能看懂图片了!今天,腾讯AI助手“腾讯元宝”再次上新——所接入的DeepSeek能够理解图片信息了。在此之前,DeepSeek主要支持扫描图片中的文字。...
-
发布了文章 2个月前
DeepSeek刚提到FP8,英伟达就把FP4精度推向预训练,更快、更便宜
DeepSeek刚提到FP8,英伟达就把FP4精度推向预训练,更快、更便宜 前些天,DeepSeek 在发布 DeepSeek V3.1 的文章评论区中,提及了...
-
发布了文章 2个月前
DeepSeek,改变了AI的游戏规则
DeepSeek,改变了AI的游戏规则 这两天,中美AI领域发生了两件大事:在美国发布AI禁令后,特朗普随即宣布了一项预算高达5000亿美元的AGI计划——星际之门,以保证其在AI领域的领先地位。而在大洋彼岸的中国,一...
-
发布了文章 2个月前
深入探讨DeepSeek大模型的核心技术
...
-
发布了文章 2个月前
DeepSeek现象分析报告
未来将随处可见自己的镜像空间,2025年的新春,在网络空间静悄悄地引发了一场史诗级大战,在年后开工之后,化成滚滚洪流,爆发deepseek深度现象。DeepSeek,由知名量化资管巨头幻方量化于2023年7月创立,是一个在人...
没有更多内容