deepspeed github
-
发布了文章 2个月前
DeepSite – 基于 DeepSeek 开源的 AI 前端开发工具
DeepSite 是基于 DeepSeek-V3 模型的在线开发工具,用户无需配置环境或安装软件,在网页上直接输入需求,快速生成游戏、应用或网页的代码,支持实时预览效果。...
-
发布了文章 2个月前
DeepSeek-baidu09V2.5 – DeepSeek开源的融合通用和代码能力的AI模型
DeepSeek-V2.5 是DeepSeek推出的融合通用与代码能力的全新开源模型。保留了之前 Chat 模型的通用对话能力以及 Coder 模型的代码处理能力,更好地对齐了人类的偏好,并且在写作任务、指令跟随等多个方面实...
-
发布了文章 2个月前
DeepGEMM – DeepSeek 开源的 FP8 通用矩阵乘法库
DeepGEMM是DeepSeek开源的为高效简洁的FP8矩阵乘法(GEMM)设计的库,目前仅支持NVIDIA Hopper张量核心。DeepGEMM支持普通和混合专家(MoE)分组的GEMM操作,基于即时编译(JIT)技术...
-
发布了文章 2个月前
DeepEP – DeepSeek 开源的专家并行通信库,专为 MoE 训练和推理设计
DeepEP 是 DeepSeek 开源的首个专为混合专家模型(MoE)训练和推理设计的开源 EP(专家并行)通信库。提供了高吞吐量和低延迟的全对全 GPU 内核,支持节点内和节点间的 NVLink 和 RDMA 通信。...
-
发布了文章 2个月前
DeepSeek开源新版R1 媲美OpenAI o3
...
没有更多内容










