deepfake开源
-
发布了文章 2个月前
DeepSeek开源优化并行策略
DeepSeek今日宣布开源优化并行策略,旨在提升V3/R1训练中的计算通信重叠。此次开源包括DualPipe和EPLB两项重要技术。DualPipe是一种双向管道并行算法,用于V3/R1训练中的计算通信重叠。它实现了向后和...
-
发布了文章 2个月前
刚刚,DeepSeek 开源 DeepSeek-Prover-V2-671B 新模型
刚刚,DeepSeek 开源 DeepSeek-Prover-V2-671B 新模型 就在刚刚,DeepSeek 在全球最大 AI 开源社区 Hugging Face 发布了一个名为 DeepSeek-Prover-V...
-
发布了文章 2个月前
DeepSeek开源优化并行策略
DeepSeek今日宣布开源优化并行策略,旨在提升V3/R1训练中的计算通信重叠。此次开源包括DualPipe和EPLB两项重要技术。DualPipe是一种双向管道并行算法,用于V3/R1训练中的计算通信重叠。它实现了向后和...
-
发布了文章 2个月前
DeepSeek开源放大招:FlashMLA让H800算力狂飙!曝光低成本秘笈
DeepSeek开源放大招:FlashMLA让H800算力狂飙!曝光低成本秘笈 就在刚刚,DeepSeek放出了开源周首日的重磅炸弹——FlashMLA。这是DeepSeek专为英伟达Hopper GPU打造的高效ML...
-
发布了文章 2个月前
刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中
刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中 上周五,DeepSeek 发推说本周将是开源周(OpenSourceWeek),并将连续开源五个软件库。第一个项目,果然与推理加速有关。北...
-
发布了文章 2个月前
DeepSeek-baidu09V2.5 – DeepSeek开源的融合通用和代码能力的AI模型
DeepSeek-V2.5 是DeepSeek推出的融合通用与代码能力的全新开源模型。保留了之前 Chat 模型的通用对话能力以及 Coder 模型的代码处理能力,更好地对齐了人类的偏好,并且在写作任务、指令跟随等多个方面实...
-
发布了文章 2个月前
DeepSeek V3 – DeepSeek开源的最新版 AI 模型,编程能力超越Claude
DeepSeek V3是知名私募巨头幻方量化旗下人工智能公司深度求索(DeepSeek)开源的最新版AI模型,在多语言编程能力上的进步显著。在aider多语言编程测评中的表现超越了Claude 3.5 Sonnet V2等竞...
-
发布了文章 2个月前
DeepSeek Engineer – 开源AI编程助手,处理用户对话生成结构化JSON
DeepSeek Engineer 是集成DeepSeek API 的AI编程助手,基于命令行界面让用户能读取本地文件、创建新文件及实时对现有文件进行差异编辑。DeepSeek Engineer用 Pydantic 进行类型...
-
发布了文章 2个月前
DeepGEMM – DeepSeek 开源的 FP8 通用矩阵乘法库
DeepGEMM是DeepSeek开源的为高效简洁的FP8矩阵乘法(GEMM)设计的库,目前仅支持NVIDIA Hopper张量核心。DeepGEMM支持普通和混合专家(MoE)分组的GEMM操作,基于即时编译(JIT)技术...
-
发布了文章 2个月前
DeepClaude – 开源AI应用开发平台,深度集成 DeepSeek R1 和 Claude 模型
DeepClaude 是高性能的开源 AI 工具,基于深度集成 DeepSeek R1 和 Claude 两大模型,结合推理、创造力和代码生成能力。DeepClaude提供零延迟的即时响应,支持端到端加密和本地 API 密钥...
-
发布了文章 2个月前
DeepSeek开源新版R1 媲美OpenAI o3
...
没有更多内容