deepin 开源
-
发布了文章 2个月前
DeepSeek开源优化并行策略
DeepSeek今日宣布开源优化并行策略,旨在提升V3/R1训练中的计算通信重叠。此次开源包括DualPipe和EPLB两项重要技术。DualPipe是一种双向管道并行算法,用于V3/R1训练中的计算通信重叠。它实现了向后和...
-
发布了文章 2个月前
DeepSeek开源优化并行策略
DeepSeek今日宣布开源优化并行策略,旨在提升V3/R1训练中的计算通信重叠。此次开源包括DualPipe和EPLB两项重要技术。DualPipe是一种双向管道并行算法,用于V3/R1训练中的计算通信重叠。它实现了向后和...
-
发布了文章 2个月前
Deepmind 重磅开源:消除幻觉,让 LLMs 学会规则库和多步推理
Deepmind 重磅开源:消除幻觉,让 LLMs 学会规则库和多步推理 2024 年 12 月,真是大模型的杀疯了的一个月。前有《智谱 GLM-4V-Flash API 发布即免费》、《Gemini2.0 实时全模态...
-
发布了文章 2个月前
刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中
刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中 上周五,DeepSeek 发推说本周将是开源周(OpenSourceWeek),并将连续开源五个软件库。第一个项目,果然与推理加速有关。北...
-
发布了文章 2个月前
DeepCoder-14B:开源AI编码模型挑战闭源的o3-mini和o1
...
-
发布了文章 2个月前
DeepSeek Engineer – 开源AI编程助手,处理用户对话生成结构化JSON
DeepSeek Engineer 是集成DeepSeek API 的AI编程助手,基于命令行界面让用户能读取本地文件、创建新文件及实时对现有文件进行差异编辑。DeepSeek Engineer用 Pydantic 进行类型...
-
发布了文章 2个月前
DeepSeek开源新版R1 媲美OpenAI o3
...
没有更多内容

















