首页 / AI人工智能 / 连不上Gemini CLI，试下DeepSeek-R1接入Claude code

连不上Gemini CLI，试下DeepSeek-R1接入Claude code

baidu09_com 2025-09-08 23 0

这两天Google推出了Gemini-CLI这个编程工具，功能和Claude Code基本一致，结果根本排不上队，登录一下很快闪退，和下图一样，使用感受令人不愉悦。很多人都在等着体验这个新工具，但现实是您可能要等很久才能轮到。不过，我发现了一个完美的替代方案——claude-code-router，它能让您用DeepSeek-R1的强大推理能力来驱动Claude Code。

连不上Gemini CLI，试下DeepSeek-R1接入Claude code 第1张

什么是Claude Code Router

Claude Code Router [1] 本质上是一个"API路由器"，国人自己的项目，它的核心思想很特别。这个项目可以把原本发送给Claude API的请求，重新路由到任何OpenAI兼容的API服务上，比如DeepSeek、OpenRouter、甚至本地的Ollama。听起来简单，但实际上这解决了一个大问题：您不再需要依赖昂贵的Claude API，也不用受限于单一模型的能力。

这个开源项目在GitHub上（地址在下文）已经获得了1.9k stars，说明它确实解决了很多开发者的痛点。项目作者不仅提供了完整的源码，还有详细的文档和配置示例，让部署变得非常简单。

连不上Gemini CLI，试下DeepSeek-R1接入Claude code 第2张

Claude Code为什么这么强大

要理解claude-code-router的价值，我们得先明白Claude Code本身到底有多厉害。通过深入分析Claude Code的System Prompt和工具实现，可以发现这绝不是一个简单的聊天机器人，而是一个按照软件工程标准精心设计的AI智能体。

连不上Gemini CLI，试下DeepSeek-R1接入Claude code 第3张

智能上下文管理：永不中断的长期工作

Claude Code最核心的创新是它的上下文管理系统。传统AI对话很容易因为上下文窗口限制而"失忆"，但Claude Code通过ClearTool实现了智能对话压缩。这个工具不是简单的截断，而是会深度分析整个对话历史，提取关键的技术细节、代码模式、架构决策，然后生成一个结构化的摘要。摘要包含7个关键部分：用户请求、技术概念、文件变更、问题解决过程、待办任务、当前工作状态和下一步计划。这意味着即使对话历史超过100轮，AI仍然能清楚地记住项目的来龙去脉。

持久记忆机制：像人类工程师一样积累经验

更厉害的是MemoryTool带来的持久记忆能力。AI可以将重要信息保存到项目根目录的CLAUDE.md文件中，包括项目结构、代码约定、踩过的坑、解决方案等。下次打开项目时，AI会自动读取这些记忆，就像一个有经验的工程师重新熟悉代码库一样。这种设计让AI具备了"学习"和"积累"的能力，每次交互都在为下一次工作打基础。

工程化思维：不只是写代码，更要写好代码

从System Prompt可以看出，Claude Code被明确要求要具备工程师的思维模式。它必须"理解文件的代码约定"、"模仿代码风格"、"使用现有库和工具"、"遵循现有模式"。在实际工作中，它会先检查package.json确认项目依赖，参考邻近文件了解代码风格，然后再开始编码。完成代码后，还会主动运行lint和typecheck进行验证。这种工程化的工作流程，确保了代码质量和项目一致性。

命令行优化：为开发者效率而生

Claude Code的交互设计完全针对命令行环境优化。System Prompt明确要求："回答必须简洁直接"、"避免不必要的前言后语"、"一个词的回答最好"。这种极简风格看似简单，实际上需要AI具备很强的信息提炼能力。它必须在保持准确性的同时，将复杂的技术问题浓缩成最直接的答案，这正是命令行环境下开发者最需要的效率。

并行处理：现代开发的节奏

Claude Code还支持并行工具调用，可以同时执行多个操作，比如同时运行"git status"和"git diff"，或者批量编辑多个文件。这种并行处理能力大大提升了工作效率，让AI能够跟上现代开发的快节奏。结合主动验证机制，整个系统体现了软件工程的最佳实践。

项目作者的初衷与技术突破

了解了Claude Code的强大之后，您可能会好奇：既然Claude Code这么厉害，为什么还要做一个Router项目呢？这就要从项目作者的经历说起了。作者在Github上有一篇Blog介绍了开发的初衷。

早在2025年2月25日，Claude Code发布的第二天，项目作者就开始了对这个工具的逆向工程。原因很简单：Anthropic屏蔽了中国区用户，想用Claude Code必须通过繁琐的申请流程，而且很可能申请不到。作为一个技术人员，作者选择了更直接的方式——既然无法正常使用，那就自己想办法。

技术突破的关键发现

通过深入的逆向分析，作者发现了一个关键信息：Claude Code允许通过环境变量ANTHROPIC_BASE_URL来覆盖API地址。这个发现意义重大，因为它意味着可以在不修改Claude Code源码的情况下，将所有请求重定向到自定义的服务器。

基于这个发现，claude-code-router的核心技术原理就很清晰了：

API格式转换：实现一个Express.js服务，提供/v1/messages端点，将OpenAI格式的API请求转换为Anthropic格式
环境变量劫持：通过设置ANTHROPIC_BASE_URL将Claude Code的请求重定向到本地服务
中间件架构：使用中间件模式处理请求/响应的格式转换和内容重写

从单模型到多模型路由的演进

项目的发展也很有意思。最初因为DeepSeek不支持Function Call，作者选择了qwen-max模型。后来尝试过复杂的四模型分工机制（router、tool、think、coder），但发现免费小模型无法胜任任务分发的重任。

直到2025年5月底Claude Code正式发布，DeepSeek系列模型（包括5月28日发布的R1）开始完美支持Function Call，作者重新设计了整个架构。现在的四模型分工更加科学：默认模型兜底、background处理后台任务、think负责推理规划、longContext处理长文本场景。

这种演进过程体现了项目作者对技术的深度思考：不是为了技术而技术，而是为了解决实际问题而不断优化。最终的结果是，您可以以Claude十分之一的成本，获得接近Claude Code原生的使用体验。

三步完成部署，比想象中简单

部署claude-code-router的过程非常简单，您只需要三个步骤就能搞定，按照下面的方式即可。首先安装Claude Code官方工具，然后安装路由器，最后启动就行了。整个过程大概需要5分钟，比配置一个普通的开发环境还要快。我这里提供两种方案，以上是一个Mac的部署方案。如果在Windows里安装，需要切换到wsl -d ubuntu的环境，如果以下命令运行报错，再用Powershell的管理员终端进入，在以下命令之前加入sudo提权即可。

步骤1：安装Claude Code

npm install -g @anthropic-ai/claude-code

步骤2：安装Claude Code Router

npm install -g @musistudio/claude-code-router

步骤3：启动并配置

# 终端1：手动启动服务

ccr start

# 终端2：启动Claude Code

ccr code

第一次运行时，系统会提示您输入API配置信息。您只需要依次填入：

OPENAI_BASE_URL: https://api.deepseek.com
OPENAI_API_KEY: 您的DeepSeek API密钥
OPENAI_MODEL: deepseek-chat或deepseek-reasoner

配置完成后，所有信息会自动保存到~/.claude-code-router/config.json文件中，下次启动就不用重新输入了。

为什么DeepSeek-R1是最佳选择

说到模型选择，DeepSeek-R1真的是项目作者经过深度实践后的推荐选择。从claude-code-router的架构设计可以看出，作者专门将DeepSeek-R1配置为"think"模型，用于处理Claude Code的推理和Plan Mode任务。这个选择并非偶然：DeepSeek-R1具备强大的推理能力，在处理复杂编程任务时表现出色，特别适合需要深度思考的场景。从技术发展历程看，直到2025年5月28日DeepSeek-R1发布后，DeepSeek全系列模型才完美支持Function Call，这使得它能很好地驱动Claude Code的工具调用机制。更重要的是成本优势让人无法忽视：DeepSeek的价格不到Claude Sonnet 3.5的十分之一，在北京时间凌晨0:30到8:30之间，DeepSeek-R1的成本更是只有平时的25%。

连不上Gemini CLI，试下DeepSeek-R1接入Claude code 第4张

DeepSeek-R1的实战表现：从想法到成品

为了测试DeepSeek-R1的真实能力，刚才我让claude-code-router创建一个"炫酷的博客网站"。这个要求看似简单，但实际上需要AI具备项目规划、技术选型、代码实现和问题解决的全链路能力。结果让人印象深刻：DeepSeek-R1展现出了超乎预期的适应性和问题解决能力。

连不上Gemini CLI，试下DeepSeek-R1接入Claude code 第5张

自动调整策略的智能表现

一开始，DeepSeek-R1尝试使用标准的npx create-next-app命令快速搭建项目。但它很快发现这个自动化工具会在终端中弹出交互式选择，无法在CLI环境中自动化完成。您猜怎么着，这时候DeepSeek-R1做出了一个决定：立即放弃自动化工具，改用手动创建的方式。它先创建项目目录，再逐个安装依赖，手动构建整个项目结构。

完整的技术栈实现

DeepSeek-R1不仅创建了基础的Next.js项目，还完整实现了现代Web开发的最佳实践。它自动选择了React 18、配置了Tailwind CSS进行样式管理、设置了PostCSS和Autoprefixer、创建了响应式的网格布局，甚至还加入了玻璃拟态效果和悬停动画。整个技术选型体现了对当前前端生态的深度理解，从页面结构到样式系统都考虑得很周全。

连不上Gemini CLI，试下DeepSeek-R1接入Claude code 第6张

最终交付的完美成果

经过一系列智能调整后，DeepSeek-R1成功交付了一个功能完整的博客网站。这个网站具备紫色到靛蓝的渐变背景、6个交互式博客卡片、响应式布局设计，在http://localhost:3000成功运行。从用户输入"创建一个炫酷的博客网站"到看到实际效果，整个过程展现了AI在复杂任务中的规划能力、执行能力和问题解决能力。