连不上Gemini CLI,试下DeepSeek-R1接入Claude code
这两天Google推出了Gemini-CLI这个编程工具,功能和Claude Code基本一致,结果根本排不上队,登录一下很快闪退,和下图一样,使用感受令人不愉悦。很多人都在等着体验这个新工具,但现实是您可能要等很久才能轮到。不过,我发现了一个完美的替代方案——claude-code-router,它能让您用DeepSeek-R1的强大推理能力来驱动Claude Code。

什么是Claude Code Router
Claude Code Router [1] 本质上是一个"API路由器",国人自己的项目,它的核心思想很特别。这个项目可以把原本发送给Claude API的请求,重新路由到任何OpenAI兼容的API服务上,比如DeepSeek、OpenRouter、甚至本地的Ollama。听起来简单,但实际上这解决了一个大问题:您不再需要依赖昂贵的Claude API,也不用受限于单一模型的能力。
这个开源项目在GitHub上(地址在下文)已经获得了1.9k stars,说明它确实解决了很多开发者的痛点。项目作者不仅提供了完整的源码,还有详细的文档和配置示例,让部署变得非常简单。

Claude Code为什么这么强大
要理解claude-code-router的价值,我们得先明白Claude Code本身到底有多厉害。通过深入分析Claude Code的System Prompt和工具实现,可以发现这绝不是一个简单的聊天机器人,而是一个按照软件工程标准精心设计的AI智能体。

智能上下文管理:永不中断的长期工作
Claude Code最核心的创新是它的上下文管理系统。传统AI对话很容易因为上下文窗口限制而"失忆",但Claude Code通过ClearTool实现了智能对话压缩。这个工具不是简单的截断,而是会深度分析整个对话历史,提取关键的技术细节、代码模式、架构决策,然后生成一个结构化的摘要。摘要包含7个关键部分:用户请求、技术概念、文件变更、问题解决过程、待办任务、当前工作状态和下一步计划。这意味着即使对话历史超过100轮,AI仍然能清楚地记住项目的来龙去脉。
持久记忆机制:像人类工程师一样积累经验
更厉害的是MemoryTool带来的持久记忆能力。AI可以将重要信息保存到项目根目录的CLAUDE.md文件中,包括项目结构、代码约定、踩过的坑、解决方案等。下次打开项目时,AI会自动读取这些记忆,就像一个有经验的工程师重新熟悉代码库一样。这种设计让AI具备了"学习"和"积累"的能力,每次交互都在为下一次工作打基础。
工程化思维:不只是写代码,更要写好代码
从System Prompt可以看出,Claude Code被明确要求要具备工程师的思维模式。它必须"理解文件的代码约定"、"模仿代码风格"、"使用现有库和工具"、"遵循现有模式"。在实际工作中,它会先检查package.json确认项目依赖,参考邻近文件了解代码风格,然后再开始编码。完成代码后,还会主动运行lint和typecheck进行验证。这种工程化的工作流程,确保了代码质量和项目一致性。
命令行优化:为开发者效率而生
Claude Code的交互设计完全针对命令行环境优化。System Prompt明确要求:"回答必须简洁直接"、"避免不必要的前言后语"、"一个词的回答最好"。这种极简风格看似简单,实际上需要AI具备很强的信息提炼能力。它必须在保持准确性的同时,将复杂的技术问题浓缩成最直接的答案,这正是命令行环境下开发者最需要的效率。
并行处理:现代开发的节奏
Claude Code还支持并行工具调用,可以同时执行多个操作,比如同时运行"git status"和"git diff",或者批量编辑多个文件。这种并行处理能力大大提升了工作效率,让AI能够跟上现代开发的快节奏。结合主动验证机制,整个系统体现了软件工程的最佳实践。
项目作者的初衷与技术突破
了解了Claude Code的强大之后,您可能会好奇:既然Claude Code这么厉害,为什么还要做一个Router项目呢?这就要从项目作者的经历说起了。作者在Github上有一篇Blog介绍了开发的初衷。
早在2025年2月25日,Claude Code发布的第二天,项目作者就开始了对这个工具的逆向工程。原因很简单:Anthropic屏蔽了中国区用户,想用Claude Code必须通过繁琐的申请流程,而且很可能申请不到。作为一个技术人员,作者选择了更直接的方式——既然无法正常使用,那就自己想办法。
技术突破的关键发现
通过深入的逆向分析,作者发现了一个关键信息:Claude Code允许通过环境变量ANTHROPIC_BASE_URL来覆盖API地址。这个发现意义重大,因为它意味着可以在不修改Claude Code源码的情况下,将所有请求重定向到自定义的服务器。
基于这个发现,claude-code-router的核心技术原理就很清晰了:
- API格式转换:实现一个Express.js服务,提供/v1/messages端点,将OpenAI格式的API请求转换为Anthropic格式
- 环境变量劫持:通过设置ANTHROPIC_BASE_URL将Claude Code的请求重定向到本地服务
- 中间件架构:使用中间件模式处理请求/响应的格式转换和内容重写
从单模型到多模型路由的演进
项目的发展也很有意思。最初因为DeepSeek不支持Function Call,作者选择了qwen-max模型。后来尝试过复杂的四模型分工机制(router、tool、think、coder),但发现免费小模型无法胜任任务分发的重任。
直到2025年5月底Claude Code正式发布,DeepSeek系列模型(包括5月28日发布的R1)开始完美支持Function Call,作者重新设计了整个架构。现在的四模型分工更加科学:默认模型兜底、background处理后台任务、think负责推理规划、longContext处理长文本场景。
这种演进过程体现了项目作者对技术的深度思考:不是为了技术而技术,而是为了解决实际问题而不断优化。最终的结果是,您可以以Claude十分之一的成本,获得接近Claude Code原生的使用体验。
三步完成部署,比想象中简单
部署claude-code-router的过程非常简单,您只需要三个步骤就能搞定,按照下面的方式即可。首先安装Claude Code官方工具,然后安装路由器,最后启动就行了。整个过程大概需要5分钟,比配置一个普通的开发环境还要快。我这里提供两种方案,以上是一个Mac的部署方案。如果在Windows里安装,需要切换到wsl -d ubuntu的环境,如果以下命令运行报错,再用Powershell的管理员终端进入,在以下命令之前加入sudo提权即可。
步骤1:安装Claude Code
npm install -g @anthropic-ai/claude-code
步骤2:安装Claude Code Router
npm install -g @musistudio/claude-code-router
步骤3:启动并配置
# 终端1:手动启动服务
ccr start
# 终端2:启动Claude Code
ccr code
第一次运行时,系统会提示您输入API配置信息。您只需要依次填入:
- OPENAI_BASE_URL: https://api.deepseek.com
- OPENAI_API_KEY: 您的DeepSeek API密钥
- OPENAI_MODEL: deepseek-chat或deepseek-reasoner
配置完成后,所有信息会自动保存到~/.claude-code-router/config.json文件中,下次启动就不用重新输入了。
为什么DeepSeek-R1是最佳选择
说到模型选择,DeepSeek-R1真的是项目作者经过深度实践后的推荐选择。从claude-code-router的架构设计可以看出,作者专门将DeepSeek-R1配置为"think"模型,用于处理Claude Code的推理和Plan Mode任务。这个选择并非偶然:DeepSeek-R1具备强大的推理能力,在处理复杂编程任务时表现出色,特别适合需要深度思考的场景。从技术发展历程看,直到2025年5月28日DeepSeek-R1发布后,DeepSeek全系列模型才完美支持Function Call,这使得它能很好地驱动Claude Code的工具调用机制。更重要的是成本优势让人无法忽视:DeepSeek的价格不到Claude Sonnet 3.5的十分之一,在北京时间凌晨0:30到8:30之间,DeepSeek-R1的成本更是只有平时的25%。

DeepSeek-R1的实战表现:从想法到成品
为了测试DeepSeek-R1的真实能力,刚才我让claude-code-router创建一个"炫酷的博客网站"。这个要求看似简单,但实际上需要AI具备项目规划、技术选型、代码实现和问题解决的全链路能力。结果让人印象深刻:DeepSeek-R1展现出了超乎预期的适应性和问题解决能力。

自动调整策略的智能表现
一开始,DeepSeek-R1尝试使用标准的npx create-next-app命令快速搭建项目。但它很快发现这个自动化工具会在终端中弹出交互式选择,无法在CLI环境中自动化完成。您猜怎么着,这时候DeepSeek-R1做出了一个决定:立即放弃自动化工具,改用手动创建的方式。它先创建项目目录,再逐个安装依赖,手动构建整个项目结构。
完整的技术栈实现
DeepSeek-R1不仅创建了基础的Next.js项目,还完整实现了现代Web开发的最佳实践。它自动选择了React 18、配置了Tailwind CSS进行样式管理、设置了PostCSS和Autoprefixer、创建了响应式的网格布局,甚至还加入了玻璃拟态效果和悬停动画。整个技术选型体现了对当前前端生态的深度理解,从页面结构到样式系统都考虑得很周全。

最终交付的完美成果
经过一系列智能调整后,DeepSeek-R1成功交付了一个功能完整的博客网站。这个网站具备紫色到靛蓝的渐变背景、6个交互式博客卡片、响应式布局设计,在http://localhost:3000成功运行。从用户输入"创建一个炫酷的博客网站"到看到实际效果,整个过程展现了AI在复杂任务中的规划能力、执行能力和问题解决能力。
多模型路由的强大之处
这个项目最厉害的地方在于它的路由策略。您可以配置不同的模型来处理不同类型的任务:可以用本地的qwen-coder处理后台任务,用DeepSeek-R1处理需要推理的复杂问题,用Gemini处理长上下文的任务。
实际效果怎么样?用户反馈说,在VS Code Copilot用Claude-4处理Flutter问题时搞砸了文件,但用claude-code-router配合DeepSeek,几轮对话就完成了任务,成本还不到1块钱。
更多可能性等待探索
值得一提的是,项目作者在文档中还提到了一个很有意思的玩法:可以同时配置本地模型和云端API协同工作。比如用本地的Ollama跑qwen-coder处理一些简单的后台任务,同时用DeepSeek API处理复杂推理,这样既能保证效果又能进一步降低成本。不过说实话,我还没有深入尝试过这种混合部署方式,感觉应该会很有趣。
如果您对claude-code-router这个项目感兴趣,或者在使用过程中遇到什么问题,非常欢迎加入我们的技术交流群一起探讨。毕竟AI工具发展得这么快,大家一起分享经验、探索新玩法,肯定比一个人摸索要有效率得多。让我们一起在这个AI编程的新时代里,找到最适合自己的开发方式吧!
引用链接
[1] Claude Code Router: https://github.com/musistudio/claude-code-router
文章来自于“Al修猫Prompt”,作者“Al修猫Prompt”。











































全部评论
留言在赶来的路上...
发表评论