Claude Code CLI 接入
Claude Code 是 Anthropic 出的终端 AI 编程助手。它用 Anthropic 原生协议 /v1/messages,也是我们上游 Max 订阅对接的原生客户端——在 226-ai 体验最好。
前置
- macOS / Linux / WSL 终端
- Node.js 18+(安装 Claude Code 需要)
- 已在
console.226-ai.com拿到sk-xxxtoken
安装 Claude Code
npm install -g @anthropic-ai/claude-code
# 或
curl -fsSL https://claude.ai/install.sh | bash配置:两个环境变量搞定
把这两行加到 ~/.zshrc / ~/.bashrc:
export ANTHROPIC_BASE_URL=https://api.226-ai.com
export ANTHROPIC_AUTH_TOKEN=sk-你的token注意:
ANTHROPIC_BASE_URL不带/v1后缀- 用
ANTHROPIC_AUTH_TOKEN而不是ANTHROPIC_API_KEY(后者 Claude Code 内部也支持,但前者更常被-no-browser模式识别)
重开终端或 source ~/.zshrc,然后:
claude --version
claude -p "你是谁?"返回一段 Claude 的回答即接入成功。
常用命令速查
claude # 进入交互式对话
claude -p "写 README" # 一次性问答
claude -p "重构这个模块" -d # 加 -d 启用 deep/思考模式
claude --model claude-opus-4-7 -p "架构评审" # 强制某模型
/model claude-sonnet-4-6 # 交互时临时切模型
/clear # 清理当前上下文
/cost # 看当前对话消耗了多少 token(调我们 API 时以 /1M 价乘算)
/quit # 退出推荐的默认模型
export ANTHROPIC_MODEL=claude-sonnet-4-6我们跑下来最划算的组合:
- 日常编辑 / 补全:
claude-sonnet-4-6(速度快、质量高) - 小修改 / 聊天:自动降级到
claude-haiku-4-5-20251001 - 大重构 / 架构设计:手动
--model claude-opus-4-7
长请求避坑(重要)
Claude Code 在做大项目 refactor 时会产生 长推理 + 长输出,可能在流式响应里出现 100 秒内没字符输出的间隙,触发 Cloudflare 橙云的超时。
症状:请求跑到一半连接断,终端报 "connection reset" 或类似。
解决:切到直连入口:
export ANTHROPIC_BASE_URL=https://api-direct.226-ai.com:10443这条入口不经 Cloudflare 橙云代理,不受 100 秒限制。代价是证书为 Cloudflare Origin CA(Claude Code CLI 内置信任链可能不含,遇到证书错误加:
export NODE_TLS_REJECT_UNAUTHORIZED=0 # ⚠️ 仅内测/自用环境生产环境建议把 Cloudflare Origin CA 装进系统信任库,我们能提供 PEM。
工具调用(Function Calling)
Claude Code 自身就大量用 tool use(文件读写、shell、grep 等)。对 226-ai 用户不用额外配置,我们原样转发 Anthropic 的 tools / tool_use 字段。
提示词缓存(Prompt Caching)
Claude Code 自动对代码库上下文、system prompt 标记缓存。连续使用同一会话时你的 cache_read_input_tokens 会很高,扣费按输入价的 10% 算,非常便宜。初次进入新仓库时才会有较大的 cache_creation_input_tokens。
在 console.226-ai.com → 日志 里能看到每次请求分 4 列(input / output / cache_read / cache_create)的 token 数。
常见错误
HTTP 401:Token 贴错。 HTTP 404 on /v1/messages:ANTHROPIC_BASE_URL 带了 /v1,去掉。 ENOTFOUND api.226-ai.com:DNS 问题,或 export HTTPS_PROXY 污染了环境,unset HTTPS_PROXY HTTP_PROXY。 connection reset in middle of streaming:切 api-direct.226-ai.com:10443。 回答偏短或 max_tokens 警告:加 --max-tokens 8192(Claude Code 默认对 Opus 会限制较低的输出上限)。
多项目 / 多账户切换
想对不同仓库用不同 token?用 direnv 或项目级 .envrc:
# 仓库 A 的 .envrc
export ANTHROPIC_AUTH_TOKEN=sk-project-a-token
export ANTHROPIC_MODEL=claude-opus-4-7
# 仓库 B 的 .envrc
export ANTHROPIC_AUTH_TOKEN=sk-project-b-token
export ANTHROPIC_MODEL=claude-sonnet-4-6cd 进仓库时 direnv 自动加载对应 token,配额/计费分仓库统计。
验证接入成功的一条命令
claude -p "一句话说你是哪个模型。" 2>&1 | head -5应该返回类似 "我是 Claude Sonnet 4.6..." 的一句话。如果走了 226-ai 而不是直连 Anthropic,你在 console.226-ai.com 日志会看到这条调用,说明链路通了。