226·AI 支持哪些客户端？

Claude Code (Anthropic 原生协议)、Cursor、Continue、Aider、Cline、LangChain、LlamaIndex、openai SDK、anthropic SDK、Cherry Studio、Zed 等所有支持 OpenAI 兼容或 Anthropic 协议的客户端都可零代码改动接入。

支持哪些 Claude 模型？

全系列：claude-sonnet-4-6 (主力)、claude-opus-4-7 (高端推理)、claude-haiku-4-5-20251001 (走量)、以及历史版本 claude-sonnet-4-5、claude-opus-4-1/4-5/4-6、claude-3-5-haiku 等共 18+ 变种。

支付宝、微信支付即时到账（< 30 秒）。¥1 充值 = $1 quota（1:1 直观）。访问 console.226-ai.com 注册后直接在控制台充值。

新用户有什么优惠？

注册即送 ¥10 试用额度，无需充值即可体验所有模型。每日签到额外送 ¥0.20。邀请朋友注册成功后双方各送 ¥10，被邀请人后续充值消费 5% 永久返佣。

模型列表与定价

Q: 226·AI 比直接用 Anthropic API 便宜吗？

226·AI 价格只比 Anthropic 官方贵 22%（22% 中转加价覆盖运维），但解决了人民币充值和国内访问的核心问题。Sonnet 4.6 输入 ¥3.66/M tokens，输出 ¥18.30/M tokens。

Q: 226·AI 比 LingyaAI / OpenRouter 怎么样？

价格上和 LingyaAI 持平、比 OpenRouter 便宜 30%。核心差异在路由能力：226·AI 主力走 Tokyo Max 订阅 + Prompt Cache 自动命中，长上下文/多轮对话实际扣费比这两家低 30~50%。

Q: 充值 ¥100 实际能用多久？

Sonnet 4.6 短对话约 5000 次；长 refactor (30K context) 约 500 次；Opus 4.7 复杂任务约 100 次；Haiku 4.5 走量约 50000 次。

Q: 余额会过期吗？

不会。充值额度永久有效，不用完不退款。

Q: 如何充值？

支付宝、微信支付即时到账（< 30 秒）。¥1 充值 = $1 quota（1:1 直观）。访问 console.226-ai.com 注册后直接在控制台充值。

Q: 新用户有什么优惠？

注册即送 ¥10 试用额度，无需充值即可体验所有模型。每日签到额外送 ¥0.20。邀请朋友注册成功后双方各送 ¥10，被邀请人后续充值消费 5% 永久返佣。

226·AI 提供 Claude / GPT / Gemini 三家主流大模型的统一 API 接入。价格按 Anthropic / OpenAI / Google 官方公布价 + ~20% 中转加价，整体比 lingyaai / poloai 略低，比 OpenRouter 便宜约 30%。

价格对比一览（核心模型）

模型	我们 (¥/M tokens)	Anthropic 直连 (¥/M)	LingyaAI (¥/M)	OpenRouter (¥/M)
claude-sonnet-4-6 input	3.66	3.00	~3.66	~4.50
claude-sonnet-4-6 output	18.30	15.00	~18.30	~22.00
claude-opus-4-7 input	18.30	15.00	~18.30	~22.00
claude-opus-4-7 output	91.50	75.00	~91.50	~110.00
claude-haiku-4-5 input	0.30	0.25	~0.32	~0.40
claude-haiku-4-5 output	1.52	1.25	~1.60	~2.00

226·AI 的隐形优势：

主力路由 Tokyo Max OAuth + Prompt Cache 命中，长上下文 + 多轮对话实际扣费比表上低 30~50%
充值 ¥1 = $1 quota（1:1 直观）
注册即送 $10 试用额度
邀请朋友双方各送 $10

可用模型总览（2026-05-05）

系列	型号（精确名）	主用途	上下文	输入价 ¥ / 1M	输出价 ¥ / 1M
Claude Haiku 4.5	`claude-haiku-4-5-20251001`	日常对话、编辑辅助、走量	200K	0.30	1.52
Claude Haiku 3.5	`claude-3-5-haiku-20241022`	遗留客户端兼容	200K	0.24	1.20
Claude Sonnet 4.6	`claude-sonnet-4-6`	代码补全、中等推理	200K	3.66	18.30
Claude Sonnet 4.5	`claude-sonnet-4-5-20250929`	上一代 sonnet	200K	3.00	15.00
Claude Sonnet 3.7	`claude-3-7-sonnet-20250219`	遗留	200K	3.00	15.00
Claude Opus 4.7	`claude-opus-4-7`	复杂推理、大项目 refactor	200K	18.30	91.50
Claude Opus 4.6	`claude-opus-4-6`	上一代 opus	200K	18.30	91.50
Claude Opus 4.5	`claude-opus-4-5-20251101`		200K	16.00	80.00
Claude Opus 4.1	`claude-opus-4-1-20250805`		200K	15.00	75.00
Claude Opus 4	`claude-opus-4-20250514`		200K	15.00	75.00
Claude Sonnet 4	`claude-sonnet-4-20250514`		200K	3.00	15.00
Gemini 3 Flash	`gemini-3-flash` / `gemini-3-flash-preview`	快速回复、廉价吞吐	1M	~0.30	~1.50
Gemini 3.1 Flash	`gemini-3.1-flash` / `gemini-3.1-flash-preview`	同上新版	1M	~0.30	~1.50
GPT-* 系列	`gpt-4o`, `gpt-4o-mini`, `gpt-4.1-`, `gpt-5-`, `o1/o3/o4-*`	等 OpenAI 渠道上线	因模型而异	官方价	官方价

（GPT 系列目前禁用，等 OpenAI 账户充值后启用。届时调用会自动生效。）

型号推荐（按场景）

写代码 / 补全

首选：claude-sonnet-4-6（Claude Code 默认模型，速度和质量平衡）
极快、轻量：claude-haiku-4-5-20251001（聊天、简单修改）
深度 refactor / 设计：claude-opus-4-7（最贵，但架构级任务值）

翻译 / 阅读理解

gemini-3-flash（便宜、长上下文）
claude-haiku-4-5-20251001

长文档分析（> 500K token）

gemini-3-flash（1M context 最划算）
claude-opus-4-7（200K 上限内质量最高）

推理 / 数学

claude-opus-4-7（Thinking 模式待开，see 02a-claude-code.md）
后续 o1 / o3 上线后更合适

定价机制

官方 API 价 vs 我们的扣费

我们的扣费 = Anthropic / OpenAI / Google 官方价 × 1.22（22% 中转加价覆盖运维成本）

但因为我们主力走 Claude Max 订阅 OAuth + Prompt Cache 命中，长上下文 + 多轮对话实际扣费远低于上表数字。新用户单次调用平均 ¥0.08（用 Claude Code 跑 100K context refactor 任务），跑 100 次约消耗 ¥10。

缓存定价（仅 Claude 系列支持，Anthropic 规则）

当你用 cache_control 标记可缓存内容时：

缓存创建：输入价 × 1.25 倍（第一次写入缓存时比普通贵 25%）
缓存读取：输入价 × 0.10 倍（后续命中缓存便宜 90%）

Claude Code 这类工具会自动对 system prompt 和代码库上下文做缓存，连续使用时你实际消耗远低于上表的原价。

扣费公式

扣费 quota = (prompt_tokens × 模型输入倍率
            + completion_tokens × 模型输入倍率 × 补全倍率
            + cache_read_tokens × 0.10 × 模型输入倍率
            + cache_create_tokens × 1.25 × 模型输入倍率)
            × 分组倍率

quota → USD 换算：1 USD = 500,000 quota
充值 ¥1 = $1 quota（USDExchangeRate = 1，1:1 直观）

补全倍率 = 输出价 / 输入价：

Claude 系列：5（输出贵 5 倍）
GPT 系列：通常 3-4
Gemini Flash：5（和 Claude 对齐）

分组倍率 由你的令牌所属分组决定，见下。

令牌分组（倍率）

在创建令牌时可选分组，不同分组对应不同的扣费乘数：

分组	倍率	场景	何时选
default	1.0x	标准价（上表所列），三上游冗余路由	公测默认，绝大多数用户用这个
chatgpt	1.5x	分配到需 ChatGPT Pro 顶级号的通道时	暂未启用
claude-cache	2.5x	分配到缓存命中通道（上游便宜但经销溢价）	暂未启用
claude	2.9x	分配到最稳定的 Claude 通道	高端 VIP 用户
auto	动态	new-api 自动选最便宜可用分组	随 new-api 计算

公测期建议全选 default，简单透明。

真实成本举例

以 "你发 100 字问题 + Claude Sonnet 4.6 回 200 字" 为例：

Sonnet 4.6：输入 ¥3.66/M，输出 ¥18.30/M
Tokens（中文约 1 字 = 1.3 token，这里估计 130 输入 + 260 输出）
输入成本：130 × ¥3.66/M = ¥0.000476
输出成本：260 × ¥18.30/M = ¥0.004758
合计扣费：¥0.0052 ≈ 0.5 分钱
default 分组 1x → 用户账户扣 0.5 分
换算 quota：0.0052 × 500000 = 2,610 quota

同样问题换 Opus 4.7

输入 ¥18.30/M，输出 ¥91.50/M
130 × 18.30/M + 260 × 91.50/M = ¥0.00238 + ¥0.02379 = ¥0.0262 ≈ 2.6 分
是 Sonnet 的 5 倍贵

换 Haiku 4.5

输入 ¥0.30/M，输出 ¥1.52/M
合计 ¥0.000434 ≈ 0.04 分
是 Sonnet 的 1/12 便宜

所以日常把 default 模型设成 Sonnet，重活手动切 Opus，走量场景换 Haiku，是最划算的常规做法。

如何设置 Claude Code 默认模型

bash

# ~/.zshrc 或 ~/.bashrc
export ANTHROPIC_MODEL=claude-sonnet-4-6

运行时覆盖：

bash

claude --model claude-opus-4-7 -p "深度重构 auth 模块"

上游供给说明（透明化）

模型系列	上游路由优先级	你的扣费口径
Claude 全系	Tokyo Max 订阅 (priority 15) → OpusClaw 商业中转 (priority 10)	按 Anthropic 官方价 × 1.22
Gemini	OpusClaw 商业中转	按 Google 官方价
GPT-*	等 OpenAI 官方账户充值	按官方 API 价

双层冗余：当 Tokyo Max 触发限速或维护，自动 fallback 到 OpusClaw 商业 API，你的客户端无感切换。

你被扣的 quota 数字 = 上表标价计算出的金额。我们的成本和你的扣费是两条账：

你扣 ¥0.01 = 你从账户里扣 ¥0.01
我们实际付 Anthropic 多少钱，取决于当时路由到哪条通道

这对你是好事：你的扣费口径稳定，不会因为上游换通道价格波动。

充值与优惠

充值方式	单价	何时到账	备注
支付宝	¥1 = $1 quota	< 30 秒	推荐
微信支付	¥1 = $1 quota	< 30 秒	推荐
兑换码	客服或活动获得	立即	节日活动

邀请返利：每位被邀请用户充值消费的 5% 自动返到你的账户余额。

新用户：注册即送 ¥10 试用额度（足够跑 ~2000 次 Sonnet 短对话或 200 次长 refactor）。

模型版本生命周期

Anthropic / Google 的新模型发布后，我们通常当天或次日就能路由过来
老模型（claude-3-5-haiku-20241022 这种日期标识的）永久保留，避免你客户端硬编码的版本突然 404
重大 breaking change 会在 https://console.226-ai.com/ 首页公告，给 1 周适配期

如何确认模型当前是否可用

bash

curl https://api.226-ai.com/v1/models -H "Authorization: Bearer sk-xxx"

返回的 data[] 里能看到的，就是此刻可调用的。如果列表里没你要的型号——可能对应上游暂时离线，走 fallback 通道即可（我们会自动切备用渠道，你客户端无感）。

常见问题（FAQ）

226·AI 比直接用 Anthropic API 便宜吗？

直接用 Anthropic API 没有"便宜"一说——你必须付费充值美元，且对中国大陆用户有访问限制。226·AI 把这两个问题一起解决：人民币直充、国内可用、价格只比官方贵 22%。

比 LingyaAI / OpenRouter 怎么样？

价格上和 LingyaAI 持平、比 OpenRouter 便宜 30%。核心差异在路由能力：226·AI 主力走 Tokyo Max 订阅 + Prompt Cache 自动命中，长上下文/多轮对话实际扣费比这两家低 30~50%。

充值 ¥100 实际能用多久？

Sonnet 4.6 短对话（500 字以内）：约 5,000 次
Sonnet 4.6 长 refactor（30K context）：约 500 次
Opus 4.7 复杂任务：约 100 次
Haiku 4.5 走量：约 50,000 次

支持发票吗？

公测期暂不支持。企业版正式上线后提供增值税专票（联系 [email protected] 议价）。

余额会过期吗？

不会。充值额度永久有效，不用完不退款。

如果上游 Anthropic 涨价，你们会跟着涨吗？

会，但提前 7 天在控制台首页公告。历史上 Anthropic 一年最多调整 1-2 次价格。

模型列表与定价 ​

价格对比一览（核心模型） ​

可用模型总览（2026-05-05） ​

型号推荐（按场景） ​

写代码 / 补全 ​

翻译 / 阅读理解 ​

长文档分析（> 500K token） ​

推理 / 数学 ​

定价机制 ​

官方 API 价 vs 我们的扣费 ​

缓存定价（仅 Claude 系列支持，Anthropic 规则） ​

扣费公式 ​

令牌分组（倍率） ​

真实成本举例 ​

同样问题换 Opus 4.7 ​

换 Haiku 4.5 ​

如何设置 Claude Code 默认模型 ​

上游供给说明（透明化） ​

充值与优惠 ​

模型版本生命周期 ​

如何确认模型当前是否可用 ​

常见问题（FAQ） ​

226·AI 比直接用 Anthropic API 便宜吗？ ​

比 LingyaAI / OpenRouter 怎么样？ ​

充值 ¥100 实际能用多久？ ​

支持发票吗？ ​

余额会过期吗？ ​

如果上游 Anthropic 涨价，你们会跟着涨吗？ ​

模型列表与定价

价格对比一览（核心模型）

可用模型总览（2026-05-05）

型号推荐（按场景）

写代码 / 补全

翻译 / 阅读理解

长文档分析（> 500K token）

推理 / 数学

定价机制

官方 API 价 vs 我们的扣费

缓存定价（仅 Claude 系列支持，Anthropic 规则）

扣费公式

令牌分组（倍率）

真实成本举例

同样问题换 Opus 4.7

换 Haiku 4.5

如何设置 Claude Code 默认模型

上游供给说明（透明化）

充值与优惠

模型版本生命周期

如何确认模型当前是否可用

常见问题（FAQ）

226·AI 比直接用 Anthropic API 便宜吗？

比 LingyaAI / OpenRouter 怎么样？

充值 ¥100 实际能用多久？

支持发票吗？

余额会过期吗？

如果上游 Anthropic 涨价，你们会跟着涨吗？