模型列表与定价
226·AI 提供 Claude / GPT / Gemini 三家主流大模型的统一 API 接入。 价格按 Anthropic / OpenAI / Google 官方公布价 + ~20% 中转加价,整体比 lingyaai / poloai 略低,比 OpenRouter 便宜约 30%。
价格对比一览(核心模型)
| 模型 | 我们 (¥/M tokens) | Anthropic 直连 (¥/M) | LingyaAI (¥/M) | OpenRouter (¥/M) |
|---|---|---|---|---|
| claude-sonnet-4-6 input | 3.66 | 3.00 | ~3.66 | ~4.50 |
| claude-sonnet-4-6 output | 18.30 | 15.00 | ~18.30 | ~22.00 |
| claude-opus-4-7 input | 18.30 | 15.00 | ~18.30 | ~22.00 |
| claude-opus-4-7 output | 91.50 | 75.00 | ~91.50 | ~110.00 |
| claude-haiku-4-5 input | 0.30 | 0.25 | ~0.32 | ~0.40 |
| claude-haiku-4-5 output | 1.52 | 1.25 | ~1.60 | ~2.00 |
226·AI 的隐形优势:
- 主力路由 Tokyo Max OAuth + Prompt Cache 命中,长上下文 + 多轮对话实际扣费比表上低 30~50%
- 充值 ¥1 = $1 quota(1:1 直观)
- 注册即送 $10 试用额度
- 邀请朋友双方各送 $10
可用模型总览(2026-05-05)
| 系列 | 型号(精确名) | 主用途 | 上下文 | 输入价 ¥ / 1M | 输出价 ¥ / 1M |
|---|---|---|---|---|---|
| Claude Haiku 4.5 | claude-haiku-4-5-20251001 | 日常对话、编辑辅助、走量 | 200K | 0.30 | 1.52 |
| Claude Haiku 3.5 | claude-3-5-haiku-20241022 | 遗留客户端兼容 | 200K | 0.24 | 1.20 |
| Claude Sonnet 4.6 | claude-sonnet-4-6 | 代码补全、中等推理 | 200K | 3.66 | 18.30 |
| Claude Sonnet 4.5 | claude-sonnet-4-5-20250929 | 上一代 sonnet | 200K | 3.00 | 15.00 |
| Claude Sonnet 3.7 | claude-3-7-sonnet-20250219 | 遗留 | 200K | 3.00 | 15.00 |
| Claude Opus 4.7 | claude-opus-4-7 | 复杂推理、大项目 refactor | 200K | 18.30 | 91.50 |
| Claude Opus 4.6 | claude-opus-4-6 | 上一代 opus | 200K | 18.30 | 91.50 |
| Claude Opus 4.5 | claude-opus-4-5-20251101 | 200K | 16.00 | 80.00 | |
| Claude Opus 4.1 | claude-opus-4-1-20250805 | 200K | 15.00 | 75.00 | |
| Claude Opus 4 | claude-opus-4-20250514 | 200K | 15.00 | 75.00 | |
| Claude Sonnet 4 | claude-sonnet-4-20250514 | 200K | 3.00 | 15.00 | |
| Gemini 3 Flash | gemini-3-flash / gemini-3-flash-preview | 快速回复、廉价吞吐 | 1M | ~0.30 | ~1.50 |
| Gemini 3.1 Flash | gemini-3.1-flash / gemini-3.1-flash-preview | 同上新版 | 1M | ~0.30 | ~1.50 |
| GPT-* 系列 | gpt-4o, gpt-4o-mini, gpt-4.1-*, gpt-5-*, o1/o3/o4-* | 等 OpenAI 渠道上线 | 因模型而异 | 官方价 | 官方价 |
(GPT 系列目前禁用,等 OpenAI 账户充值后启用。届时调用会自动生效。)
型号推荐(按场景)
写代码 / 补全
- 首选:
claude-sonnet-4-6(Claude Code 默认模型,速度和质量平衡) - 极快、轻量:
claude-haiku-4-5-20251001(聊天、简单修改) - 深度 refactor / 设计:
claude-opus-4-7(最贵,但架构级任务值)
翻译 / 阅读理解
gemini-3-flash(便宜、长上下文)claude-haiku-4-5-20251001
长文档分析(> 500K token)
gemini-3-flash(1M context 最划算)claude-opus-4-7(200K 上限内质量最高)
推理 / 数学
claude-opus-4-7(Thinking 模式待开,see 02a-claude-code.md)- 后续
o1 / o3上线后更合适
定价机制
官方 API 价 vs 我们的扣费
我们的扣费 = Anthropic / OpenAI / Google 官方价 × 1.22(22% 中转加价覆盖运维成本)
但因为我们主力走 Claude Max 订阅 OAuth + Prompt Cache 命中,长上下文 + 多轮对话实际扣费远低于上表数字。新用户单次调用平均 ¥0.08(用 Claude Code 跑 100K context refactor 任务),跑 100 次约消耗 ¥10。
缓存定价(仅 Claude 系列支持,Anthropic 规则)
当你用 cache_control 标记可缓存内容时:
- 缓存创建:输入价 × 1.25 倍(第一次写入缓存时比普通贵 25%)
- 缓存读取:输入价 × 0.10 倍(后续命中缓存便宜 90%)
Claude Code 这类工具会自动对 system prompt 和代码库上下文做缓存,连续使用时你实际消耗远低于上表的原价。
扣费公式
扣费 quota = (prompt_tokens × 模型输入倍率
+ completion_tokens × 模型输入倍率 × 补全倍率
+ cache_read_tokens × 0.10 × 模型输入倍率
+ cache_create_tokens × 1.25 × 模型输入倍率)
× 分组倍率
quota → USD 换算:1 USD = 500,000 quota
充值 ¥1 = $1 quota(USDExchangeRate = 1,1:1 直观)补全倍率 = 输出价 / 输入价:
- Claude 系列:5(输出贵 5 倍)
- GPT 系列:通常 3-4
- Gemini Flash:5(和 Claude 对齐)
分组倍率 由你的令牌所属分组决定,见下。
令牌分组(倍率)
在创建令牌时可选分组,不同分组对应不同的扣费乘数:
| 分组 | 倍率 | 场景 | 何时选 |
|---|---|---|---|
| default | 1.0x | 标准价(上表所列),三上游冗余路由 | 公测默认,绝大多数用户用这个 |
| chatgpt | 1.5x | 分配到需 ChatGPT Pro 顶级号的通道时 | 暂未启用 |
| claude-cache | 2.5x | 分配到缓存命中通道(上游便宜但经销溢价) | 暂未启用 |
| claude | 2.9x | 分配到最稳定的 Claude 通道 | 高端 VIP 用户 |
| auto | 动态 | new-api 自动选最便宜可用分组 | 随 new-api 计算 |
公测期建议全选 default,简单透明。
真实成本举例
以 "你发 100 字问题 + Claude Sonnet 4.6 回 200 字" 为例:
- Sonnet 4.6:输入 ¥3.66/M,输出 ¥18.30/M
- Tokens(中文约 1 字 = 1.3 token,这里估计 130 输入 + 260 输出)
- 输入成本:130 × ¥3.66/M = ¥0.000476
- 输出成本:260 × ¥18.30/M = ¥0.004758
- 合计扣费:¥0.0052 ≈ 0.5 分钱
- default 分组 1x → 用户账户扣 0.5 分
- 换算 quota:0.0052 × 500000 = 2,610 quota
同样问题换 Opus 4.7
- 输入 ¥18.30/M,输出 ¥91.50/M
- 130 × 18.30/M + 260 × 91.50/M = ¥0.00238 + ¥0.02379 = ¥0.0262 ≈ 2.6 分
- 是 Sonnet 的 5 倍贵
换 Haiku 4.5
- 输入 ¥0.30/M,输出 ¥1.52/M
- 合计 ¥0.000434 ≈ 0.04 分
- 是 Sonnet 的 1/12 便宜
所以日常把 default 模型设成 Sonnet,重活手动切 Opus,走量场景换 Haiku,是最划算的常规做法。
如何设置 Claude Code 默认模型
# ~/.zshrc 或 ~/.bashrc
export ANTHROPIC_MODEL=claude-sonnet-4-6运行时覆盖:
claude --model claude-opus-4-7 -p "深度重构 auth 模块"上游供给说明(透明化)
| 模型系列 | 上游路由优先级 | 你的扣费口径 |
|---|---|---|
| Claude 全系 | Tokyo Max 订阅 (priority 15) → OpusClaw 商业中转 (priority 10) | 按 Anthropic 官方价 × 1.22 |
| Gemini | OpusClaw 商业中转 | 按 Google 官方价 |
| GPT-* | 等 OpenAI 官方账户充值 | 按官方 API 价 |
双层冗余:当 Tokyo Max 触发限速或维护,自动 fallback 到 OpusClaw 商业 API,你的客户端无感切换。
你被扣的 quota 数字 = 上表标价计算出的金额。我们的成本和你的扣费是两条账:
- 你扣 ¥0.01 = 你从账户里扣 ¥0.01
- 我们实际付 Anthropic 多少钱,取决于当时路由到哪条通道
这对你是好事:你的扣费口径稳定,不会因为上游换通道价格波动。
充值与优惠
| 充值方式 | 单价 | 何时到账 | 备注 |
|---|---|---|---|
| 支付宝 | ¥1 = $1 quota | < 30 秒 | 推荐 |
| 微信支付 | ¥1 = $1 quota | < 30 秒 | 推荐 |
| 兑换码 | 客服或活动获得 | 立即 | 节日活动 |
邀请返利:每位被邀请用户充值消费的 5% 自动返到你的账户余额。
新用户:注册即送 ¥10 试用额度(足够跑 ~2000 次 Sonnet 短对话或 200 次长 refactor)。
模型版本生命周期
- Anthropic / Google 的新模型发布后,我们通常当天或次日就能路由过来
- 老模型(
claude-3-5-haiku-20241022这种日期标识的)永久保留,避免你客户端硬编码的版本突然 404 - 重大 breaking change 会在
https://console.226-ai.com/首页公告,给 1 周适配期
如何确认模型当前是否可用
curl https://api.226-ai.com/v1/models -H "Authorization: Bearer sk-xxx"返回的 data[] 里能看到的,就是此刻可调用的。如果列表里没你要的型号——可能对应上游暂时离线,走 fallback 通道即可(我们会自动切备用渠道,你客户端无感)。
常见问题(FAQ)
226·AI 比直接用 Anthropic API 便宜吗?
直接用 Anthropic API 没有"便宜"一说——你必须付费充值美元,且对中国大陆用户有访问限制。226·AI 把这两个问题一起解决:人民币直充、国内可用、价格只比官方贵 22%。
比 LingyaAI / OpenRouter 怎么样?
价格上和 LingyaAI 持平、比 OpenRouter 便宜 30%。核心差异在路由能力:226·AI 主力走 Tokyo Max 订阅 + Prompt Cache 自动命中,长上下文/多轮对话实际扣费比这两家低 30~50%。
充值 ¥100 实际能用多久?
- Sonnet 4.6 短对话(500 字以内):约 5,000 次
- Sonnet 4.6 长 refactor(30K context):约 500 次
- Opus 4.7 复杂任务:约 100 次
- Haiku 4.5 走量:约 50,000 次
支持发票吗?
公测期暂不支持。企业版正式上线后提供增值税专票(联系 [email protected] 议价)。
余额会过期吗?
不会。充值额度永久有效,不用完不退款。
如果上游 Anthropic 涨价,你们会跟着涨吗?
会,但提前 7 天在控制台首页公告。历史上 Anthropic 一年最多调整 1-2 次价格。