tgje-97-ai-billing-from-token-to-outcome-double-edged

AI计费的演进-从黑盒走向结果导向丨Token经济学

AI计费的演进-从黑盒走向结果导向丨Token经济学 一个朋友他们公司的Agent每天跑几十万次调用,他想算一算一个月到底要花多少钱。这个问题听起来很基础——Token数量乘以单价乘以调用次数,不就完了吗? 他打开了Anthropic的价格页,然后卡住了。 session runtime按每会话小时收费,cache write和cache hit各有不同的乘数,和Token根本不在一个维度上。他再去看OpenAI,web search按千次调用收费,container按session时长收费,file search storage按GB/天收费,regional processing再叠一层百分之十。Google Gemini稍微收敛一些,但grounding和context caching也各自独立计价。 ...

2026年4月22日 · 7 分钟 · 约 3138 字 · 塔迪Tardi
tgje-93-token-double-black-box

Token计费的数量黑盒与质量黑盒|你买的Token,买到了什么

Token计费的数量黑盒与质量黑盒|你买的Token,买到了什么 三月底开始,GitHub和Reddit上涌现大量投诉。 Claude Code Max 20x计划,200美元一个月,5小时使用窗口之前可以支撑一整天的开发工作,但用户报告额度在不到90分钟内耗尽,有人更极端,19分钟见底。 Anthropic后来在Reddit回应:我们知道用户触达使用上限的速度远超预期,正在调查,这是团队最高优先级。 ...

2026年4月19日 · 6 分钟 · 约 2540 字 · 塔迪Tardi