tgje-97-ai-billing-from-token-to-outcome-double-edged

AI计费的演进-从黑盒走向结果导向丨Token经济学

AI计费的演进-从黑盒走向结果导向丨Token经济学 一个朋友他们公司的Agent每天跑几十万次调用,他想算一算一个月到底要花多少钱。这个问题听起来很基础——Token数量乘以单价乘以调用次数,不就完了吗? 他打开了Anthropic的价格页,然后卡住了。 session runtime按每会话小时收费,cache write和cache hit各有不同的乘数,和Token根本不在一个维度上。他再去看OpenAI,web search按千次调用收费,container按session时长收费,file search storage按GB/天收费,regional processing再叠一层百分之十。Google Gemini稍微收敛一些,但grounding和context caching也各自独立计价。 ...

2026年4月22日 · 7 分钟 · 约 3138 字 · 塔迪Tardi