跨主题线索

阅读线索:推理成本一年跌 10×,AI app 该按什么定价

跨主题线索 · 拉的是 inference-economics × saas-postmortem · 2026-05-20

这条线索

inference-economics 主题里有一条几乎没人反对的共识:推理成本一年跌大约 10×(Tri Dao 的 100× since ChatGPT、Redpoint 的 "推理和训练成本每年下降约 10 倍")。saas-postmortem 主题里同样有共识:per-seat pricing 在 agentic 场景里不成立。把这两条放一起会形成一个让人不舒服的悖论——如果 AI 成本在塌、per-seat 定价在死,那 AI app 该卖什么价、向谁收? 这条线索把推理经济学和 SaaS 定价的死亡拉到一张桌子上,发现两边在用不一致的因果模型解释同一个市场。

把这两个题目接起来的具体瞬间

1. Bret Taylor 拒绝按 token 收费 —— 把"成本归零"和"定价"明确解耦

saas-postmortem 里 Bret Taylor 给的最干脆的定价立场:

"The value of AI agents should be priced based on measurable outcomes rather than token usage, as token usage is an input uncorrelated with the output clients care about."
「AI agent 的价值应该按可衡量的结果定价,而不是按 token 用量——token 用量是输入指标,跟客户在意的产出无关。」

inference-economics 里 Bob McGrew 给出"如果不解耦会发生什么"的最悲观版本:

由于竞争,代理的价格可能仅为计算成本,从而可能侵蚀依赖于专业知识稀缺性的传统经济模式。
— Bob McGrew · The Breakthroughs Needed for AGI

桥接:Bret Taylor 的"outcome-based pricing"和 McGrew 的"price → compute cost"是对同一个推理成本归零趋势的两种应对策略。Taylor 押的是"把定价从成本侧脱钩到价值侧";McGrew 隐含的预测是"如果不脱钩,price 会被竞争打回到成本"。两人在描述同一种力学的两条出路。没人正面问:哪些 vertical 来得及在 price-equals-cost 之前完成 pricing 模型的转换?


2. Anish Acharya 说 incumbents 在涨价 —— 但他没解释成本侧塌陷怎么允许的

saas-postmortem 里 Anish Acharya 给的反"SaaS dead"叙事的实证:

"Incumbent SaaS companies are raising prices, indicating sustained product market fit and competitive strength despite narratives of decline."
「现有 SaaS 公司在涨价——表明产品 PMF 持续、竞争力仍在,尽管有衰退叙事。」

inference-economics 里 Redpoint 的实证给了相反方向:

许多投资组合公司在几天内从 Anthropic 切换到 DeepSeek,在模型推理方面实现了 80-90% 的成本降低。
— Redpoint AI Investors · Ep 61: Redpoint's AI Investors

桥接:如果 Redpoint 的"几天切换 DeepSeek 省 80–90%"是真的、Anish 的"incumbents 涨价"也是真的,那 客户能不能切换跟客户愿意为什么付费完全是两件事。Anish 隐含的判断是:客户付的不是 inference 成本,是他们自己工作流被替代的劳动价值。这跟 ai-moat-2026 里"软件市场从 IT 预算扩到劳动预算"的判断是同一条——但两人都没正面说:如果客户付的是 labor value,那 vendor 的成本下降不会自动传到客户价格——除非有新进入者把它传过去。这是 Anish 论点的潜在隐患:他认为 incumbents 涨价是 PMF 的证据,但也可能只是新进入者还没来得及压价。


3. Tuhin 的 Jevons paradox 是这场辩论的隐藏变量

inference-economics 里 Tuhin 给的判断把成本归零变成了需求扩张:

Decreasing the cost of intelligence triggers a Jevons paradox, where lower prices lead to increased consumption as developers build more complex, long-horizon agentic workflows that require significantly more compute.
智能成本下降会触发 Jevons paradox——价格下降导致消费增加,因为开发者构建更复杂、长程的 agentic workflow,反过来需要更多算力。
— Tuhin Srivastava · Baseten CEO on the AI Inference Crunch

桥接:如果 Tuhin 是对的,那 Anish 的"incumbents 涨价"就有了一种新解释——客户每个 task 的复杂度在变高,所以即使 per-token 成本掉了,total bill 不一定降。这反过来又支持 Bret Taylor 的 outcome-based 定价——按 task 收费比按 token 收费更跟客户价值对齐。但这条逻辑链里有一个没人核验的环节:Jevons paradox 假设消费侧的预算可以无限扩张——而企业 AI 预算的实际弹性数据在语料里完全缺失(见 inference-economics 的信息缺口清单)。


4. Klarna 的 Siemiatkowski 给的是"软件即将塌"的最激进版本 —— 但他自己的应对策略是 outcome-based

saas-postmortem 里 Klarna CEO 同时给了"软件成本归零"的判断和"VIP 关系是新护城河"的应对:

"You should think that cost of creating software is going down to zero."
「你应该认为创建软件的成本会降到零。」
Sebastian Siemiatkowski · 20VC: SaaS is Dead
"So we said the future of VIP experience will be the human connection, the relationship. And now we genuinely believe."
「所以我们说 VIP 体验的未来是人际连接、关系。现在我们真心相信。」
Sebastian Siemiatkowski · 20VC: SaaS is Dead

桥接:Siemiatkowski 的"软件成本归零 + VIP 关系是护城河"是最完整的 cost-zero 应对模型——成本侧让 AI 接管,价值侧靠人类关系。他的暗含定价模型不是 per-seat 也不是 per-token,是 *per-VIP-relationship*。这条比 Bret Taylor 的 outcome-based 更激进——它假设 VIP 客户愿意支付远超 outcome 价值的溢价。他没量化这条——Klarna 实际 VIP 客户的 ARPU vs 普通客户多几倍?


如果你继续往下拉

把推理成本曲线和 SaaS 定价死亡叠在一起后,真正剩下的开放问题不是"定价模型该选哪个",而是"surplus 该归谁"

对 builder 的具体含义:今天定价模型的选择不是"按 token vs 按 outcome"这种战术问题——是赌"在 inference cost 跌到价格地板之前,能不能把客户搬到 outcome-based 上去"的时间窗赌。Bret Taylor 押 18 个月内成;McGrew 隐含的预测是大多数 vendor 来不及。没人有 data 来真正回答这道题——这是 inference-economics 和 saas-postmortem 两个题目共享的最大信息缺口(两边的"还需要什么"清单里都写了"outcome-based pricing 缺乏 18 个月+ 留存数据")。


取材