跨主题线索

阅读线索：推理成本一年跌 10×，AI app 该按什么定价

更新日志

2026-07-16 — 引用忠实度修复（全站审计）：5 处——重引 5 条（原为 AI Takeaways 摘要冒充引语）、更正归属 1 条（Redpoint AI Investors→Scott Raney）、修正语义失真 2 处（McGrew：定价高于计算成本某些机会成本；DeepSeek 切换发生在发布后几周内而非几天）。引用忠实度二次修复：1 处（重引 1 · 降级转述 0）——Tuhin 的 Jevons paradox 段原引用取自 AI Takeaways Q&A 合成层，改为原始对话（Sarah Guo × Tuhin，逐字）重引。

这条线索

inference-economics 主题里有一条几乎没人反对的共识：推理成本一年跌大约 10×（Tri Dao 的 100× since ChatGPT、Redpoint 的 "推理的成本每年下降约 10 倍，训练的成本每年也下降 10 倍"）。saas-postmortem 主题里同样有共识：per-seat pricing 在 agentic 场景里不成立。把这两条放一起会形成一个让人不舒服的悖论——如果 AI 成本在塌、per-seat 定价在死，那 AI app 该卖什么价、向谁收？ 这条线索把推理经济学和 SaaS 定价的死亡拉到一张桌子上，发现两边在用不一致的因果模型解释同一个市场。

把这两个题目接起来的具体瞬间

1. Bret Taylor 拒绝按 token 收费 —— 把"成本归零"和"定价"明确解耦

saas-postmortem 里 Bret Taylor 给的最干脆的定价立场：

"And so my view is to the degree agents have a measurable outcome, outcome-based pricing feels like the secular business model for agents. … The reason why I don't think token-based makes sense is It's charging for an input that is uncorrelated with the output that your clients actually care about."
「因此，我的观点是，在某种程度上，agent 具有可衡量的结果，基于结果的定价感觉就像是 agent 的长期商业模式。……我不认为基于 token 的方式有意义的原因是，它对客户实际关心的输出是不相关的输入收费。」
Bret Taylor · Uncapped #42 Bret Taylor from Sierra

inference-economics 里 Bob McGrew 给出"如果不解耦会发生什么"的版本——专业知识稀缺性的溢价被竞争抹掉。注意他的原话是定价会高于计算成本某些机会成本；"价格将以计算成本定价、侵蚀传统经济模式"是主持人开场转述他推文时的简化说法，不是他本人的措辞：

「但律师之所以昂贵，是因为他们的时间稀缺。因为只有这么多人接受过这种培训，但是当你用它制作出一个 AI 模型时，那么现在实际上有无限数量的律师。所以它一点也不稀缺。也许你的 AI 律师初创公司能够领先于其他人。但它底层是相同的前沿模型。而且，你知道，其他一些初创公司可能会加入并与之竞争。所以我们应该期望看到它的定价高于计算成本的某些机会成本。」
— Bob McGrew · The Breakthroughs Needed for AGI

桥接：Bret Taylor 的"outcome-based pricing"和 McGrew 的"定价被竞争压向计算成本"是对同一个推理成本归零趋势的两种应对策略。Taylor 押的是"把定价从成本侧脱钩到价值侧"；McGrew 的预测是"如果不脱钩，价格会被竞争压到只比计算成本高出某些机会成本"——稀缺性溢价消失，但不是 price 恰好等于 cost。两人在描述同一种力学的两条出路。没人正面问：哪些 vertical 来得及在价格贴近计算成本之前完成 pricing 模型的转换？

2. Anish Acharya 说 incumbents 在涨价 —— 但他没解释成本侧塌陷怎么允许的

saas-postmortem 里 Anish Acharya 给的反"SaaS dead"叙事的实证：

"Price is a measure of product market fit, right? And if you have enormous competitive pressure, you are not raising prices, you're typically cutting prices. So I think one, you've got this sort of, you know, this dissonant fact that prices are going up. Two, if you look at the incumbents today, like ServiceNow is not IBM. They're a highly capable incumbent."
「价格是产品市场契合度的一个衡量标准，对吧？如果你面临巨大的竞争压力，你就不会提高价格，通常会降低价格。所以我认为，首先，你们看到了这种不和谐的事实，价格正在上涨。其次，如果你看看今天的行业巨头，比如 ServiceNow，它不是 IBM。他们是非常有能力的行业巨头。」
Anish Acharya · Anish Acharya: Is SaaS Dead in a World of AI?

inference-economics 里 Redpoint 的 Scott Raney 给了相反方向的实证：

「DeepSeek 发布几周内，我认为我们投资组合中的很多公司都从 Anthropic 转到了 DeepSeek，他们发现成本降低了大约 80% 到 90%，这大大降低了模型推理所需的成本，这非常了不起。」
— Scott Raney · Ep 61: Redpoint's AI Investors

桥接：如果 Scott Raney 的"DeepSeek 发布几周内切换、省 80–90%"是真的、Anish 的"incumbents 涨价"也是真的，那 客户能不能切换跟客户愿意为什么付费完全是两件事。Anish 隐含的判断是：客户付的不是 inference 成本，是他们自己工作流被替代的劳动价值。这跟 ai-moat-2026 里"软件市场从 IT 预算扩到劳动预算"的判断是同一条——但两人都没正面说：如果客户付的是 labor value，那 vendor 的成本下降不会自动传到客户价格——除非有新进入者把它传过去。这是 Anish 论点的潜在隐患：他认为 incumbents 涨价是 PMF 的证据，但也可能只是新进入者还没来得及压价。

3. Tuhin 的 Jevons paradox 是这场辩论的隐藏变量

inference-economics 里 Tuhin 给的判断把成本归零变成了需求扩张：

"They would insert more intelligence if you make it cheaper. They will insert more intelligence anyway, but if you make it more cheaper, they'll insert a hell of a lot more intelligence. You see this with agents. Agents are just longer running. And I think that's what we have seen with the cost of inference going down, which is folks are just like, okay, we can run this for longer, or we can make it do a bit more work, and we'll get to a larger end."
「如果你降低成本，开发者就会嵌入更多的智能。无论如何他们都会嵌入更多智能，但如果你把成本压得更低，他们会嵌入多得多的智能。你在智能体（agents）上就能看到这一点。智能体的运行时间更长。随着推理成本的下降，我们看到的情况是，大家会觉得：好吧，我们可以让它运行得更久，或者让它处理更多工作，从而获得更好的最终结果。」
Tuhin Srivastava · Baseten CEO on the AI Inference Crunch

桥接：如果 Tuhin 是对的，那 Anish 的"incumbents 涨价"就有了一种新解释——客户每个 task 的复杂度在变高，所以即使 per-token 成本掉了，total bill 不一定降。这反过来又支持 Bret Taylor 的 outcome-based 定价——按 task 收费比按 token 收费更跟客户价值对齐。但这条逻辑链里有一个没人核验的环节：Jevons paradox 假设消费侧的预算可以无限扩张——而企业 AI 预算的实际弹性数据在语料里完全缺失（见 inference-economics 的信息缺口清单）。

4. Klarna 的 Siemiatkowski 给的是"软件即将塌"的最激进版本 —— 但他自己的应对策略是 outcome-based

saas-postmortem 里 Klarna CEO 同时给了"软件成本归零"的判断和"VIP 关系是新护城河"的应对：

"You should think that cost of creating software is going down to zero."
「你应该认为创建软件的成本会降到零。」
Sebastian Siemiatkowski · 20VC: SaaS is Dead

"So we said the future of VIP experience will be the human connection, the relationship. And now we genuinely believe."
「所以我们说 VIP 体验的未来是人际连接、关系。现在我们真心相信。」
Sebastian Siemiatkowski · 20VC: SaaS is Dead

桥接：Siemiatkowski 的"软件成本归零 + VIP 关系是护城河"是最完整的 cost-zero 应对模型——成本侧让 AI 接管，价值侧靠人类关系。他的暗含定价模型不是 per-seat 也不是 per-token，是 *per-VIP-relationship*。这条比 Bret Taylor 的 outcome-based 更激进——它假设 VIP 客户愿意支付远超 outcome 价值的溢价。他没量化这条——Klarna 实际 VIP 客户的 ARPU vs 普通客户多几倍？

如果你继续往下拉

把推理成本曲线和 SaaS 定价死亡叠在一起后，真正剩下的开放问题不是"定价模型该选哪个"，而是"surplus 该归谁"：

如果成本侧塌（10× / 年）+ 客户支付意愿不变（按 outcome / labor value）→ surplus 应该归 AI vendor。这是 Anish / Tuhin / Sierra 的隐含立场。
如果竞争压价（DeepSeek 让 vendor 切换 80–90%）→ surplus 通过价格下调归客户。这是 McGrew / Redpoint 实证的方向。
如果 Jevons paradox 生效 → 总开支扩张、surplus 同时归两边——vendor 卖更多 token、客户做更复杂的事。这是最复杂但最有可能的混合状态。

对 builder 的具体含义：今天定价模型的选择不是"按 token vs 按 outcome"这种战术问题——是赌"在 inference cost 跌到价格地板之前，能不能把客户搬到 outcome-based 上去"的时间窗赌。Bret Taylor 押 18 个月内成；McGrew 隐含的预测是大多数 vendor 来不及。没人有 data 来真正回答这道题——这是 inference-economics 和 saas-postmortem 两个题目共享的最大信息缺口（两边的"还需要什么"清单里都写了"outcome-based pricing 缺乏 18 个月+ 留存数据"）。

取材

Bret Taylor (Sierra) · 2026-02-26 · 313ea6160e7181b985fcd3c0984d0d5a
Sebastian Siemiatkowski (Klarna) · 2026-02-26 · 313ea6160e71818c90ddf5ff3b4fbf8b
Anish Acharya (a16z) · 2026-02-26 · 313ea6160e71814897fac5bc7bbb76af
Tuhin Srivastava (Baseten) · 2026-05-11 · 35dea6160e718145a7a3c5263827a3bb
Bob McGrew (former OpenAI Research) · 2025-06-18 · 216ea6160e7181a4abe1e0c576c28050
Tri Dao (Together.AI) · 2025-09-11 · 26bea6160e7181f39b48fd0fba93d842
Scott Raney、Patrick Chase (Redpoint AI Investors) · 2025-04-28 · 1e3ea6160e7181dc895ff3e77430e7ae