主题综述

数字台账 · Numbers That Matter

活文档 · 最近更新 2026-07-02 · 覆盖 283 篇访谈

教 AI 经济学与规模感的硬数字。同一主题族内按时间排序以显趋势线；相互冲突或彼此更新的数字相邻放置并标注对照；最亮眼的 11 条附逐字引用。

更新日志

2026-07-02 — 首次全量构建：从 lens 数字抽取的 574 条原始条目中，去掉重复入库的同集数字、过编辑闸门后收录 250 条，按七个主题族归档；覆盖全部 283 篇访谈（2025-04 至 2026-06 入库）。

推理成本与算力经济

成本曲线：同等能力的推理价格以每年 10x—100x 的速度崩塌，而总消耗按 Jevons 悖论指数上升；算力与收入的换算关系首次有了公开口径。

~10x/年 — LLM 推理与训练成本每年下降约10倍，持续改善应用层公司的毛利结构——'模型变便宜利好应用层'的量化依据 · Jacob Effron, Scott Raney, Patrick Chase, Alex Bard (Redpoint) · 2025-04 · 访谈
80-90% — 多家组合公司在几天内从 Anthropic 切换到 DeepSeek，推理成本立降80-90%——证明模型层规模不构成转换成本护城河 · Jacob Effron, Scott Raney, Patrick Chase, Alex Bard (Redpoint) · 2025-04 · 访谈
97 倍/年 — Gemini 等文本模型的成本去年降低了 97 倍，Labs 据此假设视频模型会走同样的成本曲线。（→ 对照上一条：成本下降口径从 10x/年刷到 97x/年） · Josh Woodward (Google Labs) · 2025-05 · 访谈
10-20x (GPT-4 -> GPT-5 Pro) — GPT-5 Pro 单次回答用的算力约是 GPT-4 的 10-20 倍就能给出好得多的答案——而对真正重要的问题，值得花的算力'大得不可比拟' · Jakub Pachocki & Szymon Sidor · 2025-08 · 访谈
10,000+ H100，6家云、24个数据中心、4国 — Fal管理的推理基础设施规模——一家专注生成媒体推理的公司需要的资本密集度 · Gorkem & Batuhan (Fal) · 2025-09 · 访谈
1.5x-10x vs 自托管 — 自研推理引擎（自定义CUDA内核+扩散缓存+量化）比自托管快最多10倍，但开源社区会不断追上——性能优势是持续赛跑而非一次性护城河 · Gorkem & Batuhan (Fal) · 2025-09 · 访谈
≥100x（自ChatGPT发布以来） — 推理成本三年降了至少100倍：一半来自同参数量的更好模型（数据+MoE架构），一半来自推理优化（量化、减少数据搬运、KV缓存管理）（→ 对照 2025-04 Redpoint 的 10x/年：三年累计口径吻合） · Tri Dao · 2025-09 · 访谈
-5%性能 ↔ +3x生产力 — Triton这类跨芯片抽象层的经济学：放弃5%性能换3倍开发生产力是明确值得的交易——评估任何抽象层的标尺 · Tri Dao · 2025-09 · 访谈
>40% of revenue — NVIDIA收入中推理占比已超40%——推理而非训练正在成为主要负载与增长引擎 · Jensen Huang · 2025-09 · 访谈
30x (Blackwell vs Hopper) — 极限协同设计带来单代30倍性能提升——摩尔定律死后靠全栈优化维持双指数下的token成本下降 · Jensen Huang · 2025-09 · 访谈
75 vs 50-65 points — NVIDIA约75%毛利 vs 竞品50-65%——但15%的折扣抵不过30倍性能差，即使ASIC免费也输在电力机会成本上 · Jensen Huang · 2025-09 · 访谈
200MW→$2B, 600MW→$6B, 2GW→$20B+ ARR — Friar 披露 OpenAI 2023-2025 三年算力与收入几乎 1:1 同比例增长（每 100MW ≈ $10 亿 ARR），这是其提前为 2028-2030 下注数据中心的依据 · Sarah Friar (OpenAI CFO) · 2026-01 · 访谈

"We exited at 23 at 2 billion in ARR, so 200 megawatts, 2 billion. We exited at 24 at 6 billion, so 6 billion, 600 megawatts. And we exited last year a little over 20 billion, 20 billion, 2 gigawatts. Actually, it's been accelerating."
「我们 23 年收官时 ARR 是 20 亿美元——200 兆瓦对 20 亿；24 年收官 60 亿——600 兆瓦对 60 亿；去年收官略超 200 亿——2 吉瓦对 200 亿。而且这个比例还在加速。」
Sarah Friar (OpenAI CFO) · Episode 12 - State of the AI Industry

400K-500K GPUs 24/7 — 仅凭小样本统计估算，vLLM 常年运行在 40-50 万块 GPU 上（含 Amazon Rufus 等），一个开源推理引擎已成为事实基础设施 · Simon Mo & Woosuk Kwon · 2026-01 · 访谈
-99% cost; 2x capability / 7 months — 获取前沿模型的成本下降99%、能力每7个月翻倍——AI进步速度与通缩的核心刻度 · David George (a16z Growth) · 2026-01 · 访谈
150x drop/21mo (GPT-4级); 88x/11mo (o1级) — 同等能力模型的 token 价格崩塌速度——在收入和用量疯涨的同时发生，是被市场噪音掩盖的最重要信号之一 · Elad Gil & Sarah Guo · 2026-02 · 访谈

"The cost of a million tokens on an O1 equivalent model in December of 24 was about 26 bucks. And then in November of 25, it was 30 cents. So we saw another 88X drop, not 88%, you know, 88 times cheaper in 11 months for that next generation of models."
「o1 等级模型一百万 token 的价格，24 年 12 月约 26 美元，25 年 11 月只要 30 美分——又一次 88 倍的下降。不是 88%，是便宜 88 倍，只用了 11 个月。」
Elad Gil · From SaaS to AI-First

1000 pJ vs 1 pJ — 把参数从SRAM移到乘法单元花约1000皮焦，而乘法本身只要1皮焦——batching存在的能源经济学根源 · Jeff Dean (Google) · 2026-02 · 访谈
$200M tape-out vs 20% savings on $1B+ inference — 10亿美元级训练意味着推理支出必须超10亿才能自负盈亏，此时省20%推理成本即可覆盖2亿美元流片费——定制ASIC的约束是时间线不是钱 · Martin Casado & Sarah Wang (a16z) · 2026-02 · 访谈
12-20 W — 人脑功耗仅相当于一只昏暗灯泡——对比AI模型能耗，说明效率仍有数量级提升空间 · Elad Gil & Sarah Guo · 2026-02 · 访谈
~20瓦 — 人脑用20瓦完成认知——Rao 30年前的顿悟起点，也是模拟计算路线宣称可大幅削减AI功耗的基准参照（→ 对照上一条：同一个 20 瓦锚点，两位讲者独立引用） · Naveen Rao & Konstantine Buhler · 2026-02 · 访谈
99% from AI-native companies — 按推理次数算99%来自AI原生公司——说明企业市场几乎未开发，是机会的量化下限 · Tuhin Srivastava · 2026-05 · 访谈
95% of token volume — Baseten上95%的token量涉及特定模型修改/后训练——'vanilla开源直接用'的时代已结束 · Tuhin Srivastava · 2026-05 · 访谈
3-5yr term + 20-30% TCV prepay for 1,000 H100/B200 — 顶级云买千卡的门槛条款——说明算力采购已变成重资本长周期豪赌，倒逼推理公司尽早上市 · Tuhin Srivastava · 2026-05 · 访谈
90 clusters / 18 clouds; mid-90s% utilization; 30x growth — 供应紧缺比外界想象严重：几乎无闲置算力，需跨18云抽象出运行时织物来保SLA · Tuhin Srivastava · 2026-05 · 访谈
100 步 → 4-8 步 — 通过蒸馏让小模型学教师模型的简化输出分布，用 4-8 步达到原 100 步的生成质量——配合 <100ms 的实时交互延迟硬门槛，是实时视频生成的成本关键 · Ethan He · 2026-06 · 访谈
10x/year — 模型效率年增10倍但总消耗指数上升——杰文斯悖论的实时案例 · Brendan Foody · 2026-06 · 访谈
10x/年 — AI 工作负载年增速把硬件推到物理极限，是数据中心硬件从公用品变高利润品的根因 · Alex Sacerdote (Whale Rock Capital) · 2026-06 · 访谈

训练与 CapEx

两条主线：数据质量 > 数据数量（专家数据溢价成为行业定价）；capex 从美元计价换成吉瓦计价，回本算术仍没有答案。

10-15% — 只有当任务对业务工作流至关重要、额外10-15%的性能提升有决定性价值时，才值得做强化微调，否则等下一代模型即可 · Isa Fulford (OpenAI) · 2025-04 · 访谈
对数线性（log-linear） — 模型智能与训练计算量呈对数线性关系——每个智能增量都要求计算量指数级增长，预训练收益递减是固有的而非意外。 · Bob McGrew (OpenAI 前研究主管) · 2025-06 · 访谈
全部数据中心跑数月；下一代需新建数年 — 一次预训练要占用所有数据中心几个月，而下个模型需要一座新数据中心（数年工期）——解释预训练节奏为何被基建锁死。 · Bob McGrew (OpenAI 前研究主管) · 2025-06 · 访谈
~100 个样本 — 强化微调（RFT）达到领域前沿能力所需的数据量级——远比 SFT 数据高效且不易出错。 · Michelle Pokrass (OpenAI) · 2025-06 · 访谈
10%→50% 通过率 — 如果微调能把通过率从 10% 提到 50% 但仍不够产品化——说明该能力在风口浪尖，几个月后的新模型会直接碾压它。 · Michelle Pokrass (OpenAI) · 2025-06 · 访谈
数十亿美元（高估一个数量级） — 有公司在 SFT/RLHF 遗留数据上花了数十亿美元，但实际所需少一个数量级——众包标注模式正在崩溃，钱正流向专家评估 · Brendan Foody (Mercor CEO) · 2025-06 · 访谈
3.6–3.9 bits/parameter (fp32 transformer) — 「Morris 常数」：32 位精度训练的 Transformer 每个参数只能存约 3.6-3.9 比特信息，32 位里只用了 3-4 位，说明模型存储效率有巨大改进空间 · Jack Morris · 2025-07 · 访谈
1,000 条人工 > 10,000,000 条合成 — 一千条高质量精选人工数据对模型训练的价值可超过一千万条合成数据 · Edwin Chen · 2025-07 · 访谈
99% 无用 — 客户花六个月攒了 1000-2000 万条合成数据，最后发现 99% 没有价值——合成数据被普遍高估 · Edwin Chen · 2025-07 · 访谈
$500B Stargate (Abilene ~10%) — 星门初始承诺 5000 亿美元、钱不在银行账户里边建边融——为下一代 AI 服务融资建设史无前例算力 · Sam Altman · 2025-08 · 访谈
10-100x — 今天能提供的服务与 10 倍乃至 100 倍算力能提供的服务之间'差距大得不可思议'——算力需求远未饱和是 Stargate 的核心论据 · Sam Altman · 2025-08 · 访谈
30名研究生×2年 ≈ 随机水平 — DCLM研究：最顶尖的人类专家花两年设计过滤标准后，仍无法以高于随机的准确率预测数据质量分类器的判断——人工直觉在数据筛选上失效 · Ari Morcos · 2025-08 · 访谈
~$500B/年 — 全行业每年AI基础设施支出约5000亿美元——这是'更好的架构值多少钱'的分母：省10倍成本或提前1-2年到AGI都价值巨大 · Tri Dao · 2025-09 · 访谈
中位 $95/hr、顶级 $500/hr（vs 众包 ~$30/hr） — Mercor 专家中位时薪 95 美元、顶级专家 500 美元，是 Scale/Surge 众包范式的 3 倍——高盛银行家、医生律师给模型写评估的市场化价格，'高素质专家+善待'取代'低价众包' · Brendan Foody · 2025-09 · 访谈
10GW ≈ $400B — 每10吉瓦AI工厂约合4000亿美元，须靠承购收入+股权+债务三条腿融资——这是他回应'循环收入'质疑的账本 · Jensen Huang · 2025-09 · 访谈

"10 gigawatts is like $400 billion, something like that. And that $400 billion will have to be largely funded by their offtake, right, their revenues, which is growing exponentially. It has to be funded by their capital, the money they've raised through equity, and whatever debt they can raise."
「10 吉瓦大约就是 4000 亿美元。这 4000 亿主要要靠他们的承购——也就是指数增长中的收入——再加上股权融资和能募到的债务来买单。」
Jensen Huang · NVIDIA: OpenAI, Future of Compute, and the American Dream

$200-500/次 — 单次微调运行本身很便宜，真正的成本不在算力 · Kyle Corbitt (OpenPipe/CoreWeave) · 2025-10 · 访谈
≥2周工程师时间（RL环境需数月） — 微调/RL的真实成本是前期搭建训练系统，外加此后每次改prompt都要重训带来的迭代变慢 · Kyle Corbitt (OpenPipe/CoreWeave) · 2025-10 · 访谈
七位数（$1M+） — 大实验室在RL环境初创公司上的采购至少七位数，说明'环境'是RL scaling的核心瓶颈与生意 · Kyle Corbitt (OpenPipe/CoreWeave) · 2025-10 · 访谈
$600B收入缺口 — $150B英伟达芯片≈$300B数据中心投资，按50%毛利需$600B终端收入回本——'客户的客户是否健康'至今没有答案 · David Cahn · 2025-10 · 访谈

"If you invest $150 billion in NVIDIA chips, that's about $300 billion of data center investments. And to pay that back, the person using the compute needs to earn a 50% gross margin. So there's about $600 billion of revenue that needs to get generated. ... The question behind the question was, is the customer's customer healthy?"
「买 1500 亿美元的英伟达芯片，约等于 3000 亿美元的数据中心投资；要回本，用这些算力的人得按 50% 毛利挣出约 6000 亿美元收入。……问题背后的问题是：客户的客户健康吗？」
David Cahn (Sequoia) · 20VC: Sequoia's David Cahn on The Winners and Losers in AI

$40B/GW（Vera Rubin代$50-60B） — 行业改用吉瓦而非美元宣布交易，掩盖了每吉瓦约400亿美元、且宣布时仅10-20%资金到位的事实（→ 对照上一条与 Jensen 的 $400B/10GW：三个口径互相印证） · David Cahn · 2025-10 · 访谈
2x / 3个月 — AI模型规模与容量每三个月翻倍，要求系统性能每年增长10-16倍——远超摩尔定律，必须靠网络层创新补足 · Michael Kagan (Nvidia CTO) · 2025-11 · 访谈
~10x/年 — 'Huang-Kagan定律'斜率约每年一个数量级；产品节奏已从两年一代加速到一年一代，每代性能提升10倍 · Michael Kagan (Nvidia CTO) · 2025-11 · 访谈
数百-数千样本 — 强化微调只需数百到数千个样本即可定制模型，远比SFT数据高效，使应用层模型定制终于成立（→ 对照 2025-06 Pokrass 的 ~100 样本：量级一致） · Brendan Foody (Mercor) · 2025-11 · 访谈
100x smaller training runs — 机器人领域的训练算力比前沿 LLM 小约 100 倍，说明机器人瓶颈在硬件经济性而非软件 · David Owen & Yafah Edelman (Epoch AI) · 2025-11 · 访谈
数倍于最终训练 run 的开支 — 实验算力获得的资金是正式发布模型训练 run 的许多倍，成为反驳纯软件奇点的关键证据 · David Owen & Yafah Edelman (Epoch AI) · 2025-11 · 访谈
≈印第安纳州首府全城用电 — Anthropic/Amazon 数据中心用电接近一座州首府城市，Colossus 2 建设周期不到两年——扩张速度只受资金约束 · David Owen & Yafah Edelman (Epoch AI) · 2025-11 · 访谈
38亿条游戏片段 — Medal 积累的 3.8B 游戏剪辑构成人类巅峰行为数据集，是世界模型训练的独家底料 · Pim De Witte (General Intuition) · 2025-12 · 访谈
~$100B/年 — Stargate 每年千亿美元级算力投资，说明大厂在算力、能源、数据上的支出规模（→ 对照 2025-08 Altman 的 $500B 总承诺：这里是年化口径） · Jonathan Siddharth (Turing) · 2025-12 · 访谈
0.5B–10B 参数 — 企业定制模型的主流区间：小模型在保险承保等专有任务上比万亿参数大模型更快更准，且数据不外流——是永久需求而非过渡 · Jonathan Siddharth (Turing) · 2025-12 · 访谈
2-3人×~1年，2018-19年即可达GPT-3.5级 — 带着完整后见之明，几个有才华的人网起几台 GPU 盒子在 2018-19 年就能做出 ChatGPT 3.5 级模型——后训练技巧可换取大量有效算力 · John Schulman (Thinking Machines) · 2025-12 · 访谈

"You could have gotten something that was ChatGPT 3.5 level maybe back in 2018 or 2019 with a couple people."
「你本可以在 2018 或 2019 年用几个人得到一些达到 ChatGPT 3.5 水平的东西。」
John Schulman (Thinking Machines) · John Schulman on dead ends, scaling RL, and building research institutions

1人/1机/约半年 — NanoChat 由一人半年在单机上写成，是复现 chat 模型成本的当代上界 · John Schulman (Thinking Machines) · 2025-12 · 访谈
$150/hr vs $22/hr — 专家给AI标注/生成数据的时薪对比教书时薪，解释了专家供给为何涌向数据业务（→ 对照 2025-09 Mercor 时薪：专家数据溢价已成行业定价） · Garrett Lord · 2025-12 · 访谈
≥50% — Surge目前一半以上业务已在纯文本之外（多模态数据），前沿数据需求早已越过语言模型 · Edwin Chen · 2025-12 · 访谈
2yr + 3-5yr lifetime — 今天设计的TPU两年后进数据中心、再服役三到五年——芯片设计必须预测2-6年后的ML计算形态 · Jeff Dean (Google) · 2026-02 · 访谈
~200 行 Python — MicroGPT：去掉效率优化后，训练 LLM 的核心算法只有约 200 行 Python——其余全部代码复杂度都来自效率需求 · Andrej Karpathy · 2026-03 · 访谈

"Training neural nets and LLMs specifically is a huge amount of code. But all of that code is actually complexity from efficiency. It's just because you need it to go fast. If you don't need it to go fast and you just care about the algorithm, then that algorithm actually is 200 lines of Python."
「训练神经网络、尤其是 LLM，代码量巨大。但那些代码其实都是效率带来的复杂度——只是因为你需要它跑得快。如果不需要快、只关心算法本身，那这个算法其实就是 200 行 Python。」
Andrej Karpathy · Andrej Karpathy on Code Agents, AutoResearch, and the Loopy Era of AI

落后数月 — 开源模型落后闭源数月且在收敛；对绝大多数消费级用例，当前开源模型已经够用，差距主要是资本支出 · Andrej Karpathy · 2026-03 · 访谈
15 years of capacity in 15 months — 微软以'15个月建成过去15年量级'的速度扩数据中心——史无前例的capex节奏，靠agentic系统而非线性加人来运营 · Satya Nadella · 2026-06 · 访谈

"We built in the last 15 months more Azure capacity than we built in the first 15 years."
「过去 15 个月我们建成的 Azure 容量，超过了最初 15 年建成的总和。」
Satya Nadella (Microsoft CEO) · The Rise of the Full-Stack Builder and Hyper-Leveraged Generalist

9 TFLOPs (original Transformer rig) vs 100s TFLOPs (single consumer GPU today) — 当年训练初代Transformer的机器性能不及今天桌下一块消费级GPU的零头——激进架构实验已平民化 · AI Research Legend（未具名Transformer元老，疑为Łukasz Kaiser） · 2026-06 · 访谈
PB-scale storage ≈ GPU compute cost — 视频大模型训练本质是IO受限问题——存取PB级视频数据的成本与GPU算力成本相当 · Ethan He · 2026-06 · 访谈
18-24个月 — 资本转化为可售算力的物理周期：6个月内砸钱无用，一年半到两年才见产能——AI 基建的经济学节拍 · Roman Chernin (Nebius) · 2026-06 · 访谈

定价·毛利·商业模型

定价锚正从软件预算（美国 ~$1T）切换到人力预算（$20T—$80T）；客服是第一个 ROI 完全可量化的用例。

$450B vs $35B — 客服人力成本4500亿美元 vs 客服软件市场350亿美元：AI'按工作收费'打开的是十倍于软件预算的人力预算 · Jacob Effron, Scott Raney, Patrick Chase, Alex Bard (Redpoint) · 2025-04 · 访谈
$200/月 — ChatGPT 顶级 SKU 定价——AI 公司能从第一天就向消费者收高价，商业模式质量高于上一代靠网络效应慢慢变现的消费公司。 · a16z 消费团队 panel（未具名） · 2025-06 · 访谈
10 小时工作/次 — Deep Research 类工具可替代十小时人工工作，使 $200/月订阅对个人也容易合理化。 · a16z 消费团队 panel（未具名） · 2025-06 · 访谈
$60T（全球 GDP 的 60%） — 全球 $100T GDP 中 60% 是人类劳动——AI 是能自主'干活'的劳动力而不只是生产力工具，这就是 KP 的顶层市场测算。 · Mamoon Hamid · 2025-08 · 访谈
up to 80% — Decagon 客户把客服成本最高砍掉 80% 且同时改善解决率和满意度——AI 吃的是服务预算而非软件预算 · Martin Casado & Sarah Wang · 2025-08 · 访谈
~10x — 人力预算通常比软件预算大一个数量级——AI应用从'对标软件成本'切换到'对标业务问题'是收入天花板抬升的核心机制。 · Jesse Zhang · 2025-09 · 访谈
3-5x ROI → ~3x value capture — 给客户3-5倍投资回报最有说服力，自己约捕获所替代价值的三分之一；很多客户在AI代理上的花费已超过之前的客服CRM。 · Jesse Zhang · 2025-09 · 访谈
60-80% — AI客服完全跑起来后的良好解决率区间，具体取决于AI被授予多少执行动作的权限。 · Jesse Zhang · 2025-09 · 访谈
60-70% — Decagon 案例研究中部分大企业联络中心运营成本降低60-70%——大企业采购AI客服的第一衡量指标是效率，第二是客户满意度。 · Jesse Zhang · 2025-09 · 访谈
65% — Intercom 的 FIN agent 已解决约 65% 的进线客服工单——就业冲击的实证数据点。 · Nathan Labenz · 2025-10 · 访谈
17-20M agents — 全球联络中心历史人工座席规模；软件市场数百亿美元、AI 市场预计高数百亿——被低估的巨型市场。 · Ping Wu & Doug Leone · 2025-10 · 访谈
~25% — 联络中心约四分之一交互是创收型（销售/催收/挽留）——它不是纯成本中心，自动化的价值计算要重做。 · Ping Wu & Doug Leone · 2025-10 · 访谈
$200-300/月 — ChatGPT顶级SKU $200、Google Ultra $250、Grok $300——消费者首次自发为软件付出此等价格，是'消费投资文艺复兴'的证据（→ 对照 2025-06 的 $200：顶级 SKU 价格带半年内扩到 $300） · Kevin Rose & Anish Acharya · 2025-10 · 访谈
$20T vs $1T — 美国劳动支出约20万亿美元、软件仅1万亿——AI真正争夺的是那20万亿的劳动预算，而非软件预算（→ 对照 2025-08 Mamoon 的 $60T 全球口径） · Michael Barton (Coatue) · 2025-11 · 访谈
$30T — 数字知识工作自动化对应 30 万亿美元的市场规模——AI 价值创造的本质是预算从人力转移到技术 · Jonathan Siddharth (Turing) · 2025-12 · 访谈
$20k/年收费的'功能' — 过去只算一个功能的东西现在能收 2 万美元，因为它替代的是一整个人头——定价锚从软件预算换成了工资 · 未署名嘉宾（AI 护城河圆桌） · 2025-12 · 访谈
~10亿用户中付费 <5000万 — 消费级 AI 最大的悬念：如何货币化剩余 95% 的用户——广告等新模式的空间所在 · David George (a16z Growth) · 2025-12 · 访谈
95% — OpenAI 95% 的消费者用户是免费的——这是其论证必须引入广告的经济学前提（→ 对照上一条：官方口径确认） · Sarah Friar & Vinod Khosla · 2026-01 · 访谈
~1B users / 30M paying; $1B+/month burn — 免费替代品未对付费造成价格压力；货币化10亿免费用户的上行空间远大于3000万付费者的降价风险，burn 主要来自研发（→ 再对照：货币化 10 亿免费用户成为消费级 AI 最大悬念） · David George (a16z Growth) · 2026-01 · 访谈
+50%回收收入 — Salient做AI汽车贷款催收不只省成本，而是为客户多收50%的钱——'创造价值'比'节省成本'更难被替换 · a16z 合伙人（未具名） · 2026-01 · 访谈
5x收入 — Velex买断西班牙全部法律记录再叠加AI，收入翻五倍——围墙花园数据策略的量化案例 · a16z 合伙人（未具名） · 2026-01 · 访谈
5x+律师收入 — Eve自动化证据收集/医疗年表/索赔函后，原告律师可接案量与收入提升五倍以上 · a16z 合伙人（未具名） · 2026-01 · 访谈
US software spend ~1% GDP vs white-collar payroll ~20% GDP — AI 的市场空间锚定在白领工资而非软件支出，因此影响将远超移动和云 · David George (a16z Growth) · 2026-01 · 访谈
$20B topline; 3x capacity → 3x revenue — 每上一批推理算力都被100%订完——'不是泡沫'论的核心证据 · Anish Acharya (a16z) · 2026-02 · 访谈
80% / 20% — 各基础模型80%功能互为替代、20%是专家能力——多模型世界里聚合层（应用公司）价值的来源 · Anish Acharya (a16z) · 2026-02 · 访谈
8-12% of spend — SaaS只占企业支出8-12%；AI的真正大市场是切入人力预算，且转移已在发生 · Anish Acharya (a16z) · 2026-02 · 访谈
40x — 大科技的AI业务需增长40倍才能兑现，但相对其现有业务体量'其实不算多'——因为这是预算迁移而非净新支出 · Martin Casado (a16z) · 2026-02 · 访谈
$20/月 → 数百/月 → 数千至数万/月 — tab补全约$20/月、高级本地模型数百美元/月、并行云代理预期数千到数万——'双子座悖论'：工具越强，个体杠杆越大，愿付价格指数级抬升 · Cursor 团队（嘉宾未具名） · 2026-03 · 访谈
数万亿美元 — 即使今天暂停模型开发，现有能力仍有数万亿美元经济价值未释放——瓶颈是应用AI市场的不成熟而非模型智能 · Bret Taylor · 2026-03 · 访谈
70-90%（RAMP达90%） — Sierra客户全量部署后AI自动解决客服案例的比例；剩余进入人工的案例更难，平均处理时长反而上升但坐席满意度提高 · Bret Taylor · 2026-03 · 访谈
90%×90% → 99% — 推理模型90%正确+监督模型90%正确，链式串联后整体有效性达99%——'模型星座'架构的核心算术 · Bret Taylor · 2026-03 · 访谈
15-20% → 50-80% — Decagon将客服自动解决率提升的典型幅度——客服的ROI早已被内部追踪，所以极易量化论证，这是客服成为最清晰AI用例的原因之一（→ 对照 2025-09 Decagon 的 60-80%：口径一致，提升幅度补全） · Jesse Zhang · 2026-03 · 访谈
8x（对比文本） — 语音到语音模型的幻觉率是文本AI的8倍——语音是最大前沿但对企业场景尚未就绪，且人脑对口语'不对劲'极度敏感 · Jesse Zhang · 2026-03 · 访谈
六位数合同（零 ARR 时） — 客服是他们探索的所有想法中唯一让客户在其 ARR 为零时就愿签六位数合同的赛道——付费意愿即市场真实性的判据 · Jesse Zhang (Decagon) · 2026-03 · 访谈
20% 效率增益 — Legora 的 token 支出规则：不设预算而按机会成本算——多花 token 若能给工程师或用户带来20%效率提升几乎总是值得 · Jacob Lauritzen (Legora CTO) · 2026-06 · 访谈
10% / 90% — AI 让产品「表面」的10%极易复制，但边缘案例、审计日志、RBAC、规模稳定性这90%才是企业级软件的真壁垒 · Jacob Lauritzen (Legora CTO) · 2026-06 · 访谈
$80万亿 — 应用层 AI 要切入的实体产业规模（金融、法律、医疗、物流）——五层蛋糕最顶层的市场体量（→ TAM 阶梯的最高一档：$35B 软件 → $1T 软件 → $20T 人力 → $80T 实体产业） · Jensen Huang · 2026-06 · 访谈

增长与规模

收入爬坡的新基准线：$1B→$10B 从二十年压缩到一年；agent 采用曲线（任务时长每 4-7 个月翻倍）是能力侧最重要的单一指标。

4万→1500万 (2024.3→2025.3) — E2B 沙箱一年用量增长375倍，Claude 3.5/3.7 Sonnet 发布后显著加速，说明agent工作负载从实验转向生产 · Vasek Mlejnsky (E2B) · 2025-04 · 访谈
100x（近几年） — LLM 推理用量的疯狂普及等同2000年互联网、2010年移动的时刻，判定'现在是十多年来创业最佳时机' · Victor Lazarte (Benchmark) · 2025-04 · 访谈
Mercor 11个月 / Brex 18个月 — AI 时代收入爬坡速度的新标杆，传统'$10M 收入即领先'的 SaaS 基准已失效 · Victor Lazarte (Benchmark) · 2025-04 · 访谈
$300M — Cursor 达到3亿美元 ARR——AI 编码工具变现速度的行业标杆（从第一行代码到发布仅数月，增长为持续指数型） · Michael Truell (Anysphere/Cursor) · 2025-05 · 访谈
数小时 — Claude 4 解锁了连续数小时无人值守的代理任务（如大规模代码重构）——代理任务时长是能力代际的标尺。 · Ben Mann (Anthropic 联合创始人) · 2025-06 · 访谈
ChatGPT > Twitter(25万粉) — 5 月 10 日至录制时，ChatGPT 给 Lenny's Newsletter 带来的流量已超过其 25 万粉丝的 Twitter——AI 平台作为分发渠道的拐点信号 · Robert McCloy (Scrunch AI) · 2025-07 · 访谈
流量6x / 转化率9x — 身份验证公司 Clerk 针对性优化 AI 想引用的内容类型后，ChatGPT 来源流量涨 6 倍、转化率提升 9 倍——AI 流量质量高于普通搜索 · Robert McCloy (Scrunch AI) · 2025-07 · 访谈
7亿活跃用户 — Meta AI 靠 Instagram 搜索兜底导流成为'沉默的怪物'——AI 爱好者圈几乎不讨论，但分发体量惊人 · Robert McCloy (Scrunch AI) · 2025-07 · 访谈
约90% — 她们估计 TikTok/Reels/YouTube Shorts 上约 90% 的内容已是 AI 生成——AI 视频从技术论坛玩具到吞噬主流信息流的规模刻度 · Olivia Moore & Justine Moore (a16z) · 2025-07 · 访谈
$4B → $9B (Anthropic, 2025) — Anthropic 收入预测因 Claude Code 从今年 40 亿美元上调至 90 亿美元——但她反复追问：毛利率是多少？收入若是负利润率就没意义 · Steph Palazzolo · 2025-08 · 访谈
18% → 50%+（2月至今） — 视频模型占Fal收入份额从2月的18%涨到超过50%，由混元视频等高质量开源模型驱动——生成媒体的重心正快速从图像转向视频 · Gorkem & Batuhan (Fal) · 2025-09 · 访谈
全球第5大网站 — ChatGPT已是世界第五大网站，若保持轨迹将成为第一——'免费AGI'触达数十亿人的分发规模 · Sam Altman & Vinod Khosla · 2025-09 · 访谈
$1M → $500M run rate（17 个月） — 自称史上最快收入增长，比 Cursor 从100万到5亿快一个月；Scale被收购后公司规模翻了4倍（同月另一期录制口径为 16 个月到 $400M——增速本身仍在加速） · Brendan Foody · 2025-09 · 访谈
6x vs Google search — Webflow 来自LLM的流量转化率是谷歌搜索流量的6倍——多轮追问把购买意图预先淬炼过，AEO线索质量远高于SEO。 · Ethan Smith · 2025-09 · 访谈
600M vs 3B MAU — AI答案引擎约6亿独立月活 vs Google搜索30亿——新入口渗透率已达老入口的1/5 · James Cadwallader & Martin Rehak · 2025-09 · 访谈
~2h, doubling every 4-7 months — METR 口径的 agent 任务时长曲线，衡量 agent 能力最重要的单一指标。 · Nathan Labenz · 2025-10 · 访谈
multi-hour @50%, ~1hr @80% — 前沿模型在50%成功率下能做多小时软件工程任务，80%成功率下约一小时——且历代模型都落在同一条外推曲线上（→ 对照上一条 METR 曲线：历代模型落在同一条外推线上） · Sherwin Wu (OpenAI) · 2026-02 · 访谈
80% of AI startups (using open models) — 『80% AI 初创用中国开源模型』大概率为真，但只统计用开源模型的公司；按实际用量加权商业模型仍占多数。 · Nathan Labenz · 2025-10 · 访谈
30-40% of queries at peak — NanoBanana 上线后部分国家高峰时段 Gemini 查询中图像类占 30-40%——单一功能改变产品使用结构。 · Josh Woodward · 2025-10 · 访谈
2/3自建 vs 1/3外购 — MIT报告被误读的关键分母：企业2/3的AI项目是自建或咨询公司代建，外购专业初创方案的1/3成功率显著更高 · Garry Tan & Lightcone hosts (YC) · 2025-11 · 访谈
~5% — 企业AI需求汹涌但实施极难、仅约5%项目奏效——主持人认为这是初创公司的机会清单而非AI失败的证据 · Garry Tan & Lightcone hosts (YC) · 2025-11 · 访谈
70:30 — Sora上线初期创作者与消费者比例达70:30，远超社交产品常态，证明生成式AI能促创作而非只促消费 · Bill Peebles, Rohan Sahai & Thomas Dimson (OpenAI Sora) · 2025-11 · 访谈
~1/3 — 她引用OpenAI研究：约三分之一的ChatGPT使用是写作帮助——证明聊天框界面只解锁了简单用例 · Eugenia Kuyda (Replika/Wabi) · 2025-11 · 访谈
~10亿 — 已有近十亿人用AI聊天工具但只用于搜索/写作，说明瓶颈在界面而非需求 · Eugenia Kuyda (Replika/Wabi) · 2025-11 · 访谈
$1→$100M revenue run rate in 11 months — Mercor 自称硅谷增长最快公司：11 个月内 ARR 从近零冲到一亿美元（→ 对照 2025-09 两期：$1M→$400-500M 用 16-17 个月——同一家公司的增速叙事逐月刷新） · Brendan Foody · 2025-11 · 访谈
$0 → $100M（7个月） — Handshake AI靠给前沿模型供数据，7个月从零做到一亿美元业务——AI数据市场的爆发速度 · Garrett Lord · 2025-12 · 访谈
$190M ARR — 法律AI应用层的收入标尺——垂直应用在模型商阴影下仍能快速做大 · Winston Weinberg · 2026-01 · 访谈
6x — 前沿企业的 AI 使用强度是中位数企业的 6 倍，企业侧能力差距巨大 · Sarah Friar & Vinod Khosla · 2026-01 · 访谈
≤30% — Khosla 估计大多数用户只用到了 AI 全部能力的 30% 或更少——需求瓶颈在人不在模型 · Sarah Friar & Vinod Khosla · 2026-01 · 访谈
$0→$50M ARR — AI 公司创造了'四分钟一英里'式的新基准：见过别人从零到 5000 万后，任何不快速增长的公司都要先回答'为什么不能' · Vinod Khosla & Keith Rabois · 2026-01 · 访谈
365B searches: ChatGPT 2 yrs vs Google 11 yrs — ChatGPT 达到3650亿次查询只用了谷歌1/5.5的时间——AI建立在互联网+云之上可即时全球分发 · David George (a16z Growth) · 2026-01 · 访谈
2025 cohort +50% vs 2024; 2x companies to $10M ARR in 3 months — 2025年新公司队列增长快50%、三个月内达千万美元ARR的公司数翻倍——创业加速不是暂时异常（iOS发布+60%、GitHub push+41%） · Patrick & John Collison (Stripe 年度信) · 2026-02 · 访谈
$1B→$10B: ~20yr (ADP/Adobe) → 8-9yr (Salesforce/MSFT) → 3-5yr (Google/Meta/AWS) → ~1yr (AI labs) — 收入从10亿到100亿美元所需时间的代际压缩——AI实验室预计一年走完 · Elad Gil & Sarah Guo · 2026-02 · 访谈
693% YoY; $1M revenue/FTE — 离群AI公司同比增速693%、人均收入高达100万美元——比SaaS前辈更快且销售费用更少 · David George (a16z Growth) · 2026-02 · 访谈
~$50B — 当前AI赋能收入约500亿美元、年增速远超100%，比早期云计算的采用曲线陡得多 · David George (a16z Growth) · 2026-02 · 访谈
0→$10M ARR（极短时间） — 本周期最大的不同：过去把'0到1'重定义为0到$1M ARR，如今公司以史无前例的速度冲到$10M ARR——启动资源更少、收入留存更好 · Alfred Lin · 2026-03 · 访谈
$1B run-rate; 5T tokens/天 — 发布仅数天的 GPT-5.4（Codex）即达 10 亿美元运行率收入、日处理 5 万亿 token——模型改进周期在坍缩（5.1→5.2→5.3→5.4） · Brad Lightcap (OpenAI) · 2026-04 · 访谈
95%集中在前4-5个蓝链 — 人类认知带宽有限导致的旧SEO经济学——与agent的『无限带宽』形成对照 · James Cadwallader (Profound) · 2026-04 · 访谈
单次查询用65个网页 — 一个agent为回答『买哪个淋浴喷头』综合了65个网页——agent消费互联网的表面积远超人类（→ 对照上一条：人类认知带宽 vs agent 无限带宽，SEO 经济学的地基置换） · James Cadwallader (Profound) · 2026-04 · 访谈
$25B annualized — 私有 AI 公司（OpenAI/Anthropic）在上市前就达到万亿美元估值和 250 亿美元年化收入，速度远超 Mag 7 历史轨迹 · Philippe Laffont (Coatue CIO) · 2026-06 · 访谈
~前几个百分点 — 即便技术先进的大公司也只用到潜在 AI 用例的极小部分——Chernin 用此论证基建热潮不是泡沫（→ 对照 2026-01 Khosla 的 ≤30%：供给侧与需求侧同一判断） · Roman Chernin (Nebius) · 2026-06 · 访谈
100-1000x — agent 普及后搜索查询量的预期放大倍数——现有搜索基础设施完全没有为这种吞吐而建 · Will Bryk (Exa) · 2026-06 · 访谈
10^12 → 10^15 页 — 从万亿页到千万亿页：agent 想要的世界数据远超当前索引，检索算法成本不能随规模指数化 · Will Bryk (Exa) · 2026-06 · 访谈
~2% — 会 C++ 编程的人口比例——40年来技术越复杂会编程的人越少，AI 用自然语言编程反转了这条技术鸿沟曲线 · Jensen Huang · 2026-06 · 访谈
数十万个 — NVIDIA 公司内部当前运行的 agent 数量——agent 经济在英伟达内部已先行落地 · Jensen Huang · 2026-06 · 访谈

人效与组织

AI 写代码的占比、单人杠杆与组织形态：人均产出取代人头数成为核心指标，token 支出开始超过工资单。

50-100 天 — Google Labs 从最初想法到把 AI 产品交付到最终用户手中的目标周期。 · Josh Woodward (Google Labs) · 2025-05 · 访谈
95%+ — Anthropic 内部估计 Claude Code 的代码 95% 以上由 Claude Code 自己编写——瓶颈随之转移到决策、协调和合并队列。 · Mike Krieger (Anthropic CPO) · 2025-06 · 访谈
熟悉领域1.5x / 陌生领域5x — Anthropic 最顶尖工程师自述编码代理带来的加速：熟悉领域 1.5 倍，新语言或生疏领域 5 倍——AI 研究本身正被加速 · Sholto Douglas (Anthropic) · 2025-06 · 访谈
$1B+ 收入 / ~100 人 / 零融资（4 年） — Surge 完全 bootstrap，不到五年做到年收入超 10 亿美元、员工不足百人，人均产出约 1000 万美元——数据公司靠技术而非人海（2025-12 另一期口径不变） · Edwin Chen · 2025-07 · 访谈
80% 用于理解系统 — 工程师 80% 时间花在理解复杂系统和协作而非写代码——这是做「代码理解 agent」而非代码生成的立论基础 · Misha Laskin · 2025-07 · 访谈
3 人 — IMO 金牌模型的核心团队只有三个人（依托 OpenAI 基础设施）——前沿突破的最小作战单元可以极小 · Alex Wei, Sheryl Hsu & Noam Brown · 2025-08 · 访谈
每诊所 1 名后台 — 医疗账单公司借 LLM 让 10-15 人诊所只需 1 名后台人员——AI 让以前不敢提的商业承诺变得可兑现。 · Garry Tan · 2025-08 · 访谈
6 engineers x 3 months -> 1 weekend — AI 辅助编码让过去需要六名工程师三个月的项目，如今他和朋友两人一个周末就能完成——瓶颈因此转移到产品管理 · Andrew Ng · 2025-08 · 访谈
$50M+ ARR, cash-flow positive — Gamma 以刻意精简的团队做到 5000 万美元以上 ARR 且现金流为正——反例是烧钱补贴推理成本的竞争对手已死掉或转向 · Jon Noronha · 2025-08 · 访谈
$500M ARR with 0 salespeople — Canva 在达到 5 亿美元 ARR 前没雇过一名销售——PLG 能在巨大规模下成立的极端证据，Gamma 沿此路径 · Jon Noronha · 2025-08 · 访谈
10-15% -> 30-50% (some 10x) — CTO 报告从 Copilot 时代的 10-15% 提升到一年后 Cursor 用户的 30-50%、个别 10 倍——AI 采购从'凭感觉试验'转向有形 ROI 的标志 · Martin Casado & Sarah Wang · 2025-08 · 访谈
数百个 PR/天（单个重度用户） — OpenAI 内部重度用户每天用 Codex 生成数百个 PR，验证了代理编码的实际价值并指导产品方向 · Mark Chen & Nick Turley · 2025-08 · 访谈
1.5x — 顶级kernel研究者自述Claude Code让他的生产力提升约1.5倍——写Triton内核'相当不错'，o3级推理模型能做高水平优化头脑风暴（→ 对照 2025-06 Sholto 的 1.5x/5x：顶尖工程师自估口径趋同） · Tri Dao · 2025-09 · 访谈
85% — Barton自评其85%的工作可由AI完成，Coatue正据此招分析师重构内部工作流 · Michael Barton (Coatue) · 2025-11 · 访谈
20个团队×5-10人 — 约20个完全独立的小产品团队并行发布，用可容忍的重复换取交付速度 · Mati Staniszewski (ElevenLabs CEO) · 2025-11 · 访谈
25% since 2015 → projected 70% by 2030 — LinkedIn 全站数据显示 AI 正在加速职位技能构成的换血速度 · Ryan Roslansky · 2025-11 · 访谈
4 employees at $1M ARR — 首次跨过百万 ARR 时全公司只有 4 人，刻意小团队高人效 · Adit Abraham · 2025-11 · 访谈
$100k robot vs $20k/yr human — 造一台机器人 10 万美元，不一定优于年薪 2 万美元的人力——机器人本质是硬件经济学问题 · David Owen & Yafah Edelman (Epoch AI) · 2025-11 · 访谈
10-100x — 顶级程序员的工作已变成并行指挥 10 个编码 bot，生产力将比过去高 10 到 100 倍 · Marc Andreessen · 2026-01 · 访谈
~几千人/条 iPhone 产线 — 一条 iPhone 组装线需要数千名制造工程师；若 AI 能替代这层职能，美国在岸制造即获得巨大成本优势——AI 降本的对象是工程师而非工人 · Vinod Khosla & Keith Rabois · 2026-01 · 访谈
4% of all public GitHub commits — Claude Code 已署名 GitHub 全部公开提交的4%，且指数增长——AI从辅助转向直接作者的行业级证据 · Boris Cherny (Anthropic Claude Code 负责人) · 2026-02 · 访谈

"These numbers are just totally crazy, right? Like 4% of all commits in the world is just way more than I imagined. And like you said, it still feels like the starting point. These are also just public commits. So we actually think if you look at private repositories, it's quite a bit higher than that."
「这些数字简直疯狂——全世界 4% 的提交，远超我的想象。而且这仍然只像是起点。这还只是公开提交；看私有仓库的话，比例还要高不少。」
Boris Cherny (Anthropic) · Head of Claude Code: What happens after coding is solved

+200% per-engineer, team 4x — Claude Code 团队自成立以来工程师人数扩大4倍的同时，人均生产力还提升了200% · Boris Cherny (Anthropic Claude Code 负责人) · 2026-02 · 访谈
1 year → 3 months — AI提速让企业计划周期从一年压缩到三个月，逼CEO成为更快的决策者 · Brian Halligan (HubSpot / Sequoia CEO coach) · 2026-02 · 访谈
95% daily — OpenAI 95%的工程师每天使用Codex · Sherwin Wu (OpenAI) · 2026-02 · 访谈
+70% PRs — 用Codex的工程师PR多70%，且差距随熟练度继续扩大 · Sherwin Wu (OpenAI) · 2026-02 · 访谈
20-30 agents/engineer — 工程师已在同时管理20-30个Codex实例；他预期经理同理将管理大得多的团队 · Sherwin Wu (OpenAI) · 2026-02 · 访谈
7,000 → 3,000 — Klarna靠AI自动化+自然减员把员工数近乎腰斩，同时人均薪酬上升 · Sebastian Siemiatkowski (Klarna) · 2026-02 · 访谈

"We used to be 6,000 or over 7,000 people and we're now less than 3,000. And I didn't ask for a single dime to do all this."
「我们过去有 6000 或超过 7000 人，现在不到 3000 人。我做这一切没要一分钱。」
Sebastian Siemiatkowski (Klarna CEO) · 20VC: SaaS is Dead: Why Systems of Record Will Die in an Agentic World

700 — 著名的'AI客服替代700名客服'声明；他称即便以现在所知也不会改口 · Sebastian Siemiatkowski (Klarna) · 2026-02 · 访谈
100-1000x — 会用代理工具的工程师与不用者的产出差距——最低标准没变，但上限被极大抬高，个人影响力取决于用工具的能力与意愿（→ 对照 2026-01 Andreessen 的 10-100x：上限口径继续抬升） · Simon Last · 2026-03 · 访谈
每~6个月 — Notion定期彻底重写AI harness以贴合最新模型能力，且重写周期随进展加速还在缩短——'做一套然后守着'是多数公司犯的错 · Simon Last · 2026-03 · 访谈
新服务2小时上线可用 — Snap内部周五『vibe-code』一个全新服务点子，两小时内投入使用——执行成本坍塌的实例 · Evan Spiegel · 2026-04 · 访谈
35 hours/week — 传统会议型管理的信息获取成本——Chesky过去每周35小时开会只为拿到信息，AI founder mode要用异步流取代 · Brian Chesky · 2026-05 · 访谈
3 weeks → 2 days (~90% reduction) — 复现旧论文到可运行状态的耗时对比——coding agent让研究者从单线程转为三件事并行 · AI Research Legend（未具名Transformer元老，疑为Łukasz Kaiser） · 2026-06 · 访谈
tokens > headcount (already at Mercor) — Mercor内部agent的token支出已超过员工工资总额——他预言的企业范式在自家先兑现 · Brendan Foody · 2026-06 · 访谈

"Like right now, we're spending more on tokens for our internal agents than we are on employee headcount. And I think most businesses are going to look like that."
「就在现在，我们花在内部 agent token 上的钱，已经超过了员工人头开支。我认为大多数企业都会变成这样。」
Brendan Foody (Mercor CEO) · 20VC: Mercor CEO on Why Application Layer Companies Have No Defensibility

$20M liquid stock offers; 8-figure/yr packages — 顶级AI研究员的真实市场价：常见2000万美元流动股票报价，年包八位数——预计随技能扩散回归正常 · Brendan Foody · 2026-06 · 访谈
16%→80% (one quarter) — agent 驱动代码库中 AI 提交占比在一个季度内从 16% 升至 80%，说明 2025 年 12 月前后（Opus 4.5/GPT 5.2）跨过了自主性能力阈值（→ 对照 2026-02 Claude Code 占 GitHub 全站 4%：agent 驱动代码库内的占比已到 80%） · Walden Yan (Cognition) & Cole Murray (OpenInspect) · 2026-06 · 访谈
1 engineer + 2 founders — 第二产品 Merge Agent Handler 由 1 名工程师加两位创始人用 AI 工具做出，说明 AI 时代'桶'型人才的杠杆 · Shensi Ding & Gil Feig (Merge) · 2026-06 · 访谈
2x → 1,000x — 无限 AI 杠杆时代，处于手艺极端前沿者的溢价从 2 倍升至可能 1000 倍，根本改变个人才能的定价 · David Senra (Founders Podcast) · 2026-06 · 访谈
1850年约50% → 今天约10% — 人一生中花在工作上的时间占比的历史变迁——论证 AI 生产力红利会兑换成闲暇（更短工作周、更长退休）而非永久失业 · Tyler Cowen & Alex Tabarrok · 2026-06 · 访谈
$2M → $300K/年 — 被 AI 取代的专业服务精英的收入路径变化量级——失去的是高薪自动通道而非生计，故过渡可管理 · Tyler Cowen & Alex Tabarrok · 2026-06 · 访谈
<100人 — Exa 声称用不到100人建出对 agent 而言优于 Google 的搜索引擎——范式切换（服务 agent 而非人类点击）压缩了所需团队规模 · Will Bryk (Exa) · 2026-06 · 访谈

估值与融资

AI 溢价（A 轮 +30% 持续一年未消）、幂律集中与泡沫算术。

$3M-$10M ARR — AI 公司在早期即达此区间（旧时代 A 轮基准是$1M ARR），但收入成熟度与公司成熟度脱节，是新的风险源 · Jacob Effron, Scott Raney, Patrick Chase, Alex Bard (Redpoint) · 2025-04 · 访谈
120x 收入（Series B） — Mercury B 轮以 120 倍收入完成——支撑他'创始人应拿最高估值但别花掉'的亲历论据（当时融 $1.2 亿不知怎么花） · Immad Akhund (Mercury) · 2025-06 · 访谈
独角兽仅回报 8x — 种子入场价 2000-2500 万美元、稀释后投到独角兽也可能只有 8 倍——想做 10x 基金必须猎 $100 亿+ 的十角兽，独角兽狩猎时代已结束 · Immad Akhund (Mercury) · 2025-06 · 访谈
83% — 互联网泡沫周期中 83% 的风投利润产生于公认是泡沫的最后三年——提前喊泡沫离场等于放弃 83% 的利润。 · Josh Kopelman · 2025-08 · 访谈
-1x / +1000x — 风投不加杠杆最多亏 1 倍但可能赚千倍——所以顶级基金的亏损率反而高于平庸基金，漏掉赢家（omission）比投错（commission）更致命。 · Marc Andreessen · 2025-08 · 访谈
后续轮估值平均高4倍 — 红杉在cap table上的信号效应使初创公司后续融资估值平均高出4倍，延长跑道、降低死亡率——品牌VC的可量化溢价 · Pat Grady · 2025-08 · 访谈
$2B minimum raise — a16z 的经验法则：要在基础模型领域竞争，即使产品没什么进展也必须能融到至少20亿美元，否则投资人不该入场。 · Ben Horowitz · 2025-09 · 访谈
$10M offered vs $200K asked — Databricks 创始团队（6个博士+教授）最初只想融20万美元，Horowitz 反手给1000万逼他们按真公司的规模思考。 · Ben Horowitz · 2025-09 · 访谈
$10B (~20x run rate) — A 轮、B 轮均以约 100 倍收入倍数成交；而以 $500M run rate 看 $10B 传闻估值反而只有 20 倍——按增速'便宜'，公司盈利到不需要融资，融资只为宣示 RL 环境市场领导者地位 · Brendan Foody · 2025-09 · 访谈
$150-200B/yr in, >$1T/yr exits needed — 风投行业年投入要求 7000-8000 亿美元回报，即每年超万亿美元退出总额才合理——现实极少达成，故称『无回报风险』。 · Roelof Botha · 2025-10 · 访谈
+30.9%（$55M vs $42M） — 2025上半年融资的AI软件公司估值溢价30.9%，Lin认为源于服务市场扩张的信念，但承认付的是2-4年后的价格、'有点鲁莽' · Alfred Lin · 2025-10 · 访谈
$500B→$5T — 为二级市场$500B估值辩护的算术：$4T的NVIDIA按10%复利十年超$10T，OpenAI若能到$5T则现在入场仍划算 · Alfred Lin · 2025-10 · 访谈
40% of S&P 500 — 七家公司占标普四成，类比90年代日本占全球股市43%（美国41%）随后解体——集中度本身是系统脆弱性 · David Cahn · 2025-10 · 访谈
80%+流向算力生产者 — 人人嘴上说要投'算力消费者'，pitch book数据却显示八成以上AI美元仍流向生产端——言行背离的套利空间 · David Cahn · 2025-10 · 访谈
~20家/年 — 过去20-30年平均每年仅约20家公司实现≥$1B的真实退出，资金涌入并未改变该数字——'VC不是资产类别'的核心论据 · Roelof Botha · 2025-10 · 访谈
$250M valuation / 10% dilution at $1.5M revenue — Benchmark 在营收仅 150 万美元时按约 167 倍营收倍数入场，反映 AI 人才赛道的估值锚 · Brendan Foody · 2025-11 · 访谈
$2B valuation at $20M run rate, 4 months later — 四个月后估值翻 8 倍、仍按 100 倍 ARR 定价，展示这一轮 AI infra 融资节奏（→ 对照上一条） · Brendan Foody · 2025-11 · 访谈
$29B（ChatGPT 发布前） — Thrive 在 ChatGPT 上线前以约 290 亿美元估值投资，当时只有两家机构给了 term sheet——需要信念而非竞争优势 · Philip Clark (Thrive Capital) · 2025-11 · 访谈
$500M（OpenAI 出价，被拒） — GI 拒绝 OpenAI 5 亿美元收购数据的报价，选择自建独立世界模型实验室——给数据资产定价的罕见锚点 · Pim De Witte (General Intuition) · 2025-12 · 访谈
21x 收入，组合加权增速 112% — a16z 成长基金以 21 倍收入进入、组合美元加权增速 112%——高增长可以消化高估值的实证 · David George (a16z Growth) · 2025-12 · 访谈
$1B 融资 @ $11B 估值 / ~100 人 — Kalshi 自称美国 AI 之外增长最快的公司，百人团队完成 10 亿美元融资；受监管交易所像银行一样需要准备金 · Tarek Mansour (Kalshi) · 2025-12 · 访谈
50%（最佳基金 Venture 12） — 红杉史上表现最好的基金一半项目清零——好的挑选不是不亏钱，而是足够高的不对称机会命中率 · Pat Grady & Alfred Lin (Sequoia) · 2025-12 · 访谈
$300M（2009，募6个月）→ $15B（靠声誉完成） — 声誉复利的量化：一号基金3亿磨半年，最新150亿靠品牌直接落袋 · Marc Andreessen & Ben Horowitz · 2026-01 · 访谈
top 1/3 firms = 2/3 of market cap (highest since 1963) — '分拣机'加速运转的证据：利润与市值向头部集中达60年来最高 · Patrick & John Collison (Stripe 年度信) · 2026-02 · 访谈
Anthropic $360B vs OpenAI $500B — 主持人给出的两家实验室假想投资报价；他认为两者方向已分化不可直接比较 · Sebastian Siemiatkowski (Klarna) · 2026-02 · 访谈
~80% — AI驱动的公司贡献了标普500近80%的回报 · David George (a16z Growth) · 2026-02 · 访谈
-40% in 50 years — 标普500成分公司平均寿命50年间缩短40%——颠覆加速的底层数据 · David George (a16z Growth) · 2026-02 · 访谈
WorldCom $40B debt — dot-com基础设施靠负债400亿美元的WorldCom，而今天数据中心投资方账上有数千亿现金流——系统性风险的核心差异 · Martin Casado (a16z) · 2026-02 · 访谈
30% — Carta报告：名字或定位带AI的A轮公司估值溢价30%；Deedy认为对真正深入的少数团队而言溢价合理，因为人才池极度受限（→ 对照 2025-10 Alfred Lin 的 30.9%：溢价一年未消退） · Deedy Das · 2026-02 · 访谈
$5M 种子或 $500M 成长 → 皆可赚 $10-100B — 投对的话两种支票规模都能赚百亿——所以风投的真实成本结构是错过（omission）远贵于亏损（commission） · Marc Andreessen · 2026-04 · 访谈
1,000x revenue — 当前 AI 公司融资估值达收入的 1000 倍，Merge 创始人以此说明市场泡沫程度并坚持看收入/毛利/burn/runway · Shensi Ding & Gil Feig (Merge) · 2026-06 · 访谈
+30-40% QoQ — Coatue 跟踪的公司逐季超出盈利预期 30-40%，且盈利增长快到估值倍数持平或压缩——论证'高质量增长而非泡沫' · Philippe Laffont (Coatue CIO) · 2026-06 · 访谈
5x-7x — 电力/内存/半导体等'短缺卖方'的盈利能力在短期内增长 5-7 倍，市场奖励持有受限产能的一方 · Philippe Laffont (Coatue CIO) · 2026-06 · 访谈

其他关键数字

评估工程、世界模型、能源与其他不肯归类但值得记住的数字。

≥90% — LLM 法官与人工标注 ground truth 的一致率至少要达到90%，eval 才算可用——评估器本身的验收标准 · Aman Khan (Arize) · 2025-05 · 访谈
~3 个月 — AI 评估标准的'保质期'——进展太快、基准迅速饱和，评估集必须持续重造。 · Michelle Pokrass (OpenAI) · 2025-06 · 访谈
350万个演示文稿 — 在 Figma Slides 发布前，用户已在并非为此设计的 Figma Design 里做了 350 万份演示文稿——'用户破解产品'的需求信号可以量化到这个规模 · Yuhki Yamashita (Figma CPO) · 2025-06 · 访谈
pass@1 vs pass@256 显著差距 — 许多评估在允许尝试 256 次时可完全解决但单次尝试不保证——可靠性（时间范围内成功率）才是衡量 agent 能力扩展的正确指标 · Sholto Douglas (Anthropic) · 2025-06 · 访谈
97% text recovery — 从单个文本嵌入向量中可恢复高达 97% 的原文，证明向量数据库交换 embedding 约等于交换明文数据，隐私假设不成立 · Jack Morris · 2025-07 · 访谈
~1 minute — Genie 3 生成的世界元素能持续约一分钟——受实时推理权衡限制而非根本限制，且无需显式 3D 表示即实现。 · Shlomi Fruchter & Jack Parker-Holder (Google DeepMind) · 2025-08 · 访谈
AI 88% vs 医生 73% vs 医生+AI 76% — 斯坦福多中心研究：复杂诊断中 AI 单独准确率最高，医生介入反而把 AI 拉低到 76%——人机协作可能是减分项。 · Vinod Khosla · 2025-08 · 访谈

"AI alone, 88%. ... But then they gave the AI to the doctors. The doctors improved from 73% to 76%. The AI got degraded from 88 to 76%."
「仅靠 AI，准确率 88%。……但后来他们让医生使用 AI。医生从 73% 提高到 76%。AI 从 88% 降到 76%。」
Vinod Khosla · Vinod Khosla: Predicting the Future

5-10 examples POC / 100+ production — eval 黄金数据集的经验值：内部测试从 5-10 行起步，生产级置信度需 100+ 例（视行业监管程度） · Aman Khan · 2025-08 · 访谈
1 point on 300-scale in 4 years — 美国高中生中位数四年只在300分制量表上提高1分——高中阶段学习近乎完全停滞 · Joe Liemandt · 2025-09 · 访谈
20-30 hours/subject-grade — 用学习科学引擎掌握一个年级科目组合只需20-30小时（Math Academy四年级数学28小时、六七年级22小时） · Joe Liemandt · 2025-09 · 访谈
3-4 days + 30 min/week — 首次错误分析需3-4天密集标注（一次性成本），之后接入CI+cron后每周约30分钟即可维持 · Hamel Husain & Shreya Shankar · 2025-09 · 访谈
100 traces / ~1 hour — 人工看100条trace约1小时，产出的具体失败洞察远超任何幻觉/毒性自动评分——eval中ROI最高的一小时 · Hamel Husain · 2025-10 · 访谈
51,000 (2018) → 1,200 (2023), -98% — 监管不确定性下中国年新创公司数量五年跌 98%——创业者承担风险的意愿对政策极其敏感。 · Roelof Botha · 2025-10 · 访谈
86/100 — Harvey创立前的验证实验：GPT-3回答100个房东-租客法律问题，执业律师认为86个可不加编辑直接发给客户——连OpenAI法务都惊讶 · Sarah Guo & Elad Gil（回顾多位嘉宾） · 2025-11 · 访谈
$75-80k → 数百美元/颗（10年） — 激光雷达传感器十年内成本下降约 300 倍，是硬件创业门槛坍塌的核心证据 · Philip Clark (Thrive Capital) · 2025-11 · 访谈
5/10 — 全球市值前十中五家是硬件公司（Apple、Nvidia、Broadcom、Tesla、TSMC），支撑硬件复兴论 · Philip Clark (Thrive Capital) · 2025-11 · 访谈
4秒记忆窗口 — GI 世界模型仅凭 4 秒记忆即表现出空间记忆，并继承数据集中的超人操作行为（→ 对照 2025-08 Genie 3 的 ~1 分钟：不同路线的记忆窗口） · Pim De Witte (General Intuition) · 2025-12 · 访谈
6-12个月 — 评估者不执行检查代码导致模型在华丽但错误的数据上退化，团队半年到一年才发现——坏测量的代价 · Edwin Chen · 2025-12 · 访谈
10s low-res non-realtime → 60s real-time photoreal in ~1 yr — Genie 2 到 Genie 3 一年间的跨越；一年前'实时1分钟一致性'还是 stretch goal，现在用户已嫌1分钟太短（→ 对照前两条：世界模型时长/记忆的进度线） · Google Genie 3 / Project Genie 团队 · 2026-02 · 访谈
~90% of tasks < 1 expert-hour — SWE-Bench Verified 九成问题专家工程师一小时内可解且高度自包含——已无法代表行业转向的数小时/数天级任务 · Mia Glaese & Olivia Watkins (OpenAI Frontier Evals) · 2026-02 · 访谈
>50% of deep-dived failures — 对模型无法稳定通过的任务深查，过半是基准自身缺陷（过窄测试、要求猜特定命名）而非模型能力问题 · Mia Glaese & Olivia Watkins (OpenAI Frontier Evals) · 2026-02 · 访谈
>90%（一个月内） — Luckey估计即使免费送出，绝大多数人也会因体验不达标一个月内弃用VR——'免费也不够便宜'的量化表达 · Palmer Luckey · 2026-02 · 访谈
~90% — 深挖技术细节后，至少90%自称做RL/AI的公司其实只是在改LLM提示词——技术型投资人敢问'蠢问题'才能识别 · Deedy Das · 2026-02 · 访谈
100+工具即降智 — 一次性暴露上百个工具导致模型质量下降和token暴涨，倒逼渐进式披露架构 · Simon Last & Sarah Sachs (Notion) · 2026-04 · 访谈
相关系数>0.8 — 人均GDP与人均能耗高度相关——能源产量是经济繁荣的终极代理指标，这是全篇的第一性论据 · Scott Nolan (General Matter) · 2026-04 · 访谈
1颗燃料芯块 ≈ 1吨煤 — 核燃料能量密度的第一性推论：核电本应是最便宜的能源，贵只因几十年没建堆 · Scott Nolan (General Matter) · 2026-04 · 访谈
100:1 (Jensen Huang's claim) — 黄仁勋主张安全代理需百倍于生产代理；Lahav认同方向但质疑其'原生安全行不通'的假设 · Dan Lahav · 2026-05 · 访谈
weeks (Stockholm) vs months (SF) — AI经营实体业务的瓶颈是人类监管环境而非软件——同一家AI咖啡馆在斯德哥尔摩数周开业、在旧金山要数月审批 · Lukas Petersson & Axel Backlund · 2026-06 · 访谈