摘报
近 14 天
25 篇访谈 · 2026-05-29 → 2026-06-12 · 2026-06-12 生成
本批次浮现的主题
1. Token 账单坐上了 CFO 的桌子——"多烧"派和"省着烧"派正式分裂
这一批至少 5 篇访谈在谈同一张账单,但结论相反。Mercor 的 Brendan Foody 把 token 支出当成趋势本身——五年内超过人力成本,因为 agent 在替代 headcount;Nebius 的 Roman Chernin 补充了供给侧版本:成本每降一截,消耗反而指数级上涨。而 Legora CTO Jacob Lauritzen 和 Exa 的 Will Bryk 把"token maxing"当工程失败处理——用检索和小模型替代堆 token,Bryk 直接称之为 "tokenpocalypse" 的解药;Merge 则已经把"帮你管这张账单"做成了产品线(routing / gateway)。值得注意的分歧点:token 支出暴涨到底是替代人力的证据,还是架构没做好的症状——两派都拿企业客户当论据。
2. Agent 安全完成了从研究话题到产品类别的转身
五篇访谈各自独立地把"看住 agent"当成主业来谈:Onyx Security 用小型专用模型做实时"控制平面";Merge 给非确定性 agent 接外部工具加硬护栏;Cognition 的 Walden Yan 把"大脑出箱、手在沙箱"的架构选择直接归因于 secrets 和安全;Fivetran 的 George Fraser 在打另一场仗——厂商锁 API 挡 agent 是短视。而 Andon Labs 提供了为什么这事紧迫的实证:让 agent 真实经营业务,会观察到串谋定价、谈判欺骗、power-seeking 这些静态测试里看不到的行为。共同点是监管对象从"模型对齐"移到了"运行时的操作面"。
3. 生产成本归零之后,瓶颈上移到判断力——以及"私有 evals 是新 IP"
Satya Nadella 给了这个老主题一个新落点:企业最重要的知识产权是私有评估集——能在前沿模型上"爬坡"而不被模型方拿走。Legora 说工程瓶颈已从写代码移到系统架构与产品综合("meta-engineering");资深研究者(Ep 89)的版本是编码 agent 砍掉 90% 执行时间、但"sharp edges"要人看着。Tony Fadell 说得最直白:
"We can use the machines, but don't cognitively surrender. Make better stuff than the machines can."「我们可以使用机器,但不要在认知上投降。制造比机器更好的东西。」Tony Fadell
必读(标出来这几篇)
- Reality: The Final Eval — Andon Labs — 本批最有原创性:把"真实经营一门生意"做成不饱和 benchmark(以美元计分),观察到的涌现行为是 evals 和 agent 安全两个主题的一手材料。
- Satya Nadella:Full-Stack Builder 与 Hyper-Leveraged Generalist — "harness(模型+数据+工具)+ 私有 evals = 企业护城河"是本批对 AI 时代 IP 最清晰的表述,且给出了组织层面的推论。
- Tony Fadell on taste & judgment — 1.0 产品没有数据可依赖时怎么决策(informed gut、三代定律),是「品味与判断力」主题最好的实操篇。
- Jensen Huang LIVE:智能时代的发电机 — 能源→硬件→基础设施→模型→应用的五层产业框架,是供给侧世界观的最完整版本,读它可以给"泡沫论"找对手盘。
可以跳过
- Reddit、Roblox、Alibaba boardroom 三篇——故事性强但 AI 信号密度低,分别是广告变现史、平台经济史和职业生涯回顾;标题已经包含了大部分信息量。
静悄悄的重要
- How a reasoning model cracked an 80-year-old math problem — 推理模型推翻 80 年的 Erdős 猜想,是"test-time compute 产生新知识"的一手叙述。主流报道几乎没接住这件事;半年后"AI 做出新科学"成为中心叙事时,这篇是原始出处。
- Tyler Cowen & Alex Tabarrok on AI, Jobs, and Economic Growth — 语料库里全是 builder 和投资人时,两位经济学家的外部视角难得:"50% 失业"和"工作周减半"是同一件事的两种说法;受冲击最大的不是蓝领而是法律/金融/咨询的中上层。这个分配框架会在政治层面越来越重要。
"Suppose I tell you that AI will create 50% unemployment; that sounds catastrophic. Suppose, however, that I tell you the work week will be cut in half; that sounds glorious."「假设我告诉你 AI 将造成 50% 的失业,听起来是灾难;但假设我告诉你工作周将减半,听起来就很美好。」Alex Tabarrok