今日观点
AI 行业正在经历一场「务实化阵痛」——从宏大叙事转向账单、IPO 和制造良率。
① Uber 被 Claude Code 烧穿 AI 预算:$200/月的工具为何如野火燎原
发生了什么
Uber COO 在最近一次内部会议上坦言,公司 AI 预算已被严重超支,而罪魁祸首是一个每月仅 $200 的编码工具——Anthropic 的 Claude Code。
据 Fortune 报道,Uber 工程师和产品团队自发大规模使用 Claude Code,未经集中审批就迅速扩散到全公司。管理层最初只为一个试点团队采购了许可,但工具「像野火一样蔓延」,实际用到的席位远超预算假设,导致 AI 支出在单一季度内大幅超支。Uber 现在正在紧急重新评估其 AI 工具的采购和预算管理流程。
关键数据点:
- Claude Code 定价:$200/月/席位
- 覆盖范围:工程团队 + 产品团队
- 预算状况:严重超支(具体数字未公开)
- 扩散模式:自底向上,未经集中采购
为什么重要
这条新闻揭示了 AI 行业 2026 年最现实的问题:AI 生产力工具的「影子 IT」效应正在吞噬企业预算。
过去企业 AI 支出集中在训练基础设施(GPU、云)和 API 调用费用上。但 Claude Code、Copilot、Cursor 这类 AI 编码工具的定价模式(每席位固定月费 × 席位数)创造了一种全新的支出模式:一个工程师团队在内部推广一个 $200/月的工具似乎没多少钱,但如果 500 个工程师都在用,那就是 $120 万/年——而这只是众多 AI 编码工具之一。
Uber 的问题不是个例。当 AI 编码工具的生产力提升效果足够好(工程师自发采用),传统的 IT 预算控制模型就失效了——你可以在流程上拒绝批准,但工程师会用个人账号或用团队经费绕过去。
对你有啥用
如果你在科技公司负责技术团队或 IT 采购:立即盘点团队正在使用的 AI 工具数量和实际席位 —— 可能你已经被「影子 AI 采购」了。建议做三件事:
- 建立 AI 工具统一采购通道(而不是封杀,封杀只会催生更多个人账号)
- 谈判企业级席位折扣($200/月的定价通常是零售价)
- 监控月度 AI 工具支出趋势,和工程效率提升挂钩做 ROI 分析
如果你是个体开发者:Claude Code 的 $200/月定价在生产力回报上大概率是正的——但如果你只是偶尔用,GitHub Copilot($10/月)或 Cursor Pro($20/月)可能更适合你。
② Altman & Amodei 集体改口:AI 取代工作的预言在 IPO 前「降级」
发生了什么
OpenAI 的 Sam Altman 和 Anthropic 的 Dario Amodei 这两位 AI 领域最知名的 CEO,正在悄悄地收回他们此前关于 AI 大规模取代人类工作的激进预言——而动作背后的时间点与两家公司筹备 IPO 高度重合。
据 Fortune 报道,Altman 和 Amodei 最近几个月都在公开场合大幅软化措辞:
- Altman(2024 年):「AI 将取代 95% 的工作」→ Altman(2026 年 5 月):「AI 更多是增强而非替代大部分岗位。过渡将比我预想的更慢。」
- Amodei(2024 年):「AGI 将在十年内取代数百万就业岗位」→ Amodei(2026 年 5 月):「技术采纳的时间线比预期更长。」
两家的动态:
- OpenAI:传闻正在筹备 IPO,目标估值或超 $3000 亿
- Anthropic:同样在准备上市,时间线可能在 2026-2027 年
为什么重要
这不是简单的个人观点转变,而是两层结构性压力下的必然调整:
IPO 叙事需求:上市路演的核心是「可持续增长」而非「颠覆性破坏」。告诉投资者「我们的技术会消灭行业」不会帮助估值;告诉他们「我们的技术能提高效率、带来渐进式增长」才是标准剧本。
监管风险规避:在各国 AI 监管法案密集推进的 2026 年,继续高喊「AI 取代一切」只会加速限制性立法,直接损害商业前景。
有趣的是,技术本身并没有变弱——GPT-5 的基准测试持续上升,Claude 能力的边界也在外扩。改变的不是技术能力,而是商业策略。 这意味着,当 CEO 们开始「降级」预言时,技术发展的实际节奏并没有放慢——你只是听到了更「适合上市」的版本。
对你有啥用
如果你是 AI 从业者:不要因为 CEO 们改口就放慢你的 AI 技能积累——技术的实际进步曲线没有变。Altman 和 Amodei 的「降级」是商业策略,不是技术评估。
如果你是投资者:关注 AI 公司的 IPO 招股说明书中的风险披露语句——那才是真正被律师和银行家逐字审查过的官方立场。CEO 访谈和博客是公关工具,S-1 才是真相。
如果你只是一个关注 AI 发展的读者:当 CEO 的说法从「终结一切」变成「逐步提升」时,未必是技术放缓的信号,更可能是他们准备卖股票了。
③ Figure 02 人形机器人连续工作 200 小时分拣包裹,物流自动化新纪录
发生了什么
Figure Robotics 宣布其人形机器人 Figure 02 在一个真实物流仓库中完成了连续 200 小时(8.3 天)的包裹分拣任务,全程无故障。
关键指标:
- 工作时长:200 小时连续运行(8 天 8 小时)
- 任务:真实物流仓库中的包裹分拣
- 成功率:99.8%(没有出现无法立即恢复的掉落)
- 能耗:约 1.8 kWh/小时
- 充电策略:每 12 小时无线充电 15 分钟(「午休」模式)
- 之前同类记录:Tesla Optimus 在 2026 年 1 月创下的约 72 小时
Figure 02 使用了机载视觉和强化学习,能适应不同形状和大小的包裹。整个操作在初始演示后完全自主运行,无需人工干预。
为什么重要
这是一条将人形机器人从「实验室 Demo」推向「商业可行性」的关键证据。
几个关键意义:
- 200 小时无故障远超传统的仓库轮班周期(通常 8-12 小时),意味着可以覆盖全天候运营
- 99.8% 的分拣成功率超过人类水平——人类在 8 小时轮班中通常在 98-99% 之间
- 无线充电 + 自主运行的组合让「停机维护」成为可计划的事件而非被动修复
- 真实仓库环境(不是受控实验室)证明了泛化能力
对于 Figure 的竞争对手(Tesla Optimus、Boston Dynamics、1X、Apptronik 等),这是一个需要回应的里程碑。
对你有啥用
如果你是物流/仓储从业者:开始关注人形机器人的部署成本和总拥有成本数据。Figure 尚未公布定价,但 200 小时无故障的运营数据意味着 TCO 模型可能比预期更早进入可计算阶段。
如果你是机器人投资者:Figure 的运营数据比任何基准测试都更有说服力。持续关注其单台机器人的全天候吞吐量(每小时处理的包裹数)与人类基线对比。
如果你是普通科技爱好者:人形机器人正在发生从「让人惊呼神器的视频」到「悄无声息地干了一天又一天」的转变——后者的商业价值远大于前者。
④ SK 海力士发布自冷却 iHBM 芯片:从系统级散热到芯片级散热
发生了什么
韩国 SK 海力士发布了新一代 iHBM(集成式高带宽内存) 芯片,其最大亮点是将微流道冷却系统直接集成到内存芯片堆叠中,从物理层面解决 AI GPU 集群的散热瓶颈。
核心参数:
- 温度降低:对比标准 HBM4,最高可降 40°C
- 带宽:单堆栈 1.2 TB/s(对比 HBM3e 约 800 GB/s)
- 能效:性能功耗比提升 25%(低温下漏电流减少)
- 冷却方式:芯片内置微流道,循环介电冷却液
- 供应时间:2026 年 Q3 向关键客户提供样品,2027 年 H1 量产
为什么重要
AI 训练和推理集群正面临一个「热墙」:随着 GPU 功率密度持续攀升(H200 约 700W,下一代 Blackwell 和 Rubin 预计突破 1200W),传统的风冷和液冷方案已经不够用了。
SK 海力士的 iHBM 代表了一个思路转变:与其在系统层面装更大的散热器,不如在芯片层面解决热源。这和在 CPU 上加散热片的逻辑类似——但以前 HBM 内存的散热问题被 GPU 核心的散热掩盖了。
这还有一层竞争含义:在接下来的 HBM4 时代,热管理能力可能成为内存厂商的核心差异化指标,而不仅仅是带宽和容量。三星、美光和 SK 海力士的三方竞争将从「谁的带宽更高」延伸到「谁的温度更低」。
对你有啥用
如果你是 AI 基础设施从业者:iHBM 的 40°C 降温和 25% 能效提升意味着在同样的散热架构下可以塞入更多 GPU。如果你在规划 2027 年的 AI 集群,iHBM 兼容性应该成为 GPU 选型的考量因素之一。
如果你是投资者:SK 海力士的技术领先意味着 HBM 市场的份额格局可能进一步分化。三星和美光需要回应对 iHBM 的技术路线,否则可能在高利润市场失去订单。
如果你是普通读者:理解这个趋势——AI 硬件的竞争正从「谁算得更快」转向「谁散热更好」,因为物理散热能力正在成为算力增长的新天花板。
⑤ 微软开源 SkillOpt:让 AI Agent 通过「技能复用」降低推理成本
发生了什么
微软研究院开源了 SkillOpt,一个面向大规模 AI Agent 的任务映射框架。核心思路很简单但效果显著:把复杂用户请求分解为可复用的「技能」模块,然后缓存这些技能的执行方案以避免每次重复调用 LLM。
关键数据:
- 延迟降低:端到端任务完成时间最多减少 60%
- 技能复用率:1000 次请求后,70% 的新请求复用了之前发现的技能
- Token 节省:技能复用减少 40% 的 token 消耗
- 硬件支持:x86 CPU、NVIDIA GPU、Qualcomm NPU、AMD GPU
- 技术细节:技能用 DSL 描述,优化器使用学习到的成本模型决定「调用 LLM」还是「执行缓存技能」
该项目已在 GitHub 开源,论文将被 ICML 2026 收录。
为什么重要
Agentic AI(能自主执行多步操作的 AI)是 2026 年最热的方向之一,但它面临一个致命问题:每次执行都调用 LLM,成本太高、延迟太长。
SkillOpt 的思路是「一次学习,多次使用」——这看起来简单,但实现起来需要解决技能分解、组合优化、缓存失效检测和异构调度等问题。微软的成果表明,工业级的技能复用系统已经可以实现 40-60% 的效率提升。
这可能会改变 Agent 类产品的商业模型:从「按 token 收费」转向「技能订阅制」——用户为「能做什么」付费,而不是为「每次做了什么」付费。
对你有啥用
如果你是 AI 开发者/Agent 构建者:立即看 SkillOpt 的 GitHub 仓库——它的技能分解和缓存策略可以直接集成到你的 Agent 系统中。即使不用微软的实现,其方法论(将任务分解为可复用的 DSL 技能块)也值得借鉴。
如果你是 AI 产品经理:关注「技能复用」对定价模型的影响——如果你在做 Agent 产品,SkillOpt 这样的框架可以大幅降低单次执行成本,让固定月费定价(而非 token 计价)变得可行。
📊 今日数据速览
| 事件 | 影响力 | 建议操作 |
|---|---|---|
| Uber AI 预算被 Claude Code 烧穿($200/月/席位) | ⭐⭐⭐⭐ | 技术负责人立即盘点团队 AI 工具席位使用情况,建立统一采购通道 |
| Altman & Amodei 为 IPO 软化 AI 取代工作预言 | ⭐⭐⭐⭐ | 别被 CEO 改口误导,技术仍在加速;关注招股书的实际风险披露 |
| Figure 02 人形机器人连续 200 小时分拣包裹(99.8% 成功率) | ⭐⭐⭐⭐⭐ | 物流从业者关注 TCO 数据;投资者关注量产计划 |
| SK 海力士 iHBM 自冷却芯片(降温 40°C,1.2 TB/s) | ⭐⭐⭐⭐ | 基础设施规划者将 iHBM 兼容性纳入 2027 年集群选型 |
| 微软开源 SkillOpt(推理延迟 -60%,Token -40%) | ⭐⭐⭐⭐ | Agent 开发者立即试用;产品经理关注技能复用对定价模式的影响 |
💡 小编视角
今天的五条新闻有一条共同的暗线:AI 行业正在从「宏大愿景」转向「具体账单」。
Uber 的 AI 预算超支不是小事——它揭示了 AI 编码工具的渗透速度已经超越了企业管理层的感知速度。当一个 $200/月的工具能像野火一样「烧穿」一家千亿市值公司的预算时,说明AI 生产力工具已经好到「不用才是风险」的程度。而这种渗透发生在管理层注意力之外。
Altman 和 Amodei 的改口则是另一层信号:当行业领袖开始为 IPO 调整叙事时,意味着 AI 行业正在从「技术革命」走向「商业运营」。技术没有变慢,但讲述技术的方式变了——这对投资人来说是好事(终于可以按 PE 倍数估值了),对从业者来说是提醒(不要被叙事迁移影响判断)。
Figure 和 SK 海力士的新闻提供了两个不同维度的「落地证据」——人形机器人在真实仓库里干了一周活,散热技术从系统级下探到芯片级。这些都是量变引起质变的过程,不像大模型发布那样引人注目,但它们的长期影响可能更大。
最后是微软 SkillOpt——它回答了 Agent 领域的一个核心商业问题:「如何让 AI Agent 不再是烧钱的黑洞?」技能复用 + 缓存机制让多步 Agent 的推理成本可控,这让更多商业化的 Agent 产品变得可行。
总结一句话:2026 年 5 月的 AI 行业,大模型发布已经不再是主角——主角换成了「怎么用」、「怎么卖」和「怎么造」。
📌 更多 AI 工具对比与在线工具,微信搜 AI Toolkit 或访问 navbox.com.cn 获取
📌 每日 AI 资讯更新,关注 navbox.com.cn/news/