AI 日报 5/27：Uber 被 Claude Code 烧穿 AI 预算、Altman & Amodei 为 IPO 集体改口、Figure 机器人连干 200 小时分拣、SK 海力士自冷却 iHBM 芯片、微软开源 SkillOpt

今日观点

AI 行业正在经历一场「务实化阵痛」——从宏大叙事转向账单、IPO 和制造良率。

① Uber 被 Claude Code 烧穿 AI 预算：$200/月的工具为何如野火燎原

发生了什么

Uber COO 在最近一次内部会议上坦言，公司 AI 预算已被严重超支，而罪魁祸首是一个每月仅 $200 的编码工具——Anthropic 的 Claude Code。

据 Fortune 报道，Uber 工程师和产品团队自发大规模使用 Claude Code，未经集中审批就迅速扩散到全公司。管理层最初只为一个试点团队采购了许可，但工具「像野火一样蔓延」，实际用到的席位远超预算假设，导致 AI 支出在单一季度内大幅超支。Uber 现在正在紧急重新评估其 AI 工具的采购和预算管理流程。

关键数据点：

Claude Code 定价：$200/月/席位
覆盖范围：工程团队 + 产品团队
预算状况：严重超支（具体数字未公开）
扩散模式：自底向上，未经集中采购

为什么重要

这条新闻揭示了 AI 行业 2026 年最现实的问题：AI 生产力工具的「影子 IT」效应正在吞噬企业预算。

过去企业 AI 支出集中在训练基础设施（GPU、云）和 API 调用费用上。但 Claude Code、Copilot、Cursor 这类 AI 编码工具的定价模式（每席位固定月费 × 席位数）创造了一种全新的支出模式：一个工程师团队在内部推广一个 $200/月的工具似乎没多少钱，但如果 500 个工程师都在用，那就是 $120 万/年——而这只是众多 AI 编码工具之一。

Uber 的问题不是个例。当 AI 编码工具的生产力提升效果足够好（工程师自发采用），传统的 IT 预算控制模型就失效了——你可以在流程上拒绝批准，但工程师会用个人账号或用团队经费绕过去。

对你有啥用

如果你在科技公司负责技术团队或 IT 采购：立即盘点团队正在使用的 AI 工具数量和实际席位 —— 可能你已经被「影子 AI 采购」了。建议做三件事：

建立 AI 工具统一采购通道（而不是封杀，封杀只会催生更多个人账号）
谈判企业级席位折扣（$200/月的定价通常是零售价）
监控月度 AI 工具支出趋势，和工程效率提升挂钩做 ROI 分析

如果你是个体开发者：Claude Code 的 $200/月定价在生产力回报上大概率是正的——但如果你只是偶尔用，GitHub Copilot（$10/月）或 Cursor Pro（$20/月）可能更适合你。

② Altman & Amodei 集体改口：AI 取代工作的预言在 IPO 前「降级」

发生了什么

OpenAI 的 Sam Altman 和 Anthropic 的 Dario Amodei 这两位 AI 领域最知名的 CEO，正在悄悄地收回他们此前关于 AI 大规模取代人类工作的激进预言——而动作背后的时间点与两家公司筹备 IPO 高度重合。

据 Fortune 报道，Altman 和 Amodei 最近几个月都在公开场合大幅软化措辞：

Altman（2024 年）：「AI 将取代 95% 的工作」→ Altman（2026 年 5 月）：「AI 更多是增强而非替代大部分岗位。过渡将比我预想的更慢。」
Amodei（2024 年）：「AGI 将在十年内取代数百万就业岗位」→ Amodei（2026 年 5 月）：「技术采纳的时间线比预期更长。」

两家的动态：

OpenAI：传闻正在筹备 IPO，目标估值或超 $3000 亿
Anthropic：同样在准备上市，时间线可能在 2026-2027 年

为什么重要

这不是简单的个人观点转变，而是两层结构性压力下的必然调整：

IPO 叙事需求：上市路演的核心是「可持续增长」而非「颠覆性破坏」。告诉投资者「我们的技术会消灭行业」不会帮助估值；告诉他们「我们的技术能提高效率、带来渐进式增长」才是标准剧本。
监管风险规避：在各国 AI 监管法案密集推进的 2026 年，继续高喊「AI 取代一切」只会加速限制性立法，直接损害商业前景。

有趣的是，技术本身并没有变弱——GPT-5 的基准测试持续上升，Claude 能力的边界也在外扩。改变的不是技术能力，而是商业策略。 这意味着，当 CEO 们开始「降级」预言时，技术发展的实际节奏并没有放慢——你只是听到了更「适合上市」的版本。

对你有啥用

如果你是 AI 从业者：不要因为 CEO 们改口就放慢你的 AI 技能积累——技术的实际进步曲线没有变。Altman 和 Amodei 的「降级」是商业策略，不是技术评估。

如果你是投资者：关注 AI 公司的 IPO 招股说明书中的风险披露语句——那才是真正被律师和银行家逐字审查过的官方立场。CEO 访谈和博客是公关工具，S-1 才是真相。

如果你只是一个关注 AI 发展的读者：当 CEO 的说法从「终结一切」变成「逐步提升」时，未必是技术放缓的信号，更可能是他们准备卖股票了。

③ Figure 02 人形机器人连续工作 200 小时分拣包裹，物流自动化新纪录

发生了什么

Figure Robotics 宣布其人形机器人 Figure 02 在一个真实物流仓库中完成了连续 200 小时（8.3 天）的包裹分拣任务，全程无故障。

关键指标：

工作时长：200 小时连续运行（8 天 8 小时）
任务：真实物流仓库中的包裹分拣
成功率：99.8%（没有出现无法立即恢复的掉落）
能耗：约 1.8 kWh/小时
充电策略：每 12 小时无线充电 15 分钟（「午休」模式）
之前同类记录：Tesla Optimus 在 2026 年 1 月创下的约 72 小时

Figure 02 使用了机载视觉和强化学习，能适应不同形状和大小的包裹。整个操作在初始演示后完全自主运行，无需人工干预。

为什么重要

这是一条将人形机器人从「实验室 Demo」推向「商业可行性」的关键证据。

几个关键意义：

200 小时无故障远超传统的仓库轮班周期（通常 8-12 小时），意味着可以覆盖全天候运营
99.8% 的分拣成功率超过人类水平——人类在 8 小时轮班中通常在 98-99% 之间
无线充电 + 自主运行的组合让「停机维护」成为可计划的事件而非被动修复
真实仓库环境（不是受控实验室）证明了泛化能力

对于 Figure 的竞争对手（Tesla Optimus、Boston Dynamics、1X、Apptronik 等），这是一个需要回应的里程碑。

对你有啥用

如果你是物流/仓储从业者：开始关注人形机器人的部署成本和总拥有成本数据。Figure 尚未公布定价，但 200 小时无故障的运营数据意味着 TCO 模型可能比预期更早进入可计算阶段。

如果你是机器人投资者：Figure 的运营数据比任何基准测试都更有说服力。持续关注其单台机器人的全天候吞吐量（每小时处理的包裹数）与人类基线对比。

如果你是普通科技爱好者：人形机器人正在发生从「让人惊呼神器的视频」到「悄无声息地干了一天又一天」的转变——后者的商业价值远大于前者。

④ SK 海力士发布自冷却 iHBM 芯片：从系统级散热到芯片级散热

发生了什么

韩国 SK 海力士发布了新一代 iHBM（集成式高带宽内存） 芯片，其最大亮点是将微流道冷却系统直接集成到内存芯片堆叠中，从物理层面解决 AI GPU 集群的散热瓶颈。

核心参数：

温度降低：对比标准 HBM4，最高可降 40°C
带宽：单堆栈 1.2 TB/s（对比 HBM3e 约 800 GB/s）
能效：性能功耗比提升 25%（低温下漏电流减少）
冷却方式：芯片内置微流道，循环介电冷却液
供应时间：2026 年 Q3 向关键客户提供样品，2027 年 H1 量产

为什么重要

AI 训练和推理集群正面临一个「热墙」：随着 GPU 功率密度持续攀升（H200 约 700W，下一代 Blackwell 和 Rubin 预计突破 1200W），传统的风冷和液冷方案已经不够用了。

SK 海力士的 iHBM 代表了一个思路转变：与其在系统层面装更大的散热器，不如在芯片层面解决热源。这和在 CPU 上加散热片的逻辑类似——但以前 HBM 内存的散热问题被 GPU 核心的散热掩盖了。

这还有一层竞争含义：在接下来的 HBM4 时代，热管理能力可能成为内存厂商的核心差异化指标，而不仅仅是带宽和容量。三星、美光和 SK 海力士的三方竞争将从「谁的带宽更高」延伸到「谁的温度更低」。

对你有啥用

如果你是 AI 基础设施从业者：iHBM 的 40°C 降温和 25% 能效提升意味着在同样的散热架构下可以塞入更多 GPU。如果你在规划 2027 年的 AI 集群，iHBM 兼容性应该成为 GPU 选型的考量因素之一。

如果你是投资者：SK 海力士的技术领先意味着 HBM 市场的份额格局可能进一步分化。三星和美光需要回应对 iHBM 的技术路线，否则可能在高利润市场失去订单。

如果你是普通读者：理解这个趋势——AI 硬件的竞争正从「谁算得更快」转向「谁散热更好」，因为物理散热能力正在成为算力增长的新天花板。

⑤ 微软开源 SkillOpt：让 AI Agent 通过「技能复用」降低推理成本

发生了什么

微软研究院开源了 SkillOpt，一个面向大规模 AI Agent 的任务映射框架。核心思路很简单但效果显著：把复杂用户请求分解为可复用的「技能」模块，然后缓存这些技能的执行方案以避免每次重复调用 LLM。

关键数据：

延迟降低：端到端任务完成时间最多减少 60%
技能复用率：1000 次请求后，70% 的新请求复用了之前发现的技能
Token 节省：技能复用减少 40% 的 token 消耗
硬件支持：x86 CPU、NVIDIA GPU、Qualcomm NPU、AMD GPU
技术细节：技能用 DSL 描述，优化器使用学习到的成本模型决定「调用 LLM」还是「执行缓存技能」

该项目已在 GitHub 开源，论文将被 ICML 2026 收录。

为什么重要

Agentic AI（能自主执行多步操作的 AI）是 2026 年最热的方向之一，但它面临一个致命问题：每次执行都调用 LLM，成本太高、延迟太长。

SkillOpt 的思路是「一次学习，多次使用」——这看起来简单，但实现起来需要解决技能分解、组合优化、缓存失效检测和异构调度等问题。微软的成果表明，工业级的技能复用系统已经可以实现 40-60% 的效率提升。

这可能会改变 Agent 类产品的商业模型：从「按 token 收费」转向「技能订阅制」——用户为「能做什么」付费，而不是为「每次做了什么」付费。

对你有啥用

如果你是 AI 开发者/Agent 构建者：立即看 SkillOpt 的 GitHub 仓库——它的技能分解和缓存策略可以直接集成到你的 Agent 系统中。即使不用微软的实现，其方法论（将任务分解为可复用的 DSL 技能块）也值得借鉴。

如果你是 AI 产品经理：关注「技能复用」对定价模型的影响——如果你在做 Agent 产品，SkillOpt 这样的框架可以大幅降低单次执行成本，让固定月费定价（而非 token 计价）变得可行。

📊 今日数据速览

事件	影响力	建议操作
Uber AI 预算被 Claude Code 烧穿（$200/月/席位）	⭐⭐⭐⭐	技术负责人立即盘点团队 AI 工具席位使用情况，建立统一采购通道
Altman & Amodei 为 IPO 软化 AI 取代工作预言	⭐⭐⭐⭐	别被 CEO 改口误导，技术仍在加速；关注招股书的实际风险披露
Figure 02 人形机器人连续 200 小时分拣包裹（99.8% 成功率）	⭐⭐⭐⭐⭐	物流从业者关注 TCO 数据；投资者关注量产计划
SK 海力士 iHBM 自冷却芯片（降温 40°C，1.2 TB/s）	⭐⭐⭐⭐	基础设施规划者将 iHBM 兼容性纳入 2027 年集群选型
微软开源 SkillOpt（推理延迟 -60%，Token -40%）	⭐⭐⭐⭐	Agent 开发者立即试用；产品经理关注技能复用对定价模式的影响

💡 小编视角

今天的五条新闻有一条共同的暗线：AI 行业正在从「宏大愿景」转向「具体账单」。

Uber 的 AI 预算超支不是小事——它揭示了 AI 编码工具的渗透速度已经超越了企业管理层的感知速度。当一个 $200/月的工具能像野火一样「烧穿」一家千亿市值公司的预算时，说明AI 生产力工具已经好到「不用才是风险」的程度。而这种渗透发生在管理层注意力之外。

Altman 和 Amodei 的改口则是另一层信号：当行业领袖开始为 IPO 调整叙事时，意味着 AI 行业正在从「技术革命」走向「商业运营」。技术没有变慢，但讲述技术的方式变了——这对投资人来说是好事（终于可以按 PE 倍数估值了），对从业者来说是提醒（不要被叙事迁移影响判断）。

Figure 和 SK 海力士的新闻提供了两个不同维度的「落地证据」——人形机器人在真实仓库里干了一周活，散热技术从系统级下探到芯片级。这些都是量变引起质变的过程，不像大模型发布那样引人注目，但它们的长期影响可能更大。

最后是微软 SkillOpt——它回答了 Agent 领域的一个核心商业问题：「如何让 AI Agent 不再是烧钱的黑洞？」技能复用 + 缓存机制让多步 Agent 的推理成本可控，这让更多商业化的 Agent 产品变得可行。

总结一句话：2026 年 5 月的 AI 行业，大模型发布已经不再是主角——主角换成了「怎么用」、「怎么卖」和「怎么造」。

📌 更多 AI 工具对比与在线工具，微信搜 AI Toolkit 或访问 navbox.com.cn 获取
📌 每日 AI 资讯更新，关注 navbox.com.cn/news/