AI 日报 5/31:OpenRouter 获 $1.13B 融资、某公司月烧 $5 亿用 Claude、EY 报告被曝 AI 幻觉

OpenRouter 完成 $1.13 亿 B 轮融资,谷歌英伟达等巨头集体下注 AI 基础设施;某公司未设上限月耗 $5 亿调用 Claude,AI 成本管控成新课题;EY 加拿大网络安全报告被曝大量编造引用;3D 硅芯片突破可能延续摩尔定律;AI 职业哀伤正在吞噬科技从业者

今日观点

AI 的成本「失控」和「基建化」正在同步发生——最贵的不是模型,是没有管理好模型。


① OpenRouter 获 $1.13 亿 B 轮融资,谷歌英伟达领衔 AI 基础设施大赌注

发生了什么

5 月 28 日,OpenRouter 宣布完成 1.13 亿美元 B 轮融资,由 CapitalG(谷歌旗下风投) 领投,参与方包括 NVentures(英伟达)、ServiceNow Ventures、MongoDB Ventures、Snowflake Ventures、Databricks Ventures,以及 AMP PBC、Pace Capital,现有投资者 Andreessen Horowitz 和 Menlo Ventures 继续跟投。该消息在 Hacker News 上获得 330 票、154 条讨论。

OpenRouter 是当前最流行的 AI 模型 API 聚合与路由平台,让开发者通过统一接口调用 200+ 个模型,并自动根据性能/成本/延迟进行路由选择。

为什么重要

这笔融资的特殊之处不在于金额(1.13 亿在 AI 领域只能算中等),而在于投资方的阵容。谷歌、英伟达、Snowflake、Databricks、MongoDB——这些公司既是 AI 的玩家也是竞争对手——同时下注一家「中间层」,释放了两个信号:

第一,AI 模型 API 的「聚合层」正在变成基础设施。就像 AWS 没有杀死所有云服务一样,模型越来越多并不等于开发者愿意接 20 个 API。OpenRouter 的位置恰好卡在「模型提供商」和「开发者」之间。

第二,云和数据平台巨头们不想被任何一家模型公司锁定。谷歌自己就有 Gemini,英伟达有自己的 NIM,但它们依然愿意投资 OpenRouter——这意味着企业客户的需求是「不要只给我一个模型,给我全部模型的便利入口」。

对你有啥用

  • API 用户:如果你用 OpenRouter,可以关注其定价优化功能——它会自动选择最便宜的可用模型满足你的请求质量要求
  • 自建 Agent 团队:考虑在 Multi-Agent 系统中引入路由层(OpenRouter 或自建类似的),不要在单一的模型提供商上锁死
  • 关注合并趋势:OpenRouter 的估值水涨船高后,被大厂收购的概率增加——如果被 Google 收购,价格和开放性都可能变化

② 某公司月耗 $5 亿调用 Claude——未设用量上限的惨痛教训

发生了什么

5 月 29 日,Tom’s Hardware 报道了一起令人瞠目结舌的事件:一家匿名公司(未公开名称)在一个月内因调用 Claude AI 产生了 5 亿美元的费用,原因是 IT 部门在购买企业版许可证时没有设置用量上限,导致所有员工可以无限制调用 Claude。

据知情人士透露,这笔费用直到月度账单出来才被发现——而那时 5 亿美元已经花完了。该事件在硅谷内部引发了广泛讨论,多个企业开始紧急审查自己的 AI 用量管控策略。

为什么重要

这个故事的核心教训不是「Claude 太贵」,而是 「AI 成本管理正在成为企业的必修课」。企业采购 AI 服务不像采购传统 SaaS——AI 的用量是非线性的,一个员工写脚本批量调用就能在几小时内花掉几万美元。

这背后反映了一个更深层的问题:企业级 AI 的计费和治理体系严重滞后于技术本身。AWS 有预算警报和用量上限,Slack 有按席位定价,但 AI API 的「按 token 计费」模式让传统采购流程完全失效。5 亿美元的账单是极端案例,但月超支 10 倍、20 倍的情况据传在多家企业中已经发生。

对你有啥用

  • 团队管理者:立即检查你们的 Claude / GPT / Gemini 企业订阅中有没有设置用量上限。尤其是「按用量计费」的 API 账户
  • 开发者:在代码中加入 max_tokensmax_calls_per_day 的硬限制——API 客户端不应依赖于服务端限流
  • CIO / CTO:考虑建立 AI 治理委员会,每个部门的 AI 预算需要有独立的上限和审批流程
  • 个人用户:如果你在用 API key 跑脚本,也给自己设一个预算警报——OpenRouter 和大多数提供商都支持

③ 四大会计师事务所也翻车:EY 加拿大报告被曝大量 AI 幻觉引用

发生了什么

5 月 14 日,GPTZero 发布了一项调查,发现 EY(安永)加拿大分所发布的网络安全报告《Points of Attack》中存在大量 编造的引用和误导性的数据来源。该报告主题是关于忠诚度计划欺诈的网络安全分析。

调查发现的关键问题包括:

  • 报告声称某项数据表明「忠诚度计划欺诈攻击自 2019 年以来增加了 89%」,但来源要么根本不存在,要么被错误引用(实际数据仅适用于 2018-2019 一年而非 2019 至今)
  • 多处引用的文献标题、作者、出版信息无法通过正常渠道验证
  • 部分统计数据的表述方式和错误模式与 AI 生成内容的典型特征高度吻合

该报告被多家媒体引用,包括澳大利亚 Canberra Times 的一篇文章被分发到 60+ 家报纸。

为什么重要

这不仅仅是「AI 翻车了」的又一个案例。关键是:

一个没有名字的创业公司用 AI 生成垃圾内容,没人会在意。但当四大会计师事务所之一的 EY 发布的报告出现系统性 AI 幻觉,后果是 cascade 式的——这篇报告被引用到 60 多家报纸的新闻报道中,进入了商业决策链条,甚至可能被 AI「深度研究」工具当作权威信源,形成「AI 吃 AI 的屎」的正反馈循环。

GPTZero 的调查指出:「AI 深度研究工具依赖于不同于人类的信源选择信号,因此更容易受到数据投毒的影响。」 EY 的假报告被 AI 搜索引擎索引 → 其他 AI 工具引用它 → 假信息被进一步放大,这就是所谓的「AI poisons the well」。

对你有啥用

  • 读者:不要盲目信任知名机构发布的白皮书和行业报告——AI 幻觉已经渗透到了专业级文档中
  • 企业用户:如果你的团队在使用 AI 辅助写作研究报告、投标书或合规文档,务必建立人工验证机制,尤其是引用部分
  • AI 工具用户:使用 Perplexity、Gemini Deep Research 等工具时,对你不太熟悉的领域的回答保持怀疑——交叉验证至少 3 个独立信源
  • 甲方视角:如果你收到乙方(尤其是咨询公司)的 AI 辅助报告,可以要求其披露 AI 使用声明

④ 3D 硅芯片重大突破:单晶硅垂直堆叠,良率 98-100%

发生了什么

5 月 30 日,伊利诺伊大学厄巴纳-香槟分校的研究团队在《自然》杂志上发表了一项里程碑式的研究:他们成功实现了 单晶硅的垂直堆叠,制造出真正的 三维单片集成芯片,器件良率达到 98-100%。

核心技术创新:

  • 使用 超薄(10nm 以下)硅纳米膜,在低温(200°C)下逐层堆叠,解决了「上层工艺不能烧坏下层电路」的热预算问题
  • 采用 无结晶体管(junctionless transistor) 设计,避免了传统掺杂工艺所需的高温(600°C+)
  • 成功演示了 3 层堆叠、每层 625 个晶体管的逻辑电路和 SRAM 单元
  • 输出电流密度与标准体硅工艺相当,比其他替代材料(多晶硅、金属氧化物等)的 3D 器件 高出 3-4 倍

研究团队表示:该工艺可扩展,理论上可堆叠更多层。合作伙伴包括 IBM、Intel 和台积电。

为什么重要

芯片行业正处在「摩尔定律能否延续」的十字路口——晶体管的物理尺寸已经逼近硅原子的极限(1-2nm 以下量子效应失控)。这次突破给出的答案是:不再缩小,而是向上堆叠

这类似于从「平房」到「摩天大楼」的转变。SRAM 一个 bit 需要 6 个晶体管,传统做法需要 6 倍的地面面积;现在可以分成两层、每层 3 个晶体管,面积减半、层间通信更快。

对于 AI 来说,这尤其关键:现代 AI 芯片(GPU/TPU)的算力瓶颈往往不在计算单元本身,而在于 数据搬运——内存墙。3D 堆叠让计算和存储之间的距离从毫米级缩短到微米级,极大降低延迟和能耗。

对你有啥用

  • AI 从业者:关注这项技术的产业化时间表——如果能进入台积电的量产线,2-3 年后你可能在训练集群中看到 3D 芯片
  • 长期视角:这项技术对边缘 AI 的影响可能更大——更高的集成度意味着手机 / IoT 设备上可以运行更大参数级别的模型
  • 投资视角:材料科学和半导体设备公司(硅纳米膜沉积、低温键合设备相关)可能受益

⑤ AI 职业哀伤:正在吞噬科技从业者的心理危机

发生了什么

一篇题为《AI Job Grief: The Unnamed Psychological Crisis Hitting Tech Workers》的长文在 Hacker News 上获得了 88 票和广泛讨论。作者通过对 Reddit、学术研究和行业数据的系统梳理,提出了一个观点:科技从业者正在经历的「AI 焦虑」本质上不是恐惧,而是哀伤(grief)——对即将失去的职业身份和自我认同的预先哀悼。

关键发现:

  • 2025 年 9 月,佛罗里达大学医学院两位精神病学家发表论文,提出了一个新概念:AIRD(Artificial Intelligence Replacement Dysfunction,人工智能替代功能障碍),描述面临 AI 替代的工人出现的焦虑、失眠、抑郁、身份混乱等症状
  • 一项针对 2,400 名知识工作者的调查发现,29% 的员工承认主动破坏公司的 AI 战略——包括将专有数据输入公开 AI 工具、拒绝使用 AI 等
  • 中佛罗里达大学的学生在一场 AI 讲座上集体嘘校长,高喊「AI sucks」
  • 传统的「Kübler-Ross 五阶段哀伤模型」在 AI 替代场景中失效——因为被替代的目标不是一次性的,而是渐进的、永不停息的

为什么重要

大多数关于 AI 的讨论聚焦于「模型能力」和「生产力提升」,但对于无数普通从业者来说,AI 首先意味着 「我学了十年的技能还值钱吗?」

这篇文章最刺痛人的一点是:这不是普通的工作焦虑,而是一种被剥夺了表达权利的哀伤。公司把裁员叫「战略转型」「效率提升」,没有给哀伤留下任何社会许可的空间。一个人可以愤怒地抗议(因为愤怒是社会许可的情绪),但不能公开哀悼自己职业生涯的消逝。

这种现象在数据科学领域尤为突出——「数据科学家」这个头衔在 EMEA 地区已经成为薪酬最低的同类职位。一个专业不需要被消灭,只要核心含义被掏空,从业者就会失去职业身份。

对你有啥用

  • 个人发展:仔细区分「技能焦虑」和「身份焦虑」——前者可以通过学习新技能解决,后者需要重新定义自己的职业身份
  • 管理者:如果团队中有员工表现出对 AI 的抵触或消极情绪,不要简单归咎于「跟不上时代」——这可能是真实的哀伤反应
  • 团队建设:创造安全的讨论空间,让团队成员表达对 AI 的真实感受,而不是要求所有人「拥抱变化」
  • 长期策略:从「我是什么 title」转向「我解决什么问题」——职业身份绑定 title 越来越危险,绑定问题域则更安全

今日数据速览

事件影响力建议操作
OpenRouter $1.13 亿 B 轮融资⭐⭐⭐⭐⭐可在应用层引入 API 路由策略,避免单一模型依赖
某公司月烧 $5 亿用 Claude⭐⭐⭐⭐⭐立即建立 AI 用量上限和预算警报机制
EY 报告被曝 AI 幻觉引用⭐⭐⭐⭐对第三方 AI 辅助报告建立引用验证流程
3D 硅芯片单片集成突破⭐⭐⭐⭐关注产业化时间表,2-3 年后或影响 AI 硬件格局
AI 职业哀伤心理危机⭐⭐⭐区分技能焦虑与身份焦虑,重新定义职业身份

小编视角

今天的五条新闻看似毫无关联——一个 API 路由器融资、一个公司烧钱上了天、一份咨询报告翻车、一片硅芯片突破、一篇心理分析长文——但它们串起来看,AI 行业正在经历一场深刻的「成人礼」。

第一阶段(2023-2024 年):所有人都在追模型——参数越大越好,榜单越高越牛。 第二阶段(2025 年):模型能力到达实用线,焦点转向产品和落地。 第三阶段(2026 年,就是现在):治理和成本的「原罪」开始浮出水面。

OpenRouter 融资告诉我们:模型太多了,你需要一个管家。$5 亿账单告诉我们:没有管家的后果很严重。EY 翻车告诉我们:AI 写的东西没人验证等于在社交媒体上喊了一嗓子。3D 芯片告诉我们:硬件的瓶颈远没有到头。AI 哀伤告诉我们:技术转型中最痛苦的不是代码重写,是身份重写。

对读者来说,今天最有实操价值的一条建议可能是:

立即检查你的 AI 用量预算,给 API key 设置硬上限。从 $5 亿账单里学到这堂课的成本太高了——好在你可以从别人的教训里免费学。

至于职业焦虑的朋友——如果你在做 AI 相关的产品、工具和技术,你不是被替代的一方,你是替代工具的制造者。但如果你的工作是「把 Excel 数据拉成 PPT」,那确实值得焦虑——不过不是因为 AI,而是因为那个工作本来就不是一个「职业身份」,只是一个任务。


📌 更多 AI 工具对比与在线工具,微信搜 AI Toolkit 或访问 navbox.com.cn 获取

📌 每日 AI 资讯更新,关注 navbox.com.cn/news/

← 返回资讯列表 下一篇 →