今日观点
AI 的成本「失控」和「基建化」正在同步发生——最贵的不是模型,是没有管理好模型。
① OpenRouter 获 $1.13 亿 B 轮融资,谷歌英伟达领衔 AI 基础设施大赌注
发生了什么
5 月 28 日,OpenRouter 宣布完成 1.13 亿美元 B 轮融资,由 CapitalG(谷歌旗下风投) 领投,参与方包括 NVentures(英伟达)、ServiceNow Ventures、MongoDB Ventures、Snowflake Ventures、Databricks Ventures,以及 AMP PBC、Pace Capital,现有投资者 Andreessen Horowitz 和 Menlo Ventures 继续跟投。该消息在 Hacker News 上获得 330 票、154 条讨论。
OpenRouter 是当前最流行的 AI 模型 API 聚合与路由平台,让开发者通过统一接口调用 200+ 个模型,并自动根据性能/成本/延迟进行路由选择。
为什么重要
这笔融资的特殊之处不在于金额(1.13 亿在 AI 领域只能算中等),而在于投资方的阵容。谷歌、英伟达、Snowflake、Databricks、MongoDB——这些公司既是 AI 的玩家也是竞争对手——同时下注一家「中间层」,释放了两个信号:
第一,AI 模型 API 的「聚合层」正在变成基础设施。就像 AWS 没有杀死所有云服务一样,模型越来越多并不等于开发者愿意接 20 个 API。OpenRouter 的位置恰好卡在「模型提供商」和「开发者」之间。
第二,云和数据平台巨头们不想被任何一家模型公司锁定。谷歌自己就有 Gemini,英伟达有自己的 NIM,但它们依然愿意投资 OpenRouter——这意味着企业客户的需求是「不要只给我一个模型,给我全部模型的便利入口」。
对你有啥用
- API 用户:如果你用 OpenRouter,可以关注其定价优化功能——它会自动选择最便宜的可用模型满足你的请求质量要求
- 自建 Agent 团队:考虑在 Multi-Agent 系统中引入路由层(OpenRouter 或自建类似的),不要在单一的模型提供商上锁死
- 关注合并趋势:OpenRouter 的估值水涨船高后,被大厂收购的概率增加——如果被 Google 收购,价格和开放性都可能变化
② 某公司月耗 $5 亿调用 Claude——未设用量上限的惨痛教训
发生了什么
5 月 29 日,Tom’s Hardware 报道了一起令人瞠目结舌的事件:一家匿名公司(未公开名称)在一个月内因调用 Claude AI 产生了 5 亿美元的费用,原因是 IT 部门在购买企业版许可证时没有设置用量上限,导致所有员工可以无限制调用 Claude。
据知情人士透露,这笔费用直到月度账单出来才被发现——而那时 5 亿美元已经花完了。该事件在硅谷内部引发了广泛讨论,多个企业开始紧急审查自己的 AI 用量管控策略。
为什么重要
这个故事的核心教训不是「Claude 太贵」,而是 「AI 成本管理正在成为企业的必修课」。企业采购 AI 服务不像采购传统 SaaS——AI 的用量是非线性的,一个员工写脚本批量调用就能在几小时内花掉几万美元。
这背后反映了一个更深层的问题:企业级 AI 的计费和治理体系严重滞后于技术本身。AWS 有预算警报和用量上限,Slack 有按席位定价,但 AI API 的「按 token 计费」模式让传统采购流程完全失效。5 亿美元的账单是极端案例,但月超支 10 倍、20 倍的情况据传在多家企业中已经发生。
对你有啥用
- 团队管理者:立即检查你们的 Claude / GPT / Gemini 企业订阅中有没有设置用量上限。尤其是「按用量计费」的 API 账户
- 开发者:在代码中加入
max_tokens和max_calls_per_day的硬限制——API 客户端不应依赖于服务端限流 - CIO / CTO:考虑建立 AI 治理委员会,每个部门的 AI 预算需要有独立的上限和审批流程
- 个人用户:如果你在用 API key 跑脚本,也给自己设一个预算警报——OpenRouter 和大多数提供商都支持
③ 四大会计师事务所也翻车:EY 加拿大报告被曝大量 AI 幻觉引用
发生了什么
5 月 14 日,GPTZero 发布了一项调查,发现 EY(安永)加拿大分所发布的网络安全报告《Points of Attack》中存在大量 编造的引用和误导性的数据来源。该报告主题是关于忠诚度计划欺诈的网络安全分析。
调查发现的关键问题包括:
- 报告声称某项数据表明「忠诚度计划欺诈攻击自 2019 年以来增加了 89%」,但来源要么根本不存在,要么被错误引用(实际数据仅适用于 2018-2019 一年而非 2019 至今)
- 多处引用的文献标题、作者、出版信息无法通过正常渠道验证
- 部分统计数据的表述方式和错误模式与 AI 生成内容的典型特征高度吻合
该报告被多家媒体引用,包括澳大利亚 Canberra Times 的一篇文章被分发到 60+ 家报纸。
为什么重要
这不仅仅是「AI 翻车了」的又一个案例。关键是:
一个没有名字的创业公司用 AI 生成垃圾内容,没人会在意。但当四大会计师事务所之一的 EY 发布的报告出现系统性 AI 幻觉,后果是 cascade 式的——这篇报告被引用到 60 多家报纸的新闻报道中,进入了商业决策链条,甚至可能被 AI「深度研究」工具当作权威信源,形成「AI 吃 AI 的屎」的正反馈循环。
GPTZero 的调查指出:「AI 深度研究工具依赖于不同于人类的信源选择信号,因此更容易受到数据投毒的影响。」 EY 的假报告被 AI 搜索引擎索引 → 其他 AI 工具引用它 → 假信息被进一步放大,这就是所谓的「AI poisons the well」。
对你有啥用
- 读者:不要盲目信任知名机构发布的白皮书和行业报告——AI 幻觉已经渗透到了专业级文档中
- 企业用户:如果你的团队在使用 AI 辅助写作研究报告、投标书或合规文档,务必建立人工验证机制,尤其是引用部分
- AI 工具用户:使用 Perplexity、Gemini Deep Research 等工具时,对你不太熟悉的领域的回答保持怀疑——交叉验证至少 3 个独立信源
- 甲方视角:如果你收到乙方(尤其是咨询公司)的 AI 辅助报告,可以要求其披露 AI 使用声明
④ 3D 硅芯片重大突破:单晶硅垂直堆叠,良率 98-100%
发生了什么
5 月 30 日,伊利诺伊大学厄巴纳-香槟分校的研究团队在《自然》杂志上发表了一项里程碑式的研究:他们成功实现了 单晶硅的垂直堆叠,制造出真正的 三维单片集成芯片,器件良率达到 98-100%。
核心技术创新:
- 使用 超薄(10nm 以下)硅纳米膜,在低温(200°C)下逐层堆叠,解决了「上层工艺不能烧坏下层电路」的热预算问题
- 采用 无结晶体管(junctionless transistor) 设计,避免了传统掺杂工艺所需的高温(600°C+)
- 成功演示了 3 层堆叠、每层 625 个晶体管的逻辑电路和 SRAM 单元
- 输出电流密度与标准体硅工艺相当,比其他替代材料(多晶硅、金属氧化物等)的 3D 器件 高出 3-4 倍
研究团队表示:该工艺可扩展,理论上可堆叠更多层。合作伙伴包括 IBM、Intel 和台积电。
为什么重要
芯片行业正处在「摩尔定律能否延续」的十字路口——晶体管的物理尺寸已经逼近硅原子的极限(1-2nm 以下量子效应失控)。这次突破给出的答案是:不再缩小,而是向上堆叠。
这类似于从「平房」到「摩天大楼」的转变。SRAM 一个 bit 需要 6 个晶体管,传统做法需要 6 倍的地面面积;现在可以分成两层、每层 3 个晶体管,面积减半、层间通信更快。
对于 AI 来说,这尤其关键:现代 AI 芯片(GPU/TPU)的算力瓶颈往往不在计算单元本身,而在于 数据搬运——内存墙。3D 堆叠让计算和存储之间的距离从毫米级缩短到微米级,极大降低延迟和能耗。
对你有啥用
- AI 从业者:关注这项技术的产业化时间表——如果能进入台积电的量产线,2-3 年后你可能在训练集群中看到 3D 芯片
- 长期视角:这项技术对边缘 AI 的影响可能更大——更高的集成度意味着手机 / IoT 设备上可以运行更大参数级别的模型
- 投资视角:材料科学和半导体设备公司(硅纳米膜沉积、低温键合设备相关)可能受益
⑤ AI 职业哀伤:正在吞噬科技从业者的心理危机
发生了什么
一篇题为《AI Job Grief: The Unnamed Psychological Crisis Hitting Tech Workers》的长文在 Hacker News 上获得了 88 票和广泛讨论。作者通过对 Reddit、学术研究和行业数据的系统梳理,提出了一个观点:科技从业者正在经历的「AI 焦虑」本质上不是恐惧,而是哀伤(grief)——对即将失去的职业身份和自我认同的预先哀悼。
关键发现:
- 2025 年 9 月,佛罗里达大学医学院两位精神病学家发表论文,提出了一个新概念:AIRD(Artificial Intelligence Replacement Dysfunction,人工智能替代功能障碍),描述面临 AI 替代的工人出现的焦虑、失眠、抑郁、身份混乱等症状
- 一项针对 2,400 名知识工作者的调查发现,29% 的员工承认主动破坏公司的 AI 战略——包括将专有数据输入公开 AI 工具、拒绝使用 AI 等
- 中佛罗里达大学的学生在一场 AI 讲座上集体嘘校长,高喊「AI sucks」
- 传统的「Kübler-Ross 五阶段哀伤模型」在 AI 替代场景中失效——因为被替代的目标不是一次性的,而是渐进的、永不停息的
为什么重要
大多数关于 AI 的讨论聚焦于「模型能力」和「生产力提升」,但对于无数普通从业者来说,AI 首先意味着 「我学了十年的技能还值钱吗?」。
这篇文章最刺痛人的一点是:这不是普通的工作焦虑,而是一种被剥夺了表达权利的哀伤。公司把裁员叫「战略转型」「效率提升」,没有给哀伤留下任何社会许可的空间。一个人可以愤怒地抗议(因为愤怒是社会许可的情绪),但不能公开哀悼自己职业生涯的消逝。
这种现象在数据科学领域尤为突出——「数据科学家」这个头衔在 EMEA 地区已经成为薪酬最低的同类职位。一个专业不需要被消灭,只要核心含义被掏空,从业者就会失去职业身份。
对你有啥用
- 个人发展:仔细区分「技能焦虑」和「身份焦虑」——前者可以通过学习新技能解决,后者需要重新定义自己的职业身份
- 管理者:如果团队中有员工表现出对 AI 的抵触或消极情绪,不要简单归咎于「跟不上时代」——这可能是真实的哀伤反应
- 团队建设:创造安全的讨论空间,让团队成员表达对 AI 的真实感受,而不是要求所有人「拥抱变化」
- 长期策略:从「我是什么 title」转向「我解决什么问题」——职业身份绑定 title 越来越危险,绑定问题域则更安全
今日数据速览
| 事件 | 影响力 | 建议操作 |
|---|---|---|
| OpenRouter $1.13 亿 B 轮融资 | ⭐⭐⭐⭐⭐ | 可在应用层引入 API 路由策略,避免单一模型依赖 |
| 某公司月烧 $5 亿用 Claude | ⭐⭐⭐⭐⭐ | 立即建立 AI 用量上限和预算警报机制 |
| EY 报告被曝 AI 幻觉引用 | ⭐⭐⭐⭐ | 对第三方 AI 辅助报告建立引用验证流程 |
| 3D 硅芯片单片集成突破 | ⭐⭐⭐⭐ | 关注产业化时间表,2-3 年后或影响 AI 硬件格局 |
| AI 职业哀伤心理危机 | ⭐⭐⭐ | 区分技能焦虑与身份焦虑,重新定义职业身份 |
小编视角
今天的五条新闻看似毫无关联——一个 API 路由器融资、一个公司烧钱上了天、一份咨询报告翻车、一片硅芯片突破、一篇心理分析长文——但它们串起来看,AI 行业正在经历一场深刻的「成人礼」。
第一阶段(2023-2024 年):所有人都在追模型——参数越大越好,榜单越高越牛。 第二阶段(2025 年):模型能力到达实用线,焦点转向产品和落地。 第三阶段(2026 年,就是现在):治理和成本的「原罪」开始浮出水面。
OpenRouter 融资告诉我们:模型太多了,你需要一个管家。$5 亿账单告诉我们:没有管家的后果很严重。EY 翻车告诉我们:AI 写的东西没人验证等于在社交媒体上喊了一嗓子。3D 芯片告诉我们:硬件的瓶颈远没有到头。AI 哀伤告诉我们:技术转型中最痛苦的不是代码重写,是身份重写。
对读者来说,今天最有实操价值的一条建议可能是:
立即检查你的 AI 用量预算,给 API key 设置硬上限。从 $5 亿账单里学到这堂课的成本太高了——好在你可以从别人的教训里免费学。
至于职业焦虑的朋友——如果你在做 AI 相关的产品、工具和技术,你不是被替代的一方,你是替代工具的制造者。但如果你的工作是「把 Excel 数据拉成 PPT」,那确实值得焦虑——不过不是因为 AI,而是因为那个工作本来就不是一个「职业身份」,只是一个任务。
📌 更多 AI 工具对比与在线工具,微信搜 AI Toolkit 或访问 navbox.com.cn 获取
📌 每日 AI 资讯更新,关注 navbox.com.cn/news/