AI 日报 5/25：DeepSeek 永久降价75％+推 Reasonix 编码 Agent、微软大规模取消 Claude Code 许可证、AI 芯片 Memory 成本占比达 63%

今日观点

AI 的「成本战争」已从模型训练打到了推理和基础设施层面。

① DeepSeek 王炸连招：V4 Pro 永久降价 75% + 推出 Reasonix 原生编码 Agent

发生了什么

这个周末 DeepSeek 连续释放了两枚重磅炸弹：

第一弹：V4 Pro 永久降价 75%

DeepSeek 宣布将旗舰模型 V4 Pro 的价格折扣从「限时优惠」转为永久定价。Bloomberg 等多家媒体报道了这一消息。调整后的价格约为原价的 25%，这使得 V4 Pro 成为目前主流旗舰模型中性价比最高的选择之一。

第二弹：Reasonix 原生编码 Agent 发布

几乎同时，DeepSeek 发布了 Reasonix——一个原生 AI 编码 Agent，定位直指 Cursor 和 Claude Code。Reasonix 的特点：

高缓存命中率：通过智能缓存机制大幅降低重复代码补全的推理成本
极低 token 消耗：针对编码工作流做了专门的 token 优化，实际使用成本比竞品低一个数量级
原生集成：与 DeepSeek 自家模型深度绑定，无需额外配置 API

HN 上用户以 384 票将 Reasonix 推上热门，评论区一片「DeepSeek 这是要把 AI 编码的成本打到地板价」的感叹。

为什么重要

这两件事放在一起看，DeepSeek 的战略非常清晰——用价格战抢模型市场份额，用 Reasonix 抢开发者生态入口。

V4 Pro 的永久降价意味着 DeepSeek 的推理成本结构已经足够优化到可以长期维持低价。而 Reasonix 则是从「卖模型」转向「卖工具链」的关键一步——开发者一旦习惯了 Reasonix 的编码体验，就很难再切换到其他模型。

这是中国 AI 公司第一次在「开发者工具」层面向西方产品发起正面竞争。之前 DeepSeek 只是在模型层面追赶，现在开始构建从模型到工具到工作流的完整闭环。

对你有啥用

如果你在寻找高性价比的 AI 编码助手：第一时间上手 Reasonix 试试，它的成本结构可能会让你重新评估目前的 AI 编码工具预算。如果缓存命中率高，实际费用可能只有 Claude Code 的十分之一。

如果你在做 AI 应用开发：V4 Pro 的降价意味着你可以重新评估 DeepSeek 作为后端模型。之前价格差距不够大时切换动力不足，现在 75% 的永久折扣值得花一天时间做 benchmark。

② 微软内部大规模取消 Claude Code 许可证：一场企业级 AI 工具的「安全审查」

发生了什么

据 HN 爆料（478 票热门），微软内部正在大规模取消员工对 Claude Code 的访问权限。多位微软员工在内部渠道反映，他们收到通知称 Claude Code 许可证被暂停或不再续期。

消息源称，这并非简单的「预算削减」，而是涉及安全合规审查——Claude Code 的云端推理意味着代码片段会被发送到 Anthropic 的服务器，这在微软的合规框架下引发了数据隐私方面的担忧。

目前微软官方尚未对此发表正式声明。

为什么重要

这条消息的关键不在于微软「讨厌」Anthropic，而在于企业级 AI 编码工具的合规性问题正在从理论变为现实。

Claude Code（以及 Cursor、GitHub Copilot 等）的核心工作模式是：开发者的本地代码 → 发送到云端模型推理 → 返回补全建议。对于普通开发者来说这没问题，但对于大型企业（尤其是微软这种体量），代码本身就是核心资产，任何外传都可能违反合规要求。

如果微软——作为 GitHub Copilot 的拥有者——都认为 Claude Code 有合规风险，那其他大企业的安全团队大概率也会得出类似结论。这意味着企业市场对「本地推理」AI 编码工具的需求将急剧上升。

对你有啥用

如果你在大型企业做 AI 工具选型：提前了解合规团队的态度，如果公司有严格的代码外传限制，那么本地推理的模型（如通过 Ollama / llama.cpp 自建）可能是唯一选择。

如果你是独立开发者/小团队：短期不受影响，但建议保持关注。这个趋势可能会推动更多本地 AI 编码工具的成熟，长期看对所有人都有利。

③ Google Gemini Omni 实测：从「多模态」到「任意模态」的跨越

发生了什么

The Verge 发布了一篇 Gemini Omni 的详细上手评测，称其「让人瞠目结舌」。

Gemini Omni 是 Google 的「大一统」模型——接受任意输入（文本/图片/视频/音频），输出任意内容。评测中提到了几个令人印象深刻的场景：

玩具熊「旅行」视频：评测者上传了一张毛绒玩具熊的照片，用语音说「让它去海边度假」，Gemini Omni 直接生成了一段玩具熊在海滩上的短视频，动作自然、光影一致。
视频理解与生成：输入一段家庭录像，模型能理解场景内容并基于它生成新的视频片段
实时语音翻译+图像叠加：对着镜头说中文，眼镜上实时显示英文翻译，同时生成对应的视觉辅助图像

评测结论是：「Omni 不仅仅是又一个模型更新，它改变了你对 AI 能力边界的认知。」 但评测也指出，生成视频的保真度还不及专门视频模型（如 Sora），「全能但尚未全精」。

为什么重要

Omni 的战略意义在于：Google 不再区分模型类型了。文本模型、图像模型、音频模型、视频模型——这些区分正在消失。一个模型吃掉所有模态，这对应用开发的影响是革命性的。

以前你做一个 AI 应用，需要拼接多个模型：用 Whisper 做语音识别、用 GPT 做文本理解、用 Stable Diffusion 做图像生成、用 ElevenLabs 做语音合成。Omni 的理念是：一个模型、一个 API、所有模态。

目前 Omni 以「Flash」版本先发，主打视频生成能力，后续会扩展到更完整的形态。

对你有啥用

如果你是 AI 应用开发者：关注 Omni API 的开放节奏。如果 Google 真能把「任意输入 → 任意输出」做到产品级可用，你现有的多模型拼接架构可能要被重新思考。

如果你在做多模态内容创作：可以先在 Google AI Studio 上体验 Omni Flash 的视频生成能力，看看它能否简化你的创作流程——比如直接口头描述需求就生成素材。

④ Epoch AI 数据：HBM 内存已占 AI 芯片组件成本的 63%，成最大单一成本项

发生了什么

Epoch AI 发布了一份关于 AI 芯片组件成本结构的最新分析报告，揭示了一个惊人的趋势：

高带宽内存（HBM）目前占 AI 芯片组件成本的 63%，而 2024 年 Q1 这个比例只有 52%
计算核心（GPU die）的成本占比在同期从约 40% 降至约 30%
封装、基板等其他组件的成本占比变化不大

这意味着，一块 AI 加速器芯片的 BOM 中，接近三分之二的成本流向了内存，而非计算核心。HBM 的供不应求和复杂制造工艺（需要 TSV 硅通孔和微凸点技术）是成本高企的根本原因。

为什么重要

这个数据点可能被很多人忽视，但它的影响极其深远：

Scaling Law 的物理瓶颈：如果模型规模继续增长，HBM 需求只会更大。HBM 产能受限于 DRAM 晶圆产能和先进封装能力，短期内难以大幅扩张
芯片设计方向转变：既然内存是成本大头，降低 AI 芯片总成本的最有效途径不是改进计算核心，而是减少内存需求或用更便宜的内存方案替代
竞争格局影响：拥有 DRAM 产能的厂商（三星、SK 海力士、美光）在 AI 供应链中的议价能力将继续增强。三星芯片员工今年平均 $34 万奖金就是最好的佐证

对你有啥用

如果你在 AI 基础设施/芯片领域：关注 HBM 供应链动态和替代方案。HBM4 的进展、存算一体芯片、以及更高效的内存压缩/量化方案都会是未来两年的关键变量。

如果你只是 AI 应用开发者：这个趋势的直接影响是推理成本下行空间有限——硬件端的成本大头在内存而非计算，这意味着模型推理定价的下降可能不会像大家预期的那么快。

⑤ 「Claude 不是你的架构师」：一篇引发开发者热议的技术反思

发生了什么

一篇题为 “Claude is not your architect. Stop letting it pretend” 的技术博客在 HN 上获得 219 票 热议。

作者的核心观点：当前开发者过度依赖 AI（特别是 Claude）来做架构决策，而 Claude 的本质是一个「模式补全器」——它能给出看起来很合理的架构方案，但缺乏真正理解业务上下文的能力。

作者列举了几个典型案例：

Claude 推荐的微服务拆分方案，在实际流量只有日均几百请求的场景下完全是过度设计
Claude 生成的数据库 schema 经常遗漏关键约束和外键关系
在复杂的状态管理和并发控制问题上，Claude 给出的方案常常「在理论上可行但在实践中脆弱」

评论区反应两极：有人表示「深有同感，上周 Claude 给我推荐了一个 Redis + PostgreSQL + Elasticsearch 三件套方案，而我的项目只需要 SQLite」，也有人认为「这取决于你怎么用——它在代码层面是出色的执行者，在架构层面是建议者而不是决策者」。

为什么重要

这篇博文的流行反映了 AI 编码工具正在经历的「第二波认知调整」。

第一阶段（2023-2024）：所有人都对 AI 写代码感到惊叹，能跑就行。第二阶段（2025-2026 初）：AI 编码 Agent 开始承担更复杂的任务，出了一些「以为它懂但其实不懂」的问题。第三阶段（现在）：开发者开始冷静下来，重新界定 AI 的能力边界——它在「已知模式」的代码实现上表现出色，但在需要「业务理解」和「经验判断」的架构决策上仍不可靠。

这不是 AI 的失败，而是一个成熟的过程。就像当年 Stack Overflow 没有让程序员失业一样，AI 编码工具也不会——它只是改变了编程的性质。

对你有啥用

如果你正在用 AI 编码工具做项目：遵循「AI 写代码，人做架构」的原则。让 AI 负责实现你定义好的架构方案，而不是让 AI 来决定架构本身。具体操作：先手写或详细 Prompt 定义好接口、数据结构、模块边界，然后让 AI 填充实现。

如果你在团队推广 AI 编码工具：把这篇博文分享给你的团队，它有助于建立正确的心智模型，避免「AI 说这样做所以这样做」的盲目信任。

📊 今日数据速览

事件	影响力	建议操作
DeepSeek V4 Pro 永久降价 75% + Reasonix 编码 Agent	⭐⭐⭐⭐⭐	立刻上手测试 Reasonix，评估作为主力编码工具的可行性
微软内部大规模取消 Claude Code 许可证	⭐⭐⭐⭐	企业用户提前了解合规要求，关注本地推理方案
Google Gemini Omni 任意模态模型实测	⭐⭐⭐⭐	开发者关注 Omni API 开放节奏，尝试 AI Studio 体验版
HBM 内存占 AI 芯片成本 63%	⭐⭐⭐⭐	推理成本下降空间有限，算力规划时需考虑硬件成本结构
「Claude 不是你的架构师」引发行业讨论	⭐⭐⭐	建立「AI 写代码，人做架构」的工作流认知

💡 小编视角

这周末的新闻看似散乱，但其实指向同一个趋势：AI 行业正在从「炫技模式」切换到「工程模式」。

DeepSeek 降价+Reasonix 是「工程效率」的体现——与其卷谁的模型更聪明，不如卷谁的开发工具更省钱更好用。微软 cancel Claude Code 是「工程合规」的问题——AI 工具的引入不仅要看能力，还要看安全。HBM 占比 63% 是「工程成本」的物理现实——模型进步没那么便宜，硬件供应链才是真正的瓶颈。Claude 不是架构师是「工程认知」的成熟——我们知道 AI 能做什么，也知道它不能做什么。

这些信号放在一起，说明 AI 行业正在翻过「Demo 惊艳期」、进入「落地深水区」。对开发者和创业者的建议是：

追踪成本结构变化 — DeepSeek 的降价和 HBM 的成本占比是两个最有价值的数据点。前者告诉你 AI 能多便宜，后者告诉你 AI 不会一直变便宜
企业合规要提前布局 — 微软的 Claude Code 禁令不是孤例，如果你在大公司做 AI 工具选型，现在就该搞清楚合规团队的底线在哪里
准确界定 AI 的能力边界 — AI 是最强「执行者」，最弱「决策者」。做架构决策时用它做 reference check 可以，但最终判断还是要靠人的经验

📌 更多 AI 工具对比与在线工具，微信搜 AI Toolkit 或访问 navbox.com.cn 获取
📌 每日 AI 资讯更新，关注 navbox.com.cn/news/