今日观点
AI 行业最热的关键词已经不是「模型能力」,而是「基础设施化」——模型变成平台,Agent 开始管钱。
① Claude Opus 4.8 发布:Effort 控制、动态工作流、Fast Mode 降价 3 倍
发生了什么
5 月 28 日,Anthropic 正式发布 Claude Opus 4.8,这是 Opus 家族的最新版本。它在 Opus 4.7 的基础上进行了全维度的能力提升,定价不变,立即可用。
三个核心更新:
- Effort Control(投入度控制):用户现在可以在 claude.ai 上调节 Claude 对任务的投入程度——简单问答用低投入(更快/更省),复杂推理用高投入(更深/更准)。这个能力也通过 API 开放给开发者。
- Dynamic Workflows(动态工作流):Claude Code 新增动态工作流功能,允许 Agent 自动拆解超大规模任务、分级执行,不再受单次上下文窗口限制。
- Fast Mode 降价 3 倍:Opus 4.8 的快速模式(2.5 倍推理速度)比前代便宜 3 倍。
基准测试方面,Opus 4.8 在编码、Agent 技能、推理和实用知识任务上都全面超越前代。同时,Claude Opus 4.8 已同步上线 GitHub Copilot,开发者可以在 IDE 中直接使用。
为什么重要
Anthropic 正在做一件竞争对手没做到的事:在同一个模型上同时提供「深度思考」和「极速响应」两种模式。Effort Control 让用户按需付费,动态工作流则把单体 Agent 升级为可自动扩展的多步处理器。这比单纯发布一个更大参数的模型更有工程意义。
值得注意的是,社区发现 Opus 4.8 可能在部分能力上有 Qwen 蒸馏的痕迹——这暗示 Anthropic 在探索高效模型压缩的路径,而非一味堆参数。
对你有啥用
- 开发者:试用 Claude Code 的
dynamic-workflows功能,claude code --dynamic可直接处理大型代码库重构 - API 用户:Effort Control 参数可以帮你节省 30-50% 的简单任务成本——设置
thinking_budget为 low 即可 - 普通用户:在 claude.ai 上可以通过滑块调节 Claude 的投入度,深度讨论和专业建议场景调高,日常问答调低
② Anthropic 融 650 亿美金,估值 9650 亿——距离万亿俱乐部一步之遥
发生了什么
5 月 28 日,Anthropic 宣布完成 H 轮融资 650 亿美元,由 Altimeter Capital、Dragoneer、Greenoaks 和 Sequoia Capital 领投,估值达到 9650 亿美元(post-money)。这使其超越 OpenAI(约 3000 亿估值),成为全球估值最高的 AI 初创公司。
核心数据:Anthropic 的 年化收入已突破 470 亿美元,企业客户覆盖全球各行各业。自 2 月的 G 轮融资以来,采用率持续加速增长。此次融资主要用于安全与可解释性研究、扩展算力,以及持续扩充团队。
为什么重要
从数字看,Anthropic 的估值 / 收入比(约 20x)其实低于 OpenAI(约 30x+),说明市场认为 Anthropic 的增长曲线更陡、风险更低。「安全优先」的品牌策略在 B 端市场上获得了巨大红利——大企业更愿意把钱给一个「不会胡来」的模型公司。
对你有啥用
- 开发者:Anthropic 估值越高,Claude API 长期降价的可能性越大——营收规模支撑规模效应
- 求职者:Anthropic 的招聘节奏会继续加快,尤其是安全研究、企业解决方案和基础架构方向
- 观察者:这轮融资基本上宣告「AI 双头垄断」格局形成——Anthropic 和 OpenAI 之间的竞争将决定未来 3 年 AI 生态走向
③ Liquid AI 发布 LFM2.5-8B-A1B:在 8B 参数里塞进 38T 训练量的 MoE
发生了什么
5 月 29 日,Liquid AI 发布了 LFM2.5-8B-A1B,一个面向边缘设备的高吞吐量混合专家模型(MoE)。虽然名字里有 8B,但实际每次推理只激活 1B 参数(A1B = active 1 billion)。训练数据量达到 38T tokens。
核心亮点:
- MoE 架构:8B 总参数 / 1B 激活参数——在边缘设备上跑出大模型级别的能力
- 38T tokens 训练:训练规模达到旗舰模型级别,远超同体量模型
- 高吞吐量:专为实时、高并发场景优化,适合手机、IoT 和嵌入式设备
- MIT 许可证:完全开源,可商用
为什么重要
「38T tokens + 1B 激活参数」这个组合意味着:你可以在手机上跑出一个接近 GPT-3.5 水平的模型。Liquid AI 的思路和 Apple 最近的 Gemini 蒸馏传闻异曲同工——业界正在集体押注「大模型塞进小设备」。
Liquid AI 此前获得了 $250M 融资,由 AMD 领投,说明硬件厂商也在押注边缘 AI。
对你有啥用
- 移动端开发者:在 Hugging Face 下载
LFM2.5-8B-A1B,用 llama.cpp 或 MLX 在手机上跑本地推理——完全离线、数据不离开设备 - IoT / 嵌入式:1B 激活参数意味着能在树莓派级别的硬件上运行,适合做本地语音助手、实时翻译、监控分析
- 隐私敏感场景:纯本地推理意味着所有数据不出设备,适合医疗、金融等合规要求高的场景
④ Robinhood 开放 API:你的 AI Agent 现在可以自己炒股了
发生了什么
5 月 27 日,Robinhood 宣布推出 AI Agent API,允许开发者通过 API 让 AI Agent 直接执行股票交易。这意味着 AI Agent 不再是「建议你买什么」,而是 直接下单、持仓管理、止盈止损。
Robinhood 提供了标准的 REST API 和 WebSocket 接口,Agent 可以:读取账户余额和持仓、查询实时行情、按策略自动下单、设置条件单(止损/止盈/追踪)。安全方面,Robinhood 引入了 Agent 专用的 OAuth 作用域,用户可以限定 Agent 的操作范围(比如只读、只允许买某类 ETF、单笔上限等)。
为什么重要
这是主流券商第一次 正式为 AI Agent 开放交易接口。过去 Agent 炒股需要「曲线救国」——通过 Playwright 模拟点击或对接第三方券商。Robinhood 开了先河,意味着金融行业对 Agent 的态度从「观察」转向「接入」。
当然这也引发担忧——CAPTCHA 检测公司 Roundtable 同日发布报告称 CAPTCHA 仍然可以有效检测 AI Agent,意味着恶意 Agent 的自动化注册和薅羊毛行为仍被有效拦截。Robinhood 的 Agent 权限体系实际上也是金融合规的「护栏」。
对你有啥用
- 量化玩家:检查 Robinhood API 文档,评估能否用 Claude Code / GPT 生成交易策略 → 自动执行的全闭环
- 风险关注:务必使用 Agent 专用 OAuth 权限隔离——只给必要的最小权限,设置单笔和日交易上限
- 提醒:中国用户无法直接使用 Robinhood,但可以关注国内券商是否会跟进类似的 Agent API
⑤ Mistral 不再只是模型公司:从数据中心到芯片,法国 AI 野心浮现
发生了什么
5 月 28-29 日,Mistral AI 在巴黎举办 AI Now Summit,透露了一系列重大战略转向。核心信号:Mistral 不再只是一家模型公司,而是在构建完整的 AI 栈。
具体动作:
- 自家数据中心:一座 40MW 的数据中心在建,用于训练和推理
- Mistral Compute 云服务:推出 AI 计算云服务,对标 AWS / GCP 的 GPU 实例
- Mistral Vibe 产品:面向创意工作者的 AI 内容生成平台
- 自研芯片计划:CEO Arthur Mensch 表示正在探索设计自有 AI 芯片
- 咨询业务:为企业提供 AI 转型咨询和定制模型服务
与此同时,Mistral 在 AI Now Summit 上展示了其模型路线图,强调欧洲在 AI 主权和开源生态中的位置。
为什么重要
Mistral 的战略转变反映了 AI 行业的深层趋势:纯模型公司没有护城河。OpenAI 在做搜索和 Agent、Anthropic 在做安全和平台、Google 在做全栈整合。Mistral 的选择是「欧洲版全栈」——从芯片到数据中心到模型到产品到咨询,全部自己来。
这对开发者是个好消息:一个独立的、非美国的 AI 生态正在成型,意味着更多选择、更少供应商锁定风险。
对你有啥用
- 欧洲用户 / 合规需求:如果你需要 GDPR 合规的 AI 服务,Mistral Compute 和 Mistral Vibe 值得关注
- 开源爱好者:Mistral 依然是开源模型的坚定支持者,其模型在 Ollama / llama.cpp 上可直接运行
- 投资者视角:Mistral 的自研芯片计划对标 OpenAI + Broadcom 的合作模式——如果成功,它将成为欧洲的 AI 基础设施公司
今日数据速览
| 事件 | 影响力 | 建议操作 |
|---|---|---|
| Claude Opus 4.8 发布 + Effort Control | ⭐⭐⭐⭐⭐ | 试调 Effort 参数,节省简单任务成本 |
| Anthropic 650 亿美元 H 轮融资 | ⭐⭐⭐⭐⭐ | 关注 Anthropic 企业版定价趋势 |
| Liquid AI LFM2.5 边缘 MoE 模型 | ⭐⭐⭐⭐ | 下载模型,在本地设备跑推理测试 |
| Robinhood 开放 AI Agent 交易 API | ⭐⭐⭐⭐ | 评估 Agent 交易策略,注意权限隔离 |
| Mistral 转型全栈 AI 公司 | ⭐⭐⭐ | 关注 Mistral Compute,欧洲部署优选 |
小编视角
今天这五条新闻串起来看,AI 行业正在发生一个很有意思的转变——大家都在从「模型」往「平台」和「基础设施」迁移。
Anthropic 融 650 亿不是为了训练更大模型,而是建算力、做安全研究、铺企业市场;Liquid AI 做的不是最大模型,而是能塞进手机的小模型;Robinhood 给 Agent 开交易接口,本质上是在构建「Agent 经济的基础设施」;Mistral 干脆从芯片到数据中心到云到产品全栈自己来。
对普通开发者的启示其实很简单:别只盯着模型排行榜了。模型能力差异正在快速缩小(Opus 4.8 vs Gemini 3.5 Flash vs GPT-4.5+ 差距已经不大),真正的机会在「谁能让模型在生产环境里稳定、便宜、安全地跑起来」。
如果你还在纠结「哪个模型最好」——答案是「哪个模型在你的场景里最便宜、最可控」。下载一个本地模型跑跑,试试 Agent API 接自己的数据,比读一百篇评测文章都更有用。
📌 更多 AI 工具对比与在线工具,微信搜 AI Toolkit 或访问 navbox.com.cn 获取
📌 每日 AI 资讯更新,关注 navbox.com.cn/news/