今日观点
Google 在 I/O 2026 上秀的不是产品,是生态统治力。
从搜索到水印,从模型到眼镜,Google 正用 AI 把整个产品线重写一遍。而 Figure 的 200 小时直播则证明——人形机器人的"演示能力"已经追上了营销能力。
① Google 搜索全面 AI 化:AI Mode 月活 10 亿,搜索不再是"10个蓝链接"
发生了什么
Google I/O 2026 上,搜索 VP Liz Reid 宣布了一个历史性转变——“Google 搜索就是 AI 搜索”。核心变化:
- AI Mode 月活用户突破 10 亿,使用量每季度翻倍
- AI Overview 全面覆盖,几乎所有搜索都会产生 AI 摘要
- 新搜索框号称是 25 年历史上最大改变——动态扩展、AI 自动补全,全球上线
- 生成式 UI:AI Mode 可以为查询问题生成交互界面(滑块、按钮、图表)
- 搜索生成 App:搜索能直接创建一个"迷你 App"帮你解决问题,比如规划周末行程时自动生成带地图、评论、日历集成的交互页面
为什么重要
这不仅是功能更新,而是 Google 对搜索引擎本质的重新定义。
过去 25 年搜索的核心是"给你 10 个蓝色链接让你自己翻",现在变成了"AI 直接给你答案和交互工具"。搜索不再是信息检索工具,而是 AI Agent 的入口。
Liz Reid 坦言,AI Overview 只是过渡方案,AI Mode 才是未来——你看到的生成式 UI 和那些"迷你 App"本质上就是 AI Agent 在实时帮你干活。
对你有啥用
如果你在做网站/SEO:传统 SEO 的权重将继续下降,Google 越来越多地直接从页面提取信息生成答案,而不是给链接。内容质量比关键词密度重要 10 倍。
如果你是开发者:搜索生成 App 的能力意味着你以后向 Google 问"帮我做一个旅行计划"就能得到一个可交互的工具——记住这个概念,迟早会有独立的 AIGC 工具链来做这件事。
② Gemini 3.5 Flash 发布:每秒 300 token,专为 Agent 优化
发生了什么
Google 在 I/O 上正式发布了 Gemini 3.5 Flash,同时预告了代号为 Omni 的全新多模态模型线。
Gemini 3.5 Flash 的关键指标:
- 输出速度 300 tokens/秒,是上代旗舰 3.1 Pro 的 4 倍
- 输入 $1.50/百万 tokens,输出 $9/百万 tokens——比 3.1 Pro 便宜约 25%
- 在 Terminal Bench 和 SWE-Bench Pro 上接近 GPT-5.5 水平
- 专为 Agent 工作流优化——多步推理、UI 控制、代码生成都是重点方向
Gemini Omni 则是 Google 的"大一统"模型:接受任意输入(文本/图片/视频/音频),输出任意内容。目前先发版(Omni Flash)主打视频生成能力,替代 Veo 3。
同时发布的还有 Gemini Spark——Google 首个 24/7 云端 AI Agent,能全天候监测 Gmail、Drive,自动整理摘要、推送通知。
为什么重要
3.5 Flash 的意义不在于"又多了一个模型",而在于让 Agent 工作流变得经济可行。
之前跑一个 Agent 任务,模型推理的 token 消耗巨大,成本居高不下。3.5 Flash 把速度做到 300 tokens/s、价格砍到 $1.50/M,意味着你可以让 AI 跑更多轮推理、做更多步规划而不心痛钱包。
而 Omni 模型是 Google 的"终局战略"——不再区分文本模型、图像模型、音频模型,所有能力归到一个模型。
对你有啥用
如果你在用 Google API 做 AI 应用:立刻切换测试 3.5 Flash,成本节省 25% 且速度大幅提升。
如果你在做 Agent 类应用:3.5 Flash 是目前性价比最高的"推理+速度"平衡点。Agent 工作流的核心痛点就是 token 成本,这个模型直接打在了痛点上。
③ SynthID 水印被 OpenAI/Nvidia 集体采用:AI 内容标记标准浮现
发生了什么
Google 宣布将旗下 AI 内容水印技术 SynthID 开放给行业伙伴,首批采用者包括:
- OpenAI — 用于 GPT-2 生成的图像
- Nvidia — 集成到 Cosmos 世界基础模型
- ElevenLabs — 用于 AI 语音内容
- Kakao — 韩国最大互联网公司,用于各类 AI 生成内容
SynthID 与元数据标签(如 C2PA)不同,它直接嵌入到像素和音频波形中,可以抵御压缩、裁剪和旋转等常见操作。过去三年,Google 自家模型已经用 SynthID 标记了 1000 亿张图片/视频和相当于 6 万年的音频。
为什么重要
行业标准的形成需要两个条件:技术过硬 + 足够多的玩家参与。SynthID 现在两个条件都满足了。
OpenAI 采用 SynthID 是一个信号——当大模型行业的两位主角(Google 和 OpenAI)使用同一套水印方案,这基本上锁定了 AI 内容标注的技术方向。
目前 SynthID 还没有公开 API,Google 表示是为了防止被破解者利用。但企业级 API 会在"未来几个月"通过 Gemini Enterprise Agent Platform 开放。
对你有啥用
如果你发布 AI 生成内容做商业化:提前关注 SynthID 检测能力。未来用户可能直接在 Gemini App 中上传图片问"这是 AI 生成的吗",你需要在内容中加入水印以避免信任危机。
如果你是 AI 工具开发者:等企业 API 开放后尽早接入——这就像 2015 年率先接入 HTTPS 的网站,等标准强制时你已经做好了。
④ Figure 03 机器人直播 200 小时:人机对抗,人类险胜
发生了什么
Figure AI 的直播成了本周科技圈最火的事件:
- 直播时长:5月13日开始,持续 200 小时不间断
- 工作量:Figure 03 机器人团队处理了 249,560 件包裹
- 工作内容:扫描条码 → 将包裹放上传送带(条码面朝下)
- 核心技术:Helix 02 神经网络系统,训练了 1000+ 小时人类动作数据 + 20 万并行仿真环境,所有 AI 推理在机器人本地运行
- 人机对决:5月17日,机器人 vs 人类实习生 Aimé Gérard,10小时比拼。人类最终以 12,924 件 vs 12,732 件胜出。Figure CEO 放话:“这是最后一次人类能赢。”
- 商业背书:Figure 已融资近 20 亿美元,投资方包括 Microsoft、Nvidia、Intel、Amazon、OpenAI
- 实际部署:上一代 Figure 02 在宝马 Spartanburg 工厂跑了 11 个月,参与生产了 30,000 辆 BMW X3
为什么重要
这可能是我们第一次看到人形机器人以"真实工作"为标的的长时间压力测试。
之前的机器人 demo 通常是精心剪辑的短视频,而 Figure 选择直播 200 小时,意味着它真的有信心让机器人在无数双眼睛的注视下工作。直播中确实出现了掉包、抓空等失误,但这反而增加了可信度——如果是剪辑视频,你会怀疑那些失误被剪掉了。
不过要注意:这个演示只做一种单一重复性任务。从"搬包裹"到"通用劳动力"之间,还有很长的路。
对你有啥用
如果你是科技爱好者:关注 Polymarket 上直播期间出现的机器人相关预测市场——这类新型"直播+预测市场"的组合正在成为 AI/机器人公司测试公众信心的新手段。
如果你在自动化/物流行业:Figure 03 的处理速度(2.83秒/件)已经接近人类(2.79秒/件),成本优势一旦兑现,仓库自动化行业将迎来洗牌。
⑤ Google AI 眼镜上手实测:翻译是 killer app
发生了什么
TechCrunch 在 Google I/O 上体验了 Google 即将推出的 Android XR 智能眼镜(带显示版本)。关键发现:
- 翻译体验突出:演示者说西班牙语,眼镜自动翻译成英语文字叠加在视野中,同时 Gemini 语音同步播报。评测称"世界旅行者会只为了这个功能就买眼镜"
- AI 交互:长按镜框 2 秒唤醒 Gemini,可拍照、提问、操作应用
- 导航:通过 Gemini 说"去最近的咖啡店",眼镜显示步行导航叠加
- 音乐播放:可通过语音控制播放音乐,但在嘈杂环境中音质一般
- 可定制:待机界面显示天气、倒计时等小部件,还能用 AI 自定义设计
- 合作伙伴:Warby Parker、Gentle Monster、Samsung 联合开发
- 上市节奏:音频版今年秋季发货,带显示版本目前还是原型
为什么重要
智能眼镜的"技术基础"正在被逐个攻克。去年是 Meta-RayBan 证明了"眼镜可以卖得出去",今年 Google 证明了"显示+AI 助手+翻译的组合确实有用"。
评测中提到一个关键细节——原型机只有右眼有单屏显示,长时间使用会导致眼部疲劳。这说明显示模组的功耗和散热仍是瓶颈,但至少说明这条路是走得通的。
对你有啥用
如果你是出海开发者/旅行者:翻译功能足够让你成为第一批购买者。实时翻译 + AR 文字叠加在旅行场景中的价值远高于目前的手机翻译 App。
如果你是 AI 硬件创业者:注意观察 Google 的"语音+显示+摄像头"三件套方案——它定义了下一代 AI 可穿戴设备的标准配置。未来 12 个月内会有大量类似产品跟进。
📊 今日数据速览
| 事件 | 影响力 | 建议操作 |
|---|---|---|
| Google 搜索全面 AI 化,AI Mode 月活 10 亿 | ⭐⭐⭐⭐⭐ | 关注搜索生成 App 趋势,调整 SEO 策略 |
| Gemini 3.5 Flash 300 tokens/s,$1.50/M | ⭐⭐⭐⭐⭐ | 做 AI 应用的立刻切过去跑测试 |
| SynthID 被 OpenAI/Nvidia 集体采用 | ⭐⭐⭐⭐ | 做 AI 内容的提前关注水印接入 |
| Figure 03 直播 200 小时处理 25 万包裹 | ⭐⭐⭐⭐ | 观察人形机器人成本曲线,物流行业需关注 |
| Google AI 眼镜上手,翻译是 killer app | ⭐⭐⭐ | 经常出境的用户可以关注首发时间 |
💡 小编视角
今天的 I/O 2026 周回顾,透露出一个明确的信号:2026 年 AI 行业的关键词不是"更聪明的模型",而是"AI 变成基础设施"。
Google 的激进最说明问题——搜索不再是搜索,是一个 AI Agent 入口;模型不再是模型,是一整套从速度到价格到水印的生态闭环;眼镜不再是眼镜,是 AI 助手的物理载体。
对于中文开发者/创业者的建议:
- 别卷模型,卷应用 — 3.5 Flash 的成本已经把 Agent 工作流的门槛打下来了,现在是用 AI 解决真实问题的最佳时机
- 关注水印合规 — SynthID 被广泛采用后,AI 生成内容的标注要求会越来越严格
- 机器人值得跟踪 — Figure 的直播最大的价值不是技术突破,而是透明度。当公司愿意直播 200 小时给你看它的机器人犯错,它可能是真的有点东西
📌 更多 AI 工具对比与在线工具,微信搜 AI Toolkit 或访问 navbox.com.cn 获取
📌 每日 AI 资讯更新,关注 navbox.com.cn/news/