Google I/O Keynote 总结 | VibeCafé

阴明@kalasoo

·2026-05-20

Google I/O Keynote 总结

文章是谷歌 CEO Sundar Pichai 在 Google I/O 2026 大会上的演讲摘要，核心宣告了谷歌全面进入 “智能体 Gemini 时代”（Agentic Gemini Era）。文章展示了谷歌在 AI 全栈领域（从算力基础设施、底层模型到消费端产品及安全）的最新突破：

1. 底层模型：Gemini 3.5 与多模态 Omni 诞生

Gemini 3.5 Flash：正式发布，兼顾前沿智能与超快行动力，性能在多数基准测试中超越 3.1 Pro。其输出速度比其他前沿模型快 4 倍，价格却不到一半，可为大规模应用的企业节省超 10 亿美元成本。
Gemini Omni：全新推出的全模态模型，支持“任何输入生成任何输出”，率先落地视频输出。它结合了 Gemini 的推理能力与媒体生成模型，具备理解物理世界、文化和上下文的“世界模型”能力。

2. 消费端产品：Search 与应用全面“智能体化”

AI 搜索颠覆式升级：AI Overviews 用户超 25 亿，AI Mode 突破 10 亿。搜索引入了能 24/7 异步工作的“信息智能体（Information Agents）”，可自动帮用户监测网络并构建自定义的持久化仪表盘。
Gemini Spark 个人智能体：推出个人 AI 助理 Spark，在 Google Cloud 支持下可 24/7 在后台执行长周期任务（无需保持电脑开机）。它将深度集成于 Android Halo 界面以及 Chrome 浏览器中。
多模态与语音应用：YouTube 推出“Ask YouTube”对话式视频导航；Docs 推出“Docs Live”，支持直接用语音“脑暴”生成和编辑文档；同时发布了将每个元素视为独立对象的 AI 图像创作工具 Google Pics。

3. 硬件基础设施：第 8 代 TPU 算力飞跃

双芯片重构：首次针对训练和推理采用不同的专用架构，推出用于大规模预训练的 TPU 8t 和专门用于推理的 TPU 8i。
跨数据中心训练：结合 JAX 和 Pathways，打破了单一数据中心的限制，可将训练无缝分布式扩展至全球超 100 万个 TPU 上，构建全球最大的训练集群。
绿色算力：两款芯片的每瓦性能（Performance-per-watt）均提升了最高达 2 倍。

4. 开发者与科学创新：Antigravity 2.0

智能体管理平台：AI 开发平台 Antigravity 2.0 推出独立桌面版，从单纯的编码工具升级为能够管理和编排“自主 AI 智能体集群”的中央控制台。
Gemini for Science：推出科学 AI 工具集，通过 Science Skills 将智能体平台连接至全球 30 多个主要生命科学数据库，加速科研攻关。

5. AI 安全与内容透明度

SynthID 水印标准确立：谷歌隐形水印技术 SynthID 已累计为超千亿媒体资产加密。今年大会上，OpenAI、Nvidia、Kakao 和 Eleven Labs 等行业巨头宣布共同采用 SynthID 标准。
内容凭证（Content Credentials）：该技术将扩展至 Search 和 Chrome，可直接识别并向用户展示内容究竟是由相机拍摄还是由 AI 生成/篡改。

I/O 2026: Welcome to the agentic Gemini era

登录后评论

暂无评论