文章是谷歌 CEO Sundar Pichai 在 Google I/O 2026 大会上的演讲摘要,核心宣告了谷歌全面进入 “智能体 Gemini 时代”(Agentic Gemini Era)。文章展示了谷歌在 AI 全栈领域(从算力基础设施、底层模型到消费端产品及安全)的最新突破:
1. 底层模型:Gemini 3.5 与多模态 Omni 诞生
- Gemini 3.5 Flash:正式发布,兼顾前沿智能与超快行动力,性能在多数基准测试中超越 3.1 Pro。其输出速度比其他前沿模型快 4 倍,价格却不到一半,可为大规模应用的企业节省超 10 亿美元成本。
- Gemini Omni:全新推出的全模态模型,支持“任何输入生成任何输出”,率先落地视频输出。它结合了 Gemini 的推理能力与媒体生成模型,具备理解物理世界、文化和上下文的“世界模型”能力。
2. 消费端产品:Search 与应用全面“智能体化”
- AI 搜索颠覆式升级:AI Overviews 用户超 25 亿,AI Mode 突破 10 亿。搜索引入了能 24/7 异步工作的“信息智能体(Information Agents)”,可自动帮用户监测网络并构建自定义的持久化仪表盘。
- Gemini Spark 个人智能体:推出个人 AI 助理 Spark,在 Google Cloud 支持下可 24/7 在后台执行长周期任务(无需保持电脑开机)。它将深度集成于 Android Halo 界面以及 Chrome 浏览器中。
- 多模态与语音应用:YouTube 推出“Ask YouTube”对话式视频导航;Docs 推出“Docs Live”,支持直接用语音“脑暴”生成和编辑文档;同时发布了将每个元素视为独立对象的 AI 图像创作工具 Google Pics。
3. 硬件基础设施:第 8 代 TPU 算力飞跃
- 双芯片重构:首次针对训练和推理采用不同的专用架构,推出用于大规模预训练的 TPU 8t 和专门用于推理的 TPU 8i。
- 跨数据中心训练:结合 JAX 和 Pathways,打破了单一数据中心的限制,可将训练无缝分布式扩展至全球超 100 万个 TPU 上,构建全球最大的训练集群。
- 绿色算力:两款芯片的每瓦性能(Performance-per-watt)均提升了最高达 2 倍。
4. 开发者与科学创新:Antigravity 2.0
- 智能体管理平台:AI 开发平台 Antigravity 2.0 推出独立桌面版,从单纯的编码工具升级为能够管理和编排“自主 AI 智能体集群”的中央控制台。
- Gemini for Science:推出科学 AI 工具集,通过 Science Skills 将智能体平台连接至全球 30 多个主要生命科学数据库,加速科研攻关。
5. AI 安全与内容透明度
- SynthID 水印标准确立:谷歌隐形水印技术 SynthID 已累计为超千亿媒体资产加密。今年大会上,OpenAI、Nvidia、Kakao 和 Eleven Labs 等行业巨头宣布共同采用 SynthID 标准。
- 内容凭证(Content Credentials):该技术将扩展至 Search 和 Chrome,可直接识别并向用户展示内容究竟是由相机拍摄还是由 AI 生成/篡改。