Google Cloud Next 2026干货盘点:TPU v8正式发布,Gemini要当企业控制平面?

说实话,看完Google Cloud Next 2026的keynote,我的第一反应是:谷歌终于想明白了。

过去几年,谷歌在AI领域给人的印象一直是「起个大早,赶个晚集」。Transformer是谷歌发明的,结果OpenAI靠GPT系列抢尽了风头。Gemini发布得也不晚,但总觉得缺了点什么——直到这次大会,我才看明白谷歌的真正野心。

TPU v8:不只是芯片升级,是架构革命

先说说最硬核的TPU v8。谷歌这次发布了两款:8t用于训练,8i用于推理。参数很吓人:推理成本降低40%,能效比提升50%。

但这都不是重点。真正值得关注的是OCS(光路交换机)和内存池化方案的落地。

以前的AI数据中心,计算和存储是绑死的。你用GPU训练大模型,显存不够就是不够,只能换更大的卡或者多卡并行。谷歌的内存池化方案把计算和存储解耦了,通过OCS实现全光互联——说人话就是,你的模型可以「看到」一个巨大的统一内存池,而不是被限制在单卡的显存里。

这招很狠。英伟达的优势在于CUDA生态和NVLink,谷歌这是在架构层面绕开竞争。Meta和Anthropic已经签了TPU v8的大单,说明业内认可度不低。

Gemini Enterprise:从模型到「控制平面」

但TPU只是基础设施,这次大会真正的主角是Gemini Enterprise Agent Platform。

谷歌的表述很有意思:他们要把Gemini从「对话工具」升级为「企业智能体的控制平面」(Control Plane)。

什么意思?以前你用AI,是跟一个模型对话,问啥答啥。现在谷歌想让你把Gemini当成一个「操作系统」——它负责调度各种Agent,管理权限,处理数据流,协调不同系统之间的交互。

配合A2A(Agent-to-Agent)协议的发布,谷歌正在构建一个智能体之间的「通信协议层」。这让人想起当年TCP/IP协议的重要性——没有统一的通信标准,互联网就只能是孤岛。A2A想要做的,就是智能体世界的通用语言。

我的看法

说实话,这个战略方向我觉得是对的。

现在做基座模型的太多了,OpenAI、Anthropic、DeepSeek、阿里、字节……大家都在卷模型能力。但企业真正需要的不是「更强的模型」,而是「更好用的AI基础设施」。

谷歌的优势在于:它有云(GCP)、有芯片(TPU)、有模型(Gemini)、有企业客户基础。把这些串起来做成「智能体操作系统」,比单纯卖API有想象力得多。

当然,挑战也不小。A2A协议能不能成为行业标准?开发者买不买账?企业客户愿不愿意把核心系统交给谷歌调度?这些问题都需要时间验证。

但至少,谷歌找到了自己的差异化定位——不做最好的模型,做最好的AI基础设施。

这事儿挺有意思的,值得持续关注。