Google工程副总裁、Gemini模型联合负责人Noam Shazeer近日宣布,他将离开效力多年的Google,转而加入OpenAI担任新的架构研究负责人。这一消息在人工智能领域引发广泛关注,因为Shazeer是Transformer架构的核心发明者之一,其职业轨迹的转变被视为行业技术路线竞争的最新信号。
作为《Attention Is All You Need》论文的八位作者之一,Shazeer早在2017年就参与奠定了现代大模型的基础架构。从GPT系列到Claude,从Gemini到各类开源模型,几乎所有主流AI系统都沿用着Transformer的核心设计。这位技术先驱的职业生涯充满戏剧性——他曾在2000年、2012年两度加入Google,又在2021年离开创立Character.AI,2024年通过27亿美元的技术授权交易被Google重新召回,如今再度选择离开。
据知情人士透露,Shazeer与Google的"分分合合"折射出大模型研发的深层矛盾。2021年他离开时,Google因担忧安全风险拒绝发布其团队开发的对话机器人Meena,而一年后ChatGPT的爆发验证了这类产品的市场潜力。2024年回归后,Shazeer虽然成为Gemini项目的联合负责人,但Google内部对模型架构创新的保守态度,或许成为他再次出走的重要原因。OpenAI首席研究官Mark Chen在社交平台表示,公司创始人Sam Altman"等待与Shazeer合作已超过十年",这次任命标志着OpenAI在底层架构研究领域的重大突破。
当前AI行业正面临关键转折点。随着预训练规模边际收益递减,单纯扩大参数量的策略遭遇瓶颈。Google DeepMind近期发表的论文指出,Transformer架构在动态状态追踪方面存在结构性缺陷,例如难以维护持续变化的内部记忆、多轮对话中易出现逻辑矛盾等。这些发现促使头部企业将研发重心转向架构创新,包括混合专家模型(MoE)、状态空间模型、递归结构等新技术路线。
行业观察家指出,这场人才争夺战本质上是技术路线的竞争。Google虽然拥有最完整的AI研发体系,但在将研究成果转化为产品方面显得迟缓;OpenAI则通过持续的技术迭代和开放的生态策略,保持着对学术界和产业界的双重影响力。Shazeer的职业生涯轨迹,恰好映射出大模型时代技术演进的复杂图景——当行业进入"后Transformer"阶段,架构创新的能力将成为决定未来格局的核心要素。













