字节跳动AI领域近日迎来重要人事变动:深耕AI制药与大模型预训练的顶尖学者顾全全正式宣布离职,其下一步动向引发业界高度关注。这位兼具学术深度与工程实践能力的科学家,在字节的三年间完成了从AI制药到通用大模型训练的双重跨越,其主导的多项研究成果均达到国际领先水平。
顾全全的学术履历堪称璀璨:清华大学本硕毕业后赴美深造,在伊利诺伊大学香槟分校师从数据挖掘泰斗韩家炜教授,2014年获得计算机博士学位。其研究轨迹横跨学术界与工业界,先后在普林斯顿大学、弗吉尼亚大学从事博士后研究,2018年加入加州大学洛杉矶分校(UCLA)任教,2022年同时斩获斯隆研究奖与美国国家科学基金会职业成就奖,同年晋升副教授并创立AGI实验室。他的研究方向覆盖非凸优化、深度学习理论及强化学习,在Google Scholar的引用量已突破3万次。
2023年加入字节Seed团队后,顾全全首先在AI制药领域掀起风暴。其团队开发的SeedFold模型在FoldBench综合评测中全面超越AlphaFold 3:蛋白质单体预测lDDT指标达0.8889,抗体-抗原界面DockQ得分53.21%,蛋白质-RNA界面DockQ得分65.31%。这项成果直接挑战了DeepMind的王牌项目——AlphaFold系列曾因预测蛋白质结构获得诺贝尔化学奖,第三代更将预测范围扩展至DNA、RNA等生物分子。SeedFold的成功源于其创新的架构设计,团队通过优化能量函数与结构采样策略,显著提升了复杂分子体系的预测精度。
在蛋白质设计领域,顾全全团队推出的SeedProteo模型同样表现卓越。该模型突破传统方法仅设计蛋白质骨架的局限,在全原子级别直接生成蛋白质结构。其独创的"Design View"模块通过引入空间约束引导生成过程,在10个基准靶标测试中,成功率与多样性均超越AlphaProteo、RFdiffusion等主流开源方法。这项技术为新型药物开发提供了更高效的工具链。
2025年初,顾全全完成职业生涯的重要转向:从AI制药领域抽身,全身心投入大模型预训练研究。他组建的LLM优化与扩展团队专注于解决前沿规模模型训练的稳定性问题,其搭建的预训练栈为Seed 2.0的成功训练奠定关键基础。这种转型并非偶然——他在学术界提出的SPIN(Self-Play Fine-Tuning)方法,通过让大模型与历史版本对弈实现自我进化,无需人工标注数据即可提升模型能力,该论文已被ICML 2024收录。这种"用模型训练模型"的思路,与其后续在工业界的实践形成完美呼应。
在蛋白质语言模型领域,顾全全团队持续推进通用基础模型研发。DPLM系列模型已迭代至第三代:初代模型首次将离散扩散应用于蛋白质序列预训练;DPLM-2引入多模态能力,可同步生成氨基酸序列与3D结构;最新的DPLM-Evo则在扩散过程中显式建模蛋白质进化中的替换、插入和删除操作。三代模型逐步构建起覆盖表征学习、结构预测与进化模拟的完整技术体系,相关成果分别被ICML 2024、ICLR 2025及ICML 2026接收。
这位始终站在技术变革前沿的学者,在离职推文中留下意味深长的注脚:"最好的模型还没来,Scaling不会停。"这句话既是对过往研究的总结,也暗含着对未来技术突破的期待。随着其动向逐渐明朗,AI领域正屏息以待这位跨界科学家的新征程。












