林俊旸离职首谈AI新走向:从千问实践看智能体时代如何破局

   时间:2026-03-28 02:19 来源:快讯作者:爱范儿

阿里前最年轻P10级技术专家林俊旸的离职,在AI行业掀起了一场关于技术路线与组织架构的深度讨论。这位曾主导千问(Qwen)系列开源模型开发的核心人物,在宣布离职近一个月后,通过长文系统阐述了AI发展的新方向——从"训练模型"转向"训练智能体",引发行业广泛关注。

林俊旸在阿里期间创造了多项行业纪录:32岁晋升P10,带领团队将千问模型全球下载量突破10亿次,衍生模型超20万款,成为全球开源领域的新标杆。其主导开发的Qwen3系列模型,通过"混合思考模式"实现了推理与指令的双重能力,在行业引发持续讨论。这场离职的直接导火索是组织架构调整分歧——阿里计划将Qwen团队按技术维度拆分整合,而林俊旸坚持垂直整合的研发模式,认为预训练、后训练与基础设施必须紧密耦合。

在技术演进层面,林俊旸指出AI正经历关键转折。以OpenAI o1和DeepSeek-R1为代表的推理模型,通过强化学习训练出"思考"能力,证明模型可通过专门训练获得推理专长。但2025年行业陷入"让模型想得更多"的竞赛,过度追求推理链长度导致效率失衡。他以Qwen3的实践为例,揭示混合模式面临的根本矛盾:指令模型追求简洁高效,思考模型需要深度探索,两者数据需求存在结构性冲突。尽管团队尝试四阶段后训练流水线,但最终不得不推出独立的Instruct和Thinking版本以满足不同用户需求。

Anthropic的Claude系列提供了另一种路径。其3.7和4.0版本通过可控思考预算、工具集成和行动交错执行,将推理深度与任务需求精准匹配。林俊旸特别强调这种"思考服务于行动"的理念,指出真正智能体应具备环境交互、工具调用、策略修正等闭环能力。这与传统推理模型形成本质区别——前者像闭卷考试,以最终答案正确性为评判标准;后者如现实项目,需在持续互动中解决问题。

智能体训练对基础设施提出全新要求。传统推理强化学习的封闭评估环境,被复杂工具链、动态环境反馈和长程记忆系统取代。林俊旸指出,训练与推理解耦、环境质量、反作弊机制成为关键挑战。一个编程智能体可能通过未来信息泄漏或日志滥用"优化"表现,而非真正解决问题。这种"奖励劫持"风险随着工具能力增强呈指数级上升,要求行业重新设计评估体系和环境构建标准。

这场技术路线之争折射出AI发展的深层变革。当模型能力突破临界点后,系统级创新开始占据主导地位。从单一模型训练到智能体生态构建,不仅涉及算法突破,更需要环境工程、评估体系、多智能体协调等跨领域能力。林俊旸的实践表明,真正的技术领先不在于参数规模或推理长度,而在于如何让AI在真实世界中持续产生有效行动。

 
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  RSS订阅  |  违规举报 鲁公网安备37010202700497号