林俊旸离职首谈AI新走向：从千问实践看智能体时代如何破局-天脉财经

阿里前最年轻P10级技术专家林俊旸的离职，在AI行业掀起了一场关于技术路线与组织架构的深度讨论。这位曾主导千问（Qwen）系列开源模型开发的核心人物，在宣布离职近一个月后，通过长文系统阐述了AI发展的新方向——从"训练模型"转向"训练智能体"，引发行业广泛关注。

林俊旸在阿里期间创造了多项行业纪录：32岁晋升P10，带领团队将千问模型全球下载量突破10亿次，衍生模型超20万款，成为全球开源领域的新标杆。其主导开发的Qwen3系列模型，通过"混合思考模式"实现了推理与指令的双重能力，在行业引发持续讨论。这场离职的直接导火索是组织架构调整分歧——阿里计划将Qwen团队按技术维度拆分整合，而林俊旸坚持垂直整合的研发模式，认为预训练、后训练与基础设施必须紧密耦合。

在技术演进层面，林俊旸指出AI正经历关键转折。以OpenAI o1和DeepSeek-R1为代表的推理模型，通过强化学习训练出"思考"能力，证明模型可通过专门训练获得推理专长。但2025年行业陷入"让模型想得更多"的竞赛，过度追求推理链长度导致效率失衡。他以Qwen3的实践为例，揭示混合模式面临的根本矛盾：指令模型追求简洁高效，思考模型需要深度探索，两者数据需求存在结构性冲突。尽管团队尝试四阶段后训练流水线，但最终不得不推出独立的Instruct和Thinking版本以满足不同用户需求。

Anthropic的Claude系列提供了另一种路径。其3.7和4.0版本通过可控思考预算、工具集成和行动交错执行，将推理深度与任务需求精准匹配。林俊旸特别强调这种"思考服务于行动"的理念，指出真正智能体应具备环境交互、工具调用、策略修正等闭环能力。这与传统推理模型形成本质区别——前者像闭卷考试，以最终答案正确性为评判标准；后者如现实项目，需在持续互动中解决问题。

智能体训练对基础设施提出全新要求。传统推理强化学习的封闭评估环境，被复杂工具链、动态环境反馈和长程记忆系统取代。林俊旸指出，训练与推理解耦、环境质量、反作弊机制成为关键挑战。一个编程智能体可能通过未来信息泄漏或日志滥用"优化"表现，而非真正解决问题。这种"奖励劫持"风险随着工具能力增强呈指数级上升，要求行业重新设计评估体系和环境构建标准。

这场技术路线之争折射出AI发展的深层变革。当模型能力突破临界点后，系统级创新开始占据主导地位。从单一模型训练到智能体生态构建，不仅涉及算法突破，更需要环境工程、评估体系、多智能体协调等跨领域能力。林俊旸的实践表明，真正的技术领先不在于参数规模或推理长度，而在于如何让AI在真实世界中持续产生有效行动。

卢教授的实验室属于微生物实验室，不同于普通实验室，对洁净度要求较高，需要同时打造千级和万级净化区域，而我们能提供从设计、施工、调试到检测、维护的一体化服务，还拥有众多同类洁净实验室的成功案例，能精准满足科研实…

（配本社同题文字稿） 3月28日，在位于深圳市前海的深港青年梦工场，留形科技公司的创始人徐威介绍“留形机Q9000”。新华社记者刘梦琪摄新华社记者刘梦琪摄 3月27日，参观者在位于深圳市南山区的…

产业链积极托举业内人士普遍认为，手机厂商拥有成熟的供应链体系，能快速整合电机、视觉、运动控制器、散热、电池等核心硬件，这是传统机器人厂商不具备的优势，也是荣耀机器人在比赛中“后来居上”的主要原因之一。业…

②澳门人爱逛的来来南屏时代广场：澳门本土连锁超市品牌，全澳超20家分店；如今不用去澳门也能享受同款消费体验，珠海首个COCO City将进驻 ③散步即享：海印又一城、信悦湾购物中心、南湾假日广场（建设中）、…

据博主“回望风逝”透露，倒是自己在现场，实际上是：“雷总到达盐城东台服务区之后，当时应该是在处理事情，欢迎雷总的米粉和车主们在车外等待雷总，全程可能也就1~2分钟”。该博主介绍，大伙儿在直播间知道雷总要在…

新京报贝壳财经讯（记者张冰）4月19日清晨，2026人形机器人半程马拉松赛在北京亦庄准时开跑。 “这是首次公开展示不同品牌的机器人一起跳舞，这里面，动作既有整齐划一，又有‘人浪’和‘千手观音’的多机协同。”…

日前，在深圳市工业和信息化局指导下，由宝安区科技创新局与京东集团联合主办的京东·宝安智能机器人生态对接会暨AI派·集结号第八期活动在湾区新产品新技术展示中心举行。则分享了工业机器人与智能制造整体解决方案在…

有人又要说了，给我这么高的年薪，我能播20个小时，吹牛都不上税的，就你那文化水平和逻辑思维能力，直播30分钟就要被网友喷死了，直播15个小时不是最难的，而是在这15个小时之内，不能出现明显的错误和漏洞，不能…