前千问大模型技术负责人林俊旸在社交平台发布长文,首次公开离职后对大模型技术演进方向的深度思考。他指出,2025年上半年行业聚焦于提升模型"推理式思考"能力,即通过延长思考时间优化答案质量,但这种路径已触及瓶颈。以OpenAI o1和DeepSeek-R1为代表的模型证明,推理能力可通过特定训练方式实现,但单纯延长推理链并不等同于模型智能水平的提升。
林俊旸提出,下一代AI系统应转向"智能体式思考"模式。这种模式强调模型在真实环境交互中动态调整策略,通过持续接收环境反馈优化行动方案。他以千问团队2025年初的探索为例,说明构建统一系统面临的技术挑战:当试图融合思考模式与指令模式时,两种模式的数据分布差异导致模型表现失衡,既无法产生精准思考,也难以执行可靠指令。
实验数据显示,强行合并两种模式会导致系统在两个维度上均表现平庸。思考行为出现冗余计算,指令执行缺乏清晰性,整体成本超出商业应用预期。这一发现促使团队在2025年下半年调整策略,推出Qwen 2507版本的独立Instruct和Thinking模型,分别针对300亿和2350亿参数规模进行优化。
技术路径的转变引发评估体系的重构。传统推理式思考以内部思辨质量为标准,如定理证明、代码生成等基准测试;而智能体思维更关注模型在环境交互中的持续进展能力。这要求训练目标从单一模型转向"模型+环境"的复合系统,环境设计、多智能体协调、评估器稳定性等要素成为核心考量。
"好的思考应是在真实约束下最能支撑有效行动的轨迹。"林俊旸强调,智能体时代需要建立平滑的推理力度光谱,使模型能根据任务复杂度自动调节计算资源投入。这种转变标志着行业从训练静态模型向训练动态智能体的范式迁移,其核心挑战在于构建能够模拟真实世界复杂性的训练环境。
千问团队的实践显示,当模型架构、训练数据与环境设计形成协同效应时,系统在机器人控制、复杂决策等场景中的表现显著提升。这种技术演进方向正在重塑AI产业链,从芯片设计到云服务架构,从数据采集到评估标准,整个生态系统都在适应智能体时代的新要求。











