小红书Hi Lab新突破:强化学习让AI思考更精简高效!

   时间:2025-06-20 12:23 来源:天脉网作者:冯璃月

近期,小红书技术团队在人工智能领域取得了新突破。据悉,该团队通过引入Test-Time Scaling技术,显著增强了其深度思考模型的推理能力。然而,这一进步也伴随着一个显著问题:模型在思考过程中产生了大量冗余和无效的思考。

为了克服这一挑战,小红书Hi Lab团队创新性地提出了“Think When You Need”的强化学习训练策略。这一策略能够在不影响模型最终效果的前提下,实现动态的链式思考(Chain of Thought)能力,从而大幅缩短了模型的平均思考长度。实验证明,这一方法不仅在推理任务中表现出色,在非推理任务中也同样具有广泛的应用潜力。

Hi Lab团队还发现了一个令人惊讶的现象:在相同任务下,参数量更大、更为智能的模型所需的思考长度反而更短。这一发现与当前深度思考模型的一般表现形成了鲜明对比,但却与人类认知过程高度一致。这一发现不仅为人工智能领域带来了新的思考,也为未来的模型优化提供了新的方向。

 
反对 0举报 0 收藏 0
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  网站留言  |  RSS订阅  |  违规举报