天脉网 | 天脉新媒体中心主办！
手机版
二维码

时事快闻

当前位置：首页 > 天脉资讯 > 科技业界 > 正文内容

字节跳动Seed-Thinking-v1.5：2000亿参数模型，推理能力再突破！

时间：2025-08-22 17:48 来源：天脉网作者：朱天宇

近日，字节跳动公司发布了其最新的技术报告，详细介绍了Seed1.5-Thinking模型。该报告英文版共计19页，深入探讨了这款混合专家模型（MoE）的技术细节与性能表现。

Seed1.5-Thinking模型以其强大的推理能力脱颖而出，拥有200亿的激活参数和总计2000亿的参数规模。在多项基准测试中，该模型均取得了优异成绩。例如，在AIME 2024竞赛中获得了86.7分，Codeforces比赛中取得55.0分，GPQA测试中达到77.3分。这些成绩不仅彰显了模型在STEM和编程领域的卓越实力，还展示了其在非推理任务上的广泛适用性，相较于DeepSeek R1模型，胜率提高了8%。

在模型开发过程中，数据、强化学习（RL）算法及RL基础设施被视为三大核心要素。数据方面，监督微调（SFT）主要依赖于链式思维（CoT）数据。报告指出，过多的非CoT数据可能会削弱模型的探索能力。RL训练数据则涵盖了STEM问题、代码任务等多个类别，其中数学数据的强大泛化能力有助于提升模型在各项任务中的整体性能。

针对RL算法训练中的不稳定性问题，字节跳动团队自主研发了VAPO和DAPO框架。这两个框架分别针对演员-评论家及策略梯度范式，有效解决了训练过程中的不稳定性，确保了训练的稳健进行。

在RL基础设施方面，混合引擎架构的采用大大提升了训练效率与可扩展性。Streaming Rollout System（SRS）能够缓解长响应生成中的滞后问题，结合多种并行机制和内存优化策略，进一步提升了训练效果。

评估结果显示，Seed1.5-Thinking在数学推理领域与OpenAI的o3-mini-high模型表现相当，但在AIME 2025和BeyondAIME等更高级别的测试中仍存在一定差距。在科学领域的GPQA测试中，该模型接近o3水平；在编程方面则接近Gemini 2.5 Pro的性能。特别在逻辑推理的ARC-AGI测试中，Seed1.5-Thinking展现出了突出表现。人类评估显示，该模型在非推理场景的整体胜率超过DeepSeek R1达8.0%，且更符合人类偏好。

字节跳动的这一技术突破不仅展示了其在人工智能领域的深厚积累，也为未来模型性能的进一步提升奠定了坚实基础。

更多>同类天脉资讯

泰森食品2025财年营收超544亿美元，质量筑基，多业务协同促盈利增长

12-05

Mhmarkets迈汇：全球白银市场重塑实体需求主导开启新格局

12-05

影石推8K全景无人机入局，影石大疆双赛道交锋，CEO坦言与大疆“共生”

此次影石抢先一步发售无人机产品，也意味着影石和大疆将在全景相机、无人机两大赛道同时开战。红星资本局注意到，目前在电商平台上，大疆的首款全景相机Osmo 360已经降至2700元的区间，比影石旗舰全景相机I…

12-04

曾刚论养老金融：未来主流业务在望，保险机构闭环模式展独特优势

12-04

中国首推稀土通用出口许可助力永磁体企业合规出口提速

12-04

2025东南亚零食电商：健康本土化引领增长，新机遇下如何布局？

12-04

蔚来美股盘前反弹超3% ET9成全球唯一线控转向中欧双认证车型

12-04

女性掌舵罗素3000企业：虽占比低，却成激进投资者“高频关注对象”

世界大型企业联合会（The Conference Board）12月3日发布报告显示，2018年至2025年期间，女性仅占罗素3000指数公司首席执行官的6.3%，但同期有15.7%的激进投资者行动将目标对准…

12-04

飞书CEO谢欣倡议设AI年终奖，让普通职场人成AI时代“超级个体”

飞书CEO谢欣在大赛上提出“企业用好 AI，先看效率先锋”。随着大赛重要奖项的最终揭晓，飞书通过“AI年终奖”与机场广告焕新两大动作，向业界传递了一个清晰的信号：在AI落地应用的关键阶段，激发“人”的创造力…

12-04

烟台芝罘万达广场：刚被万达赎回旋即易主苏州联商玖号

12-04

OpenAI收购Neptune：深化合作，助力前沿模型学习机制探索

OpenAI当地时间12月3日宣布，已达成收购Neptune的最终协议，以深入了解前沿模型如何学习。 OpenAI首席科学家Jakub Pachocki在一份声明中表示：“Neptune构建了一套高效精准的系…

12-04

京东方晶芯科技注册资本增至约25.74亿持续布局相关领域

12-04

贝壳租房三季度逆势增长：省心租模式吸金，AI赋能人效跃升

12-04

凯美特气12月4日大宗交易：320.73万股折价成交成交额达6065万元

12-04

中际联合12月4日大宗交易：202.7万股折价成交，成交额达7706.67万元

12-04

点击查看更多 +

全站最新

【GET2025】松鼠Ai梁静：智适应大模型，以AI之力开启教育无界新征程

【GET2025】松鼠Ai梁静：智适应大模型，以AI之力开启教育无界新征程

80岁新泉股份创始人离世，妻子放弃继承，超20亿股份赠予子女

80岁新泉股份创始人离世，妻子放弃继承，超20亿股份赠予子女

黄仁勋忆往昔：英伟达首款AI超算DGX-1遇冷，马斯克成关键“救星”

黄仁勋忆往昔：英伟达首款AI超算DGX-1遇冷，马斯克成关键“救星”

苹果副总裁Joz中国直播带货成绩亮眼入职近四十年见证品牌发展

苹果副总裁Joz中国直播带货成绩亮眼入职近四十年见证品牌发展

普瑞金栗红建：深圳创新药崛起，中国成全球创新药新兴创新高地

普瑞金栗红建：深圳创新药崛起，中国成全球创新药新兴创新高地

影石推8K全景无人机入局，影石大疆双赛道交锋，CEO坦言与大疆“共生”

影石推8K全景无人机入局，影石大疆双赛道交锋，CEO坦言与大疆“共生”

热门内容

媒体信息

新传播周刊

新传播，传播新经济之声！

本栏最新

影石推8K全景无人机入局，影石大疆双赛道交锋，CEO坦言与大疆“共生”

影石推8K全景无人机入局，影石大疆双赛道交锋，CEO坦言与大疆“共生”

蔚来美股盘前反弹超3% ET9成全球唯一线控转向中欧双认证车型

蔚来美股盘前反弹超3% ET9成全球唯一线控转向中欧双认证车型

女性掌舵罗素3000企业：虽占比低，却成激进投资者“高频关注对象”

女性掌舵罗素3000企业：虽占比低，却成激进投资者“高频关注对象”

飞书CEO谢欣倡议设AI年终奖，让普通职场人成AI时代“超级个体”

飞书CEO谢欣倡议设AI年终奖，让普通职场人成AI时代“超级个体”

新泉股份创始人唐敖齐离世，妻子弃继承权，超20亿股权赠予一儿一女

新泉股份创始人唐敖齐离世，妻子弃继承权，超20亿股权赠予一儿一女

技术赋能体验升级！东风日产N6携大空间4nm芯片登场，9.19万起售

技术赋能体验升级！东风日产N6携大空间4nm芯片登场，9.19万起售

网站首页 | 关于我们 | 联系方式 | 版权隐私 | RSS订阅 | 违规举报

天脉网由天脉文化中心主办，立足北京，放眼全中国，做首都圈新经济、新文化、新科技资讯平台！
2009-2021 天脉网 (c) All Rights Reserved 鲁ICP备2022032383号-1