时事快闻

马斯克AI再发力！Grok 4.1智商情商双提升霸榜，团队“全华班”引热议

时间：2025-11-18 15:48 来源：天脉网作者：顾青青

人工智能领域再掀波澜，马斯克旗下xAI公司推出的Grok 4.1大模型正式亮相，凭借“智商情商双突破”的定位，向行业标杆GPT-5.1发起挑战。这款新模型不仅在技术性能上实现跃升，更以独特的情感交互能力引发关注，标志着大模型竞争进入新阶段。

据xAI官方披露，Grok 4.1分为Thinking（推理版）和标准版两个版本，目前已通过Grok官网、X社交平台及移动端应用向全球用户开放免费体验。在权威评测平台LMArena的最新榜单中，推理版以1483分的成绩登顶全球大模型排行榜，较第二名Gemini 2.5 Pro高出31分；标准版则紧随其后占据亚军位置。这一结果直接改写了现有竞争格局，显示出xAI在技术迭代上的强劲势头。

情感智能成为本次升级的核心亮点。在专门测试情商的EQ-Bench3评测中，Grok 4.1 Thinking以1586分刷新纪录，标准版同样位列第二，领先于国产模型Kimi K2。实测场景中，新模型展现出显著进步：不仅能耐心倾听用户诉求，更会通过共情性回应建立情感连接，甚至在对话结尾添加爱心符号等细节设计。这种拟人化交互模式，标志着大模型从工具属性向陪伴属性的重要转变。

技术层面，xAI通过三项关键创新实现突破。首先在强化学习框架上，团队将RLHF（人类反馈强化学习）技术推向新高度，利用真实对话数据与智能体奖励模型构建双重评估体系。其次，通过扩大训练规模10倍，显著提升了模型推理能力。最后，针对行业普遍存在的“幻觉”问题，新模型将错误率从12.09%压缩至4.22%，同时创意写作能力提升600分，输出内容兼具逻辑性与文学性。负责后训练的Dustin Tran透露，这些改进得益于由十几名工程师组成的精干团队，他们通过持续优化算法架构，使模型在保持高效的同时具备更强的自适应能力。

值得关注的是，xAI的研发团队构成引发行业热议。近期流传的团队合影显示，核心成员以华人科学家为主，这种人才聚集现象被解读为马斯克战略布局的重要信号。有分析认为，这种技术团队的国际化与本土化结合模式，可能为AI研发带来新的范式突破。

尽管Grok 4.1来势汹汹，但马斯克在访谈中坦言，真正值得期待的是计划于明年发布的Grok 5。这款被定位为“通向AGI关键一步”的模型，预计参数规模将达6万亿级，需要前所未有的计算资源支持。当前推迟发布的原因，既包含硬件层面的资源调配挑战，也涉及对模型安全性的严苛测试要求。这种谨慎态度反映出，在追求技术突破的同时，行业对AI伦理的重视已达到新高度。

更多>同类天脉资讯

石头科技：以技术创新拓展智能清洁边界，引领智能家居迈向空间管理新时代

这项创新不仅提升了设备对障碍物的识别能力，还赋予其完成开合抽屉、整理物品等拟人化动作的能力，为智能家居场景注入了更多可能性。石头科技通过持续的技术突破，不仅重新定义了清洁机器人的功能边界，更在推动整个行业向空…

05-20

深圳后浪订货会：控区控货助力服装业破局，开启线下价值主场新征程

05-20

Figure AI机器人与人类10小时包裹分拣对决人类虽险胜但机器人潜力引热议

自上周三起，多款人形机器人便在 Figure AI总部的环形传送带上分拣包裹。不少观众直言这场直播“莫名上头”，还将其称作“机器人治愈白噪音”，Figure AI 甚至顺势推出了这款分拣包裹人形机器人的周…

05-20

云深处科技募资25亿冲刺科创板，以高毛利底气开启具身智能跃升之路

这是一个极具含金量的指标，它意味着其产品已经真正扎进了电网巡检、工厂制造、特种作业等极为复杂的真实行业场景中。通过深耕垂直场景赚取高额的技术与解决方案溢价，让它在规模彻底爆发的前夜，就已经具备了极强的自我造血…

05-20