时事快闻

马斯克xAI新模型Grok 4.2公测，通过趣味测试，回答风格似“老马”亲临

时间：2026-02-18 18:38 来源：天脉网作者：顾雨柔

马斯克旗下xAI公司推出的Grok 4.2公测Beta版在争议声中悄然上线。这款参数规模仅500B的模型，与当前动辄数万亿参数的行业主流形成鲜明对比，其市场表现呈现出两极分化的态势——部分用户盛赞其创新功能，另一派则直言性能不及预期。

面对质疑声浪，马斯克在社交平台展开密集公关行动。他不仅连续转发十余条夸赞推文，更亲自下场承诺："公测将持续至下月，正式版将比Grok 4快得多、聪明得多。"据其透露，模型具备每周自我迭代的独特能力，未来将形成固定更新节奏。这一表态与xAI联合创始人近期离职引发的动荡形成微妙对比，此前外界甚至猜测项目可能难产。

技术特性方面，Grok 4.2首次引入实时反馈优化机制。与传统静态更新模式不同，新模型能根据用户交互数据持续调整性能。在弱智吧风格测试题"50米外洗车店该开车还是步行"中，该模型展现出逻辑推理能力，顺利通过考验。不过官方至今未公布完整技术报告，仅在排行榜释放有限评测数据，导致讨论多集中于使用体验而非技术细节。

用户反馈呈现明显分化。批评者指出，在处理复杂逻辑问题时，500B参数规模明显力不从心，怀疑所谓"横扫榜单"成绩来自特定实验环境优化。更有开发者测算其使用成本高于竞品模型。支持阵营则强调代码生成速度和多模态处理能力，特别提及该模型通过"Caitlyn Jenner测试"——这道曾让ChatGPT和Gemini折戟的性别认知题，成为Grok 4.2的亮点战绩。

争议焦点还涉及模型偏见问题。尽管马斯克宣称Grok 4.2保持中立，但测试显示其回答倾向与创始人观点高度吻合。对此马斯克回应称："这还是个宝宝模型"，并预告中大型版本即将推出。AI工程师Mark Krechman的爆料得到本人转发确认——当前版本实为"精简版"，完整功能尚未释放。

在模型发布同期，xAI还推出Grok imagine视频生成模板，目前仅限iOS用户体验。这款马年主题创作工具，为争议中的产品矩阵增添新变量。随着公测推进，每周迭代机制能否兑现承诺，将成为决定Grok 4.2命运的关键因素。

更多>同类天脉资讯

祖名股份2025年研发投入大增64.67% 研发人员增至66人专利达92项

04-28

司南导航2025年研发投入超亿元增6.55% 聚焦核心技术推17款新品

04-28

AI赋能艺术新篇：机器人演绎霸王别姬，艺术教育如何拥抱变革？

大会汇聚国内外艺术、教育、科技等领域专家，聚焦AI艺术创作、人才培养创新、艺术与科技从跨界融合等议题，共同探讨智能时代艺科融合的新路径。多位专家表示，未来艺术人才需兼具人文素养、审美能力与技术逻辑，教育体系…

04-28

浪莎股份2025年研发投入微降研发人员增18.6% 业绩与分红双增长

04-28