马斯克旗下xAI公司推出的Grok 4.2公测Beta版在争议声中悄然上线。这款参数规模仅500B的模型,与当前动辄数万亿参数的行业主流形成鲜明对比,其市场表现呈现出两极分化的态势——部分用户盛赞其创新功能,另一派则直言性能不及预期。
面对质疑声浪,马斯克在社交平台展开密集公关行动。他不仅连续转发十余条夸赞推文,更亲自下场承诺:"公测将持续至下月,正式版将比Grok 4快得多、聪明得多。"据其透露,模型具备每周自我迭代的独特能力,未来将形成固定更新节奏。这一表态与xAI联合创始人近期离职引发的动荡形成微妙对比,此前外界甚至猜测项目可能难产。
技术特性方面,Grok 4.2首次引入实时反馈优化机制。与传统静态更新模式不同,新模型能根据用户交互数据持续调整性能。在弱智吧风格测试题"50米外洗车店该开车还是步行"中,该模型展现出逻辑推理能力,顺利通过考验。不过官方至今未公布完整技术报告,仅在排行榜释放有限评测数据,导致讨论多集中于使用体验而非技术细节。
用户反馈呈现明显分化。批评者指出,在处理复杂逻辑问题时,500B参数规模明显力不从心,怀疑所谓"横扫榜单"成绩来自特定实验环境优化。更有开发者测算其使用成本高于竞品模型。支持阵营则强调代码生成速度和多模态处理能力,特别提及该模型通过"Caitlyn Jenner测试"——这道曾让ChatGPT和Gemini折戟的性别认知题,成为Grok 4.2的亮点战绩。
争议焦点还涉及模型偏见问题。尽管马斯克宣称Grok 4.2保持中立,但测试显示其回答倾向与创始人观点高度吻合。对此马斯克回应称:"这还是个宝宝模型",并预告中大型版本即将推出。AI工程师Mark Krechman的爆料得到本人转发确认——当前版本实为"精简版",完整功能尚未释放。
在模型发布同期,xAI还推出Grok imagine视频生成模板,目前仅限iOS用户体验。这款马年主题创作工具,为争议中的产品矩阵增添新变量。随着公测推进,每周迭代机制能否兑现承诺,将成为决定Grok 4.2命运的关键因素。













