科技巨头马斯克近期宣布了一项重大突破,推出了名为Grok 4的人工智能模型,声称这是AI领域的一次革命性飞跃。
据马斯克介绍,Grok 4不仅仅是一个普通的AI模型,它是一个强大的推理引擎,能够处理文本和图像输入,并具备函数调用和结构化输出的能力。这一特性使得Grok 4在处理复杂问题时显得尤为出色。
在技术上,Grok 4拥有一个256K token的上下文窗口,虽然这一数字略低于Gemini 2.5 Pro的1M token窗口,但已经超越了Claude 4 Sonnet、Claude 4 Opus以及R1 0528等其他知名模型。在定价方面,Grok 4保持了与Grok 3相当的价位,即每百万输入/输出token收费3/15美元,尽管这一价格高于Gemini 2.5 Pro和近期降价的o3,但与Claude 4 Sonnet持平。
性能上,Grok 4每秒能输出75个token,虽然不及o3、Gemini 2.5 Pro和Claude 4 Sonnet Thinking,但超过了Claude 4 Opus Thinking。然而,真正令人瞩目的是Grok 4在多个基准测试中的卓越表现。在Humanity’s Last Exam、MMLU-Pro、AIME 2024、AIME25以及GPQA等评估指标上,Grok 4均位居榜首,超越了OpenAI的o3和Google的Gemini 2.5 Pro。
马斯克对Grok 4的评价极高,他表示:“根据我的亲身体验,Grok 4是首个能够解决真实世界中复杂工程问题的AI模型,这些问题往往难以在互联网或书籍中找到答案。更令人兴奋的是,Grok 4的能力还将持续提升。”马斯克还特别强调了Grok 4在编程方面的能力,称其能够分析并修复完整的源代码文件,使用体验甚至优于Cursor。
马斯克还透露了xAI未来的产品规划。据悉,一款全新的AI编程模型将于8月面世,而一个多模态智能体则计划在9月推出,视频生成模型则定于10月发布。这一系列新产品的问世,无疑将进一步推动人工智能技术的发展和应用。