时事快闻

谷歌Gemini 3发布即登顶：碾压竞品获马斯克点赞，训练依托TPU显实力

时间：2025-11-19 15:31 来源：快讯作者：王婷

人工智能领域迎来重磅消息——谷歌正式推出其最新一代大模型Gemini 3。这款被寄予厚望的模型在发布前就已引发广泛关注，如今凭借多项突破性表现，迅速成为行业焦点。

在性能评测中，Gemini 3展现出压倒性优势。它以1501分的成绩登顶LMArena大模型竞技场，超越了马斯克旗下xAI最新发布的Grok 4.1模型。具体测试数据显示，在未借助任何外部工具的情况下，Gemini 3 Pro在"人类终极考试"中得分率达37.5%；GPQA Diamond基准测试准确率高达91.9%；数学领域"地狱模式"测试MathArena Apex中，以23.4%的得分率树立新标杆。这些数据充分证明其在推理能力和多模态处理方面的卓越实力。

该模型在跨领域问题解决方面同样表现惊艳。在MMMU-Pro测试中取得81%的成绩，Video-MMMU测试达87.6%，SimpleQA Verified基准测试获得72.1%的得分。这些突破意味着Gemini 3 Pro已具备处理科学、数学等复杂主题问题的能力，其事实准确性达到行业领先水平。更引人注目的是，在AI图灵测试"ARC-AGI-2"中，它以31.1%的得分远超GPT-5.1的17.6%，展现出接近人类思维的推理能力。

OpenAI首席执行官山姆·奥特曼和xAI创始人埃隆·马斯克均对这款新模型给予高度评价。奥特曼在社交媒体表示"Gemini 3看起来很不错"，马斯克则简单回应"干得很好"。这种来自竞争对手的认可，从侧面印证了Gemini 3的技术突破。

谷歌此次采取激进的产品落地策略。发布当日即全面整合Gemini 3至搜索服务，这是谷歌首次在产品发布同步引入最新模型。同时，该模型通过Gemini应用、AI Studio、Vertex AI开发者平台，以及全新智能体开发平台Google Antigravity向用户开放。这种全方位的生态布局，显示出谷歌用AI重构产品体系的雄心。

在应用场景方面，Gemini 3展现出惊人的多功能性。它既能编写代码可视化托卡马克等离子体流动，又能创作捕捉物理原理的诗歌；可以解读多语言手写食谱并生成数字化版本，也能通过分析学术论文和讲座视频生成交互式学习工具；甚至能担任运动教练，通过视频分析提出改进建议并制定训练计划。这些能力覆盖知识学习、创意创作、专业指导等多个领域。

技术架构层面，Gemini 3实现重大升级。其工具使用能力较前代提升30%，不仅能精准选择合适工具，更能理解复杂任务的工具组合需求。这种进步使其成为首个在模型界面集成通用Agent能力、支持多任务执行的产品。配合全新发布的Google Antigravity开发平台，开发者现在可以借助AI自主规划执行复杂软件任务，实现代码编写与验证的全流程自动化。

值得关注的是，Gemini 3的训练完全基于谷歌自研TPU芯片。在全球AI企业普遍受制于GPU供应的背景下，这种技术自主性为其模型迭代提供了独特优势。谷歌强调，该模型通过了最全面的安全评估体系，具备更强的抗攻击能力和更低的偏见风险，在安全性方面树立新标准。

随着Gemini 3的入场，大模型竞争进入新阶段。这款集推理能力、多模态处理、工具使用和安全性能于一身的模型，不仅重新定义了技术标杆，更通过生态整合策略展现出改变行业格局的潜力。人工智能的发展轨迹，正因这样的突破性创新而加速改变。

更多>同类天脉资讯