近日,科技巨头马斯克麾下的xAI公司举办了一场引人瞩目的直播发布会,正式揭晓了其最新旗舰人工智能模型——Grok 4。
在发布会上,一个名为“HLE”(Humanities Last Exam,即人类最终考试)的评测标准被频繁提及,用以评估不同AI模型的实力。xAI不仅介绍了自家的产品,还提及了OpenAI、谷歌旗下的Gemini,以及一个名为Kimi的神秘中国团队。据悉,Kimi在上个月推出的首款Agent产品——DeepResearcher,在HLE测试中表现抢眼,超越了Gemini 2.5 Pro,略胜一筹于OpenAI的同类产品,并与Gemini-Pro的Deep Research Agent打成平手,跻身当前顶尖水平之列。
DeepResearcher在海外社交媒体上引起了热烈反响。众多AI从业者纷纷点赞这款中国制造的AI产品。有网友评论称,Kimi的DeepResearcher可能是他用过最优秀的深度研究模型,视觉效果尤为出众。更有博主对其深度研究能力和准确性给予了高度评价,认为它令人印象深刻。
AI创业者Poonam Soni在社交媒体上发文表示,ChatGPT已显老态,而Kimi推出的DeepResearcher则令人眼前一亮。她强调,这是一款基于模型的Agent,而非简单的工具套用,展现了极高的技术含量。
海外AI研究者Casper同样对Kimi赞不绝口,认为它已成为中国AI领域的顶尖选手,与DeepSeek、字节跳动等巨头并驾齐驱,共同引领行业发展。
据了解,Kimi的DeepResearcher在执行研究任务时,平均会进行23次推理,由模型自主判断并筛选出信息质量最高的内容,剔除冗余和低质信息,最终自动生成分析结论。这一过程不仅确保了研究的严谨性,还有效避免了模型幻觉的产生,为用户提供了更加准确、可靠的研究成果。