DeepSeek与Kimi技术“撞车”背后:中国开源AI双子星携手改写全球格局

   时间:2026-04-27 00:25 来源:快讯作者:大河财立方

中国AI开源领域迎来重大突破,DeepSeek与Kimi两大模型近期接连发布新一代产品,引发全球技术社区高度关注。4月24日,沉寂15个月的DeepSeek正式开源全新模型DeepSeek-V4,该模型支持百万词元超长上下文,在Agent能力、世界知识储备及推理性能方面实现质的飞跃,被海外开发者誉为"鲸鱼回归"。同日发布的Artificial Analysis智能指数榜单显示,DeepSeek V4 Pro(Max)以52分跃居全球开源模型第二位,较上一代提升10分。

仅隔四天,中国另一开源力量Kimi发布万亿参数模型Kimi K2.6,该模型以54分成绩登顶Humanity’s Last Exam全工具测试,在DeepSearchQA深度检索任务中取得92.5%的领先得分。值得关注的是,K2.6成为全球前五开源模型中唯一支持图片与视频理解的多模态模型,其余四款均为纯文本模型。这两款万亿参数级模型的密集发布,标志着中国AI开源阵营正式向国际巨头发起挑战。

在底层架构创新方面,两家企业展现出深度技术协同。DeepSeek V4训练方案中引入的Muon优化器,其技术源头可追溯至Kimi团队2025年2月发表的论文《Muon is Scalable for LLM Training》。该论文首次验证Muon在480亿参数模型中的有效性,为后续万亿参数模型训练奠定基础。Kimi K2.6通过改进该优化器,在相同训练量下实现2倍token效率提升,而DeepSeek V4则将其列为架构层三大关键升级之一,显著增强训练稳定性。英伟达GTC 2026大会上,黄仁勋选择Kimi K2.5作为展示Blackwell Ultra芯片性能的基准模型,进一步印证中国开源模型的技术影响力。

商业竞争层面,中国开源模型展现出显著成本优势。OpenAI在DeepSeek V4发布前夕推出的GPT-5.5,每百万输出token定价30美元,而DeepSeek V4 Pro仅需24元人民币(约3.4美元),价格仅为前者的十分之一。价格策略背后,是国产算力生态的突破性进展——DeepSeek V4明确支持华为昇腾950芯片,通过芯模协同技术实现高吞吐推理部署;Kimi K2.6则采用国产芯片混合推理方案,从K2 Thinking版本开始应用的INT4量化技术,使其对国产加速芯片兼容性提升40%。华为官方披露,昇腾超节点已完成对两大模型的全面适配,预计下半年批量上市后将推动服务价格进一步下探。

这场技术竞赛的参与者,是两位来自广东的创业者——量化投资出身的梁文锋与学术背景深厚的杨植麟。尽管年龄相差八岁,但两人均将开源视为AI发展的核心驱动力。梁文锋团队通过DeepSeek构建起从推理模型到多模态系统的完整技术栈,杨植麟团队则凭借Kimi在数学推理与混合架构领域建立优势。这种差异化竞争与协同创新并存的模式,正在重塑全球AI产业格局。meta最新发布的Muse Spark模型,直接将DeepSeek与Kimi作为基准对比对象,印证中国开源力量已成为国际巨头不可忽视的竞争对手。

 
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  RSS订阅  |  违规举报 鲁公网安备37010202700497号