百万亿Token解码2025AI趋势：开源崛起、推理成范式、中国力量受关注-天脉财经

硅谷科技机构OpenRouter与知名风投公司a16z联合发布的《AI发展态势：基于百万亿Token的实证研究》报告，在科技圈引发广泛关注。该报告以OpenRouter平台2024年11月至2025年11月期间300余个模型的使用数据为样本，涵盖GPT系列、Claude、Gemini、DeepSeek等国内外主流模型，通过分析真实Token消耗量而非传统基准测试分数，揭示了AI发展的新趋势。

报告核心结论显示，开源模型与闭源模型的关系正从替代转向互补。预计到2025年底，开源模型使用量将占整体三分之一，其中中国开源模型表现尤为亮眼，其周使用量占比从1.2%飙升至30%，平均占比达13%，与全球其他地区开源模型的13.7%份额形成分庭抗礼之势。值得注意的是，开源市场格局已发生深刻变化——DeepSeek虽仍为最大贡献者，但其主导地位随MiniMax M2、Kimi K2等新模型涌现而被削弱，预计年底将形成5-7个模型均分市场的格局。

模型形态演变方面，中型模型正成为市场新宠。报告将模型分为大型（700亿参数以上）、中型（150-700亿参数）和小型（150亿参数以下）三类，发现小型模型逐渐失宠，中型与大型模型补位趋势明显。以Qwen2.5-Coder-32B发布为转折点，Mistral Small 3、GPT-OSS 20B等中型模型持续涌入，推动该细分市场成为新的竞争焦点。报告指出："小模型主导的时代已过去，市场正分化为新兴中型模型与顶级大型模型两极。"

语言模型的功能升级成为另一大趋势。推理模型使用量从年初的微不足道跃升至超50%，其中马斯克旗下xAI的Grok Code Fast 1占据最大推理流量份额，Gemini 2.5 Pro和Flash系列紧随其后。工具调用功能同样呈现爆发式增长，年初仅GPT-4o-mini和Claude 3.5等少数模型支持，年中后超半数模型具备该能力，Claude 4.5 Sonnet和Grok Code Fast等新玩家表现突出。报告强调："缺乏可靠工具调用能力的模型，将在企业级应用中逐渐边缘化。"

使用场景变革方面，AI正从"聊天机器人"向"智能代理"转型。用户任务复杂度显著提升，从生成短文转向分析整份文档或代码库，提示词长度增加4倍，模型推理消耗的Token量增长近3倍。典型应用场景中，编程与角色扮演占据主导地位——编程查询量从年初11%跃升至超50%，Claude系列虽仍保持60%以上份额，但OpenAI市场份额从2%增至8%，谷歌稳定在15%，Qwen、Mistral等开源模型稳步上升，MiniMax更成为近期增长最快的新秀；角色扮演领域，开源模型占比达52%，DeepSeek超三分之二流量来自该场景，显示其消费者端强粘性。

用户行为研究提出"水晶鞋效应"理论：每代前沿模型发布时，会锁定一批任务需求与模型能力完美匹配的核心用户，这些用户留存率显著高于平均水平。如Claude 4 Sonnet和Gemini 2.5 Pro发布5个月后仍保持40%留存率，得益于其在工具调用和推理能力的突破。报告指出："首个用突破性能力解决关键问题的模型，即使后续被超越，也能凭借早期积累的用户习惯和系统集成保持优势。"

地域分布上，AI发展呈现多极化趋势。亚洲地区付费使用量占比从13%翻倍至31%，北美虽仍为最大市场但份额降至不足50%。语言使用方面，英语占比82%居首，简体中文以近5%份额位列第二。价格敏感度分析显示，模型定价影响远低于预期——价格下降10%仅带动使用量增长0.5%-0.7%，且总支出未必减少，符合"杰文斯悖论"：当模型变得便宜好用时，用户会在更多场景高频调用，导致总Token量飙升。

报告同时承认局限性：OpenRouter数据主要反映开发者和服务端API调用行为，未涵盖ChatGPT等App/Web端直接访问流量；平台定价策略可能影响模型选择偏好。尽管如此，这份基于百万亿Token的实证研究，仍为理解AI发展动态提供了独特视角。

这些都为AI的指令遵循带来了混乱，而指令层级，本质上是在给大模型应对指令「混乱」建立起一套解读「权力秩序」的规则。「安全引导」展示了这样一个对比：同样面对一条包含安全系统规则的提示和一条用户请求，基线模型…

它不仅有六座布局和强劲混动，更在底盘上玩起了“逆向操作”，引发了车迷们对未来出行方式的深度思考：这到底是哈弗的又一次大胆创新，还是在市场夹缝中的一次艰难抉择？哈弗C06的出现，无疑反映了哈弗对产品定义的重新思…

打开可灵AI 点击"图片生成"，选择"图生图" 上传你的照片风格选择"人像增强"或"写实增强" 强度调到0.5-0.7之间（太低没效果，太高失真）点生成，等30秒关键参数：强度。选一张你自己的照片，…

《人工智能拟人化互动服务管理暂行办法（征求意见稿）》是一部重构网络科技与人机关系的法律秩序法，规制方向是平衡技术演进与用户安全管理，预防AI拟人化带来的负面侵权行为，核心理念是构建一套以人为本、权责清晰、科…

苹果一位发言人表示，本轮新应用增长热潮印证了应用商店的持续吸引力，以及苹果完善的开发者工具的实用价值。例如，尽管受到苹果限制，Replit发言人表示，其用户在过去几个月仍开发了近 5，000 款应用并上…

4月6日，小米创办人、董事长兼CEO雷军发文晒出小米YU7梅森·马吉拉涂装版外观。据悉，小米已官宣小米YU7将参加梅森·马吉拉2026年秋冬系列时装秀。…

最离谱的是，有乘客被困在车里将近两个小时，SOS按钮按了没用，客服电话打了20多通没人接。还有人替萝卜快跑说话，说这是系统检测到不确定状态后主动停车，是为了安全才这么做的。我理解这个逻辑，但我想反问一句：为…

在这个技术交替的节点，许多行业从业者的焦虑不再停留在“AI会不会写文章”或“AI会不会画图”这种基础层面，而是延伸到了整个工作流甚至企业组织架构被重塑的可能。如果你能在日常工作中熟练地调度和管理这些智能体工…

你有没有想过，为什么你电脑里的芯片越做越小，但AI训练却越来越耗电？但帮主做了二十年财经记者，告诉你，这件事值得你认真对待。你可能会问，太空里怎么散热？说到这儿，帮主想问问你，你觉得马斯克这个“算力上太空…

科大讯飞的智能办公本系列在市场中备受青睐，那么，科大讯飞智能办公本哪款好呢？以上三款科大讯飞智能办公本都是根据市场反馈和用户需求筛选出来的，颇受欢迎。综合考虑这些因素，就能挑选到适合自己的科大讯飞智能办公本…