谷歌DiffusionGemma文本扩散模型发布：本地推理加速性能与效率双突破-天脉财经

谷歌近日宣布推出一款名为DiffusionGemma的开放AI模型，该模型基于文本扩散机制构建，在本地推理速度上较传统自回归模型实现4倍提升。这一突破性进展为低带宽计算环境下的AI应用提供了新选择，尤其在需要快速响应的场景中展现出显著优势。

与传统自回归模型（如GPT系列）采用从左到右逐个生成Token的方式不同，DiffusionGemma通过扩散机制并行处理所有Token。该模型从随机噪声开始，逐步优化输出内容，这种并行计算模式大幅减少了内存带宽压力，特别适合本地设备运行。实验数据显示，其采样速度可达1479 Tokens/秒，单次生成开销仅0.84秒，在代码生成、数学推理等任务中效率提升尤为明显。

在性能评估方面，DiffusionGemma展现出不俗实力。代码生成任务中，LiveCodeBench得分30.9%，BigCodeBench达45.4%，Humaneval基准测试取得89.6%的成绩，与Gemini 2.0 Flash-Lite形成竞争态势。数学能力表现突出，在AIME 2025测试中取得23.3%的准确率，超越对比模型3.3个百分点。不过，模型在科学推理（GPQA Diamond 40.4%）和复杂推理（BIG-Bench Extra Hard 15.0%）任务中仍落后于主流模型，显示出架构优化空间。

开源策略方面，谷歌选择Apache 2.0许可证开放模型权重，用户可通过Hugging Face平台直接下载使用。尽管模型规模与Gemma 4系列相当，但其推理效率显著提升，且支持迭代优化机制——在生成过程中可主动检测并修正错误，输出稳定性较前代产品提高37%。这种特性使其在对话系统、实时翻译等需要低延迟的场景中具有应用潜力。

硬件适配性测试显示，DiffusionGemma能充分发挥英伟达GPU的并行计算优势。在单块H100 GPU上，模型实现每秒1000 Token的生成速度；DGX Spark集群环境下为150 Tokens/秒；DGX Station工作站更达到2000 Tokens/秒的峰值性能。这种效率提升主要得益于扩散架构与Tensor Core的深度协同，使得模型在保持精度的同时，计算资源利用率较自回归模型提高4倍。

行业分析师指出，该模型的推出标志着AI生成技术从序列处理向并行处理的范式转变。虽然当前版本在复杂推理任务中仍有局限，但其架构设计为后续优化提供了新方向。特别是对于移动端、边缘计算等资源受限场景，扩散机制可能成为突破性能瓶颈的关键技术路径。

传统扫地机器人在处理液体垃圾时往往显得力不从心，然而石头科技的研发团队针对这一痛点进行了深入研究，成功开发出一种特殊的吸入通道设计。石头科技通过持续的技术迭代与专利布局，正在重塑行业竞争格局，为传统家电企业…

他以软件方面的情感陪护大模型举例称，“与工业场景中的打工人形机器人不同，家庭陪伴场景对情感交互能力要求更高，需要机器人能够理解用户语言、生成合适回应，并通过表情与动作实现互动。” “与工业人形机器人不同，超仿…

公司方面表示，本轮融资将重点用于底层世界模型算法迭代、物理引擎升级、数据基础设施建设、人形机器人能力完善与真实场景落地，持续加速技术、产品与商业闭环进化。贾奎提到，世界模型概念近几年从视频生成、自动驾驶等…

论坛聚焦手术机器人从基础研究向临床产品的转化路径，参会者涵盖全球手术机器人领域顶级学者及创新企业代表。她在论坛上介绍了锟铻®全骨科机器人从研发到临床落地、再到海外商业化的实践路径，其中开放平台模式引发与会专家…

上纬新材CEO田华日前接受了界面新闻等媒体的采访，这是田华履新首席执行官以来首次正式对外发声，同时也是上纬新材首次对外详细拆解其在个人机器人赛道的布局逻辑。他说所有技术难题最后都是材料问题，上纬新材在轻量化…

山东钢铁公告，2026年6月29日-30日，董事长郭小龙、董事兼总经理李洪建分别增持15万股、18.9万股，增持金额分别为18.6万元、23.44万元。二人计划自增持日起6个月内，以自有资金分别增持不低于5…

截至上午收盘，紫光股份股价为28.86元/股，最新市值为825亿元。紫光股份6月29日晚公告，公司第九届董事会于近日收到董事长于英涛的书面辞职报告，于英涛因个人原因申请辞去董事长、董事及董事会可持续发展委…

IT之家 6 月 30日消息，据紫光股份、新华三公告，原紫光股份董事长、新华三总裁兼首席执行官于英涛近日申请因个人原因辞去在紫光股份及子公司（含新华三）的任何职务，辞职报告获得企业批准。紫光股份同意选举新…

谷歌DiffusionGemma文本扩散模型发布：本地推理加速 性能与效率双突破

谷歌DiffusionGemma文本扩散模型发布：本地推理加速性能与效率双突破