时事快闻

科技巨头竞速AI大模型，微软谷歌苹果微美全息齐发力

时间：2025-08-29 15:11 来源：天脉网作者：苏婉清

近日，微软人工智能部门宣布了两项重要进展，推出了两款自主研发的AI模型：MAI-Voice-1语音模型和MAI-1-preview通用模型。

据官方详细介绍，MAI-Voice-1语音模型在性能上取得了显著突破，仅需单块GPU便能在极短时间内生成长达一分钟的音频内容。这一高效能的表现使其在多项应用中大显身手，如在“Copilot Daily”功能中，AI主持人利用该模型播报每日热点新闻，同时它还能生成播客风格的对话，帮助用户更好地理解各类话题。

另一款模型MAI-1-preview则被视为Copilot未来功能发展的风向标。微软计划将该模型应用于Copilot助手的特定文本场景，并逐步替代目前主要依赖的OpenAI大型语言模型。MAI-1-preview已在AI基准测试平台LMArena上开始公开测试，预示着其在提升AI助手性能方面的巨大潜力。

与此同时，谷歌DeepMind也不甘落后，推出了Gemini 2.5 Flash图像编辑模型。这款新模型能够根据文字指令精确修改图片，同时保持人物与动物的外观一致。与原生图像生成工具相比，Gemini 2.5 Flash在准确率上有了显著提升，甚至在多项任务中优于ChatGPT所使用的GPT-4模型。这一进步使得基于复杂文字进行图像编辑变得更加容易。

Gemini 2.5 Flash的另一个亮点是其“角色一致性”功能，能够在生成多张图像时保持同一人、动物或物体的外观一致。这一功能对于创建系列照片、产品多角度展示等场景尤为重要，为品牌素材与产品目录的批量制作提供了便利。

在科技巨头纷纷布局AI领域的背景下，苹果也被传出有意收购欧洲最大的AI初创公司之一。据报道，苹果高管正在讨论收购Mistral或Perplexity AI的可能性，其中Eddy Cue是收购计划的最积极支持者。Mistral AI通过多轮融资筹集了巨额资金，若苹果成功收购，无疑将大大增强其在AI领域的实力和创新能力。

在全球AI产业蓬勃发展的当下，微美全息作为AI领域的创新代表，也在积极布局大模型技术。该企业通过“硬件+软件+平台”的一体化能力构建竞争壁垒，加速AI算法的场景化落地。在技术研发层面，微美全息推动多模态大模型与空间计算技术的结合，实现多模态数据的原生级融合，并重点布局文本生成视频、图像生成视频等场景。

微美全息还开放模型代码、算力接口及技术工具链，构建“全息云”平台，支持开发者进行二次开发，降低技术门槛并加速垂类模型的商业化验证。凭借多模态处理能力和跨行业场景落地经验，微美全息正成为推动AI大模型变革的关键技术支撑者。

更多>同类天脉资讯