科技巨头竞速AI大模型,微软谷歌苹果微美全息齐发力

   时间:2025-08-29 15:11 来源:天脉网作者:苏婉清

近日,微软人工智能部门宣布了两项重要进展,推出了两款自主研发的AI模型:MAI-Voice-1语音模型和MAI-1-preview通用模型。

据官方详细介绍,MAI-Voice-1语音模型在性能上取得了显著突破,仅需单块GPU便能在极短时间内生成长达一分钟的音频内容。这一高效能的表现使其在多项应用中大显身手,如在“Copilot Daily”功能中,AI主持人利用该模型播报每日热点新闻,同时它还能生成播客风格的对话,帮助用户更好地理解各类话题。

另一款模型MAI-1-preview则被视为Copilot未来功能发展的风向标。微软计划将该模型应用于Copilot助手的特定文本场景,并逐步替代目前主要依赖的OpenAI大型语言模型。MAI-1-preview已在AI基准测试平台LMArena上开始公开测试,预示着其在提升AI助手性能方面的巨大潜力。

与此同时,谷歌DeepMind也不甘落后,推出了Gemini 2.5 Flash图像编辑模型。这款新模型能够根据文字指令精确修改图片,同时保持人物与动物的外观一致。与原生图像生成工具相比,Gemini 2.5 Flash在准确率上有了显著提升,甚至在多项任务中优于ChatGPT所使用的GPT-4模型。这一进步使得基于复杂文字进行图像编辑变得更加容易。

Gemini 2.5 Flash的另一个亮点是其“角色一致性”功能,能够在生成多张图像时保持同一人、动物或物体的外观一致。这一功能对于创建系列照片、产品多角度展示等场景尤为重要,为品牌素材与产品目录的批量制作提供了便利。

在科技巨头纷纷布局AI领域的背景下,苹果也被传出有意收购欧洲最大的AI初创公司之一。据报道,苹果高管正在讨论收购Mistral或Perplexity AI的可能性,其中Eddy Cue是收购计划的最积极支持者。Mistral AI通过多轮融资筹集了巨额资金,若苹果成功收购,无疑将大大增强其在AI领域的实力和创新能力。

在全球AI产业蓬勃发展的当下,微美全息作为AI领域的创新代表,也在积极布局大模型技术。该企业通过“硬件+软件+平台”的一体化能力构建竞争壁垒,加速AI算法的场景化落地。在技术研发层面,微美全息推动多模态大模型与空间计算技术的结合,实现多模态数据的原生级融合,并重点布局文本生成视频、图像生成视频等场景。

微美全息还开放模型代码、算力接口及技术工具链,构建“全息云”平台,支持开发者进行二次开发,降低技术门槛并加速垂类模型的商业化验证。凭借多模态处理能力和跨行业场景落地经验,微美全息正成为推动AI大模型变革的关键技术支撑者。

 
反对 0举报 0 收藏 0
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  RSS订阅  |  违规举报