亚马逊云科技re:Invent 2025:以创新为笔,绘就Agentic AI时代新蓝图

   时间:2025-12-09 18:19 来源:快讯作者:陈丽

在科技行业的激烈竞争中,亚马逊云科技于近期举办的re:Invent全球大会上,凭借一系列创新成果,有力回应了外界对其创新步伐的质疑,展现出在AI时代持续领跑的强大实力。

在业务规模与稳定性方面,亚马逊云科技交出了令人瞩目的成绩单。其年度经常性收入(ARR)高达1320亿美元,占据全球37.5%的市场份额,成为全球数字经济当之无愧的“公共底座”。每天处理超过2亿次请求,存储对象量突破500万亿个,这些数据充分彰显了其在超大规模考验下的稳定与可靠。对于寻求将关键业务AI化的企业而言,这种“基础设施级”的保障至关重要。在Agent时代,AI应用将从实验走向7x24小时不间断的核心生产流程,唯有历经如此大规模考验的稳定性,才能成为企业业务发展的生命线。全球超过10万家企业选择亚马逊云科技的AI平台Amazon Bedrock,正是这种信任从传统云时代向AI时代自然延伸的有力证明。

亚马逊云科技对客户复杂需求的深刻理解与尊重,体现在其开放的生态构建策略上。它没有强迫客户在自研模型与外界明星模型间做出单一选择,而是通过Amazon Bedrock平台,集成了来自17家厂商的数十款模型,涵盖亚马逊Nova、谷歌Gemini、OpenAI GPT以及中国DeepSeek、阿里千问、Kimi等。这种包容开放的姿态,向企业传递了一个明确信号:平台的价值在于确保客户的成功,而非推销特定产品。企业无需押注于单一技术路线,可以自由组合、灵活演进,这种领导者胸襟为生态的繁荣发展奠定了坚实基础。

此次大会上,亚马逊云科技将核心主线明确指向All for Agentic AI。首席执行官Matt Garman在演讲中反复提及“Agent”,将其定位为下一代应用的基本单元。他指出,AI Agent正引领AI发展迈向关键拐点,未来每家公司、每一个领域都将运行数十亿个Agent。为支撑这一愿景,Matt Garman将企业落地AI的挑战系统解构为四大支柱:AI基础设施、模型生态、数据基座与开发者工具。这一完整的价值实现框架表明,亚马逊云科技提供的不是孤立的技术,而是支撑Agent发展的全方位系统。

早在Agent概念尚未广泛普及之时,亚马逊云科技便已前瞻性地开始编织支撑其落地的四大支柱,在Agentic AI战场率先构筑起系统竞争力。它所定义的Agent,并非简单的聊天机器人式辅助,而是具备自主规划、调用工具、跨会话记忆能力的下一代应用基本单元。这意味着云计算的经典三层架构将被“Agent + Token”取代,所有底层资源最终服务于Agent的7×24小时运转。

为实现这一目标,亚马逊云科技构建了一套层级分明、务实落地的完整能力栈。在底层,是承载Agent运行的AI基础设施和模型生态;中间层,全新升级的Amazon Bedrock AgentCore作为关键性“构建工具”脱颖而出。这个被下载超过200万次的SDK,致力于解决企业构建可信Agent的核心痛点——可控、可靠、可评估。它通过自然语言策略(AgentCore Policy)为Agent设置安全护栏,通过13个维度的自动化评估(AgentCore evaluations)持续监控表现,还创新性地赋予Agent“情景记忆”(Episodic Memory),使其能跨会话记忆上下文,像人类一样持续学习。这些能力直击企业“不敢让AI自主行动”的顾虑,将Agent从实验室玩具转变为可托付关键任务的生产力。

面向垂直场景,亚马逊云科技推出了开箱即用的Frontier Agents,展现了其战略雄心。这些已经过内部大规模验证的数字员工,能直接重塑软件生命周期。例如,Kiro autonomous agent能够理解宏观目标,自主规划、编码、测试。一个原需30人18个月完成的重构项目,在Kiro辅助下,仅需6人76天即可完成。其标志性的“小幽灵”Logo,寓意着亚马逊云科技产品从冰冷资源立方体向有温度、懂协作伙伴的演进。Amazon Security Agent则将安全前置到设计与开发阶段,自动审查代码漏洞,将昂贵的渗透测试变为按需服务,多媒体巨头Adobe借此确保全球营销活动符合版权与品牌规范。Amazon DevOps Agent作为虚拟运维专家,能关联复杂系统日志与数据,快速定位根因,推动系统自愈,实现运维向“系统自治”的转变。这些Agent的发布,体现了亚马逊云科技对Agent价值的深刻理解:释放真正生产力,在于让AI接管完整、跨工具、跨流程的复杂工作流,而非仅完成单一指令。

在算力支撑方面,亚马逊云科技推出的自研芯片Trainium3成为驱动Agent帝国的关键引擎。当数以十亿计的Agent7x24小时不间断推理、规划、执行,Token消耗呈天文数字增长,成本成为Agent规模化落地的首要障碍。Trainium3的战略意义在于通过降低AI普及门槛,牢牢把握算力成本控制权。基于3nm先进制程,每兆瓦电力产生的Token数量是上一代的5倍,训练成本最多可降低50%。这意味着运行同样Agent工作负载,企业算力账单可能减半甚至更低,对Agent大规模部署至关重要。其价值不仅体现在单颗芯片性能,更在于系统级工程。集成到Amazon Trainium3 UltraServer服务器中,单台最多集成144颗芯片,总算力高达362 PFlops。通过定制的NeuronSwitch高速互联技术,芯片间延迟压至10微秒以下,构建出堪比“超级计算机”的紧密算力单元,专门优化Agent应用所需的长上下文、多模态推理及复杂工作流调度。这场成本革命对亚马逊云科技具有双重战略意义:对内巩固全栈AI竞争壁垒,自研芯片与自研模型(如Amazon Nova)深度协同,实现从硅到模型的端到端效率优化;对外提供极致性价比,让客户享受更低成本算力,同时与英伟达GPU共存策略兼顾尖端客户需求与成本底线。

生成式AI的巨大变革,使云基础设施站在重要十字路口。亚马逊云科技实用计算高级副总裁Peter DeSantis认为,生成式AI对云基础设施的挑战集中在四个层面。首先是成本与效率的极限博弈,训练大模型需数百亿美元数据中心投资,运行推理成本更为惊人,迫使云提供商在架构设计各环节创新。其次是弹性边界重新定义,推理工作负载行为模式与传统计算不同,简单推理请求包含预处理、解码、后处理三阶段,各阶段对系统压力类型各异。第三是AI应用对延迟敏感度更高,实时交互、视频生成等场景要求毫秒级响应,而模型规模扩大和复杂度提升使低延迟处理海量请求成为难题。最后是安全与隐私要求更高,AI处理企业核心数据和个人隐私信息时,安全需贯穿数据生命周期每个环节,在共享云环境中确保模型权重和客户数据绝对安全成为新技术门槛。

亚马逊云科技围绕底层硬件创新给出应对答案。自研芯片从消除虚拟化性能抖动的Amazon Nitro System起步,演进至为核心工作负载量身定制的Graviton处理器。新发布的Amazon Graviton5处理器将L2缓存翻倍,性能提升30%,基于其的M9G实例使Airbnb性能提升25%、SAP事务处理速度提升60%,苹果等企业实测Swift应用迁移后性能升40%、成本降30%。面对AI推理负载,设计Mantle推理引擎,承认请求异质性,通过Bedrock服务层允许客户根据实时、标准、后台等不同紧迫性分配请求,实现资源智能调度。通过Journal持久化事务日志,使长时间推理任务故障或中断后能从精确断点恢复,结合动态调度策略让模型微调等后台任务与实时流量波谷错峰运行,极大提升集群整体利用率与经济效益。为释放硬件潜力,同步升级Neuron开发者套件,NIKKI语言让开发者进行底层内核优化,Neuron Explorer提供可视化性能分析与自动化调优建议。

 
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  RSS订阅  |  违规举报