AWS re:Invent 2025 | 以全栈工程化能力,让AI从演示走向生产力
在2025年AWS re:Invent大会的主会场,AWS CEO Matt Garman抛出的观点精准概括了行业转折:“当大模型的参数竞赛进入尾声,真正的价值战场已转向落地工程化——让AI在企业真实场景中安全、经济、高效地创造价值。”

AWS人工智能副总裁Swami Sivasubramania从自研芯片到模型平台,从智能体工具到治理体系,这场大会通过Matt Garman与AWS人工智能副总裁Swami Sivasubramania主导的一系列发布,清晰展现了AWS推动AI从技术演示走向核心生产力的全栈布局。
算力基建:自研与生态双轮驱动的成本革命
AI落地的第一道关卡,是算力成本与供给的双重挑战。对此,AWS给出了“自研芯片+生态合作”的双线解决方案。Matt Garman在 keynote 中披露,AWS自研Trainium系列芯片已部署超100万颗,业务规模达数十亿美元,成为支撑AI成本优化的核心支柱。

本次大会重点发布的Trainium3芯片与UltraServer服务器,将工程化优化推向新高度。基于3nm制程的Trainium3实现了性能4.4倍、内存带宽3.9倍的跨越式提升,每单位功耗处理的token数量更是提升5倍——这意味着企业训练同规模模型的能源成本可降低80%。而支持144颗芯片全连接的UltraServer集群,通过NeuronSwitch-v1技术将芯片间延迟控制在10微秒内,完美适配混合专家(MoE)等大模型架构的分布式训练需求。

在生态端,AWS同时推出基于英伟达Blackwell Ultra架构的P6e-GB300实例,不仅获得英伟达自用集群“Project Ceiba”的背书,更成为OpenAl数十万颗芯片集群的承载平台。这种“自研兜底+生态领先”的策略,既通过Trainium3保障了成本可控性,又借助英伟达最新GPU满足了尖端训练需求,为不同规模企业提供了阶梯式算力选择。
模型生产:从通用能力到专属价值的安全转化
“企业需要的不是通用大模型,而是懂自己业务的专属AI。” Swami在模型专场发布中强调的这一理念,贯穿于Nova 2模型家族与Nova Forge平台的设计逻辑。不同于单纯追求基准测试分数的模型迭代,AWS此次发布直指企业定制化的核心痛点:如何在安全合规前提下,将专有数据转化为模型能力。Nova 2系列模型通过场景细分实现效率优化:Lite版本聚焦低延迟通用问答,Pro版本专攻复杂推理与知识蒸馏,Sonic与Omni则分别强化长上下文语音交互和多模态处理能力。

而真正突破行业瓶颈的是Nova Forge平台首创的“开放式训练”计划——企业可将专有数据安全注入预训练过程,无需传统微调即可获得兼具通用泛化能力与行业知识的专属模型。因为Nova Forge是一个具备前沿智能、专为企业的行业和用例量身定制的模型,同时保留Amazon Nova的基础知识、安全性和可靠性——无需承担完整训练生命周期的成本和精力。数据安全是企业定制化的底线。Swami特别强调,Nova Forge采用“数据不离开企业边界”的训练架构,结合AWS KMS加密与隐私计算技术,确保专有数据既不泄露又能发挥价值。这种“安全优先”的工程化设计,让金融、医疗等敏感行业的模型定制成为可能。
生产运维:治理与自动化的全生命周期保障
当AI进入生产环境,模型治理、成本监控与自动化运维成为新的挑战。而智能体的生产落地更是难上加难:企业不仅要实现智能体的快速规模化部署,还要保障其记住过往交互与学习成果、精准控制所有智能体和工具的访问权限、掌握复杂工作流的工具使用逻辑,最终实现问题的实时观察与调试。这种多维度的复杂性严重拖慢创新节奏,如何帮助客户大规模构建、部署安全的生产级智能体?这正是Amazon Bedrock AgentCore与Amazon Nova Act协同解决的核心命题。从基础设施到场景落地,Bedrock AgentCore全托管支撑


作为最先进的Agent平台,Amazon Bedrock AgentCore能够帮助用户在安全前提下大规模构建、部署和运营Agent。Amazon Bedrock AgentCore就像一个工具箱,里面的每一件工具都为解决构建与运营Agent过程中遇到的真实问题而设计。

可以与任何Agent框架、任何模型配合使用,让你自由选择最适合自身用例的工具;同时,它具备模块化特性,你可以按需组合所需组件,由AgentCore承担繁重的底层工作,让你能够专注于创造真正解决业务问题的突破性体验。更值得关注的是,Bedrock AgentCore打破了框架与模型的绑定限制,可兼容CrewAI、LangGraph、OpenAI Agents SDK等各类开源框架,以及Bedrock内外的所有基础模型。其备模块化特性,让用户可以按需组合所需组件,由AgentCore承担繁重的底层工作,用户能够专注于创造真正解决业务问题的突破性体验。
场景化突破:Amazon Nova Act的垂直集成创新
如果说Bedrock AgentCore是智能体落地的“基础设施”,那么Amazon Nova Act则是场景化落地的“尖刀产品”。基于定制化的Amazon Nova 2 Lite模型,Nova Act不仅能出色驱动浏览器、支持API调用,还可在任务复杂度超出能力范围时自动将问题升级至人工处理,核心覆盖Web质量保证(QA)测试、数据录入、数据提取和结账流程等高频企业场景。其创新点在于打破了行业普遍的“模型-协调器-执行器分离”困境——当前多数智能体系统中,模型、任务协调模块与工具执行模块是独立训练的,数据流转存在延迟且协同性差,直接导致任务可靠性低、失败率高。

而Nova Act采用“垂直集成+同步训练”的全新路径:依托强化学习技术,让智能体在模拟真实世界用户界面的定制合成环境(Web Gym)中持续训练,将模型推理、任务协调、工具调用逻辑与SDK能力深度绑定,所有组件同步迭代优化。这种设计带来的直接价值是“规模化下的高可靠性”:不同于传统智能体“偶尔有效、批量失效”的问题,Nova Act可在大规模部署中保持稳定的任务完成率,同时具备动态推理与适应变化的能力。Swami在演示中以电商结账流程为例:Nova Act可自动识别促销规则变化、地址填写格式调整,完成率始终保持在95%以上,远超行业平均的70%水平。
开发全流程革新:Frontier Agents的协同自动化
2025年12月3日,AWS在大会上重磅发布三款“前沿智能体”(Frontier Agents)——Kiro自主Agent、AWS安全Agent与DevOpsAgent,以“编码-安全-运维”的全链路协同,彻底重构企业软件开发流程。其中Kiro自主Agent凭借连续数日的自主编程能力与规范驱动的开发逻辑,成为引爆行业关注的核心产品。Kiro的革命性突破在于颠覆了传统AI辅助编程的“氛围编码”模式,首创“规范驱动开发”(Spec-Driven Development)范式。

在大会期间,笔者采访了亚马逊云科技开发者 Agents 产品管理及体验总监Adnan Ijaz,他详细介绍了Kiro作为开发者助手,对开发者的工作流重构产生的实际影响。在实操层面的,开发者可向Kiro分配待办任务或描述需求,它把这些要求代入设计流程,自助规划执行路径,将模糊的自然语言需求代入设计流程,转化为结构化的规范文档,建立“需求澄清→技术设计→任务分解→代码生成”的工程化闭环。这是非常丰富的工作流,生成任务非常准确,整个过程仅需极少量人工确认。

这种“AI编码+智能风控+自动化运维”的组合,正推动开发者从重复编码中解放,转型为规范制定与成果审核的“指挥官”。Kiro并非孤立存在,而是与安全Agent、DevOps Agent形成协同闭环:安全Agent会主动审查代码合规性,将渗透测试转化为按需服务;DevOps Agent则通过CloudWatch等工具链监控性能、定位故障,实现从编码到部署的端到端自动化。
成本与效率:工程化落地的核心标尺
成本控制同样是AI工程化落地的关键维度。结合AWS Cost Explorer与CloudWatch的联动能力,企业可通过Spot实例抢占、SageMaker Serverless按需计费、模型分片存储等策略,将AI任务成本降低30%以上。Matt Garman以某客户案例举例:采用Trainium3集群+Spot实例后,其大模型训练成本直接削减58%,彻底打破了“AI是大企业专属”的壁垒。在自动化运维层面,Frontier Agents系列智能体构建了场景化解决方案:DevOps Agent可自动调度云资源、处理故障;Security Agent实时监控模型数据流转合规性;Kiro编码智能体则将开发效率提升40%。这种“AI赋能AI运维”的闭环设计,大幅降低了企业将AI融入业务流程的技术门槛。
结语
从Trainium3的算力优化到Nova Forge的安全定制,从Bedrock AgentCore的全生命周期管控到Nova Act的场景化突破,AWS在re:Invent 2025上的发布勾勒出清晰的行业演进路径:AI的价值实现已不再依赖单一技术突破,而是取决于“算力-模型-平台-应用”的全栈工程化能力整合。正如Matt Garman在大会收尾时所言:“让AI写一首诗很惊艳,但让AI每天安全处理十万笔交易、优化百万级供应链决策、高效完成千万次数据录入,才是真正的生产力革命。”这场转型中,AWS通过将成本、安全、合规、可靠性等落地痛点转化为可工程化解决的问题,不仅为自身云业务注入新增长极,更在重新定义企业AI落地的标准。当行业终于从“比模型参数”转向“比落地成效”,这样的全栈工程化能力,或许正是AI穿越技术泡沫、实现可持续商业价值的核心密码。当行业终于从“比模型参数”转向“比落地成效”,这样的工程化能力或许正是AI穿越泡沫、实现可持续价值的核心密码。