超级智能体时代,需要什么样的AI基础设施?

在DeepSeek横空出世之后,大模型的发展进入了新的阶段,正走向普遍应用的超级智能体时代。

无论是个人、企业还是城市的超级智能体,都需要足够灵活、高效、稳定、低碳的AI基础设施支撑。很多企业在打造自己的私有化大模型部署时,首要看重的是算力能力,其实在应用大模型时,更需要考虑整体的AI基础设施能力,包括存储、网络以及整体的管理、服务还有冷却。

在这种情况下,联想所倡导的“一横五纵”战略布局,以整体能力构筑AI导向的基础设施,对于企业而言,就变得尤为重要。

2025联想创新科技大会上,联想宣布构建从个人到企业乃至到城市的超级智能体,而其中,构建企业超级智能体的核心根基在于算力支撑体系,即整体的AI基础设施。

它不仅仅包括智算的能力,更应该是包括“端-边-云-网”的混合计算基础设施,是计算力、存储力和运载力,乃至软件、运维能力的有机结合与整体能力。只有这样构筑的整体方案,才能够作为更优秀和适用的AI基础设施,让企业能够更好地在AI时代,抓住AI技术的持续创新的机遇,应对AI时代需求的快速变化。

拥有全面的企业级产品线,并且擅长资源整合的联想宣布针对“一横五纵”战略下的产品和技术实现多项重大升级,正如联想集团副总裁、中国基础设施业务群总经理陈振宽所说,通过这些升级,联想将能够助力混合式人工智能快速落地

这一年  “一横五纵”有哪些创新?

一年前,联想发布AI导向的基础设施布局:“一横五纵”战略。这“一横五纵”共同构筑了一个巨大的“T型架构”,帮助联想基础设施业务群打造成为了一个兼具足够宽广的智算平台能力与基础设施纵深的“T型联想”,从而能够帮助中国的企业用户提供布局完整、稳定高效的AI导向的基础设施

这一年多以来携“一横五纵”布局,很好的应对了用户在AI基础设施领域的需求,这也正是联想AI基础设施在过去这一年多中业绩表现优异的重要原因之一,尤其是根据IDC数据显示,联想服务器在过去的2024年实现了全年180%的最快的市场增长。

而以DeepSeek为代表的大模型迭代与革新日新月异,模型的应用生态也在持续升级,需要更强大、更高效、更稳定、更绿色的混合式基础设施。

这正是此次联想中国基础设施业务群在“一横五纵”战略布局中,实现AI基础设施重大升级的价值所在。

在今年的联想创新科技大会上,面对AI技术的持续创新和用户需求的快速变化,联想从算力性能与效能、核心算法、算力服务等多个维度发布六大创新技术:AI推理加速算法集、AI编译优化器、AI训推慢节点故障预测与自愈系统、专家并行通信算法、“飞鱼”仿生散热设计与浸没式制冷系统、算力服务“成本-效能”双优运营系统。

联想集团副总裁、中国基础设施业务群总经理陈振宽

基于这六大技术创新,联想宣布了两大重磅升级,发布了联想万全异构智算平台3.0版本,并且实现了联想AI基础设施从计算力、存储力到运载力的全线升级。

联想集团副总裁、中国基础设施业务群总经理陈振宽表示,“此次六大创新技术的发布与两大重磅升级,是联想中国基础设施业务群坚持“一横五纵”战略布局的成果。未来,我们将继续深挖技术创新潜力,积极构建生态,通过打造持续迭代的混合式基础设施,致力于成为加速中国本地AI持续发展的技术引擎。”

联想以其在Techworld 2025上面的实现大幅度升级的“ThinkSystem”“联想问天”双品牌产品与方案,为“一横五纵”战略布局打造了更为创新与全面的AI基础设施能力,能够更好的服务AI普惠时代企业的需求。

这“一横” 为什么如此重要?

据介绍,今年新发布的联想万全异构智算平台3.0,在全面落地去年5大差异化技术的基础上,通过持续创新的四大异构智算技术,助力本地基础设施算力效率实现新的突破。

  • AI推理加速算法集该算法集融合MLA多头潜在注意力机制与混合精度量化技术,推理性能较业界最优方案领先20%,主要用来满足用户对推理更高吞吐量、更低延时的诉求。通过这个算法集改进算力的效率,可以使同等的算力支持数倍乃至十倍、数十倍用户的推理需求,该算法集已经可以将DeepSeek等大模型的推理性能提升5~10倍;
  • AI编译优化器联想AI编译机优化器在构建计算图的过程中采用了临近算子融合,自动化算子替换和路径优化等方式,大幅度简化了计算过程,降低训练与推理成本各15%以上。其中对算子的优化结合了联想与其GPU战略伙伴共同研发的成果;
  • 专家并行通信算法针对MoE架构通信瓶颈,联想研发了一种细粒度的计算通信协同优化算法,该技术在底层核函数层面实现了计算过程与通信过程的高度并行,使得两者的耗时尽可能地相互掩盖,从而大幅度提高推理响应速度,使得推理延时降低3倍,网络带宽利用率达90%;
  • AI训推慢节点自愈系统在该系统里,联想通过AI训推实践积累了AI训推故障特征库,并训练了故障预测模型。在该系统中,联想可以用AI模型预测AI的故障,首创了故障预测技术。在能预测AI故障的情况下,该系统通过异步的训练检查点或者异步的推理备份,准备好故障恢复所需要的环境,在预测故障发生时,系统自动地排出故障点,并通过多机缓存急速读取和恢复训推环境,从而能够实现百卡秒级、万卡十分钟级故障自愈,集群稳定性行业领先。

联想中国基础设施业务群战略管理部总监黄山

正如联想中国基础设施业务群战略管理部总监黄山在介绍时所称,联想万全异构智算平台3.0通过算力效率的四大技术创新为用户实现差异化优势,并获得了业界领先的成果。在国家级高质量AI集群场景中,联想与东数西算第一大智算枢纽紧密合作,在千卡训练场景中将MFU从30%提升至60%;针对模型本地部署的企业AI基础设施场景,全速运转满血版DeepSeek R1模型极限吞吐量已经超越12,000 Tokens/s,不断刷新性能行业记录。

这“五纵”全线升级 强化了什么?

在此次联想创新科技大会2025上,联想重磅升级了AI算力基础设施“五纵”全线产品,展示其协同创新能力,深度构建以计算力、存储力、运载力为核心的AI基础设施,打造覆盖AI全场景、性能领先的AI算力产品组合。

更重要的是,为应对日益迫切的国内市场需求,联想大幅度丰富了2024年发布的问天产品线,不仅仅在服务器领域实现了问天系列品牌的大规模更新,也在今年推出了问天系列品牌的存储产品,以实现从服务器到存储的更全面覆盖。

  • 在计算力层面联想重磅推出基于英特尔®至强®6处理器的全新算力服务器家族,包括联想问天 WA7880a家族在内的AI训练算力服务器家族、联想ThinkSystem SC750 V4在内的数据处理算力服务器家族;联想问天 WA5480 G5、WR5220 G5、联想ThinkSystem SR650 V4、SR650a V4、SR630 V4在内的推理应用算力服务器家族。面向不同的AI应用场景,全新算力服务器家族进行了针对性优化,充分释放AI服务器的算力潜能。联想此次重磅推出的全新算力服务器家族,采用最新一代的英特尔®至强®6处理器,与上一代相比,性能得到进一步提升,单处理器核数提升225%,AI工作负载性能提升翻倍,单机柜性能输出提升42%;
  • 在存储力层面联想凌拓产品管理与营销高级总监林佑声在会上重磅发布了联想凌拓全新存储产品家族,以及具备本地自研、自有知识产权、自主可控三大特征的联想存储新品牌——联想问天。联想凌拓从数据管理到存储架构均进行了全方位升级,包括联想问天DXN AI 存储解决方案、DXN2000系列、DXN 全闪系列,Lenovo ThinkSystem DE/DM/DG系列、NetApp ASA/AFF/FAS系列、AIPod DeepSeek一体机在内的联想凌拓全新存储产品家族,不仅提供覆盖纯训练、训推一体以及推理场景的综合架构方案,还与GPU企业展开深度合作,确保技术和产品能够快速落地、满足本地各行业实际需求;
  • 在运载力层面联想通过RoCE/IB多架构融合及低延迟优化技术,构建了覆盖多种规模AI算力集群的智能网络体系。其数据网络产品兼容多种主流AI网络架构,包括基于无阻塞通信的胖树架构(Fat-Tree)、具备高扩展性与低时延特性的蜻蜓增强型架构(Dragonfly+),以及分布式解耦的DDC架构(Distributed Disaggregated Chassis),充分满足差异化场景需求。其中,本次发布的高密度400G交换机问天NE8770-64QC,专为AI场景深度优化;也发布了两款战略级新品——面向下一代融合网络的多业务核心交换机联想问天NE7550G-8C,以及支持超大规模组网的新一代高性能核心交换机联想问天NE9770G-4C;
  • 在软件及超融合领域联想重磅升级AIO V6系列产品和联想问天WX系列虚拟化超融合8.0.2版本,进一步彰显了联想超融合产品的卓越实力。联想问天WX系列虚拟化超融合则展现出更全面的国产生态融合能力,其深度优化的国产化内核实现了对主流国产芯片、操作系统、中间件的支持;
  • 在算力服务方面联想首次发布算力服务“成本-效能”双优运营系统,持续助力客户优化运营效能与成本。其中智能调度引擎与FinOps引擎,可提升集群资源利用率13%,并精准识别58%无效实例,最大化用户效益。

正如陈振宽所述,现有产品组合重磅升级之后,将能够帮助客户打造覆盖训练、训推一体、推理、边缘推理全场景的AI基础设施,联想希望通过“AI算力满天星”,助力千行百业的客户在AI时代闪耀。

冷却和服务对AI基础设施也很重要

随着智算中心的发展和各种智算一体机的部署,企业的算力密度逐年增加,既有的风冷方案已经难以满足企业的冷却需求,液冷成为了智算中心的趋势

针对这样的需求,在此次的发布会上联想所发布和展示的单相浸没液冷方案,引发了众多的关注。

据介绍,联想的单相浸没方面采用”飞鱼”仿生散热设计,模拟鱼类游动姿态优化流体设计,支持下一代600W芯片散热,最大功耗提升20%。此前,联想与清华大学开展深入技术预研合作,研发流场优化方案及高性能散热器,使冷却液的冷却效率最大化,获得最优PUE,同时在冷却液、Tank设计方案、CDU等各方面探索低成本方案,推动浸没液冷的快速普及。

相变浸没方向通过“双循环”相变浸没制冷系统实现PUE低至1.035的业界领先水平,为更冷静、更可靠的服务器及数据中心产品提供有力支持。联想还专门在天津建立了浸没式液冷实验室,通过真实场景的实验获得可靠数据,以推动浸没式液冷的研发。

此外,不只算力效率与能效,联想在算力服务方面,也首次发布算力服务“成本-效能”双优运营系统,持续助力客户优化运营效能与成本。其中智能调度引擎与FinOps引擎,将数据输送到混合云,完成企业AI模型训练,待模型培育成熟后,可弹性部署在边缘设备或终端硬件,实现分布式推理运算,可提升集群资源利用率13%,并精准识别58%无效实例,最大化用户效益。这一创新对于提升企业AI基础设施的投资回报率具有重要价值。

超级智能体时代,AI基础设施需要整体方案

进入超级智能体时代,企业应该努力思考如何更好地利用大模型来提升业务能力,而不是在AI基础设施上耗费时间和精力,因此需要部署整体的AI基础设施方案,从算力、网络、存储乃至冷却和服务实现整体构造。

从这个角度来说,联想的“一横五纵”战略正是适应了这样的市场需求。

在“一横五纵”战略持续创新和升级的同时,联想在创新科技大会的“异构智算 本地引擎”联想AI算力基础设施技术创新论坛暨春季新品发布会分论坛上,还展出了联想万全AI一体机,支持包括百度昆仑芯片等多种AI算力芯片,实现了对多款异构算力平台的高效支持和覆盖。

面对AI普惠新时代,联想正以其“一横五纵”的战略布局,构筑了一个“T型联想”基础设施能力,以聚焦异构智算,打造更强大、更高效、更稳定、更绿色的本地算力引擎。

在超级智能体时代,需要兼具广泛覆盖业务知识与深度融合专业能力的“T型人才”,更需要兼具异构能力与多样化基础支撑的“T型基础设施”。

可以相信,随着联想在AI基础设施领域上一系列创新技术、产品和方案的发布,联想将能够与英特尔等合作伙伴一起,共同实现算力事业的繁荣发展,加速推进AI算力普惠新时代,真正实现“Smarter AI for All 让AI成为创新生产力”。

上一篇
下一篇