【国家级实验室】实测之二:比战场更残酷的考验

在上一篇文章国家级实验室实测之一:直面边缘场景的严峻考验当中,我们详细介绍过苛刻场景的需求以及Dell PowerEdge T550和T150这两台服务器在硬件设计方面的一些特点。

接下来,我们从具体应用场景的角度继续关注服务器的耐久性和可管理性,前者决定了服务器的故障率高低,而后者决定了服务器能否及时发现故障隐患,能否及时完成故障排查。

国家级实验室的苛刻测试

针对边缘场景的需求,我们尤其关注服务器在两个方面的表现。一方面是服务器对环境的影响,其中最主要的是噪音对工作人员的影响;另一方面是环境对服务器的影响,由于缺乏专用的恒温恒湿机房和电源配套,不友善的温度、湿度、供电对服务器的工作状态和寿命构成了严峻的挑战。

为此,益企研究院联合战略合作伙伴,国家级实验室:中国泰尔实验室对Dell PowerEdge T550和T150进行了环境测试。

中国泰尔实验室隶属于中国信通院,是ICT行业顶级实验室,拥有国家级检测机构3个,部级检测中心7个,核心资质5个,获得了包括CCC、CQC、CEC等国内授权,以及CE、TUV、SGS、UL等国际授权。

泰尔实验室总面积达6万多平方米,拥有1300多名高素质人才和7600多台套测试装备,目前已经有41年的历史,承担着通信政策支撑、技术研究,标准制定、测试验证、技术评估、仪表计量、软件评测等项目,在信息和通信领域的检验检测领域享有较高的声誉。

这次泰尔实验室测试的项目有:

环境温度-低温,测试标准:GB/T2423.2-2008

环境温度-高温,测试标准:GB/T2423.1-200

恒定湿热,测试标准:GB/T2423.3-2016

防雷-浪涌(冲击)抗扰度,测试标准: GB/T17626.5-2008

噪音,测试标准:GB/T9813.3-2017

特别需要指出的是,普通的高、低温、湿度测试,一般只进行2小时,模仿设备在存储、运输或临时的后勤故障等偶发的极端条件。

但我们需要考察的是边缘场景的工作常态,服务器会持续地在恶劣环境下工作,因此,益企研究院和中国泰尔实验室决定将环境温度和湿度测试的时间大幅度延长,达到24小时,可以称之为严苛了。

除此之外,其他测试项目也均在不同状态下重复多次测试,两台服务器的测试周期达到了1个月。可谓时间长,任务重,条件还苛刻!

模拟实际场景的噪音测试

进过数据中心机房的人们对其第一印象不一定是壮观、整洁,而肯定是“嘈杂”。大量的服务器集中在一起,风扇猛转,那是相当的嘈杂、刺耳。但毕竟没什么人长时间在数据中心机房内作业,偶尔维保一下,噪音还是可以忍受的。

益企研究院经常进行企业级计算、存储设备测试,经常与服务器们的噪音为伍,设备满载时突然飙升的风噪尤其容易让人分神。因此从个人感受而言,对服务器的噪音进行定量评价最为关心。

在噪音测试中,中国泰尔实验室将服务器置于距地面垂直距离75厘米的桌面上,声级计与地面垂直距离120厘米、与服务器水平距离50厘米,声级计与水平方向夹角30°。这个状态模拟的是人在工作(坐姿)时,头部与服务器的相对位置关系。

同时在测试中,服务器将被人为设置为四种状态:通电空闲、风扇25%额定转速、50%额定转速、100%额定转速。

在实际的应用场景中,PowerEdge T150最可能与工作人员共处一室甚至共享工位。

泰尔实验室的实际噪音测试结果表明,这是一台安静的服务器,可以融入环境,几乎不会对人产生干扰。在空闲状态下,T150的噪音值只有24.0分贝,相当于不会影响睡眠;在50%额定转速下,噪音值为47.0分贝,优于0类声环境功能区,可满足类似康复疗养区等特别需要安静的区域的要求。

值得一提的是,我们还额外测试了PowerEdge T150样机在风扇自动调速模式下的噪音。在环境温度处于25~26℃之间,英特尔至强E-2356处理器满载时,噪音为25.2分贝,仅略高于闲置状态。

这个数据也说明对于该等级的配置,在对于人体适宜的环境温度下,处理器风扇的噪音不大且基本上被比较严实的机箱阻挡。除非环境温度过高,或者服务器配置较高、整体负载大,使得机箱内总热量增加,否则机箱排风扇也不会带来什么噪音。

而PowerEdge T550在25%额定转速下的噪音值为58.9分贝,满足2类声环境功能区,具体来说,就是实现以商业金融、集市贸易为主要功能,或者达到居住、商业、工业混杂,需要维护住宅安静的区域的要求;在50%额定转速下的噪音值为67.0分贝,不会对环境造成严重影响;在100%额定转速下的噪音值为71.0分贝,不会对听力和身体健康造成负面影响。

极端温度和湿热环境

在缺乏通风的条件下,夏季室内温度可以远远超过气温,甚至超过地表直射的温度。譬如温室大棚/阳光房的温度可以达到55℃以上,基于真空管技术的太阳能热水器水温可以达到60℃以上。我们将高温环境测试的温度设定为65℃,大致相当于无保护设施内可能达到的温度上限。两台服务器都在这样的高温下挺过了24小时的煎熬。

低温测试的目标温度时-20℃,这相当于服务器直接安置于大型冷库内。冷库也是普通工作人员能够进行较长时间作业的低温场所。服务器们同样安然度过。

恒定湿热是我们最担心的测试之一,毕竟潮湿是电子设备的大敌。环境的设定是40±2℃,85±3%RH,这完全是属于桑拿房的效果,否则以目前地球的环境,自然条件下很难同时实现这样的温度和湿度,经历24小时桑拿热蒸之后,服务器安然无恙。

考虑到PowerEdge T150很可能会部署在施工现场、基层网点等区域,会面临基础设施不完善的问题,防雷、接地均可能不可靠。

为此我们特意增加了防雷/浪涌测试,使用8/20微秒波形、5千安短路电流,正负极各冲击5次,期间T150完全不接地,并顺利过关。我们在此顺便强烈提醒大家:任何场所都一定要注意防雷设施的布设,认真检查电源线路的接地情况,否则即使你正使用的T150能扛得住,但其他用电设备出现故障也会导致业务中断和资产损失。

皮实耐用还好管理

除了皮实耐用,边缘服务器还得拥有良好的可维护性和可管理性,才能确保万无一失。之前我们已经介绍了服务器硬件的基于免工具等特点的优点,而在软件、系统、状态信息等层面,可维护性和可管理性主要体现在远程管理方面。

作为专业的服务器供应商,戴尔在远程管理的技术和工具上有深厚的积累,其中,我们针对实际应用场景重点介绍独具特色的iDRAC。借软硬件相结合的方式,戴尔iDRAC为用户提供了一套安全、高效的解决方案。

我们可以用一句话总结iDRAC的优点:无需专业工程师即可实现远程管理。这句话虽然并不能体现iDRAC强大的功能,但却点出了边缘场景的痛点:由于地理上的分散,或者由于企业实力有限,很可能无法获得及时的技术支持。当服务器出现故障的时候,现场人员对状态一问三不知是情有可原的。

那么,我们怎么通过iDRAC解决这些痛点?

首先,iDRAC是基于独立的硬件的,它的全称是Integrated Dell Remote Access Controller,也就是集成戴尔远程控制卡。这就相当于附加在服务器内的一台小电脑,通过与服务器主板上的管理芯片BMC进行通信,监控与管理服务器的硬件状态信息,并实现基于硬件的键盘、鼠标输入。这就决定了它的工作并不依附于服务器的核心硬件和操作系统,在出现阻碍启动的硬件故障,或者操作系统瘫痪的情况下,iDRAC依然可以运作,可以继续提供判读系统状态、日志的可能,也允许进一步的操作,如重启、重装系统等。这就有别于一部分建立在操作系统基础上的远程管理功能。

其次,iDRAC可以通过专用的端口进行操作,其中包括机箱正面USB接口附近的iDRAC Direct(Micro/MiniUSB接口),以及机箱背面标注iDRAC图标的网络接口。通过这些专用的端口,现场人员可以简单、迅速地进入管理功能,而不需要进行复杂的配置。毕竟,这种端口层面的物理隔离,降低了面向外部世界的安全隐患(黑客攻击等)。我们可以认为,任何人在现场,只要有电脑,接上USB线或者网线,他就可以参与维护,哪怕是作为一个传声筒和操作员,从此告别两眼一抹黑的窘境。

这种低操作技能门槛的管理能力不仅仅可以用于排查故障,在日常管理用也大有用场。通过iDRAC,我们可以轻松查看服务器的运行状态、硬件信息等。通过iDRAC随时进行资产盘点是小菜一碟,既可以通过总部远程进行,也可以安排基层进行例行检查。在普通企业中,利用技术能力差别造成的信息不对称,进行偷、换硬件的侵财行为偶有发生,如果能提高资产盘点的能力,增加频次,甚至自动示警,资产安全和服务的稳定性就会得到更充分的保障。

这种低操作技能门槛的管理能力不仅仅可以用于排查故障,在日常管理用也大有用场。通过iDRAC,我们可以轻松查看服务器的运行状态、硬件信息等。利用iDRAC随时进行资产盘点是小菜一碟,既可以通过总部远程进行,也可以安排基层进行例行检查。在普通企业中,利用技术能力差别造成的信息不对称,进行偷、换硬件的侵财行为偶有发生,如果能提高资产盘点的能力,增加频次,甚至自动示警,资产安全和服务的稳定性就会得到更充分的保障。

在下图中,我们可以通过iDRAC控制台的仪表板看到服务器的状态,其中红色提示告诉我们:有一路电源没有交流电输入、机箱盖曾被打开。

能力是一种双刃剑。既然iDRAC这么强,被别有用心的人盗用怎么办?这个不用担心,可以通过密码、智能卡身份验证等进行管理,还可以通过系统锁定模式保护系统免受不必要的配置更改。万一iDRAC瘫了怎么办呢?机箱背面的“i”按钮可以重置iDRAC。

结语

Dell PowerEdge T150/T550服务器的性能和可扩展性优异,可维护性良好,节能低噪,特别契合边缘场景的需求。这两台服务器在泰尔实验室经受了比行业惯例更为严苛的极端温度、湿度的测试考验,展现了稳定的可用性,确保业务不会由于异常的环境影响而中断。身处恶劣环境之下,面对繁重的业务压力,对队友的信心比什么都要重要。

上一篇
下一篇