轻松进行远程管理 COM-HPC集成IPMI,提升边缘服务器服务质量
供稿:康佳特科技有限公司
- 关键词:康佳特,嵌入式,COM-HPC
- 摘要:PICMG发表针对嵌入式系统平台管理的COM-HPC接口规范,目的为协助边缘服务器工程师远程管理系统。例如当系统当机时,IT管理员可按下重置按钮,发挥与亲临车间或其他场所相同的效果。该规范专为以COM-HPC嵌入式计算机模块为基础的边缘计算机而设计,旨在简化维护及提升服务质量。
PICMG发表针对嵌入式系统平台管理的COM-HPC接口规范,目的为协助边缘服务器工程师远程管理系统。例如当系统当机时,IT管理员可按下重置按钮,发挥与亲临车间或其他场所相同的效果。该规范专为以COM-HPC嵌入式计算机模块为基础的边缘计算机而设计,旨在简化维护及提升服务质量。
对IT管理员来说,其标准功能涵盖了频外管理的远程管理能力,其中包括在无须亲临服务器机房的情况下,即可监控系统功能、安装更新与修补程序以及故障排除。
大多数IT服务提供业者的标准做法,是远程访问客户本地服务器或进行云端托管。随着新的PICMG COM-HPC接口规范问世,支持这项行之有年做法的远程管理功能,将延伸至边缘服务器与网关伺服层技术。边缘服务器与网关伺服层技术实现了数字化及IIoT(工业物联网),但需要远程管理功能弥补商业级IT与工业级营运科技(OT)间的落差。
而以嵌入式计算机模块为基础去设计边缘层平台的工程师,通常会希望透过定制化满足特定需求,进而执行这些功能。PICMG特别针对这项需求,推出面向系统管理的COM-HPC子规范,且为了不造成重工,部分COM-HPC子规范将使用智能型平台管理接口(IPMI)规格。接下来让我们更深入探究系统管理接口专用的COM-HPC子规范,了解其规范对COM-HPC设计有何帮助吧。
这项工作之所以以IPMI为基础,是因为IPMI自1998年提出后,经过2001年与2004年的陆续改版后达到稳健状态,而受到广大使用者接纳。PICMG小组委员会也采用了以表现层状态转换(RESTful)API为基础的Redfish规范,并持续发表新功能。
COM-HPC标准专为全新边缘计算层设计,采用分布式架构,因此这项全新IT层级服务,提供了业者需要具备类似分布式本地或云端设备的全方位远程管理功能。
长久性与稳定性至关重要
IPMI规范定义了监控管理计算机子系统的协议、接口与架构,对描述底层硬件以及从板载管理控制器(BMC)接收和传送讯息的格式进行了标准化。 IPMI讯息可透过网络传送至远程系统BMC,或从BMC传送至电源等本机子系统。这种传送IPMI讯息的灵活性,使其可将复杂的管理任务划分为数个子区域。讯息可查询硬件当前状态,或命令BMC行动,如指示提升系统散热效果、要求系统重开机,或读取传感器。将管理任务卸除至专用实体硬件组件,可减少主机硬件与操作系统负担。IPMI规范也将系统管理与主要平台脱钩,即使在主要平台停机时,仍可执行系统管理功能。上述功能让IPMI规范成为管理服务器硬件的真实标准。规范开发人员刻意将必要的命令简洁化,以避免误解的可能性,进而确保规范的长久可用性。
IPMI规范的弹性框架可在原有强制及选择性命令之外,新增新的网络功能(NetFn)与指令。这种自由度已让许多产业工作团体受益,使其得以定义自身特定网络功能及命令,应对在制定规范时未曾想到的技术与功能。
IPMI呼叫可透过网络传送至远程系统或本机子系统。于大多数情况下,系统模块化是为了将IPMI功能延伸至子系统(如嵌入式计算机模块)。
各种远程管理选项
对嵌入式计算机模块系统而言,弹性框架让新增远程管理所需的调整更为简单。一项关于COM-HPC嵌入式EEPROM(EEEP)的调整,EEEP包含供货商信息、内存插槽、连网功能等,这些信息大致与IPMI现场替换单元(FRU)中所储存的信息相同。为了避免这些数据被复制,COM-HPC远程管理功能也涵盖了IPMI装置如何将EEEP装置中的储存信息植入FRU的相关建议。
有鉴于COM-HPC模块市场庞大,包括远程数据中心、雾端/边缘服务器与远程安装,拥有弹性的远程管理选项是相当重要的。此外开发人员也应考虑该规范对IPMI提供给模块及载板的支持成熟度的要求是截然不同的;模块的IPMI成熟度范围包括未受管理模块(M.U)、基本管理模块(M.B),到完全管理模块(M.F)。载板程度则为未受管理(C.U)到管理载板(C.M)。规范中详列各种差异,但本阶段最重要的是了解这些模块与载板的互操作性不受影响。COM-HPC IPMI规范让各类载板在各种模块中正确运作。
关键在于灵活性
PICMG COM-HPC IPMI小组委员会体认到,一体适用的解决方案无法符合各种情况所需的基本管理功能,因此才会有使用于如控制系统开启/关闭,或告知系统取得网络信息等任务的若干模块与载板设计的结合。
举例来说,使用搭载达4个模块的单一载板工作时,让个别模块具备独立完整的管理功能,更能提升效率。不过,载板上完全成熟的IPMI执行可对其他情况产生效益,不论模块是否是在受到管理的条件下,皆能对特定功能进行定制化。当然,一定也会有系统设计人员不想要管理功能,或是只想要最少的管理功能。因此,最重要的是所有模块管理层间的互操作性。
尽管模块及载板的IPMI支持成熟度不尽相同,但仍保留可互操作性,以实现各种系统设定―从搭载4个管理模块的单一未受管理载板,到搭载未受管理模块的管理载板。
灵活管理控制平台
IPMI可存取越多的系统资源,功能就会越强大。这种存取与电源间的关系就是新的COM-HPC规范具备数个特定接口,并提供最全方位系统管理功能的原因。首先是智能型平台管理总线(IPMB)接口,让载板BMC得以存取模块管理控制器(MMC)。但规范不仅限于此总线,专用的独立PCI Express通道便是特别针对载板BMC的一款新接口,包含了图型控制器并加以驱动。IPMI专用的其他接口包括I2C接口、USB端口,以及电源钮控制。这些专用IPMI通道亦可透过BMC远程访问,让系统管理员几乎可完全控制平台行为,实现最佳QoS、最少停机时间,与最高效的远程维护。以下为数个范例:
•I2C接口可用于存取模块上的EEEP数据。
•USB端口可用于仿真如键盘与鼠标,或DVD光驱等USB装置。
•电源控制可用于远程启动/关闭系统。
•当BMC执行其他平台初始化时,电源控制可用于延迟系统开机。
新的PICMG COM-HPC子规范藉此为全方位IPMI平台管理功能奠定基础,工程师可开始思考建置IPMI的硬件设计构想。于此同时,模块供货商与其合作伙伴可建置BMC与MMC,例如使用SP-X及(或)OpenBMC等开源标准韧体。
OpenBMC为Linux发行版,适用于服务器、置顶式交换器、RAID设备与其他装置中的管理控制器。OpenBMC适用于下一代以COM-HPC为基础的系统,利用Yocto、OpenEmbedded、systemd与D-Bus,让平台定制化更为轻松。具备与DCMI的完整IPMI 2.0兼容性,并搭载如电力、散热、LED、库存、活动与监视器等主机管理功能。OpenBMC并提供各种接口选项,从远程KVM、以SSH为基础的SOL、以网络为基础的用户接口,到REST以及以D-Bus为基础的接口。工程师可受益于硬件仿真及自动测试功能,而对各种BMC/BIOS映像的代码更新支持则让此功能集更为完整。
MegaRAC® SP-X为一款功能强大的服务器管理解决方案,以IPMI 2.0、DMTF Redfish、SMASH及SOL等产业标准为基础,提供如远程健康监控、远程亲临现场与先进自动化等关键服务功能。OpenEdition则为以OpenBMC韧体为基础的强化生产版本,搭载可扩充的直觉式开源架构部署框架,提供上述服务功能。MegaRAC SP-X与MegaRAC皆适用于所有主要BMC系统单芯片(SoC)设计,并支持Intel® / AMD x86、Arm® 64(包括Ampere eMAG™与Qualcomm)以及IBM POWER® 8/9平台架构。透过运用MegaRAC SP-X与MegaRAC OpenEdition的IPMI及Redfish支持,COM-HPC具备RAS管理功能,以加速在垂直产业间的采用。
结论
对系统建置人员来说,PICMG COM-HPC嵌入式计算机模块规范的主要优势在于尽管此为全新规范,但却涵盖了成熟的IPMI与Redfish管理技术并加以创新,而这无疑将是接纳PICMG新COM-HPC嵌入式计算机模块规范的动力。
市场上首款康佳特COM-HPC Client模块提供搭载Intel Xeon、Core与Celeron处理器(代号为Tiger Lake U与Tiger Lake H)等11种不同版本,包含评估载板与散热解决方案的康佳特入门套件功能已通过验证,可立即提供。而客户特定COM-HPC PMI建置版本则根据需求提供支持。
作者:
康佳特资深软件工程师: Aaron Pop
AMI资深软件工程师: David Wise
PICMG主席: Jessica Isquith