拼功能?拼价格?你已经Out啦!不落到企业用户场景里去谈功能的产品,都是耍流氓!今天我们就从戴尔智能管理员OpenManage开始,落到用户三大场景中去解密其用途和价值,且很多功能参数绝对您以前没有听说过!解密,即刻开始!
记得10年前,我和当时的同事在做服务器选型测试工作时,就不止一次谈到这样问题——当我们使用来自多家(主板/准系统)供应商的产品时,就会面临管理方案不同的问题。
举个例子,比如SuperMicro、Intel(EPSD)和Tyan这3家服务器ODM,在主板的管理上就有着不同的设计,包括BMC硬件以及与之配合的软件。那么做为一家OEM厂商,如果只是简单地组装销售,用户将无法获得统一的管理体验,很难从产品技术上形成品牌黏性。
至于较大一些的服务器品牌,为了解决这个问题会投入相应的研发,但只要您使用对比过,就会发现不同厂商在管理功能方面的差距不小。也就是说, 除了硬件的品质之外,这也是一个能够体现出Dell坚持国际领先技术和让用户“最简单”宗旨的品牌优势的地方。
那么服务器管理都能做些什么呢?相信不少读者朋友对此都已经熟悉了。本文我们想以戴尔iDRAC生命周期控制器为例,带大家简单回顾BMC/IPMI的基本功能,并介绍一下 怎么实现分钟级部署千台服务器,以及“无状态服务器池“对云计算IaaS的意义。
iDRAC:什么是生命周期控制器?
戴尔iDRAC with Lifecycle Controller被称为智能嵌入式生命周期管理,它的功能可以分为4个方面:
部署:(服务器)发现/编目,设置和操作系统部署;
维护:重新分配,修复,更换配件;
监控:电源,性能,告警/健康状况;
更新:BIOS,Firmware和驱动程序。
根据我们的理解,基础的部署、维护和监控功能由硬件来实现;而高级部署功能和更新则通过管理软件来协助提供。服务器按管理方式又可分为 带外(out-of-band)和带内(in-band)两种,带内管理可以通过安装在OS中的代理执行;而带外管理则基于下面要介绍的BMC硬件。
温故知新:BMC/IPMI硬件与管理网口
上面的照片是在数年前拍摄于戴尔PowerEdge R910服务器主板,可以看到一颗NUVOTON(前身为Winbond)BMC底板管理控制器和旁边的DRAM显存芯片。现在主流的服务器BMC一般集成基本的显卡功能。
上图中用红圈标出的部分,是R910服务器的管理网口,它是以一个子卡的形式安装在戴尔专用的NDC网卡上,四路服务器在设计上与双路有一些不同。BMC/IPMI硬件管理的网口可以共用板载以太网卡,也可采用独立设计。
现在比较流行的是主板提供单独的管理网口,受控于BMC芯片所在的嵌入式系统。 这部分电路与主板上其它单元相独立,只要+5Vsb/+3.3Vsb电源供应正常、管理网络/串口连通,哪怕CPU、内存等损坏都可以进行iDRAC带外管理操作。
硬件级远程控制、系统安装不用愁
这两个截图也是来自当年Dell R910上的iDRAC6
如上图,除了 远程开关机、重新启动等之外,iDRAC的一大基本功能就是 远程控制,或者说KVM(键盘、鼠标、显示输出)重定向。由于在操作系统完成安装之前,通常无法使用远程桌面这样的工具,因此KVM更多是用在系统配置、OS安装的阶段。
就像当年我的一位朋友指着PowerEdge R710的管理网口说: “插根网线,不用接显示器就能装系统了。”这时可能还需要本地光驱,如果支持vMedia(虚拟介质)则会更方便。
有些用户在网络环境中有PXE引导服务器,并通过FTP/NFS将操作系统安装介质映射给待安装的服务器。不过在简单环境中,使用 USB重定向技术的虚拟介质用起来更加方便。如上图,除了 物理光驱/软驱之外,我们还可以将 客户端的ISO镜像映射为服务器上的“光盘”。
注:虚拟介质功能需要iDRAC Enterprise版本的License,相对基础的iDRAC Express不提供支持。
以上功能主要涉及操作系统部署,以及在此之前的单机设置。当年我还测过有的IPMI远程管理卡,提供类似的功能动辄要上千元,而现在服务器嵌入的高级管理特性已经不只于此。下面我们重点介绍一个—— 批量配置服务器来进一步提高部署效率。
自动化模板:分钟级部署数千台服务器
让我们来看看iDRAC8的自动化服务器配置是怎么工作的。如上图中的5个步骤: 配置、采集、克隆、重新分配和维护基准。在服务器配置文件中,包括BIOS、PERC(PowerEdge RAID卡)、网卡/HBA和iDRAC/生命周期控制器的设置。
此外它还有多种使用模式,可以整合到已有的进程中,使用U盘对现场对服务器“应用配置”,或者在网络设置中应用。使用OpenManage Essentials软件来采集、设置和检测配置的一到多漂移。
带有生命周期控制器的iDRAC嵌入式服务器自动化特性, 宣称分钟级部署数千台服务器(应该是理想情况下)。对于一台尚未配置管理IP和权限的戴尔13G服务器而言,只需要标准的网络资源—— DHCP服务器和标准网络共享,然后上架、连线即可。
我们再看一下自动设置的工作流:
1. iDRAC发送DHCP请求到DHCP服务器;
2. DHCP服务器响应(给出)IP地址以及选择字段;
3. iDRAC检查选择字段并恢复来自远程共享的服务器配置文件;
4. iDRAC应用配置文件到服务器,根据变化的需要服务器可能会重启。
上图中的步骤更加形象些,希望有助于大家理解。 部署并配置好一台“golden server”(相当于模板)——导出“golden server”状态到SCP XML文件——针对即将部署的服务器型号编辑SCP XML文件——为自动化配置而设置DHCP服务器——新服务器使用DHCP自动化配置——新服务器使用一致的配置来操作。
除了通过网络来批量部署之外,iDRAC Direct功能用于在单一服务器上,使用U盘里的配置文件来执行13G服务器的设置。
这种方式不需要网络连接、DHCP服务器和文件服务器,使用场景包括:一次性验收测试、测试和开发环境,以及在远程位置的技术支持人员。
“无状态服务器池”解决云计算难题
上图介绍的是通过OpenManage Essentials软件来实现批量部署,从单个服务器配置模板“1:M”生成多套服务器配置文件。
这里的 虚拟MAC地址、WWN、WWPN和iSCSI Initiator是做什么的呢?首先,在一定范围的服务器配置中(对网卡/HBA有要求),这些是 可以在Firmware层面设置或者修改的。其目的是实现“无状态服务器池”的部署, 提升非虚拟化服务器的可移动性。
“Virtual IO Management and Stateless”一个比较成熟的应用是 SAN Boot,包括使用iSCSI和FC/FCoE,这在刀片服务器环境中使用的多一些。如果我们把思路放宽, 在云计算IaaS资源池中也有对物理服务器自动化管理的需求,而这正是戴尔OME Server Configuration Management的用武之地。
【免责声明】
文章内容来自网络,版权归原作者所有。如涉及作品版权问题,请与我们联系,我们将删除内容或协商版权问题!内容为作者个人观点,并不代表本公众号赞同其观点和对其真实性负责。
M A K EI TE A S Y
专注于数据中心基础设施运维管
理,分享运行维护经验,分享数
据中心行业发展趋势及技术应用。
原文:https://www.sohu.com/a/135429706_470046