引言
对所有类型的 Power 服务器,IBM 都会定期地在支持网站上发布最新的的更新包,以保证服务器能够安全高效地运行。而系统管理员也需要根据管理的服务器的情况,到网站上下载需要的更新,对 Power 服务器进行定期的升级和更新。随着数据中心 Power 服务器的种类和数量的增加,这一更新管理工作变得越来越困难,管理员通常需要登录很多不同的 HMC/IVM 的界面,才能完成对所管理的 Power 服务器的升级和更新工作。
SDMC 的出现,极大的简化了管理员的工作,通过 SDMC 单一的管理界面,可以对数据中心所有 Power 服务器(机架服务器和刀片服务器)统一地管理,查看 Power 服务器当前的固件信息,通过在线(或者离线)的方式对系统进行自动升级和更新。
需要注意的是升级和更新,尽管概念上略有不同,升级通常是固件发布版本的改变,如升级 POWER6 服务器,把它从 01EA340 升级到 01EA350;而更新往往基于同一个发布版本上小版本的改变,如把 Power 服务器从 01EA350_107 更新到 01EA350_108,由于 SDMC 对更新和升级的处理机制完全相同,在本文中我们不进行区别,统统以更新为例进行讨论。
SDMC 对 Power 服务器的更新管理的简单介绍
与当前 HMC/IVM 所使用的方法不同,SDMC 对 Power 服务器的更新管理,扩展使用了 Systems Director 的更新管理器 (Update Manager) 功能。从 IBM 更新支持网站(Fix Service Provider)在线地查询相关的更新,显示需要的更新,自动地下载安装指定的更新。同时,也可以根据用户预先定制的 Compliancy Policy 产生更新事件通知系统管理员。
简单而言,SDMC 对 Power 服务器固件更新,将会包括以下步骤:
- 对所管理的 Power 服务器收集库存,通过库存收集,SDMC 获取到当前服务器的相关信息。
- 通过 SDMC 自动从 Fix Service Provider 支持网站在线查询所有管理 Power 服务器相关的更新,或者使用 FTP 导入已下载好的固件更新包。
- 判断并显示当前 Power 服务器需要安装的更新。
- 安装更新。
- 提交固件更新或者拒绝更新。
注意这里的步骤 2,虽然大多数情况下用户可以通过在线更新的方式对 Power 服务器进行更新,但一些数据中心,SDMC 所在网络可能无法和外部网络互通,这时可以使用 FTP 导入更新的方式。这种离线更新的方式需要管理员从网站上选择下载 Power 服务器需要的更新,比较麻烦。在本文中我们对这两种方式都进行了介绍,但建议在条件允许的情况下使用在线更新的方式对 SDMC 管理的 Power 服务器进行固件更新。
使用 SDMC 完成 Power 服务器的在线更新
SDMC 对 Power 服务器更新的基本操作,大部分可以通过 Power 服务器的右键菜单完成,如下图 1 所示。 Power 服务器更新的基本任务菜单,包括准备状态检查(Readiness Check),查询更新(Check for Update),显示需要的更新(Show Needed Updates),从 FTP 导入更新(Import Updates by FTP),Power 服务器固件管理(Power System Firmware Management)等。请注意这些任务菜单,在后面的章节中,我们使用的大部分更新管理任务都要从这里启动。
图 1. 对 Power 服务器更新的基本任务菜单
使用 SDMC 对固件升级前的准备状态检查(Readiness Check)
在计划对 Power 服务器进行更新前,通常需要使用 SDMC 对 Power 服务器进行准备状态检查,查看 Power 服务器当前的状态信息是否符合更新的条件。
当 Power 服务器存在以下三种情况时,不能通过检测,这时需要参考相关资料修复这些问题,才能进行服务器更新。
- Power 服务器和 SDMC 之间的连接有问题;
- Power 服务器处在一个不可操作(non-operational)的状态;
- Power 服务器有一些需要处理的 Serviceable 故障。
从图 1 所示的任务菜单中点击 Readiness Check任务,在打开的窗口可以看到准备状态检查的结果,如下图 2 所示,通过准备状态检查的服务器将会显示 Passed,表示 Power 服务器当前的状态正常,可以进行更新管理。
图 2. Power 服务器准备状态检查
使用 SDMC 对 Power 服务器收集库存信息
在对 Power 服务器更新之前,还需要对 Power 服务器收集库存信息。SDMC 通过库存的收集了解到所管理的 Power 服务器的硬件(如机型)和软件信息(如已安装的更新版本)。如下图所示,选取服务器右键 Inventory 菜单下的 View and Collect Inventory 任务可以完成对服务器的库存收集。
图 3. 对 Power 服务器收集库存信息
使用 SDMC 对 Power 服务器在线查询更新信息(Check for Update)
在库存收集成功之后,从图 1 所示的服务器更新的基本任务菜单中选取 Check for Update 任务开始对 Power 服务器执行在线地查询更新信息。
图 4. 对 Power 服务器在线查询所有更新信息
在打开的窗口添加所有可用的更新类型,使 SDMC 查询 IBM 支持网站上所有和该服务器相关的更新。
使用 SDMC 对 Power 服务器显示更新
在查询更新完成之后,SDMC 自动下载了与每个更新相关的描述文件,并根据数据库中保存的 Power 服务器库存信息,判断出哪些是 Power 服务器可用的更新,哪些是需要的更新。
这时,从图 1 所示的服务器更新的基本任务菜单中点击 Show Needed Update 任务,就会把当前 Power 服务器需要的更新以列表的形式显示出来。
图 5. 显示需要的更新列表
如上图所示,只有一个需要的更新显示出来,这是由于尽管可能还有可用的更新,但不是需要的更新。
点击页面中间的 Show all available updates 链接,点击可以查看可用于当前服务器的所有更新信息。这里有 EA350_107 和 EA350_108 两个可用的更新,只有最新的 EA350_108 更新显示为需要的更新。
图 6. 显示所有可用的更新列表
从列表中选取任意可用的更新,点击安装按钮可以完成该更新的安装。
这里我们需要注意,这个列表中通常会显示出所有在网站上查询到的适用于当前 Power 服务器的更新版本,可能含有比当前版本低的更新包。
尽管我们不建议安装比当前版本低的更新,因为那就意味着降级,但通过这个页面的确可以做到服务器固件的降级。
使用 SDMC 对 Power 服务器安装需要的更新
从上图显示所有可用的更新界面选取你想安装的更新,点击 Install按钮,就会打开下图的更新安装向导程序。
图 7. 安装更新向导 - 选取自动检测安装以依赖的更新
在上图的 Options 页面,SDMC 会自动检测安装该更新是否需要依赖其它的更新,并显示在列表中,注意勾选 自动安装所有需要的更新 选项,让 SDMC 自动下载和安装所有需要的更新。
在安装向导中,SDMC 还会进行服务器的准备状态检查和更新的并发性检查,几分钟后,检查结果显示在下图中。
图 8. 服务器的准备状态检查和并发更新检查结果
根据更新的信息和服务器的信息,选取的更新可能是破坏性的(Disruptive),或者是并发性的(Concurrent)。
如果更新是破坏性的更新,就会有警告信息出现,如上图所示,让你采取一些操作以阻止服务器上的应用受到影响。如果是并发性的,在该页面不会出现警告信息。
同时,在这个结果页面也会给出安装这个更新估计需要的时间,上图中安装该更新估计时间是 33 分钟。
在理解下面的选项之前,我们先要了解一些概念。
- 临时端(Temporary Side,T-Side)和永久端(Permanent Side,P-Side):在 Power 服务器的服务处理器 (Flexible Service Processor) 中,一般会有两份固件的拷贝,分别放在 FSP 临时端和永久端。永久端用于备份旧的但运行稳定的固件,而新安装的固件通常会放在临时端。如果新安装的固件不是很稳定,可以把备份在永久端的固件恢复到临时端;如果新安装的固件比较稳定,可以把临时端的固件拷贝到永久端,作为一个新的稳定的备份。
- 并发性(Concurrent)和破坏性(Disruptive):并发性是指,可以在运行的系统上更新固件而无需重新启动系统,也不会对运行中的程序造成影响;破坏性是指,更新固件后必须重新启动系统,会对运行中的程序造成影响。
我们再来看上图中的选项,根据更新类型的不同,在该页面提供给用户的安装选项也是不同的。
如果这个更新是并发性的,只有一个选取项让用户决定是否把当前使用的运行在 FSP 临时端的固件拷贝到永久端。参见上图红框标注的选项。
如果这个更新是破坏性的,这个更新完成之后需要重启服务器才能生效,这时,将会有两个选项供你选择。
- 并发安装(Concurrent install only),不重启机器,延迟激活,更新后的固件不能生效;
- 破坏性安装(Disruptive install),更新后立即自动重启服务器,使更新后的固件生效。
一般情况下,选取缺省配置,在接下来的 Summary 页面点击完成退出安装向导,并开始在后台运行更新安装。
但是,从 Task Manager 下 Active and Scheduled Jobs 页面可以看到该更新的安装进度,点击进入可以看到在安装更新每一步的具体进度。
图 9.Power 服务器的固件安装进度
从上图可以看到,整个更新安装包括 5 个任务,首先从网站下载更新包,传送安装包到 Power 服务器,在服务器上启动安装,安装完成后重新收集 Power 服务器库存,更新服务器固件信息。整个过程完成之后,这一更新就会安装在 Power 服务器 FSP 临时端,服务器开始使用新版本的固件。
使用 SDMC 对 Power 服务器进行更新管理
SDMC 提供了一些简单的固件更新管理功能,从图 1 所示的服务器更新的基本任务菜单中点击 Power System Firmware Management任务,可以在打开的窗口看到服务器固件更新管理的基本任务,如图 10 所示。
图 10.Power 服务器的固件更新管理的任务菜单
下面,我们对这些任务做一些简单的解释。
- 接受(Accept):把处于临时端(T-Side)的新安装的固件更新版本拷贝到永久端(P-Side)作为备份。当服务器运行在 P-Side 时菜单中没有这个任务项。
- 移除并激活(Remove and Activate):当服务器运行在临时端(T-Side)时,可以使用这个选项移除新安装的固件更新,把处于永久端(P-Side)的固件备份拷贝到临时端(T-Side),并激活恢复后的固件;
- 移除(Reject):把处于永久端(P-Side)的固件备份拷贝到临时端(T-Side),只有当前你的 Power 服务器运行在永久端时才能进行此操作,由于当前运行在 P-Side 的固件处于激活状态,不需要额外激活;当服务器运行在 T-Side 时下图菜单中没有这个任务项。
- 同步(Synchronize):当 Power 服务器有冗余的 FSP 时,可以把当前使用的 FSP 的内容拷贝到冗余的 FSP 中。
- 破坏性激活(Disruptive Activate):重启服务器激活处于 Next IPL Side 的固件,这一操作也会激活先前安装但没有激活的固件更新。
- 设置下次固件引导端(Set Next IPL Side)下次服务器重启时激活的固件更新,T-Side 或者 P-Side。
对于上图所示的 Power 服务器,我们可以看到,当前使用的激活的固件版本是 01EA350_108,存放在永久端备份的稳定的固件版本是 01EA350_103,该服务器当前运行在临时端,下次启动将会从临时端引导启动。
作为示例,现在我们对当前新安装的运行在临时端的固件更新执行 移除并激活操作,点击 Remove and Activate 任务,可以打开下图页面。
图 11. 对 Power 服务器进行固件更新的移除并激活
在这个确认页面,会估算出出完成该任务的时间,并且在列表中给出完成 移除并激活 任务时,服务器将会使用和激活的固件更新的版本。对该 Power 服务器,大概需要 13 分钟完成 移除并激活 任务,那时备份在永久端的固件 EA350_103 将会恢复到临时端,并将激活使用。
确认后点击 Start Remove and Activate Task,运行在临时端的更新 EA350_108 被立即移除,SDMC 自动重启 FSP 并应用,激活恢复后的 EA350_103 固件版本。
使用 FTP 方式完成 Power 服务器固件离线更新
由于某些数据中心 SDMC 可能无法直接(或者通过网络代理)连接 IBM(Fix Service Provider)支持网站,这就需要我们使用离线更新的方式,对 SDMC 管理的 Power 服务器进行更新。在这种情况下,用户需要把更新文件手动下载并传送到 SDMC 可以连接的 FTP 服务器,通过把这些更新导入到 SDMC 系统,完成对 Power 服务器的更新。
从 IBM 支持网站下载最新的固件更新并放在 FTP 服务器
IBM 会在 IBM 支持网站定期放入最新的更新,这个网站的地址链接如下:
用户可以根据 Power 服务器的类型进行过滤,下载符合要求的固件更新,把解压后文件放在 SDMC 可以连接的 FTP 服务器上。
注意这里解压后的文件应包括安装文件,sdd 文件,readme 文件,xml 文件,这些文件都是使用 SDMC 对 Power 服务器更新时需要的,不要漏掉任何文件以防止导入失败。
把固件更新从 FTP 服务器上导入 SDMC 平台
选取需要更新的 Power 服务器,从图 1 所示的更新任务菜单中点击 Import Update by FTP任务,打开下图页面。输入更新包所在的 FTP 服务器的主机名称或者 IP 地址,FTP 登录用户名和密码,以及更新所在的位置,确认之后稍等片刻,系统提示导入完成,FTP 服务器上的固件更新成功导入到 SDMC 系统。
图 12. 从 FTP 服务器上导入 Power 服务器的固件更新
导入完成之后,也可以通过命令行查询导入的固件更新信息。
sysadmin@dhcpx61-64:~> smcli lsupd 01EA350_108_074 |
从 SDMC 显示并安装固件更新
在更新导入之后,点击服务器右键菜单 Show Needed Update任务,就会把当前 Power 服务器需要的更新以列表的形式显示出来,可以选取并安装需要的更新。具体操作可参见前面在线更新部分,这里不再赘述。
使用 SDMC 完成多台 Power 服务器固件更新的实时监控和安装
使用 SDMC,可以对所管理的(或特定)Power 服务器的固件更新进行实时监控,当 IBM 支持网站上有新的更新发布,且符合服务器的更新要求时,自动产生更新事件,通知系统管理员。
完成多台 Power 服务器更新的实时监控和安装,需要我们在更新概览页面进行一些相关的配置任务,在 SDMC 欢迎页面上点击下图所示的的链接可以打开更新概览页面。
图 13. 从欢迎页面打开更新概览
在概览页面,首先我们要做的就是为管理的 Power 服务器配置 Compliance Policy。
配置 Compliance Policy,实际上就是告诉 SDMC,服务器关注什么样的更新,这样,SDMC 根据服务器的设置,确定是否网站上发布的更新适用于这个服务器的要求,当有符合要求的更新出现时,根据更新的级别,自动产生一个相应级别(紧急的或一般的)的更新事件,提醒系统管理员。
如下图所示,点击 ChangeCompliancePolicy 任务链接,可以为管理的 Power 服务器修改 Compliance Policy。
图 14. 打开 Change Compliance Policy 任务
在打开的 CompliancePolicy 的窗口,通过 Browse(浏览)选取想要监控 Power 服务器,这里选取所有被管理的 Power 服务器;通过 Add(添加)可以添加服务器关注的更新,这里选取 All updates,意味着监控网站上所有适用于 Power 服务器的更新,只要发现服务器上没有安装任何一个可用的新更新,就会产生更新事件,点击 Save 保存这个新 Compliance Policy。
图 15. 为 Power 服务器设置 Compliance Policy
稍等片刻,我们发现与先前的图 14 相比,更新概览视图发生了一些变化。参见图 16,我们看到更新状态饼图变为黄色,这是由于有适用于两个服务器的更新没有安装,同时在黄色三角警告标志旁边显示当前管理的 Power 服务器中不符合 Compliance Policy 的服务器个数,这里显示有 2 个服务器需要安装更新。
图 16. 更新事件概览视图的变化
这时点击 View All issues可以查看更新事件的细节信息。
下图是打开的更新事件列表,可以看到在 2 个 Power 服务器都没有安装当前最新的 EA350_108 更新,推荐安装该固件更新。通过这里的 Install 按钮,可以把该更新统一安装到多台 Power 服务器上。
图 17. 为多台 Power 服务器统一安装需要的更新
安装完成后,更新事件概览饼图将会变为绿色,同时在绿色方块标志旁边将会显示所管理的 2 个 Power 服务器一切正常,当前没有最新更新可用,参见下图。
图 18. 安装完更新后的更新事件概览视图
为了使 SDMC 能够定期地自动为所有 Power 服务器查询固件更新,我们可以通过创建查询固件更新的计划任务,只需要点击上图中的 Check for Updates 链接,在弹出的任务窗口选取计划任务(Schedule),考虑到固件更新发布没有那么频繁,我们在这里选取每周查询一次,参见下图。
图 19. 创建计划任务定期查询固件更新
这样,在每周的在线更新查询完成后,更新状态概览饼图自动刷新,产生事件警告,提醒用户有最新更新适用于当前管理的服务器,用户查看相应的更新事件,可以把更新成批地安装于适用的 Power 服务器。
总结
作为 IBM 最新一代的 Power System 管理工具,SDMC 可以很方便对 Power 服务器(包括机架服务器和刀片服务器)进行统一的更新,本文详细介绍如何使用 SDMC 对服务器进行在线和离线的固件更新安装,使用 SDMC 对服务器固件进行管理,以及修改 Compliance Policy 实现对多台服务器的固件更新实时监控,查询以及统一安装。掌握本文提到的固件更新方法,系统管理员可以方便地使用 SDMC 对数据中心的 Power 服务器更新进行监控,安装和管理。
作者简介
![]()
李永超,CSTL 软件工程师 , 长期从事 Director 测试工作,目前主要负责 Director6.1 的 Automation Manager 和 Base Management Server 功能测试和系统测试工作。
http://www.ibm.com/developerworks/cn/aix/library/1111_liyc_sdmc8/index.html