免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1690 | 回复: 0
打印 上一主题 下一主题

Power7 虚拟化管理中的强大功能 - 分区的挂起和恢复 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-01-18 13:35 |只看该作者 |倒序浏览
概述
在用户日常的系统使用和维护中,经常面临以下两个问题:一,系统硬件升级时的宕机时间较长;二,系统资源无法均衡利用,造成资源浪费。针对以上问题,IBM Power7 系统提供了挂起和恢复功能,挂起是指 LPAR 处于待机 / 休眠的状态,它占用的资源可以被其他 LPAR 使用,而恢复意味着分区可以从休眠恢复到挂起时的状态,整个过程中 LPAR 的状态信息存放在存储设备的页交换空间里,因而它可以有效地减少宕机时间,合理分配和使用系统资源。本文详细介绍了挂起和恢复的基本原理、系统状态机转换、并图解介绍了系统挂起恢复的基本流程,希望能给系统实施人员和系统管理员的日常工作提供参考。
名词解释
RSDP: Reserved Storage Device Pool(存储设备池)
VIOS: 虚拟 IO 服务器
LPAR: Power 系统的逻辑分区
LPM: Logical Partition Mobile(逻辑分区迁移)

挂起和恢复的具体含义
在 IBM POWER7 系统中,VIOS 支持 AIX 或者 Linux LPAR 的挂起和恢复,当一个 LPAR 挂起的时候,其上运行的操作系统和应用都被挂起,整个 LPAR 的运行状态被保存下来。当恢复 LPAR 的时候,所有挂起时运行的进程都被复原。
一旦一个 LPAR 处于挂起状态,它占用的所有 CPU 和内存资源都可以被其他 LPAR 利用,与 VIOS 相关的虚拟适配器的配置信息暂时被移除,被保存在存储设备中,留做恢复时使用。这时 HMC 中该 LPAR 显示的状态为挂起,在挂起状态下,任何计划中或意外的断电都不会影响该 LPAR。

挂起和恢复功能给应用带来的益处
  • 均衡利用资源,可以按照应用系统的需求,更加合理地安排资源的使用,当资源紧张时,通过挂起部分 LPAR,释放出资源满足其他紧急的业务需求,待资源宽裕时,再恢复挂起的 LPAR。
  • 方便硬件的维护和升级,当需要升级时挂起系统,升级完毕,恢复系统即可。
  • 由于该处理方法只涉及一个 server 服务器,且只需 PowerVM 标准版,所以相比迁移(LPM)的方式要简单省时经济。
  • 对于应用的开启关闭需要较长时间的系统,传统的方式是通过关机进行系统维护,采用挂起和恢复功能,可以有效减少系统维护的宕机时间。

挂起和恢复中包含的基本概念
为方便读者理解挂起和恢复的功能,下面介绍两个基本概念:RSDP 和系统状态机转换,其中 RSDP( 保留存储池 ) 用于给 LPAR 分配存储空间,状态机转换主要是讨论在挂起和恢复中系统处于的运行状态。
  • RSDP 的含义
    当 LPAR 处于挂起状态时,其状态信息存放在一个保留的存储设备中,这个存储设备是通过 HMC,在 RSDP( 保留存储池 ) 中进行分配的,其容量大约是该 LPAR 最大内存的 110%。RSDP 包含许多保留存储设备,也叫做换页空间,每一个要挂起的 LPAR 都必须拥有自己的换页空间。通常我们将一个 VIOS 分区与 RSDP 关联,提供换页服务,当然为了提供冗余路径,保证高可用的换页空间设备,我们也可以将另外一个 VIOS 也与 RSDP 关联起来。
    当系统满足挂起条件时,RSDP 可以在 HMC 中设置,既可以通过 HMC CLI, 也可以通过图形界面。当执行挂起操作时,HMC 从 RSDP 中分配存储空间给相应 LPAR,通常它会自动挑选一块没有被使用而且大小合适的空间用做存储 LPAR 挂起时的数据,当然必须保证 RSDP 的该部分存储在系统挂起时是可用的。
    举例说明 RSDP 中页空间的分配,在本实例中,采用实施中最典型的双 VIOS 分区,划分了 4 个 LPAR,RSDP 的设计既包含外部存储也包含内部存储,既有双路径连接也有单路径连接,基本覆盖了 RSDP 中涉及的所有情况。
    其中 LPAR1,LPAR2,LPAR3 使用 SAN 磁盘作为换页空间设备,LPAR4 使用本地磁盘作为换页空间设备,并关联在 VIOS 分区 2 上,两个 VIOS 分区如图所示和 SAN 连接,绿线代表换页空间设备映射给 VIOS 分区 1,蓝线代表换页空间设备映射给 VIOS 分区 2,其中换页空间设备 2(Paging space device2) 和换页空间设备 3(Paging space device3) 拥有双路径。


    图 1.RSDP 中换页空间的分配([color=rgb(76, 110, 14][size=1em]




  • 在 PowerVM 的标准版中,我们可以在 RSDP 中管理换页空间,比如以下的操作:

    • 创建和删除 RSDP
    • 从 RSDP 中添加或删除 VIOS
    • 在 RSDP 中添加或删除换页空间设备
  • 挂起恢复中系统状态机转换
    以下是 LPAR 在运行中基本的状态机转换,本文侧重于挂起恢复部分的介绍。


    图2.LPAR 状态机转换

    • 挂起
      LPAR 的状态信息存放在存储设备中,任何计划中或意外的断电都不会影响该 LPAR。
      在 HMC 界面里,挂起操作通常要经过以下流程:

      • 启动挂起操作。
      • 挂起操作的环境验证,包括挂起功能是否使能,RSDP 是否存在等。
      • 保存 HMC 数据,也就是 LPAR 的系统配置信息。
      • 保存 LPAR 的数据,也就是操作系统的运行状态信息。
      • 完成挂起操作。
    • 恢复
      使 LPAR 恢复到挂起时的运行状态。
      在 HMC 界面里,恢复操作通常要经过以下流程:

      • 启动恢复操作。
      • 恢复操作的环境验证,系统硬件是否符合 LPAR 配置要求,RSDP 是否存在等。
      • 恢复 LPAR 配置。
      • 恢复 LPAR 的数据,也就是操作系统的运行状态。
      • 完成恢复操作。
    • 关闭
      将 LPAR 由挂起状态置为停机,通常换页空间会被释放,所有虚拟适配器的配置信息都会保存起来,也包括一些操作系统运行信息,以保证 LPAR 以后可以被正常激活。
      如果是强制停机,部分运行时的配置、数据信息可能会丢失,使得 LPAR 处于不一致的系统状态,从而导致 LPAR 再次激活时出错,所以不推荐这种状态转换。
    • LPM
      LPAR 的迁移,分为动态迁移和静态迁移,具体参考 IBM 其他文档介绍。
    • 迁移
    将挂起的 LPAR 迁移到另外一台主机上,该技术基于 LPM,在迁移过程中,LPAR 的配置文件,操作系统运行时状态信息都会迁移到目标主机,从而可以在新的主机上被恢复。


挂起恢复的基本操作
  • 配置需求
    为支持挂起 / 恢复功能,LPAR 需满足以下需求:

    • 软硬件最低版本
      • POWER 7 Firmware 7.2.0 SP1
      • HMC v7 r7.2.0
      • VIOS 2.2 0.11-FP24 SP01
      • AIX 7.1 TL0 SP2 or AIX 6.1 TL6 SP3

    • LPAR 配置要求
      • 用于存放 LPAR 状态的存储设备 (RSDP) 必须永久地与 LPAR 连接。
      • 确保 RSDP 中至少存在一个可用的 VIOS 活动分区
      • 该 LPAR 不能挂载物理的 IO 设备。
      • 该 LPAR 不能是全分区,IBM i 分区,VIOS 分区或者服务分区。
      • 该 LPAR 不能是一个 alternative error logging 分区 .
      • 该 LPAR 不能有 Barrier Synchronization Register (BSR)
      • 该 LPAR 不能有 huge memory pages
      • 当执行挂起或恢复操作时,系统监控必须关闭。
      • 该 LPAR 不能有基于逻辑卷的 rootvg 卷组或者包含任何外置的光学设备。
      • NPIV 必须包含两个 WWPNs, 并且在交换机中被划分到同一个 zone.
      • 挂起 LPAR 前,必须将 VIOS 中的虚拟光学库手动删除。

  • 创建 RSDP
    要使用挂起和恢复功能,必须创建 RSDP,


    图 3.RSDP 的管理配置入口([color=rgb(76, 110, 14][size=1em]查看大图

    • 创建支持挂起和恢复的分区
    • 验证分区是否支持挂起和恢复功能
    • 挂起分区

      图 4.启动 LPAR 的挂起操作
    • 恢复分区

      图 5.启动 LPAR 的恢复操作



结束语
挂起和恢复功能操作简单,实践中减少了系统维护过程中的宕机时间,使资源得到合理分配和利用,从而有效地简化了 IT 人员的系统维护工作,今后会在工程中得到广泛的应用

作者简介
张晓光,就职于 IBM CSTL,目前主要是从事 Lab Service 的工作,针对 POWER 平台进行系统实施,包括 PowerVM, PowerHA, Dirctor,VMControl 等。

康明,IBM 中国系统与科技实验室资深 IT工程师,目前主要从事 IBM Power 系统虚拟化产品相关服务工作。

田永卫,IBM 中国系统与技术实验室的资深系统工程师,研究生毕业于西安电子科技大学计算机系。目前主要从事 IBM Power 系统、IBM Systems Director 及基础架构云方面的技术。




http://www.ibm.com/developerworks/cn/aix/library/1109_zhangxg_power7suspend/index.html

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP