免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 4335 | 回复: 13
打印 上一主题 下一主题

sun双机知识(工作较忙,先发点) [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2003-07-18 22:19 |只看该作者 |倒序浏览
Sun Cluster Overview

Ha Framework in Sun Cluster—Sun双机的HA结构

HA结构提供对所有SUN HA功能的支持,HA通过在数据业务(服务)和主机节点间提供一个平台来实现,称作Logical host(逻辑主机)。逻辑主机封装(或者说描述)了数据业务(服务)环境的不可变的特征:
l        用于访问数据服务的IP地址
l        逻辑主机所需的SEVM磁盘组(dg或dgs)
l        相关的业务(服务)
当错误发生时,HA结构将整个逻辑主机转移到备用的双机节点上。HA API保证所有的资源都是可用的,并使已转移的数据服务能正确无误的重启。

HA结构同时提供也保存了装好的双机的配置数据信息。
l        CDB        双机数据库
l        CCD        双机配置数据库
CDB包含了双机配置和管理信息,CCD包含了类似的信息,以及双机当前状态的信息。CCD和CDB(用于控制)(决定了)双机的操作、配置、失败恢复和错误处理。必要时,将要用到(查询)和更改它们。

逻辑主机提供了在物理节点和数据服务间的中间平台。通过把数据服务封装在逻辑主机里,并分配给逻辑主机必需的资源来支持数据服务(如IP和dg),可使数据服务与物理主机隔离开。通过冗余数据(或称数据备份)(VolumeManager提供),冗余网卡配置(PNM提供),冗余的处理器(失败倒回failover)实现,逻辑主机能与物理主机的故障隔离。因为所有的逻辑主机资源在备份的主机上都是透明可用的,不同于去关注通常暂时的服务故障,所以高可用性数据服务的客户将不会察觉物理主机或部件的故障,不同于需要去重新进行程序处理。

逻辑主机允许管理员将部分或一个组的数据服务的所需资源绑定在一个实体上,从而便于管理。一旦逻辑主机创建,它的资源和相关的数据服务将被管理员作为一个简单的实体来管理,这使得可能复杂的资源管理问题变得简单。由于任何错误都会导致数据服务的不正确,逻辑主机的配置必须要仔细规划和配置。

数据服务常运行在逻辑主机上面。逻辑主机用scconf命令创建(对于逻辑主机所用到的所有网卡Failover组也要同时创建)。在逻辑主机被创建后,用hareg命令将一个或多个数据服务与逻辑主机建立联系。这种联合保证了数据服务将被作为逻辑主机的一部分启动、停止、和转移(或切换)处理,这也是双机环境失败倒换的一部分(单元)。你可以多个数据服务对应一个逻辑主机,多个逻辑主机对应一个物理主机,但一个数据服务只能且永远只能在一个逻辑主机,没有跨逻辑主机共享服务的可能。

错误检测机制:
和其它的SUN双机HA一样,probe被用于错误检测。探测(程序)担当数据服务的客户角色。每个数据服务都有它专门的错误检测(程序)。一般,对于每种数据服务实例,有两种类型的错误检测:
l        在主节点机上运行的本地探测(程序)
l        在第一个备份节点上运行的远端探测(程序)
探测程序周期性地运行,针对每个数据服务都设置了缺省探测间隔时间。探测(时间)和探测超时值有进是可配置的。
在准备进行切换前,远端探测(程序)总是重复一次已失败的探测。

当节点失败或应管理员要求,逻辑主机将从一个物理主机切换到另一个物理主机上去。


常用名词:
implement        实现
framework        框架,结构(平台?)
encapsulates        封装
non-portable        可移植的,便携的
migrated        转移
properly        适当的,正确的
repositories        贮存,保存
as well as        以及
isolated        隔离
transparent        透明的
outage        停机,断电,出故障
brief        简短的,短暂的,暂时的
unaware        不知道的,无察觉的
component        部件
transaction        事务处理,程序处理
potentially        可能的(大概的,潜伏的)
issue        问题(发布、发表、期刊、发行)
failover        失败倒换
mechanism        机制
association        联合(联想、共生体)
assure        保证
as with        如同…的情况一样,如同…一样
probe        探针,探测,试探
always        总是(一直)

Sun Cluster 3.0 最常见的问题的解答
本章包含关于 Sun Cluster 的最常见的问题的解答。问题是按主题编排的。
高可用性 FAQ
·        到底什么是高可用系统?
Sun Cluster 将高可用性 (HA) 定义为群集使应用程序保持活动状态并运行(即使发生通常会使服务器系统不可用的故障)的能力。
·        群集是通过什么样的进程提供高可用性的?
通过一个称为失败切换的进程,群集框架提供高可用性的环境。失败切换就是一系统列由群集执行的步骤,它将应用程序从一个故障节点转移到群集上另一个可操作节点。
·        HA 服务与可伸缩服务间有什么不同?
HA 服务意味着应用程序每次只能在群集中的一个主节点上运行。其他节点上可能运行其他应用程序,但每个应用程序只能运行在单一节点上。如果主节点发生故障,正在故障节点上运行的应用程序进行失败切换,切换到另一个节点并继续运行。
可伸缩服务将一个应用程序扩展到多个节点之上来创建一个单独的逻辑服务。可伸缩服务平衡他们在其上运行的整个群集中的节点和服务器的数目。一个节点接收所有的应用程序请求,并将这些请求分发给运行着应用程序服务器的节点。如果这一节点发生故障(它被称作全局接口节点或 GIF),则全局接口失败切换到一个仍运行的节点。在任何一个运行着该应用程序的节点发生故障时,该应用程序在其他节点上继续运行,只是性能有所下降,直到故障节点返回该群集为止。
文件系统 FAQ
·        可否将一个或多个群集节点作为高可用性 NFS 服务器运行,而将其他群集节点当作客户机?
不可以。本地锁定接口存在一些问题,有能力中止和重新启动 lockd(锁定是在 NFS 失败切换期间发生的)。在中止与重新启动之间,可以将锁定授予一个被阻塞的本地进程,从而防止了拥有该锁定的客户机系统在失败切换后要求归还锁定。
·        可否将群集文件系统用于不在 Resource Group Manager 控制之下的应用程序?
是的。然而,没有 RGM 的控制,当运行应有程序的节点发生故障时,应用程序将无法幸免。
·        所有的群集文件系统都必须在 /global/device-group 目录下有一个定位点吗?
并非必须。然而,将群集文件系统置于相同的定位点之下,比如 /global/device-group,使这些文件系统可以得到更好的组织和管理。
·        使用群集文件系统和导出 NFS 文件系统有哪些不同?
有以下几点不同:
1.        群集文件系统支持全局设备。NFS 不支持对设备的远程访问。
2.        群集文件系统有一个全局名称空间。只需要一个定位命令。使用 NFS 时,必须在每个节点上定位文件系统。
3.        与 NFS 相比,群集文件系统从高速缓存访问文件的情况更多。例如,当多个节点访问一个文件,进行访问读、写、文件锁定、异步 I/O 时。
4.        群集文件系统在某一服务器发生故障时支持无缝失败切换。NFS 支持多服务器,但只有只读文件系统有可能进行失败切换。
5.        群集文件系统是为了利用能够提供远程 DMA 和零拷贝功能的快速群集互连而建立的。
6.        如果您更改了文件的属性(例如,使用 chmod(1M)),更改会立即反映到所有的节点上。使用导出的 NFS 文件系统,这可能会花费更长的时间。
卷管理 FAQ
·        需要镜像所有磁盘设备吗?
必须镜像被视为具有高可用性的磁盘设备,或者使用 RAID-5 硬件。所有数据服务应该要么使用高可用磁盘设备,要么使用定位到高可用磁盘设备上的群集文件系统。这样的配置可以容忍单独磁盘故障。
数据服务 FAQ
·        什么样的 Sun Cluster 数据服务是可用的?
支持的数据服务列表包含在 Sun Cluster 3.0 发行说明 中。
·        Sun Cluster 数据服务支持哪些应用程序版本?
支持的应用程序版本列表包含在 Sun Cluster 3.0 发行说明 中。
·        我可以记下自己的数据服务吗?
可以。有关详细信息,请参见 Sun Cluster 3.0 Data Services Developers' Guide 和 Data Service Development Library API 附带的 Data Service Enabling Technologies 文档。
·        当创建网络资源时,我应该指定数字 IP 地址还是主机名?
指定网络资源的首选方法是使用 UNIX 主机名,而非使用数字 IP 地址。
·        当创建网络资源时,使用逻辑主机名(一个 LogicalHostname 资源)与使用共享地址(一个 SharedAddress 资源)有什么不同?
无论在那里,只要文档要求在 Failover 模式资源组中使用 LogicalHostname 资源,SharedAddress 资源和 LogicalHostname 资源就都可以替交地使用。SharedAddress 资源的使用会造成一些额外的开销,因为群集联网软件已为 SharedAddress 而配置,而不是为 LogicalHostname 而配置。
使用 SharedAddress 的优点是这样一种情形,您正在配置可伸缩和失败切换两种数据服务,并想让客户能够使用相同的主机名访问这两种服务。在这种情形下,SharedAddress 资源与失败切换应用程序资源一起包含在一个资源组中,而可伸缩服务资源则包含在另一资源组中,并被配置为使用 SharedAddress。此时,可伸缩服务和失败切换服务两者可以使用在 SharedAddress 中配置的同一组主机名/地址。
公共网络 FAQ
·        Sun Cluster 支持哪些公共网络适配器?
目前,Sun Cluster 支持以太网(10/100BASE-T 和 1000BASE-SX Gb)公共网络适配器。因为新的接口可能会在将来得到支持,所以请向 Sun 销售代表咨询以获取最当前信息。
·        在失败切换中 MAC 地址起什么作用?
当失败切换发生时,生成新的地址解析协议 (ARP) 软件包并进行广播。这些 ARP 软件包包含新的 MAC 地址(节点失败切换到的新的物理适配器的地址)和旧的 IP 地址。当网络上的另一台机器接收这些软件包之一时,它从其 ARP 高速缓存中清除掉旧的 MAC-IP 映射并使用新的映射。
·        Sun Cluster 中是否支持在 OpenBoot PROM 中为主机适配器设置 local-mac-address?=true?
不支持,不支持此变量。
群集成员 FAQ
·        所有的群集成员都需要有相同的 root 口令吗?
不要求让每个群集成员使用相同的 root 口令。但是,您可以通过在所有的节点上使用相同的 root 口令来简化该群集的管理。
·        节点引导的次序有重要意义吗?
多数情况下并不重要。但是,引导次序对防止失忆很重要(关于失忆的详细信息,请参考 定额和定额设备)。例如,如果节点 2 是定额设备的属主而节点 1 停机,并且您此时将节点 2 停机,那么您在启动节点 1 之前必须先启动节点 2。这可避免意外使用过时的群集配置信息启动节点。
·        是否需要在群集节点中镜像本地磁盘吗?
需要。尽管这一镜像并不是一种要求,但是镜像群集节点磁盘可防止非镜像磁盘故障使节点停机。镜像群集节点本地磁盘的缺点是,将耗费更多的系统管理开销。
·        群集成员的备份结果是什么?
您可以对一个群集使用多种备份方法。一种方法是将一个节点作为备份节点,连接一个磁带机/库。然后使用群集文件系统来备份数据。不要将此节点连接到共享磁盘上。
关于备份和恢复过程的其他信息,请参见 Sun Cluster 3.0 系统管理指南。
群集存储器 FAQ
·        多主机存储器的为什么具有高可用性?
多主机存储器的高可用性,是因为它可以在单磁盘丢失时因镜像(或者由于基于硬件的 RAID-5 控制器)而幸免于难。因为多主机存储器设备有不止一个主机连接,所以它也可以经受它所连接的单一节点的丢失。
·        支持什么样的多主机存储器配置?
当前不支持超过两个节点的连接。在单一包围内的所有多主机磁盘必须连接到相同的两个节点。有关详细信息,请参考 Sun Cluster 拓扑。
·        可以将为 SCSI-3 PGR 配置的磁盘作为全局设备吗?
目前 Sun Cluster 中不支持 SCSI-3 PGR。对于全局磁盘设备,仅支持 SCSI-2 语义。由于不支持 SCSI-3 磁盘,所以使用 scdidadm(1M) 命令时必须使用 -R 选项,以便为您想在群集中用作全局设备的 SCSI-3 磁盘设置正确的 SCSI 语义。
群集互连 FAQ
·        Sun Cluster 支持什么样的群集互连?
目前,Sun Cluster 支持以太网(100BASE-T 快速以太网和 1000BASE-SXGb)群集互连。对可伸缩相关接口 (SCI) 的支持也在计划之中。
客户机系统 FAQ
·        使用群集时是否需要考虑任何特殊的客户需要或限制?
客户机系统正如它们连接到其他任何服务器那样,也连接到该群集。在某些情况下,根据具体的数据服务应用程序,您可能需要安装客户方软件或执行其他配置更改,以使客户可以连接到该数据服务应用程序。有关客户方配置需求的详细信息,请参见 Sun Cluster 3.0 Data Services Installation and Configuration Guide 中的单独章节。
管理控制台 FAQ
·        Sun Cluster 是否需要管理控制台?
需要。
·        管理控制台必须专用于该群集吗?它可以用于其他任务吗?
·        Sun Cluster 不需要专用的管理控制台,但如果使用,则具有下面这些益处:
o        通过对同一台机器上的控制台和管理工具进行分组,启用了集中式群集管理。
o        可能会使硬件服务供应商更快地解决问题
·        管理控制台需要位于群集“附近”,比如在同一房间内?
请向硬件服务供应商咨询。供应商可能会要求控制台位于群集的近旁。使控制台处在同一房间内没有技术上的原因。
·        是否只要所有距离要求也首先得到满足,管理控制台就可以服务于不止一个群集?
是的。可以从一个单独的管理控制台控制多个群集。也可以在群集间共享一个单独的终端集中器。
终端集中器与系统服务处理器 FAQ
·        Sun Cluster 需要终端集中器吗?
Sun Cluster 3.0 不需要运行终端集中器。Sun Cluster 2.2 要求一个终端集中器来进行故障防御;与 Sun Cluster 2.2 不同,Sun Cluster 3.0 不依赖于终端集中器。
·        我知道大多数 Sun Cluster 服务器都使用终端集中器,而 E10000 却不使用。为什么呢?
对于大多数服务器来讲,终端集中器实际上是一个串行到以太网的转换器。其控制台端口是一个串行端口。Sun Enterprise E10000 server 没有串行控制台。系统服务处理器 (SSP) 是控制台,它或者使用以太网端口,或者使用 jtag 端口。对于Sun Enterprise E10000 server,总是将 SSP 用于控制台。
·        使用终端集中器有什么益处?
使用终端集中器提供从网络上任何地方的远程工作站对每个节点的控制台级访问,包括当节点是在 OpenBoot PROM(OBP) 时。
·        如果使用 Sun 不支持的终端集中器,需要了解什么来对我想要使用的终端集中器进行限定?
Sun 所支持的终端集中器与其他控制台设备之间的主要差别,是 Sun 终端集中器有特殊的固件来防止终端集中器在控制台引导时向控制台发送中断。注意,如果您有一个控制台设备,可以发送中断或发送可能被解释为发给控制台的中断的信号,那么该控制台设备将关闭该节点。
·        是否可以不重新引导而释放一个 Sun 所支持的终端集中器上的锁定端口?
是的。注意需要重置的端口号并进行如下操作:
telnet tcEnter Annex port name or number: cliannex: su -annex# adminadmin : reset port_numberadmin : quitannex# hangup#
有关配置和管理 Sun 所支持的终端集中器的详细信息,请参考 Sun Cluster 3.0 系统管理指南。
·        终端集中器本身失败时会发生什么情况?我必须有备用终端集中器吗?
不必。如果终端集中器发生故障,您不会丢失任何群集可用性。您将无法连接到节点控制台,直到集中器恢复工作。
·        使用终端集中器时,其安全性如何?
通常,终端集中器连接到系统管理员使用的一个小型网络,而不连接到用于其他客户访问的网络。您可以通过限制对该特定网络的访问来控制安全性。


Usage:scconf clustername -h <new hostname1>; [... <new hostname4>;]scconf clustername -i <hostname>; <if0>; <if1>;scconf clustername -F <logical-host>; [<dg>;]scconf clustername -L <logical-host>; -n <nodelist>; -g <dglist>;                -i <iplist>; [-m]scconf clustername -L <logical-host>; -rscconf clustername -pscconf clustername -s [-r] <data-service-name>; <logical-host-name>;scconf clustername -U [absolute path of the config file for Oracle Unix DLM]scconf clustername -N <0|1>; <ethernet address of host>;scconf clustername -q [-m quorum-device] <hostname1>; <hostname2>;scconf clustername -q -D [-m quorum-device]scconf clustername -A <# of active hosts>;scconf clustername -S <none|ccdvol>;scconf clustername -T <step10 and step11 timeout value>;scconf clustername -H <hostname>; [-dpt]scconf clustername -t <old-ip-addr|name>; [-Pil]scconf clustername -l <loghost update timeout value>;scconf clustername -R <data-service-name>; [<data-service-name>;...]

论坛徽章:
0
2 [报告]
发表于 2003-07-18 22:56 |只看该作者

sun双机知识(工作较忙,先发点)

l老大出手不凡,欢迎常来。

论坛徽章:
0
3 [报告]
发表于 2003-07-18 23:45 |只看该作者

sun双机知识(工作较忙,先发点)

,大哥,我这段时间在移动公司,上网的时间不多,使用的也是IBM的机器,希望给大家提供些方便

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
4 [报告]
发表于 2003-07-19 08:54 |只看该作者

sun双机知识(工作较忙,先发点)

多谢了朋友

论坛徽章:
0
5 [报告]
发表于 2003-07-21 09:01 |只看该作者

sun双机知识(工作较忙,先发点)

这是 docs.sun.com里的文章啊,在 << Sun Cluster 3.0 12/01 概念>;>;里,我也看了,但是有些问题还是不清楚,比如Volume Manager的软件是否一定要装,我公司有两台480R,一台A1000四个18.2硬盘,cluster是Legato LAAM,数据库是oracle,没有Veritas Volume Manager。我对公司说需要Veritas Volume Manager,但公司对我说以前都是这样装的。该如何规划。请教各位高手指点 。

论坛徽章:
0
6 [报告]
发表于 2003-07-21 09:14 |只看该作者

sun双机知识(工作较忙,先发点)

Volume Manager是管理磁盘组的,可以用免费的disksuite代替。

论坛徽章:
0
7 [报告]
发表于 2003-07-21 09:23 |只看该作者

sun双机知识(工作较忙,先发点)

A1000应该自带RAID MANAGER。用它就可以了。

论坛徽章:
0
8 [报告]
发表于 2003-07-21 09:32 |只看该作者

sun双机知识(工作较忙,先发点)

我在<< Sun Cluster 3.0 12/01 概念>;>;也看到其宣称除了Disksuit和Veritas Volume Manager外,Sun Cluster 3.0 还支持将磁盘直接mount为全局设备,我就是不知道Legato AAM是否也可以这样,因为Disksuit这个软件我用过多次,性能比较差,我觉得能不用就不用。

论坛徽章:
0
9 [报告]
发表于 2003-07-21 09:37 |只看该作者

sun双机知识(工作较忙,先发点)

[quote]原帖由 "johnlong"]A1000应该自带RAID MANAGER。用它就可以了。[/quote 发表:
     
这是硬件RAID,关鍵是怎么把它引到cluster里,做为全局设备。两台机器的oracle都能访问其数据。

论坛徽章:
0
10 [报告]
发表于 2003-07-21 09:48 |只看该作者

sun双机知识(工作较忙,先发点)

原帖由 "pulsar" 发表:
   
这是硬件RAID,关鍵是怎么把它引到cluster里,做为全局设备。两台机器的oracle都能访问其数据。
   
把你的软硬件环境和需求写详细点,重新发个帖子,让大家讨论一下。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP