- 论坛徽章:
- 4
|
本帖最后由 rickcafe 于 2010-08-31 19:03 编辑
是数据中心规划让你头疼,还是复杂的管理让你疲于奔命,又或者是居高不下的能耗让你一筹莫展,业务整合/服务器换代/网络压力和各种瓶颈到底是个例还是大家都碰到的麻烦?
企业服务器应用七宗罪找茬大行动之“数据中心的痛楚”,就是希望大家讲出自己在接触数据中心的过程中遇到的各种问题和困扰!
也欢迎大家互相解答相关疑问,提出建设性意见,活动期间,还会有专业编辑对疑难问题作出解答!
也不能说痛楚,不管多麻烦,都靠这行混饭的。如果一点麻烦没有了,是个人都能干,那大家也没法儿混了。
1. 系统架构设计和设备选型问题
系统架构是指存储架构、网络架构和主机(服务器)架构,同时也包含数据库架构、容灾架构等。
系统架构需要根据业务需求、投资成本、设备利旧等多方面因素考虑。
为了满足业务需求,就要从系统性能、可靠性、可扩展性、安全性、可管理性、技术先进性等多方面进行权衡。
另外,还要有前瞻性,预估未来数年业务发展和系统扩容,保证系统扩容相对简便可靠,不必大动干戈。
1.1存储
存储系统一般是目前数据中心的核心,存放了数据中心最有价值的资产--业务数据,地位非常重要,要求万无一失。
存储目前就是FC SAN、IP SAN、NAS、DAS的选择,也可能是混合架构。重点是需求、性能和对业务发展的预测。
如果有一定资金,建议选择FC SAN,属于集中存储共享架构,性能高,可扩展性强,利于投资保护,设备利旧。
对于I/O负载不高,跨地域分支机构,也可以考虑IP SAN。
NAS主要用于文件服务、归档应用,要看业务是否需要。
DAS现在用的比较少了,一般是单点系统或低成本系统。如果选用SAS接口,一般就是超低成本了,谈不上什么数据中心的档次。如果选用FC接口,未来还可以扩展为SAN架构,但也省不了太多钱,不如选用低成本的FC SAN架构。当然,如果根本不需要按数据中心的模式建议,没有共享存储的需求,也不必非要上SAN架构,要看业务类型。
具体规划内容也就是容量、可扩展性、IOPS、RAID模式、MPIO(多路径)等。
1.2 网络
网络架构的设计按部就班了,没有太多技术含量可言。主要涉及以下几方面;
系统(网络)拓朴设计:是否分层?是否采用冗余架构?是否互连?
分层是指三层还是二层(核心层,汇聚层,接入层)
冗余架构指为提高可靠性,配置双交换机、双防火墙、双路由器,多路接入等等。双路配置是否需要负载均衡,及四层交换、网络负载均衡等。
互连指是否与外网互连,其它子网和广域网、互联网。如果和其它子网互连,要考虑是否有二层环路导致的网络风暴,是否子网规划合理。如果是与专线广域网互连,需要考虑线路和传输设备的调试。如果要接入互联网,则要考虑网络安全,内外网、DMZ的划分,设备的分区部署。
网络规划就是那几部分:系统拓朴、命名定义、IP规划、VLAN规划、路由规划、安全规划、端口规划等。关键是设计合理无冲突,统一命名好记忆,文档详细免混乱。
另外网络规划要注重带宽,特别是用于IP SAN或数据库群集时,最好至少都是1000M网以上,对于特殊的应用可考虑万兆网。
1.3 主机
主机规划一般考虑的是:是否单机、双机、群集。
单机的用途也很很广泛,主要是设备选型问题,看业务需要和重要性,以及与存储、网络的互连。
双机一般是指HA双机,算是集群的一种特例,主要针对高可性用场合。
群集一般是从业务需要出发,实现应用群集,系统冗余和负载均衡,要看应用类型了。比如海量WEB应用、数据库群集、高性能计算(HPC)等。
另外,主机还涉及一点OS的规划。
1.4 数据库
主要是考虑是否单机、双机、或群集(oracle RAC),以及数据库互连、备用数据库等。首先选择好数据库应用模式,再考虑采取何种架构。具体规划类同于存储、网络规则,统一命名,及包括一些优化安装配置参数。
如果是群集模式,则要重点考虑内网(心跳)带宽设计,视群集规模,指标要提高。
是集中数据库还是按业务分划为多数据库,是三层(中件间)还是二层(c/s, b/s)要看应用的需求,这涉及了业务整合。
1.5 容灾
容灾就是根据RTO、RPO指标,及预算选择系统架构
目前可选的容灾方式包括存储级容灾(FC/LAN)、主机级容灾、数据库级容灾、应用级容灾。
根据部署地域不同,也有不同的选择,本地的,同城的,异地的,跨洲的。
另外容灾也包含了备份恢复,有硬件级的,如硬件快照、镜像、克隆;也有主机系统级、数据库级的数据备份(在线、近线、离线等)
容灾也涉及到卷管理软件和高可用软件,有与硬件/操作系统厂商同厂商的,也有第三方的。
1.6 设备选型
设备选型是根据系统架构和业务需求而定的,一般来说,主要指标如下
服务器:计算性能(如数据库应用常的tpcc等),内存;PC Server/刀片/小机;OS;冗余部件
存储:容量,可扩展容量、RAID支持、主机端口、cache大小、虚拟化技术,可管理性,及光纤交换机的口数、速率等;及冗余部件
网络:接口类型、速率、端口数量,三层/二层,协议是否标准,是否支持HA/负载均衡等。
数据库:业务用什么选什么。
容灾:看情况选择卷管理软件、高可用软件、备份软件、带库、虚拟带库等。速率、容量、压缩、加密什么的。。
1.7 谁来规划
系统架构师和售前工程师。
1.8 问题
我的问题是:专业人士是怎么考虑系统规划的?重点在什么地方?希望站方给点意见。
2. 虚拟化问题
虚拟化属于系统架构问题,但有点特殊。主要分为硬件虚拟化和软件虚拟化
硬件:IBM/HP/SUN的小机,及一些存储设备的虚拟化。
软件:虚拟化软件,如vmware/citrix/hyper-v/redhat。。。。
虚拟化环境可以部署在小机、pc server和刀片上。软件虚拟化多以刀片+vmware为多。
虚拟化可以大量整合物理服务器,提高资源利用率,空间利用率,降低能耗,优化系统,同时也方便集中管理、系统迁移和备份。
如果是高端小机,可以采用硬件虚拟化技术充分利用资源
如果是x86服务器,数量较多,且非关键业务,可以选用刀片+vmware模式,减少服务器数量。
我的问题是:专业人士是对利用虚拟化技术整合现有系统有什么意见?比如系统迁移之类。
3. 可靠性问题
设备的可靠性有时很烦人。坏个硬盘、电源还是小事,一般多是冗余部件,但要整机损坏、如主板、刀片机笼损坏就比较麻烦。
高端小机支持在线CPU等关键部件更换,PC server就往往做不到了。如何做一个硬件系统级的备份是个问题,如HP的VC连接支持刀片备份。
硬件的损坏有时不仅仅是更换硬件的问题,还涉及软件配置的调整,如带库的更换,就涉及了操作系统、备份软件等一系列环节。业务系统往往不允许长时间停机,那么如何确定一个硬件更换预案,也是很重要的。售前不需要,售后很需要。
4. 可扩展性问题
系统还是需要一定的可扩展性的。用了几年的服务器,可能在业务应用程序规模不断扩大,而出现CPU占用率过高,内存不足的现象,而采购过时配件需要有原厂的支持。
5. 安全性问题
安全性也很重要,主要是操作系统级的安全和网络安全和管理上的安全。
接入公网的设备往往会受到黑客攻击,而windows系统又容易受病毒木马攻击。在windows平台下部署企业安全防护软件非常有必要。
我的问题是:专家对此数据中心的安全性有何更多的建议?
6. 集中管理问题
有些系统自身就有集中管理特性,如刀片系统,但其它大多设备要专门配置远程管理端口和集中管理软件,如网管软件。这也是一笔投资,要视系统的重要程度来规划部署。
在条件许可的情况下,可以配置一些集中管理软件(如网管软件),便于资产普查和日常监控。
我的问题是:专家对集中管理有何建议?
7. 系统性能优化
性能优化是数据中心管理中的“高技术”部分,需要有扎实的理论功底,及对使用产品的精通,以及长期监控得到的性能分析数据,和正确合理的优化方案。
一般来说,性能优化包括了:架构优化调整、服务器存储硬件优化、网络优化、操作系统优化、数据库优化等。
另外,系统性能分析还能为应用的优化提供一定的参考信息。
优化的指导意见是硬件、操作系统可逐一调整参数测试,不应一次改过多参数。数据库优化则修改主要的参数,和提供面向应用程序的优化建议,不大批量修改参数。
优化也要有预案、测试、及回退处理方式。
我的问题是:专家对系统性能优化有何指导意见?
8. 业务整合问题
有时用户需要将已有业务进行整合,比如减少服务器数量和数据库数量(虚拟化融合,或多台单机数据库升级为群集模式),或存储设备升级,这可能涉及系统架构的变更。
在做这些事情之前,一定要有明确的规划和预案,并得到技术专家的验证,准备好备用系统及失败后的回退流程,将系统割接或切换的时间减到最少,最大减轻业务停顿所造成的不利影响。
我的问题是:专家对业务整合的各环节有何建议?
9. 技术支持
要有良好的厂商支持。大规模系统、重要系统要有专业工程师或服务外包厂商支持。过保设备一定要续保。
10. 维护管理
数据中心的维护管理是非常重要的。包括人员配置、制度建设、日常维护内容(包括巡检)和维护工具(软硬件)、操作规范、具体操作指导说明、设备更换预案、容灾预案及演练,以及技术培训,技术管理等。另外还包括供应商、原厂商、服务商的管理,以及跨部门的业务协调。
一切必须有制度、有规章、有计划、有流程、有方法、有人负责和有人监督,保证管理的系统化,可参考项目管理模式和方法来进行组织实施。
技术团队不能空谈,不能闲置,要合理分配工作,让大家忙起来,有事做事,没事学习,定期检查和测试,保证大家维持在一定的技术水平和遵守各种维护、操作规范。
我的问题:专家对维护团队管理和对外包服务管理有何建议?
11. 其它
其实很多客户的数据中心维护中心人员主要精力倒不在系统架构和系统管理,而是放在业务和应用层面。他们大量时间都花在了监控业务软件的运行方式,对系统管理往往托付给服务商。他们往往扮演业务专家和系统专家两种角色,但更多的是业务专家。 |
|