免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: 瑞儿
打印 上一主题 下一主题

[转贴]从hilinux.com架设谈网站或其他服务器运维 [复制链接]

论坛徽章:
0
11 [报告]
发表于 2010-01-19 09:56 |只看该作者
支持。不错~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

论坛徽章:
0
12 [报告]
发表于 2010-01-29 14:26 |只看该作者
全部看完了, 学到很多知识,非常感谢

论坛徽章:
0
13 [报告]
发表于 2010-02-22 17:02 |只看该作者
  看下 飘过

论坛徽章:
0
14 [报告]
发表于 2010-02-23 15:00 |只看该作者
同感,太有同感了。
我也来说说我的经历吧,献丑了。

1,下单
   事先由运维部提交服务器数量,及配置给采购部,由采购部比较HP,DELL,IMB服务器后,决定采购哪一家。

2,到货
   一般下单后一周左右就会到货了,这之前一般我们都会和供货商联系好,确定到货的大概时间,然后我们就开始做规划,服务器放在哪个机柜?装什么系统?IP用哪些?VLAN用哪个(因为不同的VLAN的权限是不一样的,低级的不能访问高级的)?视服务器数量我们会要求供货商提供多少个人去IDC安装服务器,插网线,邦线等工作(一般上架的都是民工,5,6个),另外需要他们再出几个技术人员抄MAC,设置BIOS等。
    碰到大批到货,而且配置不一样的情况时,我一般都会把到货的种类,放在哪些机柜中做好表格,一定要做到心中有数,因为民工不会知道5405和5305什么区别,他们只知道按你说的做,所以要做什么,怎么做你一定要心中有数,这样才能不出乱子。印像最深的有一次同时来了140和360,外观肯定一般的技术人员都能分得出来,但是民工不行呀,最后告诉他们,盖子上粘的是女人标签的放一堆,粘得的男人标签的放一堆。
    上架,邦线也是一样,哪些机器放哪个柜子,线怎么邦等等,只是你指挥得当,民工干活有时比技术人员还好。

3,安装
   上完架,抄完MAC汇总后就开始把服务器的信息导入到数据库,包括MAC,机器名,SN,机位,所接交换机端口等,也就是楼主所说的,看到这个信息就知道服务器的所有信息了。
    系统安装非常快,因用的全是LINUX系统,而且使用的是PXE安装,一台DL360服务器从启动到安装完成也就5,6分钟的时间,而且是安装完成后所的有任何相关配置都已自己配完(信息以MAC为主在数据库中查找),所以在安装系统这块,基本上不费什么时间,我一台PXE的服务器可以支持同时30台服务器安装,千把台的服务器一天就能搞个差不多。而且全部使用带外管理(ILO,IPMI),一台笔记本你就可以搞定一切,肯定不会一台一台的去看。

4,标签,资产统计
   系统安装完,给相关程序人员加完帐号这活就算差不多了,还有就是贴标签,资产入库。
   标签直接用标签机打印现来的不干胶,很方便,因为在上架时就定好了,一个机柜15台服务器,编号从小到大,从下往上,贴标签根本不会错。所以这就要求你每一个步骤都一定要做到心中有数,否则会死的很难看的

5,监控
   cacti,nagios,cacti一般看本机的流量,IO,CPU这些,nagios对应用进行监控,最基本的负载,磁盘使用率,CPU,内存等使用率;再用就是程序员报上来的针对各种类服务器的应用层的监控。

论坛徽章:
0
15 [报告]
发表于 2010-02-23 15:57 |只看该作者
本帖最后由 dgvri 于 2010-02-23 16:17 编辑

  1. 7,英语               不想说了,我的最大痛苦就在这里
复制代码
也是我永完的痛,英语不好搞技术太费劲了。

  1. 12,组织者            给你2个啥都不会的民工,再给你2000台服务器,要求你2天把服务器装完,你咋办?
复制代码
如果组织得当,一切心中有数,民工干活比技术人员干的都好,深有体会

  1. 机器选型的时候你也要为自己考虑,比如HP的ILO功能,可以让你远程BIOS级操作服务器
复制代码
ILO或IPMI可以做很多工作,直接重定向后,你就可以直接远程管理这台服务器,就像是在显示器前操作一样,设BIOS,RAID,按F1-F12这些等,系统坏了你可以用这种方式来修
方便,不是一盘的方便。

  1. 结果我机器至少被热死了100台以上,机器是HP的,机器过热,HP会自动关机,而且会不让你启动。你崩溃不?注:不是给hp做广告哈。
复制代码
HP的一般超过31度就开始挂了;我们在外地用来搞CDN的机房都是不太正规的机房,空调老是三天两头出问题,一出问题机器就死,而且不是死一两台,是全死。
从ILO的WEB可以看到当前环境温度,可以使这个来和机房理论。

  1. 下面是拆箱子,面对着堆积如山的2000台服务器,我是连抬手的力气都拿不出来。。。当时机房只有我们公司3个人+电信值班2个人。。。
  2. 这时候,我的办法是。。。我打电话找来了2队收废品的:
  3. 这么多箱子,除了机器和电源线留下,里头的导轨光盘等等你全部拿走,谁拆的多谁拿的多。。。
  4. 最后按照我的要求帮忙搬到机柜上。。。于是我们5个人是监工。。。看人家拆箱子搬机器。
  5. 于是人家2队人找来了30多号人,一早上把2000台机器全部拆箱子完毕放到机柜上。
  6. 要是我们几个人拆,估计......
复制代码
同感同感,太同感了,我一般都是直接让供货商找民工来拆,纸箱子直接卖掉,08年时一个HP纸箱能卖到六块钱,我们一帮兄弟半年的吃喝都是靠它,09年一个纸箱一块钱
谁说经济没有危机?

  1. 装系统
复制代码
不说了,PXE安装LINUX,比啥都方便,而且超快无比

  1. 我一看TMD全部是DVD,IBM的机器直接佩combo
复制代码
我们的服务器除了HP DL580G5外,其它的都不带光驱,也确实用不着。

  1. 办法4,HP的ILO2功能,实现远程分发。前提你得一台一台配置好BIOS里的ILO2。也是蛮痛苦的。IBM和DELL现在也都有这个功能,但是你在分发以前,还是得一台一台机器插上网线,配置好BIOS的IP,痛苦。然后把操作系统和机器的驱动程序和后续的软件全部做到一张DVD里,让他自动运行。然后所有的服务器远程运营这一个ISO,最好多弄几台,否则一台机器弄的慢死。
复制代码
BIOS我们是找供货商派技术人员一来设,ILO的IP是DHCP自动分配,但是是以MAC来分配的,我们直接把ILO做成了机房的第三个网络,方便远程管理。

  1. 好了系统装好了,电源线和网线连接完,和瀑布一样的。这时候还是尽量把他扎一下吧。
  2. 否则机器通风不畅,会导致热死。
复制代码
上架邦线都是找民工干的,邦的不好看直接让他们拆了重新邦

  1. 简单办法就是电源线扎一边,网线扎一边。有钱的公司可以买个网线序号标,没钱就自己拿胶布标。
复制代码
从下往上15台,最下面的接交换机的确1口,2接2口,以此类推;服务器都做了bonding,第二个口接到相邻的机柜的交换机上,从21口开始,所以,网线上没有任何的标签,只要知道这个规律,就搞不错线的顺序。

  1. 资产管理
复制代码
以SN号为唯一识别码,但有进也碰到没有SN号的情况,极少,一般是换了主板没有把SN重新涮进去,不过一般主机上都是SN号的标签,这个是错不了的。
资产编号也是打出来标签到贴上去,这样SN+资产编号,在数据库中一查就知道是什么时间买的,哪批,合同号,质保时间等。

  1. 维修也一样了,机器坏了,或者需要重装系统,按照上面的流程,一步步走一遍,就可以了。年底统计机房一天要干多少活,省的某些领导认为机房人TMD都在闲着。机房的人呢?没有流程不干活,否则白干。

  2. 在流程系统里重启服务器,重启服务器要是要流程,就太慢了,那么你可以做一个绿色通道,写清楚原因,重启哪个机器,直接提交给相关机房人员,在你的流程系统里绑定一个短信网关,机房人员可以收到需要重启服务器的短信。准确无误。

复制代码
如果你的机房有一千台HP服务器,他们就会派个专门的人员来响应,所以,我们一般周二去机房,在此之前一般会在上周五发邮件给HP,内容一般是有多少台什么样的服务器,SN号是多少,都是什么样的故障,需要带多少什么样的配件等等。
这一天都需要做什么工作,在周一的时候就要发给部门所有人员,让大家补充,周一下午最终确定周二去机房都做什么,怎么分工等,所以流程真的很重要。

再说重启,因为我们的机房没有人值班,我们是既当IDC管理又当SA,所以有死机重启这样的工作,直接用ILO的reboot.

  1. 升级你的服务器
复制代码
一般服务器三年报废,能用到三年头上的很少,所以也就很少碰到有升级的事,不过测试部门用的服务器一般都是不太好的,到是给他们搞过不少的硬件更换。
至于配件的记录情况,我们一般是每周一小盘,一月一大盘,每次购买的配件都记录在案,每个配件的使用也都记录在案,使用日期,用到哪台机器上这些,不过配件管理这块的确不太好管理。

  1. 要说的是,假如你一个机柜上放的机器比较多,比如4个6个机器一摞,恰巧坏了,恰巧一个人在机房,非得解决,怎么办?
  2. 简单,一个办法,但是还是需要你有力气,虽然有力学原理
  3. 比如有4台服务器,最下面的坏了,
  4. 你可以拽住最下面的把4台一起往出拉,拉出来一点,把上面3台往后推,这样一点一点的拉出来
复制代码
我倒。。。。。。。。
我告诉大家,一定要用导轨,不是一般的方便,直接抽拉,而且上下的服务器绝对不受影响

  1. 上面3台一定要留出来一点,否则放下的时候,机器和机柜托板会压住你的手,你一松手,机器震一下,硬盘就挂了。。。
复制代码
太经典了,我也这样做过。。。。。

论坛徽章:
0
16 [报告]
发表于 2010-03-05 14:12 |只看该作者
Mark 一下 ,哈哈

论坛徽章:
0
17 [报告]
发表于 2010-04-06 00:19 |只看该作者
呵呵 学习了 不过我现在做的工作是 运维监控另外加一点部署的工作
还好 我们公司比较人性化 值班的时候可以听听歌 上上网

论坛徽章:
0
18 [报告]
发表于 2010-04-15 17:48 |只看该作者
mark 流量

论坛徽章:
0
19 [报告]
发表于 2010-04-22 13:41 |只看该作者
强强强

论坛徽章:
0
20 [报告]
发表于 2010-05-24 16:03 |只看该作者
呵呵,同感啊。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP