guoli0813 发表于 2011-11-22 18:07

关于开发测试机的运维心得及难言之痛

实在找不到对应的分类,就放这儿吧,请版主高抬贵手。

我是一名OPER,负责公司内部开发测试机的运维工作,期间有很多东西需要不断的思考和提炼。对于我们BPOP而言的核心KPI就是:降低公司成本,提高机器使用率。这和产品线OP的KPI(提高产品稳定性和降低运营成本)有很大的区别,也造成很多运维思路上的不同。
先说一下心得:
1.提高虚拟机的使用率,开发测试很大一部分是用来跑code的功能,尤其是开发。所以基本上虚拟机就能满足要求。
2.从单测试组而言,提高机器复用频率。比如单测机器。
3.使用机器资源池方式,性能机的使用,QA是按照项目排期,项目一般测试不会超过7个工作日,但各个项目之间有2—5天的间歇档,这段时间的机器利用率就是零,把这部分机器回收给其他组使用来提高使用率。

以上是优化过得使用方式。
下面说一下难言之痛:
1.性能机上的环境部署一次基本上占用1人天的成本,假如机器不回收的话,基本这1人天的成本就不会消耗,但是代价就是几十台机器的空闲。
2.对开发测试机的运维和线上机器的运维很大的不同:就是开发测试机的运维是对人的运维。因为机器的使用权是开发测试人员。这就有很大的沟通成本在里面。比如机器故障(内存,硬盘,电源)的停机,网络问题的跟进等等。怎么降低这方面的成本也是一大难题。

和线上机器相比,开发测试机的利用率基本上CPU利用率是在个位数(从半年时间平均来看),所以怎么样在不影响开发测试的业务前提下提高机器使用率成为一个难题?


你有什么好的点子?不妨跟帖。

以上我只是说了几个思路,大家完全可以撇开这几个思路随便谈。

guoli0813 发表于 2011-11-23 09:24

这么多人看,没有人回帖??
这是肿么了,兄弟帖子不beautiful or what??

Shell_HAT 发表于 2011-11-23 12:59

性能机上的环境部署一次基本上占用1人天的成本
这个成本有降低的可能不?
页: [1]
查看完整版本: 关于开发测试机的运维心得及难言之痛