- 论坛徽章:
- 0
|
听朋友说这边挺容易找到做linux系统运维的工程师的。所以发个帖。先声明下,我是做猎头的。
现在给一家美资公司在北京的研发中心找一个做系统运维的工程师,工作地点在北京:
System Operations Engineer将会负责所有这些web applications和web services的管理和操作。保证服务运行稳定,健壮,花费最小,故障处理时间最小,宕机时间最小。监控所有的软件/服务的运行情况,日志分析处理(提取出各种有用的信息,如出错信息工开发人员解决),出现了问题怎么采用应急预案,零中断在我们所有的数据中心升级/部署我们的系统,系统安全,性能分析。也要负责软件开发版本的升级,做到零时间当机并且自动部署到测试环境/生产环境。包括我们的持续集成测试环境的搭建和维护。当然所有之一切都是用脚本完成的。
为了监控和操作我们系统的运行情况,我们需要建立我们自己的预警和报警系统。如果您有这方面的经验,那是一个很大的加分。
cache是系统优化的核心,如果您对怎么实现一个高性能的cache,特别是分布式cache富有经验,或者熟vanish/squid/memcached等现有的cache系统的实现/部署/维护,那将是一个big plus.
我们要面对的一个重要问题就是,Auto scheduling, 即怎么处理网站的洪峰流量,系统要有很强的scalability(我们的平台上的很多网站的一个典型的例子是:平时的时候可能几万PV,但某些特定的时候比如圣诞节可能达到几百万甚至千万级别的PV). 怎么样快速的感知整个系统的负载,快速增加/减少系统的全球各个数据中心的服务结点数而节省成本。
以上是部分的工作内容,至于要求方面我想也不用写太多吧!如有任何疑问可以QQ:407030742,或者直接邮件QQ邮箱。感谢! |
|