- 论坛徽章:
- 0
|
大型门户网站运维的关键技术点分析如下:
1大规模集群管理问题
首先我们先要明确集群的概念,集群不是泛指各功能服务器的总合,而是指为了达到某一目的或功能的服务器、硬盘资源的整合(机器数大于两台),对于应用来说它就是一个整体,目前常规集群可分为:高可用性集群(HA),负载均衡集群(如lvs),分布式储、计算存储集群(DFS,如google gfs ,yahoo hadoop),特定应用集群(某一特定功能服务器组合、如db、cache层等),目前互联网行业主要基于这四种类型;对于前两种类似,如果业务简单、应用上post操作比较少,可以简单的采用四层交换机解决(如f5、foundly),达到服务高可用/负责均衡的作用,对于资源紧张的公司也有一些开源解决办法如lvs+ha,非常灵活;对于后两种,那就考验公司技术实力及应用特点了,第三种DFS主要应用于海量数据应用上,如邮件、搜索等应用,特别是搜索要求就更高了,除了简单海量存储,还包括数据挖掘、用户行为分析;如google、yahoo就能保存分析近一年的用户记录数据,而baidu应该少于30天、soguo就更少了。这些对于搜索准备性、及用户体验是至关重要的。
2 大并发网站的设计
网站架构设计中,非常重要的一个要素,就是确保架构的可扩展性、这是高并发网站的基石。往往,一个网站的大流量不是与生具来的,而是有一个积累过程~~最后变成巨无霸,包括google、yahoo这种全球流量大户,而在这个成长过程中所积累的经验才是最值得我们学习的,包括思考方式、问题解决、改进过程。没有最好的架构设计方案,只有更好。。。,因此在此不会给大家一个终极方案。。。,在此介绍的这些经验,更多的是让大家真正掌握架构设计方法、理念、灵魂,并真正的能利用到实际中。
3 高可靠性问题解决
对于某些企业而言,系统一旦出现故障,公司就会倒闭。计划外故障会增加整个网站总体拥有成本,每小时故障发生将会引起一连串的问题,硬件问题必需要保证高可用性,并且排除硬件问题,研究表明,计划外故障仍会发生,且通常是由操作员失误、软件错误、环境条件等问题造成的,仅凭可靠的硬件是无法避免这些问题的。即使是因应用程序和系统维护而产生的计划内中断,也可能会影响业务性能或延迟必需的更新。所以高可靠性问题必需要解决的首要问题之一.
4 网站安全问题
黑客攻击已成为一个很严重的网络问题。许多黑客甚至可以突破SSL加密和各种防火墙,攻入Web网站的内部,窃取信息。黑客可以仅凭借浏览器和几个技巧,即套取Web网站的客户信用卡资料和其它保密信息。所以防火墙和补丁管理需要规范化!
还有数据备份的问题,一般大型网站备份数据服务器都不会在同一个城市,根据研案调查显示,长江以南与长江以北同时发生地震的可能性相当来说较小,所以某些大型网站的备份数据服务器都会放在不同的城市里.但同样一个问题出现了,根本现在我们的网络速度情况,当服务器发生故障需要备份数据的时候,往往会受到网络,地理位置,相对距离,交通等不方便因素,无法做到及时的恢复数据。所以建议大家看到此处时,在正在生产使用的服务器所在城市再增加一台服务器,以便能快速的恢复服务器的正常运行!
5 海量数据存储、统计分析方案、架构
关于海量数据存储,统计,分析,架构都需要科学的规范和部署,这方面的问题就太多了,在这里就不一一再讲述了。
本文来至:http://www.anyiwa.com/?p=532 如有转载请附此链接,谢谢! |
|