- 论坛徽章:
- 0
|
AWStats
是在
Sourceforge
上发展很快的一个基于Perl的WEB日志分析工具。相对于另外一个非常优秀的开放源代码的日志分析工具
Webalizer
,AWStats的优势在于:
界面友好:可以根据浏览器直接调用相应语言界面(有简体中文版)
参考输出样例:
http://www.chedong.com/cgi-bin/awstats/awstats.pl?config=chedong
基于Perl:并且很好的解决了跨平台问题,系统本身可以运行在GNU/Linux上或Windows上(安装了
ActivePerl
后);分析的日志直接支持Apache格式 (combined)和IIS格式(需要修改)。Webalizer虽然也有
Windows平台版
,但目前已经缺乏 维护;
AWStats完全可以实现用一套系统完成对自身站点不同WEB服务器:GNU/Linux/Apache和Windows/IIS服务器的统一统计。效率比较高:AWStats输出统计项目比Webalizer丰富了很多,速度仍可以达到Webalizer的1/3左右,对于一个日访问量 百万级的站点,这个速度都是足够的;
配置/定制方便:系统提供了足够灵活但缺省也很合理的配置规则,需要修改的缺省配置不超过3,4项就可以开始运行,而且修改和扩展的插件还是 比较多的;AWStats的设计者是面向精确的"Human visits"设计的,因此很多搜索引擎的机器人访问都被过滤掉了,因此有可能比其他日志统计工具统计的数字要低,来自公司内部的访问也可以通过IP过滤 设置过滤掉。提供了很多扩展的参数统计功能:使用ExtraXXXX系列配置生成针对具体应用的参数分析会对产品分析非常有用。
更多与其他工具:Webalizer, analog的比较请参考:
http://awstats.sourceforge.net/#COMPARISON
环境 centos4.4
1>安装所有的软件包
wget http://www.awstats.cn/files/awstats-6.6.tar.gz
rpm -ivh http://dag.wieers.com/rpm/packages/cronolog/cronolog-1.6.2-1.el4.rf.i386.rpm
rpm -ivh http://www.silfreed.net/download/repo/packages/cronolog/cronolog-1.6.2-1.el4.i386.rpm
yum install GeoIP Geo-IP
rpm -ivh http://mirrors.ircam.fr/pub/dag/packages/perl-Geo-IPfree/perl-Geo-IPfree-0.2-1.2.el4.rf.noarch.rpm
2>安装
tar -zxvf awstats-6.6.tar.gz
mv awstats-6.6 /var/www/html/awstats
3>配置http log
更改httpd的log方式
LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\"" combined
SetEnvIf Request_URI \.gif$ gif-image
SetEnvIf Request_URI \.GIF$ gif-image
SetEnvIf Request_URI \.jpg$ gif-image
SetEnvIf Request_URI \.JPG$ gif-image
SetEnvIf Request_URI \.png$ gif-image
SetEnvIf Request_URI \.swf$ gif-image
SetEnvIf Request_URI \.SWF$ gif-image
SetEnvIf Request_URI \.css$ gif-image
SetEnvIf Request_URI \.CSS$ gif-image
SetEnvIf Request_URI \.js$ gif-image
SetEnvIf Request_URI \.JS$ gif-image
SetEnvIf Request_URI \.ico$ gif-image
SetEnvIf Remote_Addr "*\.*\.*\.231" gif-image
SetEnvIf Remote_Addr "*\.*\.*\.230" gif-image
ErrorLog "|/usr/sbin/cronolog /var/log/httpd/hehehe.%Y-%m-%d-error_log"
CustomLog "|/usr/sbin/cronolog /var/log/httpd/hehehe.%Y-%m-%d-access_log" combined env=!gif-image
###屏蔽掉230和231的http log,因为两个IP做heartbeat,产生大量垃圾log
4>配置awstats
perl /var/log/www/html/awstats/tools/awstats_configure.pl
###默认生成的配置文件放在/etc/awstats/下
mkdir /etc/awstats/data
###建立data目录放置一些必要的数据文件
5>更新GeoIP库 每月定期下载更新
wget http://www.maxmind.com/download/geoip/database/GeoLiteCity.dat.gz
wget http://www.maxmind.com/download/geoip/database/GeoIP.dat.gz
gunzip GeoLiteCity.dat.gz
gunzip GeoIP.dat.gz
mv GeoLiteCity.dat /etc/awstats/data/
mv GeoIP.dat /etc/awstats/data/
chmod 777 /etc/awstats/data/Geo*
6>编辑/etc/awstats/awstats.www.hehehe.com.conf文件
*设置httpd logfiule的位置
LogFile="/var/log/httpd/hehehe.%YYYY-4-%MM-2-%DD-2-access_log"
*设置要分析的服务日志类型 w表示为web日志
LogType=W
*设置日志格式 1表示采用 NCSA apache combined/ELF/XLF log format
LogFormat=1
*设置要分析的域名
SiteDomain="www.hehehe.com"
HostAliases="hehehe.com www.hehehe.com 127.0.0.1 localhost"
*设置awstats的数据库存放目录
DirData="/etc/awstats/data"
*设置DirCgi
DirCgi="/var/www/html/awstats/wwwroot/cgi-bin"
DirIcons="/var/www/html/awstats/wwwroot/icon"
*设置通过浏览器刷新页面
AllowToUpdateStatsFromBrowser=1
*设置使用IP与地理名解析
LoadPlugin="geoip GEOIP_STANDARD /etc/awstats/data/GeoIP.dat"
LoadPlugin="geoip_city_maxmind GEOIP_STANDARD /etc/awstats/data/GeoLiteCity.dat"
7>修改权限
chmod -R 755 /var/www/html/awstats /etc/awstas/data
chmod 777 /var/www/html/awstats/wwwroot/cgi-bin/*.pl
8>创建awstats初始化数据库并建立awstats初始化静态统计页面
perl awstats.pl -config=www.hehehe.com -update -lang=cn
perl awstats.pl -config=www.hehehe.com -output -staticlinks -lang=cn>awstats.hehehe.html
9>设置定时更新日志统计
crontab -e
*/5 * * * * /var/www/html/awstats/wwwroot/cgi-bin/awstats.pl -config=www.hehehe.com -update -lang=cn > /dev/null
10>启动apache并查看结果
/usr/local/apache/bin/apachectl start
http://*.*.*.*/awstata/awstats.pl?config=www.hehehe.com
参考:
http://blog.csdn.net/ronaldchan2005/archive/2007/03/10/1526054.aspx
http://www.chedong.com/tech/awstats.html
本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u/19540/showart_350706.html |
|