AWStats简介:Apache/IIS的日志分析工具(3)
作者:车东 来源:笔记 by 车东 发布时间:2008-05-02 20:44:00
日志分析
./awstats.pl -update -config=sitename -lang=cn
比如:./awstats.pl -update -config=chedong
会自动调用awstats.chedong.conf这个配置文件
统计输出
GNU/Linux http://localhost/cgi-bin/awstats/awstats.pl?config=chedong
Windows 2000 http://localhost/awstats/awstats.chedong.html
日志统计自动运行
GNU/Linux上:crontab -e: 每天8点10分运行
#update awstats
10 8 * * * (cd /path/to/apache/cgi-bin/awstats/; ./awstats.pl -update -config=chedong)
Windows 2000上:设置每天8点10分运行
D:\Perl\bin\perl.exe d:\AWStats\tools\awstats_buildstaticpages.pl -update -config=chedong -lang=cn -dir=c:\inetpub\awstats\ -awstatsprog=d:\awstats\wwwroot\cgi-bin\awstats.pl
多站点日志统计
AWStats自带了一个批处理工具:tools/awstats_updateall.pl,可以批量地遍历一个目录下所有地配置文件并运行统 计。因此剩下的工作就主要是日志的同步问题了。
针对多个站点,很多配置选项是重复的,如果每个配置文件都修改维护起来会很麻烦,AWStats从5.4版本开始提供了配置文件包含的功能,所以我们可 以配置一个通用配置,比如:common.conf
然后其他站点的配置设置为:可以通过后面的选项覆盖和缺省不一致的配置。
awstats.bbs.chedong.conf
Include "chedong.common.conf"
LogFile "/path/to/bbs_log"
SiteName "bbs.chedong.com"
awstats.www.chedong.conf
Include "chedong.common.conf"
LogFile "/path/to/www_log"
SiteName "www.chedong.com"
HostAliases="chedong.com"
统计指标说明
参观者:按来访者不重复的IP统计,一个IP代表一个参观者;
参观次数:一个参观者可能1天之内参观多次(比如:上午一次,下午一次),所以按一定时间内(比如:1个小时),不重复的IP数统计,参观者 的访问次数;
网页数:不包括图片,CSS, JavaScript文件等的纯页面访问总数,但如果一个页面使用了多个帧,每个帧都算一个页面请求;
文件数:来自浏览器客户端的文件请求总数,包括图片,CSS,JavaScript等,用户请求一个页面是,如果页面中包含图片等,所以对服 务器会发出多次文件请求,文件数一般远远大于文件数;
字节:传给客户端的数据总流量;
来自REFERER中的数据:日志中的参考(REFERER)字段,记录了访问相应网页之前地址,因此如果用户是通过搜索引擎的搜索结果点击 进入网站的,日志中就会有用户在相应搜索引擎的查询地址,这个地址中就可以通过解析将用户查询使用的关键词提取出来:
比如:
2003-03-26 15:43:58 123.123.123.123 - GET /index.html 200 192 HTTP/1.1 Mozilla/4.0+(compatible;+MSIE+5.01;+Windows+NT+5.0) http://www.google.com/search?q=chedong
AWStats在搜索引擎的关键短语和关键词统计方面的功能还是比较完整的:可以对全世界3百多种机器爬虫进行识别,并且可以识别大部分主流国际化搜索引 擎和很多地区的本地语言搜索引擎。
Hacking AWStats
基于地理信息的插件安装:
GeoIP 和 Geo::IPfree(awstats 5.5+)
GeoIP和Geo::IPfree都免费的是国家/IP的影射表,比通过DNS反相解析域名得到的统计准确,而且速度快。GeoIP的API都是免费 的,缺省库是免 费的,收费的是它的数据更新服务。Geo::IPfree不仅代码是公开的,而且库数据也是公开的。
GeoIP安装:
先下载C库:GeoIP C解包后
%./configure; make
#make install
然后下载Perl库:GeoIP Perl解包后
%perl MakeFile.PL; make
#make install
Geo::IPfree安装:
下载Geo::IPfree解 包后
%perl Makefile
%make
#make install
配置:通过在配置文件中启用GEOIP相关插件:
LoadPlugin="geoip GEOIP_STANDARD /home/apache/chedong.com/cgi-bin/awstats/GeoIP.dat"
LoadPlugin="geoip_city_maxmind GEOIP_STANDARD /home/apache/chedong.com/cgi-bin/awstats/GeoLiteCity.dat"
MaxMind目前免费提供了GeoIP和GeoIPCityLite数据包:可以定期每个月从以下地址下载
猜你喜欢
- 最近,搜索引擎战略会议在寒冷的芝加哥举行。许多谷歌参加者总是被问及关于重复内容的问题。对于这个话题,我们发现有许多破碎的并且有些混乱的理解。
- 首先,说一下我们的例子目的--一让数据库输出XML,并且在.net体系下调用出来。 这个系统的数据层
- 中秋节就快到了,提前祝各位站长节日快乐,站站顺利!如何利用中秋节推广网站,下面几条可能有点帮助,希望能为大家抛砖引玉。。带来流量上的提升。一
- 昨天晚上的南大科技馆一楼报告厅,曾经有众多跨国公司高层在这里演讲的讲台,昨天被百度董事长兼首席执行官李彦宏“占据”。这位年轻的IT业富豪,在
- 在各类会议上总有一些有趣的事情。会上,搜索引擎公司总会有重大的宣布,业界重要人物也总会发表主题演讲。在旧金山召开的“复制内容和多网站问题”大
- 品牌博客成功的三进策略:一、人脉进门所有成功博客的身边都有一个很强大的由其他博客撰写者组成的支持团。网络在很大程度上可以从很多方面帮助你,这
- 题记:在很多相册的网站中,都有这样的功能:当图片分多页显示的情况下,点击图片会自动翻页到下一张图片,接下来我们在dedecms4中实现这个功
- 北京时间11月8日消息,据国外媒体报道,微博客Twitter近日开始测试更便捷的信息转发功能,部分Twitter.com用户已经可以看到&a
- 1. 关键词密度关键词除了需要出现在标题里面,还需要在整个网页里面以一定的频率出现。你需要在标题、段落内容、(文字内容的)页头和页尾、Alt
- 总共搜集了4款,大家可以根据需要下载!第一款为可直接复制文件的版本。附件:mstsc5.1.rar (312.7 KB)第二款为2
- 为了更好的实现对社区热点信息的聚焦,Discuz! 7.1新增了“主题热度与主题评价”功能,成为强化社区信息聚焦重要应用手段。重视细节改进是
- WordPress功能之所以如此强大,正是因为它不仅具有大量默认功能,还被赋予了无限的可扩展性。开发者可以通过开发插件或者widget来实现
- 首先要提到的是这里的内网是指一般我们网吧内部环境的内网,对局域网内网我没什么好说的,愿花钱的去DNS0755好了。一个基本条件:一个公网IP
- 今天需要实现一个功能,wordpress实现一篇较长的文章分页显示,于是乎找了很多资料,找了很久才找到,大部分都是3.0之前的实现方法,所以
- SEO也不会起到更多的作用了,只有内容才是真正的霸道之物。搜索引擎优化技术人员必须遵循搜索引擎的规律和指导来进行搜索引擎优化操作,而不能不切
- 12月16日,国内知名CMS厂商PHP168发布了其最新版的V6.02增强版,这个版本跟上一个版本相比,共改进了27项功能。大家如果对能需要
- 据国外媒体报道,“威比奖”(Webby Awards)周三颁发了互联网十年10大重要时刻大奖,谷歌、
- 美国域名注册商name.com发布了Cyber Monday域名注册优惠码,主要针对com和net新注册域名,原始价格是9.99美元,优惠价
- 日前,因QQ互联帐号接入政策限制在新浪微博上出现了广泛的争议,多个知名社区负责人表示无法申请QQ互联接入服务,随后有消息称Discuz将推独
- 目前,服务器管理中的最热门话题是管理虚拟服务器的问题。服务器虚拟化能够让较少的硬件资源运行多个应用程序和操作系统。这对于希望提高服务器利用率