AWStats简介:Apache/IIS的日志分析工具(2)
作者:车东 来源:笔记 by 车东 发布时间:2008-05-02 20:44:00
AWStats安装备忘
AWStats的运行模式是这样的:
分析日志:运行后将这样的日志统计结果归档到一个AWStats的数据库(纯文本)里;
然后是输出:分两种形式
一种是通过cgi程序读取统计结果数据库输出;
一种是运行后台脚本将输出导出成静态文件;
以下是2个针对单个站点日志统计例子:
一个是在GNU/Linux上通过CGI方式的输出,
一个是在Windows 2000上的基于静态页面的导出
下载/安装
http://sourceforge.net/projects/awstats/ 下载安装包后:
GNU/Linux:tar zxf awstats-version.tgz
awstats的脚本和静态文件缺省都在wwwroot目录下: 将cgi-bin目录下的文件都部署awstats.pl程序到/home/apache/cgi-bin/awstats/ 下
mv awstats-version/wwwroot/cgi-bin /path/to/apache/cgi-bin/awstats
#把图标等文件目录复制到WEB的HTML文件发布目录下:/home/apache/htdocs/ 下发布
更多的批量更新脚本等在tools 目录下,可以一并放到cgi-bin/awstats/ 目录下,
Windows 2000:按照后台脚本模式运行,直接解包,然后移动到D:\AWStats目录下
把图标icon目录复制到IIS的发布目录下:inetpub/icon
数据源日志格式和按天的截断规则
对于Apache:日志格式好设置:设置成combined格式即可,日志截断麻烦一点:需要安装cronolog工具,将日志设置成按天截断:
CustomLog "|/usr/local/sbin/cronolog /path/to/apache/logs/access_log.%Y%m%d" combined
比如:logs/access_log.20030326
日志是压缩格式,可以使用gzip -d < /home/apache/logs/access_log.%YYYY-24%MM-24%DD-24.gz | 动态解压缩统计。对于IIS:缺省有比较好的日志按天截断规则,但是IIS的日志格式比较不适合AWStats统计,
因此最好直接去掉所有日志字段,然后严格按照以下列表设置
相比IIS缺省设置:
减少的有:
增加的有:发送字节数
协议版本
参照
服务器IP地址
服务器端口
URI查询
日期 date
时间 time
客户IP地址 c-ip
用户名 cs-username
方法 cs-method
URI资源 cs-uri-stem
协议状态 sc-status
发送字节数 sc-bytes
协议版本 cs-version
用户代理 cs(User-Agent)
参照 cs(Referer)
配置文件的命名规则:awstats.sitename.conf
AWStats的主程序awstats.pl会自动根据站点名调用相应站点的配置文件:awstats.sitename.conf
比如:运行./awstats.pl -config=chedong 调用的就是同目录下的 awstats.chedong.conf 配置文件;
如果没有指定-config,还会找当前目录下的awstats.conf或者/etc/awstats.conf作为缺省配置文件。
所以最好把缺省的awstats.model.conf 重命名成 awstats.yoursite.conf;比如:awstats.chedong.conf,
对于多个站点的统计,AWStats的配置文件包含功能还是非常有用的,我们可以把通用的配置放在一个文档中,然后用(5.4版本以后开始支持) Include配置将通用配置包含在各个具体配置文件的头部,然后用其他配置覆盖通用配置中的相应属性,比如:
Include="common.conf"
LogFile="/path/to/bbs/access_log"
SiteName="bbs.chedong.com"
最少的配置文件修改:LogFile SiteDomain LogFormat
对于在GNU/Linux上统计Apache日志只需修改:LogFile SiteDomain这2个选项
GNU/Linux LogFile="/path/to/apache/logs/access_log.%YYYY-24%MM-24%DD-24"
Windows 2000 LogFile="d:\iis_logs\W3SV3\ex%YY-24%MM-24%DD-24.log"
这个配置的意思是用24小时前的年份,月份,日期拼出的日志文件名;SiteDomain="www.chedong.com"
站点的名称,缺省是空的,如果为空,AWStats将拒绝运行;对于统计IIS日志需要多修改一个:
LogFormat=2
缺省值是1:Apache日志,2是IIS日志
其他需要注意的事项:
AWStats缺省不过滤swf文件,会把.swf算成PageView,所以如果站点上swf文件主要是广告的话最好还是要过滤掉:


猜你喜欢
- 酷我音乐盒作为国内领先的网络音乐播放器,除了提供给用户完美的音乐视听享受外,在歌词方面也是精益求精,力求带给用户独一无二的全新歌词体验。经过
- 最近总是有用户向我要求“怎么不在软件里加点VIP的视频?”“可以看特别的频道或电影吗”诸多这样的问题。存在即是合理,想必做视频网站永远都无意
- linux驱动常用函数(copy_from_user open read write)1.open函数定义:int open( const
- 在不少人眼里,登录服务器也许是一件简单得几乎不值得一提的事情!可事实并非想象中那样简单轻松,在不同的服务器登录环境中,我们或许会遇到许多不同
- 那为什么同样都是学SEO的,有的人就可以一个月赚好几万,有的人却只能赚个三五千呢?其实知识都是一样的知识,SEO的技术很多的seoer都懂,
- VMware虚拟机有三种网络模式,分别是Bridged(桥接模式)、NAT(网络地址转换模式)、Host-only(主机模式) 。VMwar
- 3月24日凌晨消息,阿里巴巴网络有限公司(1688.HK)CEO卫哲近日承认,在数月之内,阿里巴巴将有一个战略性的项目面世。据悉,该项目或与
- 教你新站seo获取外部链接的五大方法大家都知道外部链接是搜索引擎优化中很重要的因素,有的时候甚至起到了决定性的作用。群里面的朋友问我,说新站
- 最新消息,日前国内人气最高的非赢性互联网技术交流社区之一深度(http://bbs.deepin.org)成功升级。经过调整后的深度社区12
- 北京时间10月14日上午消息,据国外媒体报道,消息人士透露,温思坦影业(Weinstein Company)准备将旗下富豪社交网络ASmal
- 在传统SEO时代,关键词的选择意味着在搜索引擎中的排名先后,同时也在一定程度上反映了一个网站的品牌形象——如果一个知名公司的网站在搜索引擎中
- 英文原文:Five Best FTP Clients无论你是做网站工作,还是运行一个家庭FTP服务器,或者你只是喜欢高速下载,一个稳定且功能
- –link可以通过容器名互相通信,容器间共享环境变量。–link主要用来解决两个容器通过ip地址连接
- 导入链接指的是从外部网站的页面上链回您的网站的链接。导入链接能够给您的网站带来新的用户,而且当这些链接是有价值的、网站编辑自愿选择的链接时,
- 今天VBS群里有人要了解ARP攻击,ARP攻击盛行于局域网,找了这个BAT,对付ARP攻击。网上流行一个vbs的虚拟网关,也有斯普林的程式的
- 大家慢慢的都开始知道软文在网络营销里的重要性,但是大部分的同学还停留在知其然而不知其所以然的阶段。写一篇与众不同又可以受到关注的软文是需要一
- 刚接触 Vim 会觉得它的学习曲线非常陡峭,要记住很多命令。所以这个系列的分享,不会教你怎么配置它,而是教你怎么快速的使用它。在开发时为了代
- 2月9日消息,据国外媒体报道,日前有消息称,Windows Vista SP1将于2月18日发布,而Windows XP SP3将于23日上
- 虚拟基础架构时常遭遇简单解决方案效率低下的困扰。虚拟机执行匮乏的现状阻碍了虚拟化技术的普及。以下的十大虚拟机优化小窍门能帮助用户轻松解决每个
- 作为草根的我们,在辛辛苦苦连续奋战几天几夜或更长时间后,自己的网站终于诞生了。他就像自己孩子一样,用自己全部的爱呵护着,培养他长成苍天大树。