AWStats简介:Apache/IIS的日志分析工具(2)
作者:车东 来源:笔记 by 车东 发布时间:2008-05-02 20:44:00
AWStats安装备忘
AWStats的运行模式是这样的:
分析日志:运行后将这样的日志统计结果归档到一个AWStats的数据库(纯文本)里;
然后是输出:分两种形式
一种是通过cgi程序读取统计结果数据库输出;
一种是运行后台脚本将输出导出成静态文件;
以下是2个针对单个站点日志统计例子:
一个是在GNU/Linux上通过CGI方式的输出,
一个是在Windows 2000上的基于静态页面的导出
下载/安装
http://sourceforge.net/projects/awstats/ 下载安装包后:
GNU/Linux:tar zxf awstats-version.tgz
awstats的脚本和静态文件缺省都在wwwroot目录下: 将cgi-bin目录下的文件都部署awstats.pl程序到/home/apache/cgi-bin/awstats/ 下
mv awstats-version/wwwroot/cgi-bin /path/to/apache/cgi-bin/awstats
#把图标等文件目录复制到WEB的HTML文件发布目录下:/home/apache/htdocs/ 下发布
更多的批量更新脚本等在tools 目录下,可以一并放到cgi-bin/awstats/ 目录下,
Windows 2000:按照后台脚本模式运行,直接解包,然后移动到D:\AWStats目录下
把图标icon目录复制到IIS的发布目录下:inetpub/icon
数据源日志格式和按天的截断规则
对于Apache:日志格式好设置:设置成combined格式即可,日志截断麻烦一点:需要安装cronolog工具,将日志设置成按天截断:
CustomLog "|/usr/local/sbin/cronolog /path/to/apache/logs/access_log.%Y%m%d" combined
比如:logs/access_log.20030326
日志是压缩格式,可以使用gzip -d < /home/apache/logs/access_log.%YYYY-24%MM-24%DD-24.gz | 动态解压缩统计。对于IIS:缺省有比较好的日志按天截断规则,但是IIS的日志格式比较不适合AWStats统计,
因此最好直接去掉所有日志字段,然后严格按照以下列表设置
相比IIS缺省设置:
减少的有:
增加的有:发送字节数
协议版本
参照
服务器IP地址
服务器端口
URI查询
日期 date
时间 time
客户IP地址 c-ip
用户名 cs-username
方法 cs-method
URI资源 cs-uri-stem
协议状态 sc-status
发送字节数 sc-bytes
协议版本 cs-version
用户代理 cs(User-Agent)
参照 cs(Referer)
配置文件的命名规则:awstats.sitename.conf
AWStats的主程序awstats.pl会自动根据站点名调用相应站点的配置文件:awstats.sitename.conf
比如:运行./awstats.pl -config=chedong 调用的就是同目录下的 awstats.chedong.conf 配置文件;
如果没有指定-config,还会找当前目录下的awstats.conf或者/etc/awstats.conf作为缺省配置文件。
所以最好把缺省的awstats.model.conf 重命名成 awstats.yoursite.conf;比如:awstats.chedong.conf,
对于多个站点的统计,AWStats的配置文件包含功能还是非常有用的,我们可以把通用的配置放在一个文档中,然后用(5.4版本以后开始支持) Include配置将通用配置包含在各个具体配置文件的头部,然后用其他配置覆盖通用配置中的相应属性,比如:
Include="common.conf"
LogFile="/path/to/bbs/access_log"
SiteName="bbs.chedong.com"
最少的配置文件修改:LogFile SiteDomain LogFormat
对于在GNU/Linux上统计Apache日志只需修改:LogFile SiteDomain这2个选项
GNU/Linux LogFile="/path/to/apache/logs/access_log.%YYYY-24%MM-24%DD-24"
Windows 2000 LogFile="d:\iis_logs\W3SV3\ex%YY-24%MM-24%DD-24.log"
这个配置的意思是用24小时前的年份,月份,日期拼出的日志文件名;SiteDomain="www.chedong.com"
站点的名称,缺省是空的,如果为空,AWStats将拒绝运行;对于统计IIS日志需要多修改一个:
LogFormat=2
缺省值是1:Apache日志,2是IIS日志
其他需要注意的事项:
AWStats缺省不过滤swf文件,会把.swf算成PageView,所以如果站点上swf文件主要是广告的话最好还是要过滤掉:
猜你喜欢
- Google网站优化器 (Website Optimizer,WO)是一个强大的工具,允许站长分析网站流量,测试有效性和转化率等变量,一般情
- 发布商都很关注收入的波动问题,今天我们就帮大家深入分析一下如何知道收入波动的背后原因,并采取相应的措施。首先,大家都知道,AdSense 收
- 搜索引擎营销发展大事记1994年,Yahoo、Lycos等分类目录型搜索引擎的相继诞生,搜索引擎表现出网络营销价值,搜索引擎营销的思想开始出
- 10月20日消息,在今日举行的“2009中国数码产品网上零售峰会”上,支付宝总裁邵晓锋透露,日前支付宝已经拿到国家外汇管理局的批文,中国境内
- 连接到你的独立服务器,一般来说有两种方式:你可以使用一个基于网络的接口,如Plesk;或者你可以使用SecureShellprotocol(
- (一)硬件准备一台HP ProLiant DL160 G5服务器(硬盘拓展到480G)一台个人电脑(windows操作系统)一个Lenovo
- 旷土年前写过一篇标题为《旷土:中国商业网址的成功经验分享 初期发展篇》的文章,写得比较粗糙,今天就来详细谈谈运作中的一些经验。旷土在运作中国
- 好久没写博客,懒得写。自己不写,倒是看了很多。基本都不靠谱。越发觉得国内的互联网业界浮躁,很少出现让我惊艳如美国的danah boyd。她在
- 在点石看了KYW的中国SEOer的级别,觉得很有趣,于是想写一篇中国网络赚钱的级别。和KYW不同的是他是高手可以站在一个很高的层面看待各类人
- SEO发展到今天,可以说已经有非常多的SEOER涌现,也有越来越多的“准SEOER”正在学习或打算学习SEO技术,那么,是什么导致SEO越来
- 今天之所以写这篇文章是因为昨天在群里聊天,有一位朋友自己做站三年了,曾经做了许多收入客观的网站,但是随着在IT界的摸爬滚打几年后如今在想做一
- 10月10日消息,淘宝内部人士向腾讯科技证实,淘宝已启用search.taobao.com域名,目前正在内测自己的独立搜索引擎。淘宝搜索内测
- 11月26日消息,腾讯科技今日独家获悉,谷歌中国今年9月展开的5000万元中小企业激励计划,将于11月30日结束。至此,谷歌中国针对中小企业
- 二、工作环境本文假设用户希望在企业网环境中创建一个电子邮件服务器,为本企业用户提供邮件服务。该服务器拥有一个合法的IP地址202.99.11
- 漫游(Manyou)开放平台是康盛创想(Comsenz)为第三方应用开发者提供的开放平台。漫游开放平台一端联系着数百个第三方应用开发者,一端
- 网上的一些防范asp木马的教程都基于提前防范的基础之上,例如:禁止FSO,利用NTFS限制用户目录等等。这些方法虽然有效,但是都是基于提前防
- AdSense 收入 = 广告展示次数 x 点击率 x 点击单价 x 智能定价因素(Smart Price)广告展示次数基于你的网站流量,该
- 说起电子邮箱,相信不少朋友都会有不下两三个吧?接下来我们将向你介绍如何用计算机来架设一个邮件服务器。一、下载安装WinMail1)首先有请我
- 一. HTTP压缩概述HTTP压缩是在Web服务器和 浏览器间传输压缩文本内容的方法。HTTP压缩采用通用的压缩算法如gzip等压缩HTML
- 闲暇的时候,我喜欢用自己的相机狂拍一通。然后用我喜爱的“美图秀秀”软件美化一下,就是一组组美丽的个人写真哦。软件操作简单,一些流行的图片特效