如何通过IIS日志分析网站的情况
来源:51baobao.net 发布时间:2008-07-27 16:55:00
看到这个标题,想必大家会不屑一顾,“需要分析IIS日志吗?我有流量统计、51yes、cnzz、51la等等一大堆,功能全面,用起来也方便”,在这里请大家先别急着下结论,看完下面进行的IIS日志分析后再说。
先来说说如何下载IIS日志文件。如果自己有独立的服务器,在IIS信息服务窗口中,点击要设置的网站的属性,在“网页”选项卡上可以看到“启动日志记录”项,可以设置日志的保存位置、日志的记录格式等等,虚拟主机用户可以通过空间商提供的后台生成IIS日志,如万网中称为“weblog日志下载”。
现在我们已经找到了IIS日志文件,然后把它下载下来,用ultraedit将其打开(为什么不用记事本打开呢?记事本要打开一个几十M、上百M的文本文件,其速度实在是不能让人忍受)。下面就以我的一个网站(51baobao.net)的IIS日志为例进行一下分析演示。
第一,通过IIS日志了解搜索引擎的到访记录:
用ultraedit打开后,按CTRL+F键,弹出窗口(如图1),输入Googlebot,按回车,在新窗口中显示的页面就是google机器人的到访问记录,选中其中之一双击,可以看到访问的时间和页面(如图2),在这里要注意的是所显示的时间是国际标准时间,所以要在这个时间上加8个小时,这样才是北京时间,如果是自己的独立服务器可以设置为北京时间,这里就不详述了。
(图1)
(图2)
我们继续查找Baiduspider可以看到baidu蜘蛛的爬行记录。其他搜索引擎通过查找如Yahoo、Sogou、msnbot、YodaoBot… 比如我们新做了一个网站,也在百度和google中提交了,可是site站点的时候就是看不到收录的页面,这时我们就可以利用上面的方法查看一下IIS日志,只要百度和google等搜索引擎的蜘蛛已经爬行过我们的站点了,我们就不用担心网站的收录问题了,搜索引擎会慢慢的放出已经抓取的页面,站长们继续增加内容就行了。通过此项查找还可以了解搜索引擎的到访时间和抓取页面的时间及频率。
上面是通过IIS日志查看搜索引擎的爬行记录,可能有人会问了,为什么搜索引擎的爬行记录不能被流量统计工具统计到?因为流量统计代码是采用JS调用的方式,搜索引擎蜘蛛爬行时不会调用JS文件。我们可以自己写个流量统计功能,然后include流量统计功能的这个动态页面到各个页面中,这样所有对页面的访问就都可以统计到了,并且通过agent参数,可以判断来自哪个搜索引擎,这里不再详述。
第二,通过IIS日志查找网站是否存在死链接: 在用ultraedit打开的IIS日志文件中按CTRL+F键,在出现的窗口中(如图1),选中第一和第三个复选框,输入404,然后按回车,看看在弹出的窗口中有没有找到记录。如果找到,说明你的网站存在死链接,大家都知道死链接对网站的收录是有影响的,怎么去处理就不用我说了吧。
下面是搜索404时我的网站IIS日志中出现的几条记录:
2008-07-24 16:05:08 GET /Login.asp - 60.182.153.56 HTTP/1.1 Mozilla/3.0+(compatible;+Indy+Library) - 404 0 1003
2008-07-24 16:05:08 POST /Login.asp - 60.182.153.56 HTTP/1.1 Mozilla/3.0+(compatible;+Indy+Library) http://www.51baobao.net /Login.asp 404 0 1003
2008-07-24 16:05:08 GET /reg.asp - 60.182.153.56 HTTP/1.1 Mozilla/3.0+(compatible;+Indy+Library) http://www.51baobao.net /Login.asp 404 0 1003
2008-07-24 16:05:09 POST /reg.asp - 60.182.153.56 HTTP/1.1 Mozilla/3.0+(compatible;+Indy+Library) http://www.51baobao.net /reg.asp?action=apply 404 0 1003
相信有经验的站长都明白了吧?这是有人在用一些漏洞扫描工具对网站进行漏洞测试,看看有没有漏洞,使用通用的CMS、DIG、BBS、BLOG系统的站长可要注意了,你所用的网页程序如果有漏洞,网站就会有被黑掉的危险!
第三、通过IIS日志查找网站是否存在程序错误:
我们再输入500进行查找,如果查找到相关页面,说明网站 的程序在运行过程中出现了错误,需要对程序进行修改。
第四、通过IIS日志查找网站是否被入侵过:
通过IIS日志可以判断网站是否曾被通过SQL注入过,是怎样被入侵的。在网站IIS日志我们搜索一下%20和’单引号(半角的),看看是否有相关的页面存在,当然不是所有包括%20和’的页面都是被注入页面,但一般的SQL注入都是通过%20(空格的ASC码的16进制值是20)和单引号进行的。此方法可以判断出程序上的漏洞,这样我们可以修改程序防止SQL注入。我曾经用这个办法将网站被SQL注入的全过程及入侵的破坏程度进行了解,然后修改了程序,防止了网站再次被入侵。
介绍以上几点,以供大家参考。
对于apache的日志,分析方法也类似。现在有一些IIS日志分析软件可以帮助我们分析出搜索引擎的到访情况以及404错误的网页,但对于通过网站漏洞被入侵的问题只能靠我们手工查找了。
由于平时很少写文章,写的词不达意还望各位谅解,欢迎与我进行MSN交流(51baobao.net#live.cn),同时欢迎访问我的网站51baobao.net。
转载时请尊重作者的版权,保持文章的完整,请不要对本文进行修改。
猜你喜欢
- 站长网是个很普通的网站,为什么他会有人气?不是因为网站成功,Admin5团队成功的是人。一.为人低调图王从来没有摆过架子,尽管他很忙,但是我
- iis限制,流量限制与cpu限制的对比当前的虚拟主机主要分为三类流量限制:一:流量限制就是直接限制网络流量,这种限制通常是最严厉的一种流量限
- 网站建立起来了,却无人问津。每天看着竞争对手的网站红红火火,自己的网站却门庭冷落。你企业的网站就这样被架空了。我想目前很多的企业网站都处于这
- 这个题目有点儿大,而我写的常常很小(内容)。那就随便谈谈吧。优化不能只针对搜索引擎,只针对排名。而应该更多的面向用户。比如把网站loadin
- 日前一起关于不正当占用他人姓名作为注册域名的案件在美国结束审理,法院裁定犯案者向所以涉案的人员归还本属于他们的域名。在这起案件中,被占用域名
- 一年一度的圣诞节又到了,asp之家为大家选了一些圣诞节的手机祝福短信,大家可以挑选一些发送给你的亲朋好友,给他们送上一个圣诞节的祝福!圣诞乐
- 雅虎准备在硅谷圣塔克拉拉市兴建办公园区。雅虎表示,新建园区的目的是将现有办公和研发场所合并,以适应未来成长的需要。新园区占地四十八英亩,由十
- 一、域名过期后第一阶段域名过期后1~45天内,将处于注册商保留状态whois英文状态:REGISTRAR-HOLD二、域名过期后第二阶段 注
- 有Godaddy主机用户或许还不了解ColdFusion还有ColdFusion DNS,下面给大家介绍下什么是ColdFusion? 如同
- SEO初学者: 特征:1. 认真看过的SEO文章不超过200篇,没耐心读完他人的SEO博客或教材。只懂SEO的皮毛,对SEO的理解只是改改T
- 另一个经常会碰到的问题是,网站被惩罚排名下降应该怎么办?首先应该确定你的网站是完全被封,还是只是排名下降。直接搜索一下域名或URL用site
- 网上翻阅了很多的资料,很多人都说用netstat无法查看单个商品的使用状况。其实,很简单,用以下命令就可以得到一个商品的占用善。以下是以11
- a)准备工作和建立内容在你注册域名之前,你就应该记录下你的想法,应该准备足够100个网页的内容。请注意是至少。这100个网页应该是真正的内容
- 给文件夹设置权限一删除所有的Everone权限,包括:所有磁盘根目录C:\WindowsC:\Documents and SettingsC
- 在前面的广告优化四要素系列中,我们分别对广告的格式、颜色和位置的选择技巧向大家进行了介绍。不过请注意,这三个要素并非是孤立的,而是要结合网页
- 上次写了一篇关于PayPerPost的推介文章,但是那个方法虽然可以赚钱,但是不是很多,今天我就介绍下其主业务:用博客写英文评论赚钱。适合人
- 第 1 步:选择推介区域 选择特定广告前,您需要指定国家/地区和语言首选项。为了最大限度地增加转换机会,请选择能充分反映用户情况的组合。有些
- 本文基本上没有技术含量,只是觉得用起来很方便,原来生活可以更美的……要是用隐身的话,会被在线的好友看到,先是上线,有马上下线,很容易被看出是
- 昨晚,瑞典的顶级域名系统在例行维护时发生严重问题,导致启动失败,随后引发所有的DNS查询失败,整个瑞典互联网因此而停止。这次乌龙事件发生在当
- 不知道大家在google上面搜索的时候,在看到标题下面有段“该网站可能含有恶意软件,有可能会危害您的电脑。”有何反应?如图:500){thi