如何通过IIS日志分析网站的情况
来源:51baobao.net 发布时间:2008-07-27 16:55:00
看到这个标题,想必大家会不屑一顾,“需要分析IIS日志吗?我有流量统计、51yes、cnzz、51la等等一大堆,功能全面,用起来也方便”,在这里请大家先别急着下结论,看完下面进行的IIS日志分析后再说。
先来说说如何下载IIS日志文件。如果自己有独立的服务器,在IIS信息服务窗口中,点击要设置的网站的属性,在“网页”选项卡上可以看到“启动日志记录”项,可以设置日志的保存位置、日志的记录格式等等,虚拟主机用户可以通过空间商提供的后台生成IIS日志,如万网中称为“weblog日志下载”。
现在我们已经找到了IIS日志文件,然后把它下载下来,用ultraedit将其打开(为什么不用记事本打开呢?记事本要打开一个几十M、上百M的文本文件,其速度实在是不能让人忍受)。下面就以我的一个网站(51baobao.net)的IIS日志为例进行一下分析演示。
第一,通过IIS日志了解搜索引擎的到访记录:
用ultraedit打开后,按CTRL+F键,弹出窗口(如图1),输入Googlebot,按回车,在新窗口中显示的页面就是google机器人的到访问记录,选中其中之一双击,可以看到访问的时间和页面(如图2),在这里要注意的是所显示的时间是国际标准时间,所以要在这个时间上加8个小时,这样才是北京时间,如果是自己的独立服务器可以设置为北京时间,这里就不详述了。
(图1)
(图2)
我们继续查找Baiduspider可以看到baidu蜘蛛的爬行记录。其他搜索引擎通过查找如Yahoo、Sogou、msnbot、YodaoBot… 比如我们新做了一个网站,也在百度和google中提交了,可是site站点的时候就是看不到收录的页面,这时我们就可以利用上面的方法查看一下IIS日志,只要百度和google等搜索引擎的蜘蛛已经爬行过我们的站点了,我们就不用担心网站的收录问题了,搜索引擎会慢慢的放出已经抓取的页面,站长们继续增加内容就行了。通过此项查找还可以了解搜索引擎的到访时间和抓取页面的时间及频率。
上面是通过IIS日志查看搜索引擎的爬行记录,可能有人会问了,为什么搜索引擎的爬行记录不能被流量统计工具统计到?因为流量统计代码是采用JS调用的方式,搜索引擎蜘蛛爬行时不会调用JS文件。我们可以自己写个流量统计功能,然后include流量统计功能的这个动态页面到各个页面中,这样所有对页面的访问就都可以统计到了,并且通过agent参数,可以判断来自哪个搜索引擎,这里不再详述。
第二,通过IIS日志查找网站是否存在死链接: 在用ultraedit打开的IIS日志文件中按CTRL+F键,在出现的窗口中(如图1),选中第一和第三个复选框,输入404,然后按回车,看看在弹出的窗口中有没有找到记录。如果找到,说明你的网站存在死链接,大家都知道死链接对网站的收录是有影响的,怎么去处理就不用我说了吧。
下面是搜索404时我的网站IIS日志中出现的几条记录:
2008-07-24 16:05:08 GET /Login.asp - 60.182.153.56 HTTP/1.1 Mozilla/3.0+(compatible;+Indy+Library) - 404 0 1003
2008-07-24 16:05:08 POST /Login.asp - 60.182.153.56 HTTP/1.1 Mozilla/3.0+(compatible;+Indy+Library) http://www.51baobao.net /Login.asp 404 0 1003
2008-07-24 16:05:08 GET /reg.asp - 60.182.153.56 HTTP/1.1 Mozilla/3.0+(compatible;+Indy+Library) http://www.51baobao.net /Login.asp 404 0 1003
2008-07-24 16:05:09 POST /reg.asp - 60.182.153.56 HTTP/1.1 Mozilla/3.0+(compatible;+Indy+Library) http://www.51baobao.net /reg.asp?action=apply 404 0 1003
相信有经验的站长都明白了吧?这是有人在用一些漏洞扫描工具对网站进行漏洞测试,看看有没有漏洞,使用通用的CMS、DIG、BBS、BLOG系统的站长可要注意了,你所用的网页程序如果有漏洞,网站就会有被黑掉的危险!
第三、通过IIS日志查找网站是否存在程序错误:
我们再输入500进行查找,如果查找到相关页面,说明网站 的程序在运行过程中出现了错误,需要对程序进行修改。
第四、通过IIS日志查找网站是否被入侵过:
通过IIS日志可以判断网站是否曾被通过SQL注入过,是怎样被入侵的。在网站IIS日志我们搜索一下%20和’单引号(半角的),看看是否有相关的页面存在,当然不是所有包括%20和’的页面都是被注入页面,但一般的SQL注入都是通过%20(空格的ASC码的16进制值是20)和单引号进行的。此方法可以判断出程序上的漏洞,这样我们可以修改程序防止SQL注入。我曾经用这个办法将网站被SQL注入的全过程及入侵的破坏程度进行了解,然后修改了程序,防止了网站再次被入侵。
介绍以上几点,以供大家参考。
对于apache的日志,分析方法也类似。现在有一些IIS日志分析软件可以帮助我们分析出搜索引擎的到访情况以及404错误的网页,但对于通过网站漏洞被入侵的问题只能靠我们手工查找了。
由于平时很少写文章,写的词不达意还望各位谅解,欢迎与我进行MSN交流(51baobao.net#live.cn),同时欢迎访问我的网站51baobao.net。
转载时请尊重作者的版权,保持文章的完整,请不要对本文进行修改。


猜你喜欢
- 网站重建的目的是为了获得更好的表现。因此,第一项要做的事情就是用Seo来思考新网站以什么新形式出现,新的网站在建设过程中,要考虑保持原来网站
- 虽然说亡羊补牢可以将木马后门造成的损失降至最低,但最好的方法显然是防患于未然。1、后门防范基本功首先要关闭本机不用的端口或只允许指定的端口访
- 怎么看SEO和UCD的关系?理论上UCD能做到产品效益的90分,但关键10分必须通过SEO配合,也就是搜索引擎优化。你的意思得先做好UCD,
- 从学会建站到现在也有一段时间了,在关于网站的推广与扩大方面也有了个人的一些看法,总结起来主要有以下几个方面:首先要从大的方面去把握。我认为这
- 中文教程https://www.ncnynl.com/category/turtlebot3-tutorial/官方教程https://em
- 尽管看似已经是天下太平,但是实际上,微软、雅虎与伊坎之间的传奇故事还远没有到结束的时候,硅谷对此的最新看法是,雅虎很可能握有微软希望得到的某
- 大多数人都有过这样的经历,在浏览网页的时候,经常不知误点哪个按钮,就会莫名其妙打开一个网站,这些网站或是“挂马网站”,只要点击就会中“木马病
- 昨天登陆adsense后台西联已经签发,在后台看到这样东西:在点收入对帐单 就可以看到这些东西了在这个上面可以看到你的名字拼音的,我拿笔抄下
- 本文讲诉了Linux命令学习总结:shutdown命令,具体如下:命令简介: 该命令可以安全关闭或者重新启动系统。你没有看错,sh
- 10月14日消息,据国外媒体报道,企业安全产品开发商BeyondTrust近日表示,Windows 7并未真正解决UAC(用户账户控制)问题
- Automattic官方发布了2.6.5版的WordPress,更新了/wp-includes/下的post.php、version.php
- 1、问:当在浏览器中输入“http://IP地址”和输入“http://IP地址/”有什么差别吗?它们会做什么?答:没有差别!前一种格式浏览
- 目前Google AdSense已经在国内测试电子银行转账支付服务,目前只在小部分用户种进行测试。取得测试资格的用户将可以直接通过银行账户收
- 其他不再赘述,发挥二的性格,我们直奔主题。用户打开网站的整个流程中,DNS解析时第一环,当用户输入域名并敲回车后,windows系统调用DN
- 一切本来都是那样的宁静,所有的网络服务都在默默地工作着。然而近一段时间来,经常有人打电话反映一个相同的问题:在接收E-Mail时,服务器端经
- 做网络推广几年了,天天在几个站长站潜水,文章天天看但基本没写过,总觉得说来说去就那么些东西。前段时间研究了下Twitter类网站,Twitt
- 以大划小思想,然后重定向。linux有时候会遇到文件很大,关键字查找都要超过整屏,无法查看到所有内容。比如一个非常大的日志文件info.lo
- Godaddy主机用户如果想在服务器上恢复干净设置,可以重置服务器。重置会擦除服务器的硬盘驱动上的所有内容。服务器恢复到购买它时的状态。可以
- 只要你是站长做过网站,就一定对域名不陌生吧?很多站长为了寻觅一个满意的域名费尽心思,特别是发现自己想要的域名快要过期时,不知道什么时间可以再
- 辛辛苦苦用一个月把流量升到3万,空间受不了,空间提供商说要服务器网站才能正常运转,否则空间经常会无法打开,而租个服务器最少要3000元,对于