网站运营
位置:首页>> 网站运营>> 5条Linux命令分析搜索引擎蜘蛛的爬行行为(2)

5条Linux命令分析搜索引擎蜘蛛的爬行行为(2)

 来源:asp之家 发布时间:2009-09-20 20:15:00 

标签:命令,linux,搜索引擎,蜘蛛


三 百度蜘蛛抓取首页的详细记录

cat access.log.2009-04-18 | grep Baiduspider+ | grep "GET / HTTP"



初步研究发现,百度蜘蛛对首页非常热爱,24小时每小时都要看我的某个新站的首页,而googe和yahoo蜘蛛更喜欢内页,一天中各自只看了2次首页。不知道是真的有这个规律还是只是我的小站这样。

四 Baidu蜘蛛派性记录时间点分布

cat access.log.2009-04-18 | grep "Baiduspider+" | awk '{print $4}'



五 Baidu蜘蛛爬行页面按次数降序列表

cat access.log.2009-04-18 | grep "Baiduspider+" | awk '{print $7}' | sort | uniq -c | sort -r



本文中的每条命令把Baiduspider+改成Googlebot都可以查看Google的对应的数据。

Mediapartners-Google是什么?Google adsense广告之所以能与内容相关,就是因为每个包含着adsense的广告被访问后,几秒钟内就有一个Mediapartners-Google蜘蛛来到这个页面,所以几分钟后再刷新就能显示相关性广告了。

0
投稿

猜你喜欢

手机版 网站运营 asp之家 www.aspxhome.com