网站运营
位置:首页>> 网站运营>> Linux下apache日志分析与状态查看方法

Linux下apache日志分析与状态查看方法

  发布时间:2021-11-26 19:33:41 

标签:apache,日志分析,状态查看

假设apache日志格式为:
118.78.199.98 – - [09/Jan/2010:00:59:59 +0800] “GET /Public/Css/index.css HTTP/1.1″ 304 – “http://www.a.cn/common/index.php” “Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; GTB6.3)”

问题1:在apachelog中找出访问次数最多的10个IP。
awk '{print $1}' apache_log |sort |uniq -c|sort -nr|head -n 10

awk 首先将每条日志中的IP抓出来,如日志格式被自定义过,可以 -F 定义分隔符和 print指定列;
sort进行初次排序,为的使相同的记录排列到一起;
upiq -c 合并重复的行,并记录重复次数。
head进行前十名筛选;
sort -nr按照数字进行倒叙排序。

我参考的命令是:
显示10条最常用的命令
sed -e "s/| //n/g" ~/.bash_history | cut -d ' ' -f 1 | sort | uniq -c | sort -nr | head

问题2:在apache日志中找出访问次数最多的几个分钟。
awk '{print  $4}' access_log |cut -c 14-18|sort|uniq -c|sort -nr|head
awk 用空格分出来的第四列是[09/Jan/2010:00:59:59;
cut -c 提取14到18个字符
剩下的内容和问题1类似。

问题3:在apache日志中找到访问最多的页面:
awk '{print $11}' apache_log |sed 's/^.*cn/(.*/)/"//1/g'|sort |uniq -c|sort -rn|head

类似问题1和2,唯一特殊是用sed的替换功能将”http://www.a.cn/common/index.php”替换成括号内的内容:”http://www.a.cn(/common/index.php)”

问题4:在apache日志中找出访问次数最多(负载最重)的几个时间段(以分钟为单位),然后在看看这些时间哪几个IP访问的最多?
1,查看apache进程:
ps aux | grep httpd | grep -v grep | wc -l

2,查看80端口的tcp连接:
netstat -tan | grep "ESTABLISHED" | grep ":80" | wc -l

3,通过日志查看当天ip连接数,过滤重复:
cat access_log | grep "19/May/2011" | awk '{print $2}' | sort | uniq -c | sort -nr

4,当天ip连接数最高的ip都在干些什么(原来是蜘蛛):
cat access_log | grep "19/May/2011:00" | grep "61.135.166.230" | awk '{print $8}' | sort | uniq -c | sort -nr | head -n 10

5,当天访问页面排前10的url:
cat access_log | grep "19/May/2010:00" | awk '{print $8}' | sort | uniq -c | sort -nr | head -n 10

6,用tcpdump嗅探80端口的访问看看谁最高
tcpdump -i eth0 -tnn dst port 80 -c 1000 | awk -F"." '{print $1"."$2"."$3"."$4}' | sort | uniq -c | sort -nr

接着从日志里查看该ip在干嘛:
cat access_log | grep 220.181.38.183| awk '{print $1"/t"$8}' | sort | uniq -c | sort -nr | less

7,查看某一时间段的ip连接数:
grep "2006:0[7-8]" www20110519.log | awk '{print $2}' | sort | uniq -c| sort -nr | wc -l

8,当前WEB服务器中联接次数最多的20条ip地址:
netstat -ntu |awk '{print $5}' |sort | uniq -c| sort -n -r | head -n 20

9,查看日志中访问次数最多的前10个IP
cat access_log |cut -d ' ' -f 1 |sort |uniq -c | sort -nr | awk '{print $0 }' | head -n 10 |less

10,查看日志中出现100次以上的IP
cat access_log |cut -d ' ' -f 1 |sort |uniq -c | awk '{if ($1 > 100) print $0}'|sort -nr |less

11,查看最近访问量最高的文件
cat access_log |tail -10000|awk '{print $7}'|sort|uniq -c|sort -nr|less

12,查看日志中访问超过100次的页面
cat access_log | cut -d ' ' -f 7 | sort |uniq -c | awk '{if ($1 > 100) print $0}' | less

13,列出传输时间超过 30 秒的文件
cat access_log|awk '($NF > 30){print $7}'|sort -n|uniq -c|sort -nr|head -20

14,列出最最耗时的页面(超过60秒的)的以及对应页面发生次数
cat access_log |awk '($NF > 60 && $7~//.php/){print $7}'|sort -n|uniq -c|sort -nr|head -100

0
投稿

猜你喜欢

  • 1,TCP/IP半开连接数限制是绝对不存在的2,Windows Server 2008的协议栈设计与Vista基本上相同,相对于X
  • 通过下面 10 步来保护 IIS:1.为IIS 应用程序和数据专门安装一个NTFS 设备。如果有可能,不要允许IUSER(或其它任何匿名用户
  • 问题描述在VMware Workstation中新建了一个虚拟机CentOS7,网络适配器选择的是“仅主机模式”,结果,物理机ping不通虚
  • 如果一个系统出现了问题,那么最重要的应该是知道从哪儿开始寻找错误和检查处理过程。ExchangeServer2003提供了丰富的检查和日志记
  • 昨天群里的一位朋友给我看的一篇U8上的帖子,讲的autoblog结合AdSense的些做法。帖子很不错,很多细节方面都讲的很详细,包括aut
  • 1.摘要本文主要定义了一种SMTP服务扩展,使用这种服务扩展服务器可以说明它在一个TCP发送操作中可以接收多少个指令。在一个TCP发送指令中
  • 所有搞网络营销的人都知道论坛营销基本是以量取胜,为什么说是以量取胜呢,因为你在一个论坛上只发一个帖子,基本上没什么效果,所以现在出现了很多如
  • 不说话的站长租一间房子,拉一条网线,借钱买一台电脑,很多个人站长就这样开始了自己的站长生涯。站长是没有早晨的,当早市上人潮汹涌的时候,他们才
  • 似乎正应了那句“你不理财,财不理你!”,从来没有指望google adsense能给我赚到钱,事实上它也没给我带来财富。 八月份的
  • DNS MX记录一定要放在A记录之前,否则和邮件后缀相匹配的域名没有指向邮件服务器,很有可能邮件服务器收不到邮件。DNS MX记录一定要放在
  • VMware vSphere client客户端是用来连接与管理ESX或ESXi主机的,在VMware vSphere client可以方便
  • 打个比方我删除了id是41的栏目,生成HTML时,生成到这个栏目时就出错,很不爽!!现在我们调整一下栏目id,把后面的提上来弥补41,也就是
  • ChatGPT刷屏了相信大家最近被 ChatGPT 刷屏了,其实在差不多一个月前就火过一次,不会那会好像只在程序员的圈子
  • 今天介绍下Godaddy主机用户应该如何压缩文件。随着托管账户内容的增加,压缩及archive文档的能力对简化账户维护及文档储存大有裨益。另
  • WordPress作为最受欢迎的博客平台,它给用户提供了各种工具,用户可以使用这些工具发布文章、与读者保持互动。不过,更让人高兴的是,本月即
  • 不管是在企业级应用还是在消费者领域,2015 对于 Linux 来说都是极其重要的一年。作为一个从 2005 年就开始使用 Linux 的老
  • 问题最近需要登录私有镜像中心,登录时出现错误提示:Error response from daemon: Get https://***:
  • 有这样一句话:国际化就是本土化,本土化是国际化的核心。这句话虽然简单,但是却蕴含着很多道理。如果一家企业或一种产品想要打入国际市场,就一定要
  • Windows2003服务器安装及设置教程好久没有更新了,正好最近上了一台服务器,正好把剩下的几篇补全,今天先说的是MySQL安全篇——将M
  • HI,我叫Alvaro Guzman,这是别样wordpress模版的第二部分。在这节课里,将学到如何运用,XHML+CSS来建一个网页。还
手机版 网站运营 asp之家 www.aspxhome.com