小知识:Apache日志的一些操作命令技巧

假设apache日志格式为:

?
1
2
118.78.199.98 – – [09/Jan/2010:00:59:59 +0800] “GET /Public/Css/index.css HTTP/1.1″ 304 – “http://www.a.cn/common/index.php”
“Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; GTB6.3)”

问题1:在apachelog中找出访问次数最多的10个IP。

awk {print $1} apache_log |sort |uniq -c|sort -nr|head -n 10

awk 首先将每条日志中的IP抓出来,如日志格式被自定义过,可以 -F 定义分隔符和 print指定列;

sort进行初次排序,为的使相同的记录排列到一起;

upiq -c 合并重复的行,并记录重复次数。

head进行前十名筛选;

sort -nr按照数字进行倒叙排序。

我参考的命令是:

显示10条最常用的命令
复制代码 代码如下:
sed -e “s/| /n/g” ~/.bash_history | cut -d -f 1 | sort | uniq -c | sort -nr | head

问题2:在apache日志中找出访问次数最多的几个分钟。

复制代码 代码如下:
awk {print  $4} access_log |cut -c 14-18|sort|uniq -c|sort -nr|head

awk 用空格分出来的第四列是[09/Jan/2010:00:59:59;

cut -c 提取14到18个字符 — 00:59

剩下的内容和问题1类似。

问题3:在apache日志中找到访问最多的页面:

复制代码 代码如下:
awk {print $11} apache_log |sed s/^.*cn(.*)”/1/g|sort |uniq -c|sort -rn|head

类似问题1和2,唯一特殊是用sed的替换功能将”http://www.a.cn/common/index.php”替换成括号内的内容:”http://www.a.cn(/common/index.php)”

问题4:在apache日志中找出访问次数最多(负载最重)的几个时间段(以分钟为单位),然后在看看这些时间哪几个IP访问的最多?

1,查看apache进程:

复制代码 代码如下:
ps aux | grep httpd | grep -v grep | wc -l    // ps aux是显示所有进程和其状态。

2,查看80端口的tcp连接:

复制代码 代码如下:
netstat -tan | grep “ESTABLISHED” | grep “:80” | wc -l

3,通过日志查看当天ip连接数,过滤重复:

复制代码 代码如下:
cat access_log | grep “19/May/2011” | awk {print $2} | sort | uniq -c | sort -nr

4,当天ip连接数最高的ip都在干些什么(原来是蜘蛛):

复制代码 代码如下:
cat access_log | grep “19/May/2011:00” | grep “61.135.166.230” | awk {print $8} | sort | uniq -c | sort -nr | head -n 10

5,当天访问页面排前10的url:

复制代码 代码如下:
cat access_log | grep “19/May/2010:00” | awk {print $8} | sort | uniq -c | sort -nr | head -n 10

6,用tcpdump嗅探80端口的访问看看谁最高

复制代码 代码如下:
tcpdump -i eth0 -tnn dst port 80 -c 1000 | awk -F”.” {print $1″.”$2″.”$3″.”$4} | sort | uniq -c | sort -nr

接着从日志里查看该ip在干嘛:

复制代码 代码如下:
cat access_log | grep 220.181.38.183| awk {print $1″t”$8} | sort | uniq -c | sort -nr | less

7,查看某一时间段的ip连接数:

复制代码 代码如下:
grep “2006:0[7-8]” www20110519.log | awk {print $2} | sort | uniq -c| sort -nr | wc -l

8,当前WEB服务器中联接次数最多的20条ip地址:

复制代码 代码如下:
netstat -ntu |awk {print $5} |sort | uniq -c| sort -n -r | head -n 20

9,查看日志中访问次数最多的前10个IP

复制代码 代码如下:
cat access_80_log |cut -d -f 1 |sort |uniq -c | sort -nr | awk {print $0 } | head -n 10 |less

10,查看日志中出现100次以上的IP

复制代码 代码如下:
cat access_log |cut -d -f 1 |sort |uniq -c | awk {if ($1 > 100) print $0}|sort -nr |less

11,查看最近访问量最高的文件

复制代码 代码如下:
cat access_log |tail -10000|awk {print $7}|sort|uniq -c|sort -nr|less

12,查看日志中访问超过100次的页面

复制代码 代码如下:
cat access_log | cut -d -f 7 | sort |uniq -c | awk {if ($1 > 100) print $0} | less

13,列出传输时间超过 30 秒的文件

复制代码 代码如下:
cat access_log|awk ($NF > 30){print $7}|sort -n|uniq -c|sort -nr|head -20

14,列出最最耗时的页面(超过60秒的)的以及对应页面发生次数

复制代码 代码如下:
cat access_log |awk ($NF > 60 && $7~/.php/){print $7}|sort -n|uniq -c|sort -nr|head -100
声明: 猿站网有关资源均来自网络搜集与网友提供,任何涉及商业盈利目的的均不得使用,否则产生的一切后果将由您自己承担! 本平台资源仅供个人学习交流、测试使用 所有内容请在下载后24小时内删除,制止非法恶意传播,不对任何下载或转载者造成的危害负任何法律责任!也请大家支持、购置正版! 。本站一律禁止以任何方式发布或转载任何违法的相关信息访客发现请向站长举报,会员发帖仅代表会员个人观点,并不代表本站赞同其观点和对其真实性负责。本网站的资源部分来源于网络,如有侵权烦请发送邮件至:2697268773@qq.com进行处理。
建站知识

小知识:Linux下SVN服务器自动更新文件到Web目录的方法

2023-3-16 15:41:52

建站知识

小知识:Apache的status相关问题解决办法

2023-3-16 15:56:23

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索