Python运维(一):实现对apache日志的简易分析

要求:对apache的access.log进行分析,并实现对其访问最高的前五个ip进行输出
这里就不用shell实现了,直接上python3的代码

import re


dit = {}
log = open(r'C:\Users\Cj\Desktop\WebSite.txt', 'r')
for file in log:
    for ip in re.findall(r'(\d+.\d+.\d+.\d+):\d+', file):
        dit[ip] = dit.get(ip, 0) + 1
print(dit)
px = sorted(dit.items(), key=lambda x:x[1], reverse=True)
print(px[0:2])

给以上做解答
1、把从log中用正则匹配ip
2、dit[ip] = dit.get(ip,0) + 1 的意思呢就是把这个每个匹配出来的ip进行存在字典dit中,对应的ip匹配一次就加一次。
3、利用sorted进行排序,这里的dit.items()相当于把这个dit进行列表化,lambda是对字典中的那个值进行排序,我是想实现对ip数量的排序,所以是1,True是倒序。

你可能感兴趣的:(shell)