关于web日志的处理

毕业设计准备做基于web日志的攻击路径还原,第一步工作就是进行web日志的筛查,接下来的几篇文章将记录我整个过程的想法和心得,

一般web日志格式:
200.200.107.100 - - [23/Feb/2018:21:40:54 +0800] "GET /xxx/images/jj.jpg HTTP/1.1" 200 31309

一条日志一般分为10个部分
1、200.200.107.100 远程主机IP地址,%h
2、- 占位符,%1
3、- 占位符,%u
4、[23/Feb/2018:21:40:54 服务器完成请求处理时间,[日/月/年:时:分:秒 ,%t
5、+0800] 时区,%t
6、"GET 请求方法(GET,POST),%r
7、/xxx/images/jj.jpg 请求资源URL
8、HTTP/1.1" 请求协议
9、200 返回状态
10、31309 发送给客户端总字节数,%b

web日志的异常检测
0x00
去除日志中重复序列:

重复日志

你可能感兴趣的:(关于web日志的处理)