背景
上一篇文章讲解了如何处理服务器日志文件过大导致的磁盘空间不足,链接为:情景linux--如何解决服务器日志过多导致的磁盘空间不足?。由于篇幅的原因,并没有给出实际的操作,所以有了本实践篇。
其实,解决服务器日志文件过大导致的磁盘空间不足有许多种方法,不再赘述。本文及前文的重点在于,在文中所述的特殊场景下,所体现出来的linux知识点及解决方案。
实例
承接上文,我们只需关注/opt目录的磁盘占用情况即可。
使用du
和df
命令查看/opt目录的磁盘使用情况:
df -lh
Filesystem Size Used Avail Use% Mounted on
/dev/mapper/cl-root 92G 11G 81G 12% /
devtmpfs 7.8G 0 7.8G 0% /dev
tmpfs 7.8G 0 7.8G 0% /dev/shm
tmpfs 7.8G 82M 7.7G 2% /run
tmpfs 7.8G 0 7.8G 0% /sys/fs/cgroup
/dev/sda1 1014M 138M 877M 14% /boot
/dev/mapper/vg_data2-lv_data2 200G 20G 181G 10% /opt
sudo du -sh /opt
20G /opt
由上可知,df和du得到的/opt的磁盘占用空间基本一致;这也是理论篇提到的正常情况下
。
为了让磁盘的使用情况更加明显,在/opt目录下创建一个20G的大文件:
sudo fallocate -l 20G /opt/some_server.logfile
ls -l /opt/some_server.logfile
-rw-r--r-- 1 root root 21474836480 Jun 30 12:34 /opt/some_server.logfile
此时,再次查看磁盘使用情况:
df -lh
Filesystem Size Used Avail Use% Mounted on
/dev/mapper/cl-root 92G 11G 81G 12% /
devtmpfs 7.8G 0 7.8G 0% /dev
tmpfs 7.8G 0 7.8G 0% /dev/shm
tmpfs 7.8G 82M 7.7G 2% /run
tmpfs 7.8G 0 7.8G 0% /sys/fs/cgroup
/dev/sda1 1014M 138M 877M 14% /boot
/dev/mapper/vg_data2-lv_data2 200G 40G 161G 20% /opt
sudo du -sh /opt
40G /opt
由上可知,df和du得到的/opt的磁盘占用空间基本一致,这依然是理论篇提到的正常情况下
。
新开一个终端窗口,使用cat
命令向some_server.logfile
文件中追加内容:
sudo cat >> /opt/some_server.logfile
这时,命令挂起,等待你输入要追加的内容。其实,这里并不需要真的输入内容,保持现状即可。这一步是为了让程序模拟理论篇中提到的:
当一个应用程序正在写一个大文件的时候,虽然我们可以对这个文件进行删除或挪走,但应用程序依然占有着句柄,并根据句柄所指磁盘位置直接写磁盘,而不检查该文件是否存在。
在原来的终端窗口,删除some_server.logfile
文件:
sudo rm /opt/gentoo_root.img
此时,再次查看磁盘空间:
sudo du -sh /opt
20G /opt
df -lh
Filesystem Size Used Avail Use% Mounted on
/dev/mapper/cl-root 92G 11G 81G 12% /
devtmpfs 7.8G 0 7.8G 0% /dev
tmpfs 7.8G 0 7.8G 0% /dev/shm
tmpfs 7.8G 82M 7.7G 2% /run
tmpfs 7.8G 0 7.8G 0% /sys/fs/cgroup
/dev/sda1 1014M 138M 877M 14% /boot
/dev/mapper/vg_data2-lv_data2 200G 40G 161G 20% /opt
这就是理论篇中提到的特殊情况
了。
解决删除文件,但空间未释放的问题
这时,我们将追加文件的进程结束掉,再次查看磁盘空间,磁盘占用恢复正常:
sudo du -sh /opt
20G /opt
df -lh
Filesystem Size Used Avail Use% Mounted on
/dev/mapper/cl-root 92G 11G 81G 12% /
devtmpfs 7.8G 0 7.8G 0% /dev
tmpfs 7.8G 0 7.8G 0% /dev/shm
tmpfs 7.8G 82M 7.7G 2% /run
tmpfs 7.8G 0 7.8G 0% /sys/fs/cgroup
/dev/sda1 1014M 138M 877M 14% /boot
/dev/mapper/vg_data2-lv_data2 200G 20G 181G 10% /opt
事实上,出现此类问题时,应该使用lsof | grep deleted
命令查看:
当有进程打开某文件时文件被删除,就会将该文件标记为deleted:
sudo lsof | grep deleted | grep some_server.logfile
sudo 19134 root 1w REG 8,1 21474836480 887685 /opt/some_server.logfile (deleted)
cat 19135 root 1w REG 8,1 21474836480 887685 /opt/some_server.logfile (deleted)
第二列为进程id,kill -9杀掉即可。
最佳方案
如果我们在最初出现磁盘空间不足的时候,不删除日志,而是清除其内容,情形则完全不同。
创建20G的大文件后的磁盘空间状况:
sudo du -sh /opt
40G /opt
df -lh
Filesystem Size Used Avail Use% Mounted on
/dev/mapper/cl-root 92G 11G 81G 12% /
devtmpfs 7.8G 0 7.8G 0% /dev
tmpfs 7.8G 0 7.8G 0% /dev/shm
tmpfs 7.8G 82M 7.7G 2% /run
tmpfs 7.8G 0 7.8G 0% /sys/fs/cgroup
/dev/sda1 1014M 138M 877M 14% /boot
/dev/mapper/vg_data2-lv_data2 200G 40G 161G 20% /opt
同上,新开一个终端窗口,使用命令向some_server.logfile
文件中追加内容。
在原终端里用命令清空文件some_server.logfile
的原有内容:
sudo echo "this will be the 1st line." > some_server.logfile
查看文件内容:
cat some_server.logfile
this will be the 1st line.
再查看磁盘空间:
sudo du -sh /opt
20G /opt
df -lh
Filesystem Size Used Avail Use% Mounted on
/dev/mapper/cl-root 92G 11G 81G 12% /
devtmpfs 7.8G 0 7.8G 0% /dev
tmpfs 7.8G 0 7.8G 0% /dev/shm
tmpfs 7.8G 82M 7.7G 2% /run
tmpfs 7.8G 0 7.8G 0% /sys/fs/cgroup
/dev/sda1 1014M 138M 877M 14% /boot
/dev/mapper/vg_data2-lv_data2 200G 20G 181G 10% /opt
而此时追加文件的命令窗口,依然等待着输入要追加的内容,不妨输入几行:
查看文件内容,已经有了新追加的内容,因而可以达到无需重启服务解决此问题
的效果。
cat /opt/some_server.logfile
this will be the 1st line.
2nd line
3rd line
line 4:1+2+3+_4
line 5: whatever