Linux 数据校验md5sum

一、md5sum作用

在网络传输、设备之间转存、复制大文件等时,可能会出现传输前后数据不一致的情况。这种情况在网络这种相对更不稳定的环境中,容易出现。那么校验文件的完整性,也是势在必行的。

md5sum命令用于生成和校验文件的md5值。它会逐位对文件的内容进行校验。是文件的内容,与文件名无关,也就是文件内容相同,其md5值相同。md5值是一个128位的二进制数据,转换成16进制则是32(128/4)位的进制值。

md5校验,有很小的概率不同的文件生成的md5可能相同。比md5更安全的校验算法还有SHA*系列的。

在网络传输时,我们校验源文件获得其md5sum,传输完毕后,校验其目标文件,并对比如果源文件和目标文件md5 一致的话,则表示文件传输无异常。否则说明文件在传输过程中未正确传输。

二、重要参数

-b 以二进制模式读入文件内容
-t 以文本模式读入文件内容
-c 根据已生成的md5值,对现存文件进行校验
--status 校验完成后,不生成错误或正确的提示信息,可以通过命令的返回值来判断。
--tag BSD格式查看 MD5 值
#md5sum test.py    默认是 -t
e0c4f052aa5559ed9371411bd5f416e8  test.py

#md5sum -b test.py
e0c4f052aa5559ed9371411bd5f416e8 *test.py

#md5sum -t test.py
e0c4f052aa5559ed9371411bd5f416e8  test.py

-c 选项来对文件md5进行校验。校验时,根据已生成的md5来进行校验。生成当前文件的md5,并和之前已经生成的md5进行对比,如果一致,则返回OK,否则返回错误信息
#md5sum test* >d.md5
md5sum: test_clone_code: Is a directory
md5sum: test_path: Is a director

#cat d.md5 
e0c4f052aa5559ed9371411bd5f416e8  test.py
7fd7d3329755979e673b05e926054a99  test.txt

#md5sum -c d.md5 
test.py: OK
test.txt: OK

#test.txt有改变
#echo "dshdhlshclk" >>test.txt

#md5sum -c d.md5 
test.py: OK
test.txt: FAILED
md5sum: WARNING: 1 computed checksum did NOT match


--status,不显示校验信息,以命令返回值来判断
          校验一致返回0,不一致返回1
# md5sum -c --status d.md5 

#echo $?
0

--tag BSD格式查看 MD5 值
#md5sum --tag d.md5 
MD5 (d.md5) = 6585ec7c2e5e9a3d21ece9aba821eb73

diff -c 比较两个文件差别
#md5sum test.txt >b.md5

#diff -c b.md5 d.md5 
*** b.md5	2022-03-09 14:20:53.999821690 +0800
--- d.md5	2022-03-09 14:03:12.389732202 +0800
***************
*** 1 ****
! c3f784752f361f586db036d9e933b09c  test.txt
--- 1,2 ----
! e0c4f052aa5559ed9371411bd5f416e8  test.py
! 7fd7d3329755979e673b05e926054a99  test.txt

三、注意事项

1、md5sum 是校验文件内容,与文件名是否相同无关

2、md5sum值逐位校验,所以文件越大,校验时间越长

四、参考文档

1、https://www.cnblogs.com/zhuxiaohou110908/p/5786893.html

2、https://www.cnblogs.com/miracle-luna/p/11967246.html

你可能感兴趣的:(linux,&,shell,linux,运维,服务器,md5sum)