git 彻底清除历史提交中的大文件

原因:在使用 git 开发的过程中,会出现例如:一些敏感数据、构建之后的 jar 包,不小心 git push 到 gitlab 或 github 中,这个时候并不是删除了之后重新 push 上去就可以解决问题,其他人同样可以通过 git reset 到你删除之前直接查看这些。所以有必要将这些文件删除。最大的威胁是随着工程分支的增加,tag 的增加工程会越来越大,git clone 过程中会十之八九会中断

查询需要删除的文件
step1:

检索大文件索引

// 查询一条记录
git verify-pack -v .git/objects/pack/*.idx | sort -k 3 -n | tail -1
// 查询十条记录
git verify-pack -v .git/objects/pack/*.idx | sort -k 3 -n | tail -10
step2:

根据索引查看大文件路径

// 上面命令会返回一条或十条索引, 然后 grep 查找指定的索引
git rev-list  --objects --all | grep 75583cf808c3f73c78afc56bba98eec6feeadef3

前两步示例
在这里插入图片描述

删除文件
step1:

克隆项目,这里这里是使用 BFG 进行删除的,所以需要克隆时添加 --mirror 参数。

git clone --mirror [email protected]:xichengliudui/test.git
step2:

删除文件

java -jar bfg-1.13.0.jar --delete-files text.html test.git --no-blob-protection
java -jar bfg-1.13.0.jar --delete-folders target test.git --no-blob-protection
  • java -jar bfg-1.13.0.jar 命令
  • –delete-files 删除文件
  • –delete-folders 删除目录
  • text.html 删除所有 text.html 文件
  • target 删除所有 target 目录
  • –no-blob-protection 对分支取消保护(HEAD 所指向的),不然 HEAD 指向的分支不会进行删除
cd test.git
step3:

git gc 清除一下

git reflog expire --expire=now --all && git gc --prune=now --aggressive
step4:

推送到远程仓库

git push

ref: https://rtyley.github.io/bfg-repo-cleaner/

你可能感兴趣的:(git,使用,git,gitlab,github,BFG)