git仓库清理

关于git仓库的清理,主要就是清理git仓库里面的大的二进制文件。网上查了很多教程,很多都是用:git filter-branch.清理仓库中的大文件。

我尝试着本地测试了一下,发现是真慢呀。

方法一、git filter-branch

step1:查看又哪些大文件(查看前5个大文件)

git rev-list --objects --all | grep "$(git verify-pack -v .git/objects/pack/*.idx | sort -k 3 -n | tail -5 | awk '{print$1}')"

step2: 从仓库中删除文件或文件夹

git filter-branch --force --index-filter 'git rm --cached --ignore-unmatch path-to-your-remove-file' --prune-empty --tag-name-filter cat -- --all

git filter-branch --index-filter 让每个提交的文件都复制到索引(.git/index)中

然后运行过滤器命令:git rm --cached --ignore-unmatch 文件名 ,让每个提交都删除掉“文件名”文件

然后--prune-empty 把空的提交“修剪”掉 

然后--tag-name-filter cat 把每个tag保持原名字,指向修改后的对应提交

最后-- --all 将所有ref(包括branch、tag)都执行上面的重写

step 3:删除缓存下来的ref和git操作(这一步可以跳过,也可以不执行)

git for-each-ref --format='delete %(refname)' refs/original | git update-ref --stdin

step4:运行git gc清理

git reflog expire --expire=now --all && git gc --prune=now --aggressive

step5:强制推送到远端

git push --force origin master

反正用这个方法没成功,感觉问题出在最后的推送上,因为我本地是瘦身成功的。网上搜到一些说是要把分支删得只剩master再操作。

方法二:BFG Repo-Cleaner

这个工具很快,而且会给出清理文件和受保护分支。清理后的report很清晰,推荐使用这个。git很多周边工具还是挺好用的。

环境要求:安装了java的机器。

工具下载:https://repo1.maven.org/maven2/com/madgag/bfg/1.14.0/bfg-1.14.0.jar

 工具拷贝到机器的某个位置,可重命名为bfg.jar。

我是直接对gerrit的裸库进行操作的。

step1: 在gerrit服务home目录的git目录下找到对应要瘦身仓库的.git目录。

step2: 运行如下命令:(清理大于500M的提交)

java -jar bfg.jar --strip-blobs-bigger-than 500M /usr/local/gerrit/git/common/test.git

step3: 运行如下命令进行git gc

git reflog expire --expire=now --all && git gc --prune=now --aggressive

这样就完成裸库清理,启动gerrit服务即可。

我看guide里面最后一步都是强制推送:git push origin master --force  

我感觉推完我还是没有瘦身成功,所以直接在裸库上操作了。

写在最后:这个重写git仓库太伤了,我不会再操作了,退出此江湖。。

附上git对这一块的指导文档,写得还是很清晰的:Git - 维护与数据恢复

你可能感兴趣的:(git,git)