转载自:http://www.meilongkui.com/archives/1965
对于实际的存量项目而言,从SVN迁移到Git时是必须保留分支、Tag及提交记录的,以下以Bitbucket为例总结某个实际SVN代码仓库迁移到Git代码仓库的全过程。
根据官网的文档:
在Subversion中,每一个人提交时都需要在系统中有一个用户,它会被记录在提交信息内。如果想要将Subversion用户映射到一个更好的Git作者数据中,你需要一个Subversion用户到Git用户的映射。
我们可以在对应SVN管理的工程文件夹下,使用如下命令获取到某个文件夹下所有提交者的名字:
svn log --xml|grep "^|sort -u|awk -F '' '{print $2}'|awk -F ' ' '{print $1}' > userinfo.txt
这会将SVN的提交技术输出为XML格式,然后提取出作者信息,再重定向到userinfo.txt文件中。请注意:
1、由于用到grep、sort、awk,因此在Windows环境中需要在bash中运行,如果没有的话先安装Git即可;
2、需要安装svn的命令号工具,如果没有的话需要安装下:
得到的userinfo.txt文件只包含了提交者,形如:
接下来需要按照如下的格式完成映射:
博主注:
如果SVN仓库使用VisualSVN管理的话,用户列表中会包含一个名叫VisualSVN Server的用户,需要将此用户也添加到映射列表中,才能顺利通过,例如:
VisualSVN Server=VisualSVN
一个典型的SVN仓库(该项目代号为eisp-eipsc-parent)形如:
我们使用如下命令进行克隆(首次执行时会被提示输入SVN的用户名):
$ git svn clone http://197.*.*.*:*/eisp/EIPSC/code/ --no-metadata --authors-file=userinfo.txt --trunk=trunk --branches=branch --tags=tag --no-minimize-url eisp-eipsc-parent-to-git
其中:
最后的eisp-eipsc-parent-to-git表示clone到此文件夹中
参数–authors-file表示SVN账号映射到Git账号的文件,所有的SVN提交者都要做映射;
参数–trunk表示主干所在目录;
参数–branches表示分支所在目录;
参数–tags表示标签所在目录;
参数–no-metadata表示不导出SVN元数据;当想要将Git仓库中的提交镜像回原SVN仓库中时,需要保留元数据。
参数–no-minimize-url表示不尝试读取上级目录;
如果不使用–no-minimize-url,则可能会导致在clone时扫描不正确的路径(Using higer level of URL):
请注意,该–authors-file文件中必须包括SVN工程所涉及所有提交者的信息,如果缺少会报错(请注意,git svn执行时会将所有历史branch找到,即使该branch已经被删除,这些被删除分支中可能还有别的提交者,因此可能会报错,需要在遇到错误时再添加):
当保留所有分支和提交记录时,git svn clone可能需要执行很久(This may take a while on large repositories),执行成功后形如:
此时可以看到master分支中的提交记录被完整保留了:
接下来我们需要处理SVN的标签及分支。直接执行git branch -a命令,我们会发现本地只有master一个分支,SVN的分支和标签都被当做了远程分支:
执行git show-ref可以看到所有的引用:
首先,处理标签,创建本地标签并删除对应的远程分支:
git for-each-ref refs/remotes/origin/tags |cut -d / -f 5-|grep -v @| while read tagname; do git tag "$tagname" "origin/tags/$tagname"; done
git for-each-ref refs/remotes/origin/tags |cut -d / -f 5-|grep -v @| while read tagname; do git branch -r -d "origin/tags/$tagname"; done
git for-each-ref refs/remotes/origin/ |cut -d / -f 4-|grep -v @| while read branchname; do git branch "$branchname" "refs/remotes/origin/$branchname"; done
git for-each-ref refs/remotes/origin/ |cut -d / -f 4-|grep -v @| while read branchname; do git branch -r -D "origin/$branchname"; done
根据官方文档的描述,git svn会创建一个名为trunk的额外分支,它对应于Subversion的默认分支,然而trunk引用和master指向同一个位置。鉴于在Git中master最为常用,因此我们可以移除额外的分支:
此时,可以观察到分支结构正常了:
在git svn命令执行的过程中,已经在SVN中被删除的分支也会被fetch到。例如,如下的提交对应的SVN分支实际早就被删掉了,可以看到提交记录是空的:
我们可以利用如下的命令分别列出Git分支和SVN中的实际分支:
然后使用diff命令找出不在SVN中的分支,然后将其删除:
这时再次观察分支接口,已经与SVN一致:
配置Git的username和email,并配置仓库的远程地址(需要在Bitbucket中先创建对应的Repository):
git config --global user.name ***
git config --global user.email ***
git remote add origin http://******/******.git
或
git remote set-url origin http://******/******.git
将所有分支与标签推送到远程仓库:
git push origin --all
git push origin --tags
这样,我们就可以在Bitbucket中看到原SVN仓库相关的所有分支:
标签:
及提交记录:
1、https://git-scm.com/book/zh/v2/Git-%E4%B8%8E%E5%85%B6%E4%BB%96%E7%B3%BB%E7%BB%9F-%E8%BF%81%E7%A7%BB%E5%88%B0-Git,官方迁移文档;
2、https://blog.csdn.net/ouyang_peng/article/details/80372805
3、https://stackoverflow.com/questions/5914681/git-svn-bulk-removing-orphaned-remote-branches/7209462#7209462