说的通俗一点,就是我们平时不管干什么,比如写个文档也好,写个PPT也好,都不是一次就定稿的吧,总会修修改改,而每次修修改改都会变成一个新版本的文件,说的互联网一点,就是版本迭代,版本控制。当然,我们写程序也一样,git就是来帮助我们更加方便的管理版本控制的。
下面看一下文绉绉的概念和作用:
版本控制(Revision control)是一种在开发的过程中用于管理我们对文件、目录或工程等内容的修改历史,方便查看更改历史记录,备份以便恢复以前的版本的软件工程技术。
实现跨区域多人协同开发
追踪和记载一个或者多个文件的历史记录
组织和保护你的源代码和文档
统计工作量
并行开发、提高开发效率
跟踪记录整个软件的开发过程
减轻开发人员的负担,节省时间,同时降低人为错误
简单说就是用于管理多人协同开发项目的技术。
没有进行版本控制或者版本控制本身缺乏正确的流程管理,在软件开发过程中将会引入很多问题,如软件代码的一致性、软件内容的冗余、软件过程的事物性、软件开发过程中的并发性、软件源代码的安全性,以及软件的整合等问题。
主流的版本控制器有如下这些:
Git
SVN(Subversion)
CVS(Concurrent Versions System)
VSS(Micorosoft Visual SourceSafe)
TFS(Team Foundation Server)
Visual Studio Online
版本控制产品非常的多(Perforce、Rational ClearCase、RCS(GNU Revision Control System)、Serena Dimention、SVK、BitKeeper、Monotone、Bazaar、Mercurial、SourceGear Vault),现在影响力最大且使用最广泛的是Git与SVN
记录文件每次的更新,可以对每个版本做一个快照,或是记录补丁文件,适合个人用,图例如下:
所有的版本数据都保存在服务器上,协同开发者从服务器上同步更新或上传自己的修改,图例如下:
所有的版本数据都存在服务器上,用户的本地只有自己以前所同步的版本,如果不连网的话,用户就看不到历史版本,也无法切换版本验证问题,或在不同分支工作。而且,所有数据都保存在单一的服务器上,有很大的风险这个服务器会损坏,这样就会丢失所有的数据,当然可以定期备份。代表产品:SVN、CVS、VSS
每个人都拥有全部的代码,所以存在安全隐患,怕有人泄露源码
所有版本信息仓库全部同步到本地的每个用户,这样就可以在本地查看所有版本历史,可以离线在本地提交,只需在连网时push到相应的服务器或其他用户那里。由于每个用户那里保存的都是所有的版本数据,只要有一个用户的设备没有问题就可以恢复所有的数据,但这增加了本地存储空间的占用。
不会因为服务器损坏或者网络问题,造成不能工作的情况。
以git和svn为例。
SVN是集中式版本控制系统,版本库是集中放在中央服务器的,而工作的时候,用的都是自己的电脑,所以首先要从中央服务器得到最新的版本,然后工作,完成工作后,需要把自己做完的活推送到中央服务器。集中式版本控制系统是必须联网才能工作,对网络带宽要求较高。
总结就是,git不需要联网也能正常工作,但svn必须要在联网环境下才能工作
git和linux其实有很深的渊源,git就是因为linux才出现的。
Linux 内核开源项目有着为数众广的参与者。绝大多数的 Linux 内核维护工作都花在了提交补丁和保存归档的繁琐事务上(1991-2002年间)。到 2002 年,整个项目组开始启用一个专有的分布式版本控制系统 BitKeeper 来管理和维护代码。
到了 2005 年,开发 BitKeeper 的商业公司同 Linux 内核开源社区的合作关系结束,他们收回了 Linux 内核社区免费使用 BitKeeper 的权力。这就迫使 Linux 开源社区(特别是 Linux 的缔造者 Linus Torvalds)基于使用 BitKeeper 时的经验教训,开发出自己的版本系统。(只用了2周左右,当然在此之前也有研究过bitkeeper的技术) 也就是后来的 Git!
Git是目前世界上最先进的分布式版本控制系统。
Git是免费、开源的,最初Git是为辅助 Linux 内核开发的,用来替代原来使用的 BitKeeper
到git的官网https://git-scm.com下载对应操作系统的版本即可
如果官网下的太慢可以自己找镜像,比如淘宝镜像http://npm.taobao.org/mirrors/git-for-windows/
**Git Bash:**Unix与Linux风格的命令行,使用最多,推荐最多,一般都用这个
**Git CMD:**Windows风格的命令行
Git GUI:图形界面的Git,不建议初学者使用,尽量先熟悉常用命令
1)、cd : 改变目录。
2)、cd . . 回退到上一个目录,直接cd进入默认目录
3)、pwd : 显示当前所在的目录路径。
4)、ls(ll): 都是列出当前目录中的所有文件,只不过ll(两个ll)列出的内容更为详细。
5)、touch : 新建一个文件 如 touch index.js 就会在当前目录下新建一个index.js文件。
6)、rm: 删除一个文件, rm index.js 就会把index.js文件删除。
7)、mkdir: 新建一个目录,就是新建一个文件夹。
8)、rm -r : 删除一个文件夹, rm -r src 删除src目录
9)、mv 移动文件, mv index.html src index.html 是我们要移动的文件, src 是目标文件夹,当然, 这样写,必须保证文件和目标文件夹在同一目录下。
10)、reset 重新初始化终端/清屏。
11)、clear 清屏。
12)、history 查看命令历史。
13)、help 帮助。
14)、exit 退出。
15)、#表示注释
作用域最小,仅对当前项目有效
作用域中等,为登陆这台计算机的用户
会修改如:
C:\Users\XiaoRui\.gitconfig
路径下的文件
作用域最大,为整台计算机,无论哪个用户登录也无论哪个项目
会修改如:
D:\Program Files\Git\etc\gitconfig
路径下的文件
这个问题和问题的答案其实都很容易想到,比如三种配置作用域,配置了同一个属性不同的值,那么最后针对项目是哪个生效?
其实并不难想的,一般来说,肯定是作用域越小,优先级越高,所以优先级为:git config > git config --global > git config --system
计算机各个领域都通常是这种规则,比如我们的全局变量和局部变量,如果该语言允许全局变量和局部变量同名,通常都是局部变量的优先级高于全局变量对吧
这里设置全局的用户名和邮箱。
git config --global user.name “xiafan”
git config --global user.email你的邮箱
四个工作区域分别为:工作目录(Working Directory)、暂存区(Stage/Index)、资源库(Repository或Git Directory)、远程的git仓库(Remote Directory)
其中工作目录(Working Directory)、暂存区(Stage/Index)、资源库(Repository或Git Directory)是本地工作区域
远程的git仓库(Remote Directory)是远程仓库
四个区域的关系如下:
四个工作区域的说明如下:
Workspace:工作区,就是你平时存放项目代码的地方
Index / Stage:暂存区,用于临时存放你的改动,事实上它只是一个文件,保存即将提交到文件列表信息
Repository:仓库区(或本地仓库),就是安全存放数据的位置,这里面有你提交到所有版本的数据。其中HEAD指向最新放入仓库的版本
Remote:远程仓库,托管代码的服务器,可以简单的认为是你项目组中的一台电脑用于远程数据交换
git的工作流程一般是这样的:
1、在工作目录中添加、修改文件;
2、将需要进行版本管理的文件放入暂存区域;
3、将暂存区域的文件提交到git仓库。
因此,git管理的文件有三种状态:已修改(modified),已暂存(staged),已提交(committed)
git的常用命令:
最常用的是add、commit、push、clone
版本控制就是对文件的版本控制,要对文件进行修改、提交等操作,首先要知道文件当前在什么状态,不然可能会提交了现在还不想提交的文件,或者要提交的文件没提交上。
Untracked: 未跟踪, 此文件在文件夹中, 但并没有加入到git库, 不参与版本控制. 通过git add 状态变为Staged.
Unmodify: 文件已经入库, 未修改, 即版本库中的文件快照内容与文件夹中完全一致. 这种类型的文件有两种去处, 如果它被修改, 而变为Modified. 如果使用git rm移出版本库, 则成为Untracked文件
Modified: 文件已修改, 仅仅是修改, 并没有进行其他的操作. 这个文件也有两个去处, 通过git add可进入暂存staged状态, 使用git checkout 则丢弃修改过, 返回到unmodify状态, 这个git checkout即从库中取出文件, 覆盖当前修改 !
Staged: 暂存状态. 执行git commit则将修改同步到库中, 这时库中的文件和本地文件又变为一致, 文件为Unmodify状态. 执行git reset HEAD filename取消暂存, 文件状态为Modified
使用git status命令可以查看当前文件夹所有文件的状态
使用git status [filename]命令可以查看当前文件夹特定文件的状态
在主目录下建立".gitignore"文件(maven文件一般都会自带),此文件有如下规则:
忽略文件中的空行或以井号(#)开始的行将会被忽略。
可以使用Linux通配符。例如:星号(*)代表任意多个字符,问号(?)代表一个字符,方括号([abc])代表可选字符范围,大括号({string1,string2,…})代表可选的字符串等。
如果名称的最前面有一个感叹号(!),表示例外规则,将不被忽略。
如果名称的最前面是一个路径分隔符(/),表示要忽略的文件在此目录下,而子目录中的文件不忽略。
如果名称的最后面是一个路径分隔符(/),表示要忽略的是此目录下该名称的子目录,而非文件(默认文件或目录都忽略)。
如:
#为注释
*.txt #忽略所有 .txt结尾的文件,这样的话上传就不会被选中!
!lib.txt #但lib.txt除外
/temp #仅忽略项目根目录下的TODO文件,不包括其它目录temp
build/ #忽略build/目录下的所有文件
doc/*.txt #会忽略 doc/notes.txt 但不包括 doc/server/arch.txt
怎么把一个Java项目变成一个Git项目
在git中创建一个空的git仓库,如下:
把这个仓库clone下来,得到:
把这里面所有的文件,粘到项目中,如下:
在终端执行git add .把文件上传到本地仓库
在右上角选中如下图标,commit保存到资源库
在右上角选中如下图标,push保存到远程git仓库,在这里是gitee仓库
这里感觉有个很有趣的东西啊,通过反复刷新仓库可以发现,推送过程是一个事务,只会全部推送成功或全部推送失败,不会只推送一部分,具体原理也不细究了,这里就是刚好看到这样的现象。
同一个项目可能每个人负责的是不同的功能或者模块编写,但是针对同一个项目操作很容易发生不可预计的错误,所以提出了分支,每个小组负责的部分单独开一个分支,到最后项目需要整合了再merge合并即可
# 列出所有本地分支
git branch
# 列出所有远程分支
git branch -r
# 新建一个分支,但依然停留在当前分支
git branch [branch-name]
# 新建一个分支,并切换到该分支
git checkout -b [branch]
# 合并指定分支到当前分支
$ git merge [branch]
# 删除分支
$ git branch -d [branch-name]
# 删除远程分支
$ git push origin --delete [branch-name]
$ git branch -dr [remote/branch]