Git 是一个开源的分布式版本控制系统,它的用途与SVN、CVS等版本控制系统一样,可以对文件进行版本管理。Git是目前主流的版本控制系统,很多软件项目都会用它作为源代码管理工具。
Git是分布式版本控制系统,而SVN、CVS等却是集中式版本控制系统。那么,分布式和集中式到底有什么区别呢?我们先看下图,
上图中,左边是集中式版本控制,右边是分布式版本控制。在这里解释一下,Server Computer是提供版本控制服务的,ComputerA、ComputerB分别是用户机器。我们可以看出,在集中式版本控制中,Server Computer作为中央服务器,它上面有完整的版本库。而在分布式版本控制中,每个机器上(Server Computer、ComputerA、ComputerB)都有完整的版本库,这就是集中式和分布式版本控制最大的区别。分布式版本控制系统中,Server Computer严格意义上不能算中央服务器,每个用户机器都可以脱离Server Computer,单独做自己的版本控制,而且每个用户机器之间都可以互相推送文件。当然,我们在实际应用中,由于用户机器之间不一定能互相访问、为了统一管理代码等原因,很少在用户机器之间直接推送版本库的修改,我们还是会拿一台服务器(Server Computer)作为“中央服务器”,但这个服务器的作用仅仅是用来方便“交换”大家的修改,没有它大家也一样干活,只是交换修改不方便而已。
由于集中式版本控制系统是需要一个中央服务器作为版本库,所有用户机器都需要通过这个中央服务器作版本控制,因此,集中式版本控制系统非常依赖网络。而分布式版本控制系统由于用户机器本身就可以作为版本库,因此,它可以脱离网络做版本控制,等到需要推送修改后的版本给其他用户的时候,才需要联网。
其次,分布式版本控制系统每个机器都可以作为版本库,因此,理论上不会因为一台“中央服务器”出问题而导致整个版本控制系统瘫痪。
Git的安装很简单,可以到官网下载。安装成功后,我们就可以在我们计算机上任何一个目录上右键打开Git Bash,如下图:
我们所有的Git操作命令,都会在Git Bash上完成。
由于Git和SVN、CVS这些集中式版本控制系统使用起来差别还是挺大的,有必要说明一下我们在使用Git时的工作流程,如下图:
一般工作流程如下:
本来不想写这一节,但如果不了解一下这个,后面有些东西可能理解不了,那还是硬着头皮写一下。读下去可能有点懵,但没关系,先了解一下。
我们先来理解下 Git 工作区、暂存区和版本库概念:
下面这个图展示了工作区、版本库中的暂存区和版本库之间的关系:
图中左侧为工作区,右侧为版本库。在版本库中标记为 "index" 的区域是暂存区(stage/index),标记为 "master" 的是 master 分支所代表的目录树。
图中我们可以看出此时 "HEAD" 实际是指向 master 分支的一个"游标"。所以图示的命令中出现 HEAD 的地方可以用 master 来替换。
图中的 objects 标识的区域为 Git 的对象库,实际位于 ".git/objects" 目录下,里面包含了创建的各种对象及内容。
当对工作区修改(或新增)的文件执行 git add 命令时,暂存区的目录树被更新,同时工作区修改(或新增)的文件内容被写入到对象库中的一个新的对象中,而该对象的ID被记录在暂存区的文件索引中。
当执行提交操作(git commit)时,暂存区的目录树写到版本库(对象库)中,master 分支会做相应的更新。即 master 指向的目录树就是提交时暂存区的目录树。
当执行 git reset HEAD 命令时,暂存区的目录树会被重写,被 master 分支指向的目录树所替换,但是工作区不受影响。
当执行 git rm --cached <file> 命令时,会直接从暂存区删除文件,工作区则不做出改变。
当执行 git checkout . 或者 git checkout -- <file> 命令时,会用暂存区全部或指定的文件替换工作区的文件。这个操作很危险,会清除工作区中未添加到暂存区中的改动。
当执行 git checkout HEAD . 或者 git checkout HEAD <file> 命令时,会用 HEAD 指向的 master 分支中的全部或者部分文件替换暂存区和以及工作区中的文件。这个命令也是极具危险性的,因为不但会清除工作区中未提交的改动,也会清除暂存区中未提交的改动。
Git操作的前提是创建仓库,也就是你要把哪个目录纳入版本管理,就把哪个目录创建为仓库。创建仓库会遇到两种情况,一种是没有现有Git仓库,一种是有现有Git仓库。命令如下:
git init
如果没有现有Git仓库,我们可以把要创建仓库的目录打开,然后右键Git Bash,执行git init命令,把当前目录创建为仓库。创建成功后,当前目录会出现一个.git的隐藏目录。如下图:
git clone
如果存在现有仓库,譬如说,存在某个远程仓库,我们可以用git clone命令。我们首先要获取到远程仓库的地址,譬如现在有很多开源项目会放到github上,我们可以到上面的某个开源项目上获取项目的仓库地址。如下图:
创建好本地仓库以后,我们就可以进行更多的Git操作。Git的命令有很多,这里我简单讲几个常用的命令,想要详细了解各命令,麻烦再度娘一下。
git add
git add 命令可将文件添加到暂存区。仓库里新创建的文件要先进行git add命令,这样,文件才会纳入版本管理。
git status
git status 命令用于查看在你上次提交之后是否有对文件进行再次修改。
git commit
git commit 命令可将暂存区内容添加到本地版本库中。
git checkout
git checkout 命令用法比较多,简单介绍如下:
1.git checkout
表示核查工作区相对于版本库修改过的文件。
2. git checkout + 分支名
表示切换分支。
3. git checkout -b 分支名
表示以当前分支的当前状态创建新分支并切换到新分支 -b 表示创建新分支
4. git checkout -b 分支名 commitID
表示以当前分支的commitID提交节点创建新的分支并切换到新分支。此时工作区的内容和切换分之前commitID提交节点的内容一样。
5. git checkout commitID
是以指定的提交节点创建了一个临时性分支,此临时性分支可用于做实验性修改。
6. git checkout filename
当没有提交版本号时将工作区的指定文件的内容恢复到暂存区的状态。
7. git checkout .
将工作区的所有文件的内容恢复到暂存区的状态。
8. git checkout <commit> filename
当有提交版本号时,表示将工作区和暂存区都恢复到版本库指定提交版本的指定文件的状态,此时HEAD指针不变,此时的状态相当于把工作区的内容修改到指定版本的文件内容后,再把修改的内容添加到暂存区。因此git checkout <commit> filename后,可以直接执行git commit而不需要先执行git add。
git fetch
git fetch 命令用于从远程获取代码。
git merge
git merge 命令用于把两个分支进行合并。合并的时候可能会产生冲突,解决冲突最好用一些可视化工具解决。
git pull
git pull 命令用于从远程获取代码并合并到本地的版本。这个命令相当于git fetch+git merge。
git push
git push 命令用于将本地的分支版本上传到远程并合并。
如果能把命令行用熟,Git的可视化工具其实是很容易上手的,因此,其实我是建议先熟练使用命令行。目前市面上比较流行的Git可视化管理工具有SourceTree、Github Desktop、TortoiseGit,综合网上的一些文章分析和自己的日常开发实践心得个人比较推荐开发者使用SourceTree,因为SourceTree同时支持Windows和Mac,并且界面十分的精美简洁,大大的简化了开发者与代码库之间的Git操作方式。SourceTree安装和使用也请自行度娘一下。