1.1 背景
数据是短暂的,且容易丢失的,特别是作为开发人员的我们每天频繁的对项目代码进行更新,容易产生错误代码的变更或者项目文件的丢失,所以我们需要在整个工作过程中不断的备份和存档我们的文档和项目文件。
在当下的项目开发环境下,一个项目往往是有多个开发者共同开发维护的,那么意味着他们需要操作同一项目文件,我们需要对文本和项目代码的变更进行记录管理,这些变更就构成了一个版本库,对版本库的管理就是版本控制。
一个可以管理或追踪软件代码的工具通常称为版本控制系统(VCS)。现在流行的版本控制工具很多,当然,我们接下来要说的就是称的上VCS界一哥的Git,它是一款功能强大、灵活且低开销的VCS,它可以让协同开发成为一种乐趣。
1.2 Git的诞生
其实,在Git诞生之前市面上已经有非常多的VCS了,比如当时VCS界的老大哥:SVN(现在在市面上也还有不小的份额)。那为什么还要创造Git这个新工具呢?
这当然得从他的创始人Linus Torvalds说起 ,一个在技术界被千万人顶礼膜拜的男人!为了方便管理Linux内核的开发工作,一个可靠的值得信赖的VCS是不可或缺的,但是,Linus一直痛恨的CVS及SVN都是集中式的版本控制系统,而Git是分布式版本控制系统,集中式和分布式版本控制系统有什么区别呢?
集中式版本控制系统
版本库是集中存放在中央服务器的,而干活的时候,用的都是自己的电脑,所以要先从中央服务器取得最新的版本,然后开始干活,干完活了,再把自己的活推送给中央服务器。
集中式版本控制系统最大的毛病就是必须联网才能工作,如果在局域网内还好,带宽够大,速度够快,可如果在互联网上,遇到网速慢的话,可能提交一个10M的文件就需要5分钟,这还不得把人给憋死啊。
分布式版本控制系统
首先,分布式版本控制系统根本没有“中央服务器”,每个人的电脑上都是一个完整的版本库,这样,你工作的时候,就不需要联网了,因为版本库就在你自己的电脑上。既然每个人电脑上都有一个完整的版本库,那多个人如何协作呢?比方说你在自己电脑上改了文件A,你的同事也在他的电脑上改了文件A,这时,你们俩之间只需把各自的修改推送给对方,就可以互相看到对方的修改了。
和集中式版本控制系统相比,分布式版本控制系统的安全性要高很多,因为每个人电脑里都有完整的版本库,某一个人的电脑坏掉了不要紧,随便从其他人那里复制一个就可以了。而集中式版本控制系统的中央服务器要是出了问题,所有人都没法干活了。
在实际使用分布式版本控制系统的时候,其实很少在两人之间的电脑上推送版本库的修改,因为可能你们俩不在一个局域网内,两台电脑互相访问不了,也可能今天你的同事病了,他的电脑压根没有开机。因此,分布式版本控制系统通常也有一台充当“中央服务器”的电脑,但这个服务器的作用仅仅是用来方便“交换”大家的修改,没有它大家也一样干活,只是交换修改不方便而已。
当然,Git的优势不单是不必联网这么简单,后面我们还会看到Git极其强大的分支管理,把SVN等远远抛在了后面。
好,回到我们的故事,当时Linus选择了一个商业的版本控制系统BitKeeper,BitKeeper的东家BitMover公司出于人道主义精神,授权Linux社区免费使用这个版本控制系统。然而,好景不长,Linus那些牛人不甘寂寞,试图破解BitKeeper的协议,被BitMover公司发现了,于是BitMover公司不干了,要收回Linux社区的免费使用权。Linus知道之后向人家道了个歉,但是人家肯定不会再免费提供给他们使用了,那咋办呢?Linus大神于是小小的发了一下力,花了两周的时间,用C写出了Git,一个月之内,Linux系统的源码已经由Git管理了。除了说牛逼,我们还能说什么呢?
如今,Git已经在大量的项目中得到了非常成功的应用,成为了目前世界上最先进的分布式版本控制系统(没有之一)。