Git幕后的“故事”

lovezhou1990 8年前

来自: http://blog.csdn.net/dc_726/article/details/50639745

因为做操作系统实验的原因,所以通读了一遍 《Understanding git conceptually》 ,觉得确实不错,于是就简单地记录一下。有的地方理解的还不是很深,可能不够准确,等抽时间好好读一下《Pro Git》。

作者开篇说到:仅仅记住在什么时候用什么命令是不够的,出问题只是早晚的事。只有理解了Git的工作原理,才算真正学会Git。遗憾的是大部分网上的教程都只是教你在何时使用哪个命令,然后让你去模仿。说得这么好,那就看看作者这篇教程是否把Git的工作原理讲清楚了。注意: 以下1.2.1到1.2.3都是本地化操作 ,不要看到仓库、分支、合并等词语就以为一定是远程操作了,1.2.4才会讲到多人协同开发时的远程操作。

1.Commit Object和Head

使用Git的目的当然就是管理项目文件的版本变化,在Git中保存所有管理信息的数据结构叫做仓库(Repository)。可以在一个文件夹中通过命令 git init 创建仓库。仓库保存在项目文件目录下的一个叫做.git的文件夹中,它由两部分组成:

  • 提交对象(Commit object) :反映项目状态的一组文件、对父提交对象的引用、当前提交对象的SHA-1签名构成了提交对象。父提交对象的引用使得仓库的提交对象形成了一个有向无环图,我们可以一直遍历到第一次提交。 每当我们要查询或操作仓库,都应该以如何操作commit object图的角度去思考 。
  • 对提交对象的引用(Head) :每个Head都有个名字,默认每个仓库都有个叫做master的Head。此外, 指向当前活跃Head的引用叫做HEAD (二级引用)。

例如,下面就是提交三次后的对象图:

---->  time  ----->    (A) <-- (B) <-- (C)                   ^                   |                 master                   ^                   |                  HEAD

我们日常的工作流程一般如下,下面就从图的角度说明一下Git在背后到底做了什么:

  1. 修改一些代码
  2. git log 查看历史记录:显示从HEAD到初始提交的所有提交日志。用log命令显示出每个提交对象的SHA-1签名,我们就能控制HEAD的移动。
  3. git status 查看修改文件列表:显示当前项目状态与HEAD发生变化的文件列表。
  4. git diff 比较修改内容:显示当前项目状态与HEAD发生变化的文件内容。
  5. git commit -am "message" 提交修改:创建提交对象,将HEAD作为父提交对象。提交完成后,HEAD将指向刚创建的新提交对象。-a参数相当于 git add ,自动将修改文件添加到提交列表里。

2.Branching

下面说说Git中的分支(Branch)。在Git中,Branch与Head几乎是等同的。每个Branch都由一个Head来表示。所以,我们用Branch指分支的Head以及它的所有父对象构成的整个历史,用Head指单独一个提交对象,一般是分支中最近的提交。Git分支的最佳实践是: 用分支实现新特性,保证master(主干)始终处于可发布的状态 。Git用户经常会说:”commits are cheap”,当每个开发者都在自己的分支上提交时是不用担心任何东西的,因为你不会影响到其他人!

继续上面提交三次的那个例子,我们首先用 git branch [new-head-name] [reference-to] 命令新建一个Head。其中,HEAD^表示HEAD的父级,如果未提供提交对象的话,默认为HEAD。如果只是执行 git branch 则会列出所有Head:

git branch fix-headers HEAD^    (A) -- (B) ------- (C)          |           |     fix-headers    master                      |                     HEAD

要开始在新分支上工作,就要将新创建的Head设置为HEAD,可以通过 git checkout [head-name] 完成。注意:checkout不只会修改HEAD的指向, 它还会重写文件夹中的所有文件来匹配新HEAD指向提交对象所表示的项目状态 。所以,checkout之前最好提交所有修改。切换完成后,再提交后对象图就变成了下面的样子:

         +-------------- (D)          /                 |  (A) -- (B) -- (C)         |                 | |               master  fix-headers                            |                           HEAD

现在继续看常用命令,脑海里一定从图的角度思考:

  • git checkout [branch_name] 切换分支:切换HEAD指向的位置
  • git checkout -t [branch_name] 新建分支

3.Merging

当你在分支上完成开发时就需要将改动Merge回master,命令就是 git merge [head] 和 git pull . [head] 。假设当前Head叫做HEAD,分支Head叫做fix-headers,则Git的代码合并过程如下:

  1. 找到HEAD和fix-headers的共同祖先,假设叫ancestor,先看两种简单情况:
    1.1 如果ancestor是fix-headers,则什么都不做
    1.2 如果ancestor是HEAD,则执行fast-forward-merge
  2. 否则,比较出fix-headers在ancestor后的改动,将这些改动合并到HEAD
    2.1 如果没有冲突,则创建一个新的提交对象,以HEAD和fix-headers为父级,并将HEAD指向这个新对象,并更新项目文件
    2.2 如果有冲突,则不创建提交对象,插入冲突的标记,通知用户处理
fast-forward-merge的例子:                  +-- (D) -- (E)                 /            |  (A) -- (B) -- (C)           |                 |            |              current     fix-headers                 |                HEAD    执行`git merge fix-headers`合并之后的样子:                  +-- (D) -- (E)                 /            |  (A) -- (B) -- (C)           |                              |                      fix-headers, current                                   |                                  HEAD
复杂情况下的合并例子:           +---------- (D)          /             |  (A) -- (B) -- (C) -------------- (E)                        |           |                   fix-headers    master                                    |                                   HEAD    执行`git merge fix-headers`合并之后的样子:           +---------- (D) ---------------+          /             |                  \  (A) -- (B) -- (C) -------------- (E) -- (F)                        |                  |                   fix-headers           master                                           |                                          HEAD

4.协同开发

前面讲到过:Git的重要特点就是Repository与项目文件是保存在一起的,所以Git可以在无需连网的状态下正常工作。但是这也意味着不同的开发者在默认情况下是不共享Repository的。为了实现共享,Git使用分布式模型(Distribution Model)版本管理,既可以无中心化也可以有中心。

首先要访问你朋友的远程仓库就需要一个位置,叫做remote-specification,Git可以通过SSH、HTTP等协议对外提供访问。然后就可以通过 git clone [remote-specification] 下载远程仓库到本地了。除了简单的拷贝, Git会给远程Repository创建一个reference叫做origin,同时还会给每个Head新建一个Head,名字以”origin/”开头来区分 :

远程仓库的样子:                  +---------------(E)                 /                 |  (A) -- (B) -- (C) -- (D)         |                        |          |                      master    feature                        |                       HEAD    你clone后的本地仓库是这个样子:                  +-------------- (E)                 /                 |  (A) -- (B) -- (C) -- (D)         |                        |          |       origin/master, master    origin/feature                        |                       HEAD

当远程仓库变化时,我们可以通过 git fetch [remote-repository-reference] 命令将改动抓取到本地,生成对应的提交对象,再用前面讲过的 git pull [remote-repository-reference] [remote-head-name] 进行合并。其实, pull命令也会自动进行fetch ,所以平时我们直接使用pull就可以了。来看一个例子,假设你朋友在跟你一起开发,他本地的Repository变成了这个样子:

                +-------- (E) -- (F) -- (G)                 /                         |  (A) -- (B) -- (C) -- (D) -- (H)          |                               |           |                             master     feature                               |                              HEAD    在你执行fetch之后你的仓库是这个样子:                  +------------ (E) ------------ (F) ---- (G)                 /               |                         |  (A) -- (B) -- (C) -- (D) --------------- (H)             |                        |        |          |              |                      master  feature origin/master  origin/feature                        |                       HEAD    注意:你的Head并未受任何影响,变化的只是带有"origin/"的Head。  现在就用pull命令合并,更新你的master和feature,完成后你的仓库就成了这个样子:                  +-------- (E) ------------- (F) ----- (G)                 /           |                           |  (A) -- (B) -- (C) -- (D) ------------ (H)              |                             |           |               |                          feature  origin/master,  origin/feature                                       master                                         |                                        HEAD

与之相反,将本地修改发送到远程仓库使用 git push [remote-repository-reference] [remote-head-name] ,远程仓库会负责提交对象的创建以及Head的合并移动等工作。要注意的是:向远程仓库push时,要求必须是fast-forward合并。

整理一下这部分的常用命令:

  • git pull [remote-repository-reference] [remote-head-name] 下载分支代码