看完这篇文章才对GIT有了大彻大悟的认识
git定义:版本管理工具
历史:没有git的时候,我们修改完一个文件,要先把文件拷贝一个副本到备份文件夹中,还要建个文档来记录当前文件的信息和操作记录。当文件多的时候,人工操作起来将是个非常辛苦非常庞大的工作量。
如今:有了git帮我们管理这些副本,为我们节约了非常大的人力成本,让我们的工作 变得更加轻松。我们不要把git看得那么神秘,git的核心就是创建备份和恢复备份,但是衍生出一堆的新概念,这些抽象概念可以帮助我们快速的学会 git,但是要很好的使用git,我们还需要GIT的一些底层原理。本文章是从文件的层面出发来重新理解GIT的工作原理和GIT命令的具体实现。
基础理论知识:
1.文件系统:我们可以把硬盘理解成一本汉语词典,词典前面的目录索引就是文件系 统,能帮助我们快速找到文件内容的具体位置,通常我们也只会通过索引去找文件,windows中的我的电脑就是一个索引系统,索引里面没有的文件我们就 “找不到”。我们知道从操作系统删除文件,其实只是删除了索引,具体文件内容还是存在硬盘上的,虽然我们通过索引找不到,但是我们可以通过内容去查找(利 用一些恢复工具)。
2.git仓库:就是用来存放备份文件的地方,但是备份文件存入仓库的时候会压缩, 这些压缩的备份文件存放在.git/objects目录中,直接打开是乱码,而且为了节省空间,仓库不会存放重复的文件,只有新增和修改过的文件才会存入 git仓库,删除的时候并不会从仓库移除文件,不然我们怎么恢复呢。
3.HEAD:git的版本日志或版本号,通过git log 我们可以看到很多的编号,我们通过修改head指针来切换版本,每个版本关联一份快照,每个关照关联一系列文件,就是“HEAD->快照->仓库文件”这样一个关系链,我们可以很轻松的通过移动HEAD指针来改变我们的工作区文件。
4.暂存区/缓冲区:暂存区并不存放文件内容,暂存区仅仅是一份处于编辑状态的快照(索引文件),这份快照没有编号。commit就是把暂存区保存到版本库,并给版本日志新增一个编号(HEAD/版本号)指向这个快照副本。
5.git快照:我们知道git是通过快照来管理版本的,快照就是git的文件系统,就是我们说的汉语词典的索引,每次commit就是创建一份快照,并给快照起一个编号,这个编号就是HEAD。
6.工作区:工作区就是除开.git目录的其他东西。通过操作系统的文件索引来管理的内容。就是我们正常使用电脑的时候所看到,能编辑的内容。
7.分支:分支其实就是上面说到的版本日志,一个分支就是一个版本分组,每个分支记录该分支上的所有HEAD,“分支->HEAD->快照->仓库文件”
同学们可以通过下面的图片来理解以上几个概念,下图中的每个方块都是存放在硬盘上的文件,git就是建立了这样一个关系库来管理版本的(途中的缓冲区就是暂存区)。
大家不要被上图的复杂线条缩困扰,你只需要弄清HEAD就行了,我们移动HEAD指针其实就是通过HEAD编号找到快照,再通过快照找到这个HEAD的所有文件。
git命令的理解:
1、status
1.1、对比暂存区跟工作区,对比结果主要存在3种情况:
1.1.1、【删】暂存区记录的文件在工作区没有,add的时候会从暂存区移除对应的文件索引,但并不影响git仓库的内容。
1.1.2、【增】工作区已有的文件在暂存区没有记录的,add的时候会把对应的文件拷贝到仓库中,并在暂存区建立一条索引指向仓库中对应的文件。
1.1.3、【改】对工作区的文件内容进行算法得出校验值与暂存区记录的校验值不同,add的时候会把对应的文件拷贝到仓库中,并更新暂存区该条索引的信息。
1.2、对比暂存区与当前HEAD所指向的快照,对比结果也是增、删、改3种情况
2、add
add会执行2个任务,第一是把【增】【改】的文件拷贝到仓库,第二个是维护暂存区索引,保证暂存区索引跟操作系统的文件索引内容一致,快照索引指向的是仓库中的文件,操作系统索引指向的是工作区的文件。
3、commit
commit做的事情就简单些了,先对比暂存区与工作区,当暂存区与工作区内容相同的时候,直接保存暂存区为一份新的快照、并给这个快照生成1个编号,并把当前分支HEAD改成这个编号。
4、reset
reset分2情况:
4.1、reset文件:reset b86563 b.txt ,将b86563这份快照中b.txt索引复制到暂存区的b.txt的索引。仅仅是对暂存区的索引进行修改,不影响文件内容,仅仅是修改了文件的关联。
4.2、reset HEAD:reset b86563
4.2.1、参数–soft:仅仅修改HEAD/版本号。
4.2.2、参数–mixed:默认参数,修改当前HEAD/版本号,然后用指定的快照覆盖暂存区,工作区不变。
4.2.3、参数–hard:修改当前分支HEAD,用参数HEAD关联 的快照覆盖暂存区,并把工作区恢复到快照创建时的工作区状态,实际就是对比这份“历史快照”与工作区,快照中没有的文件,从工作区删除,校验码不同以及工 作区没有的文件,通过快照找到关联的文件(仓库中的),并复制到工作区。
5、checkout
reset分2情况:
4.1、checkout HEAD:用HEAD关联的快照覆盖暂存区,并把工作区恢复到快照创建时的工作区状态,checkout 快照与reset –hard的区别就是:checkout是可恢复,reset是不可恢复(后期会删除仓库中的文件,checkout不会)
4.2、checkout分支:checkout dev ,切换到dev分支,并修改当前版本号为dev上最后一个版本号。如果dev分支不存在,创建一个名为dev的分支,版本号不变。
6、revert
revert就是创建一个新快照,并把分支HEAD修改为新创建快照的编号,用该快照覆盖暂存区,并把工作区恢复到快照创建时的工作区状态。checkout和reset会“丢弃”一些版本日志,cover不会。
总结:
1.暂存区、快照=git的文件系统=索引;仓库、工作区=我们真正需要的文件内容。
2.安全性:revert>checkout>reset,revert不会影响过去,checkout会丢弃掉一些版本号,reset会丢弃版本号和仓库中的某些备份文件。
7、远程仓库
工作区的文件是可以编辑的,git仓库的文件是不能编辑的,git上传到远程仓库或从远程仓库下载的时候,并不是下载或上传全部文件。
7.1、上传的时候,远程仓库的最新快照编号肯定是包含在本地的快照日志中的, 如果不存在,则证明远程仓库在上次下载后有改动,这时候要求先pull。反之,git会把本地新增的文件上传到远程仓库,并把新增的快照上传到远程快照。 通过图1,我们可以看出git是怎么通过HEAD轻松的找到新增的快照和文件的。
7.2、下载的时候与上传同理…
共有 1 条讨论