overlayfs 基本概念

一种联合文件系统,设计简单,速度更快。overlayfs在linux主机上只有两层,一个目录在下层,用来保存镜像(docker),另外一个目录在上层,用来存储容器信息。在overlayfs中,底层的目录叫做lowerdir,顶层的目录称之为upperdir,对外提供统一的文件系统为merged。 当需要修改一个文件时,使用CoW将文件从只读的Lower复制到可写的Upper进行修改,结果也保存在Upper层。在Docker中,底下的只读层就是image,可写层就是Container。

overlayfs存储架构 可以看到镜像层和容器层可以保存相同的文件,容器层的文件会覆盖镜像层的文件

  • 在overlayfs中每个镜像层都会在/var/lib/docker/overlay有对应的目录,使用硬链接与底层数据进行关联。

优势劣势

  • 1.OverlayFS支持页缓存共享,多个容器访问同一个文件能共享一个页缓存,以此提高内存使用
  • 2.OverlayFS消耗inode,随着镜像和容器增加,inode会遇到瓶颈。Overlay2能解决这个问题。在Overlay下,为了解决inode问题,可以考虑将/var/lib/docker挂在单独的文件系统上,或者增加系统inode设置。

overlay中的读写

在容器中读取文件

  • (1)目标文件不在容器层内,overlay会从镜像层读取文件,此时,对容器性能的影响很小。

  • (2)目标文件在容器层内,overlay直接从容器层读取。

  • (3)目标文件在容器层和镜像层同时存在,overlay读入容器层中的文件,此时容器层的文件会覆盖镜像层的文件。

在容器中修改文件

在容器中第一次修改文件,此时文件不在容器层中。overlay会把文件从镜像层复制到容器层,所有该文件中的修改都保存在容器层中。

注意:overlay工作文件系统层(devicemapper工作再块层面),因此复制文件会复制整个文件,因此在频繁读写会很消耗资源

  • (1)只是在第一次修改文件时,需要把文件从镜像层复制到容器层,后续操作都是在容器层中完成。

  • (2)overlayfs只有两层,lowerdir和upperdir,因此在很深的目录树中,搜索文件会相对比较快

在容器中删除文件和目录

在容器中删除文件时,overlay存储驱动在容器层中新建一个without文件,该文件用语隐藏镜像层中的目标文件。在容器层删除目录时,overlay存储驱动在容器层新建一个opaque目录,该目录用于隐藏镜像层中的目标目录。 需要明白的一点是,任何存储驱动都不会删除底层image中的目标文件和目录的。

overlayfs的原理测试

overlayfs挂载后系统文件的page cache是全部共享的。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
# mkdir low upper work
# ls
low  upper  work
# echo 'abs' > low/11.txt
# echo 'xuxuebiao' > upper/22.txt
# mkdir merged
# mount -t overlay overlay -olowerdir=./low,upperdir=./upper,workdir=./work ./merged
# ls
low  merged  upper  work
# cd merged/
# ls
11.txt  22.txt
# ll
total 8
-rw-r--r--. 1 root root  4 Mar 27 18:57 11.txt
-rw-r--r--. 1 root root 10 Mar 27 18:58 22.txt

# tree
.
├── low
│   └── 11.txt
├── merged
│   ├── 11.txt
│   └── 22.txt
├── upper
│   └── 22.txt
└── work
    └── work

5 directories, 4 files
可以看到,merged目录中时low和upper目录联合的结果


分别修改文件:
# cat 11.txt
abs
# cat 22.txt
xuxuebiao
# vim 11.txt
# cat 11.txt
Hello ,overlayfs!
# cat ../low/11.txt
abs
# cat ../upper/
11.txt   11.txt~  22.txt
# cat ../upper/11.txt
Hello ,overlayfs!
# cat ../upper/11.txt~
cat: ../upper/11.txt~: No such device or address
# cat ../upper/11.txt
11.txt   11.txt~
# cat ../upper/11.txt~
cat: ../upper/11.txt~: No such device or address

可以看到low目录下的文件没有变化,但是upper里面的文件内容已经改变,并且有了一个11.txt~文件


# ls -i ../upper/11.txt 11.txt
143902921 11.txt  143902921 ../upper/11.txt
可以看到upper和merged目录中的两个文件11.txt的inode其实是一致的,其实是硬链接

# ls -i ../low/11.txt 11.txt
143902921 11.txt  143902918 ../low/11.txt
merged目录文件和low目录文件对比


删除文件测试:
# rm 11.txt
rm: remove regular file ‘11.txt’? y
# ls
ls: cannot access 11.txt: No such file or directory
ls: cannot access 11.txt~: No such file or directory
11.txt  11.txt~  22.txt

# cat ../upper/11.txt~
cat: ../upper/11.txt~: No such device or address
# ls -l ../upper/11.txt
c---------. 1 root root 0, 0 Mar 27 19:08 ../upper/11.txt

删除文件后发现文件无法访问,底层变成了一个大小为0,且没有任何人有权限的一个空文件。
overlayfs用这种删除标记的方式标识文件被删除,(如果upper中没有该文件的话,则底层low中的同名文件又恢复出来显示了,因此需要有这个空文件来标识删除,并且覆盖底层的文件)

overlayfs在docker中的使用

首先,overlayfs是在高版本的内核上才支持的存储驱动,因此不管使用的官方内核,还是自己patch的内核,首先需要检查overlayfs是否被加载

overlayfs

并且同样重要的是,对于aufs和overlay的实现,用来读取或执行共享库的共享内存也在所有运行的容器之间共享,大大的减少了通用库如’libc’的内存占用。这是一个分层策略的巨大优势,同时也是Docker的graphdriver是引擎中相当重要的一部分的原因之一。graphdriver的功能作用。

  • 1.检查overlay是否被加载
1
2
3
4
5
6
查看overlay是否被加载
$ lsmod | grep overlay
查看内核是否支持overlay模块
$ modinfo overlayfs
加载内核模块
$ modprobe overlayfs
  • 2.docker启动参数修改
1
2
3
4
5
6
7
8
9
检测overlayfs释放被识别,成功启动后修改参数到默认的配置文件中
$ docker daemon(dockerd) -s overlay(--storage-driver=overlay) 

修改配置文件
$ cat /etc/sysconfig/docker.conf
DOCKER_OPTS="--storage-driver=overlay"

模拟配置:
other_args="-s overlay --graph=/export/lib/docker -H unix:///var/run/docker.sock --bip 10.0.0.1/24 -H 0.0.0.0:5256  --api-enable-cors=true"
  • 3.检验overlayfs是否成功启动
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
$ sudo /etc/init.d/docker restart
成功启动,查看存储信息:
$ sudo docker info
Containers: 11
Images: 5
Server Version: 1.9.1
Storage Driver: overlay
 Backing Filesystem: extfs
Execution Driver: native-0.2
Logging Driver: json-file
Kernel Version: 2.6.32-431.wy38.el6.x86_64
Operating System: <unknown>
CPUs: 32
Total Memory: 126 GiB
Name: -----
ID: 2IER:NO5S:4NKX:ULDJ:THGQ:GBNR:NIN6:SCXG:SMFX:PG72:JAQF:GRZW

可用看到相关存储驱动是overlay,文件系统是extfs
  • 4.overlay在docker上面的使用

默认docker会将容器以及镜像相关的文件存储在/var/lib/docker/overlay目录下

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
sh-4.1# docker  images
REPOSITORY                        TAG                 IMAGE ID            CREATED             VIRTUAL SIZE
xxbandy123/centos6.8-sshd   latest              42c75e16533e        12 weeks ago        402 MB
sh-4.1# pwd  (这里我们是配置了存储路径)
/export/lib/docker/overlay

sh-4.1# ll -t
total 28
drwx------ 4 root root 4096 Mar 31 10:37 8ab8690b0769d07cc0b546112cfc40068d99298ed7e1857272c98a522cede527
drwx------ 4 root root 4096 Mar 31 10:37 8ab8690b0769d07cc0b546112cfc40068d99298ed7e1857272c98a522cede527-init
drwx------ 3 root root 4096 Mar 31 10:35 42c75e16533e2ef46ffd22a21318d354b3f3e520709230e9848ebaca8f1f514e
drwx------ 3 root root 4096 Mar 31 10:35 b46ba152cc17054229bc0099e7fda8b34958d518ce687c0d378b4832c4d8c91e
drwx------ 3 root root 4096 Mar 31 10:35 9016bb11dc9b4a3ee23fbef484cf5b3c9b80491e87d67092febec45759baeb4f
drwx------ 3 root root 4096 Mar 31 10:35 ea80c789cb2b3bcc1d12b9b3226c8482a06f28e94a4a49f8e201b5e9cdbdf0cc
drwx------ 3 root root 4096 Mar 31 10:35 e444e2175366cd3507bc9278d9a68a7b7ca5759b364bfe960fc12a87f219e847

可用看到我们现在有一个image,id为42c75e16533e,overlay会把该镜像的所有父镜像存储到本地(image的分层缓存),该image共5层。
sh-4.1# docker  inspect 42c75e16533e | grep b46ba152cc1
    "Parent": "b46ba152cc17054229bc0099e7fda8b34958d518ce687c0d378b4832c4d8c91e",
sh-4.1# docker  inspect b46ba152cc1 | grep 9016bb11dc9b4a
    "Parent": "9016bb11dc9b4a3ee23fbef484cf5b3c9b80491e87d67092febec45759baeb4f",
sh-4.1# docker  inspect 9016bb11dc9b4a | grep ea80c789cb2
    "Parent": "ea80c789cb2b3bcc1d12b9b3226c8482a06f28e94a4a49f8e201b5e9cdbdf0cc",
sh-4.1# docker  inspect ea80c789cb2 | grep e444e2175366cd35
    "Parent": "e444e2175366cd3507bc9278d9a68a7b7ca5759b364bfe960fc12a87f219e847",
sh-4.1# docker  inspect e444e2175366cd35 | grep Parent
    "Parent": "",
sh-4.1#


由下面示例可以看到容器id 8ab8690b07,实际上是使用image 42c75e16533e 启动起来的一个container,并给出了container 的LowerDir:`/export/lib/docker/overlay/42c75e16533e2ef46ffd22a21318d354b3f3e520709230e9848ebaca8f1f514e/root`

sh-4.1# docker inspect 8ab8690b07 | grep Parent
        "CgroupParent": "",
sh-4.1# docker inspect 8ab8690b07 | grep 42c75e1653
    "Image": "42c75e16533e2ef46ffd22a21318d354b3f3e520709230e9848ebaca8f1f514e",
            "LowerDir": "/export/lib/docker/overlay/42c75e16533e2ef46ffd22a21318d354b3f3e520709230e9848ebaca8f1f514e/root",
        "Image": "42c75e16533e",
sh-4.1#

查看容器内部的存储结构:
sh-4.1# ls 8ab8690b0769d07cc0b546112cfc40068d99298ed7e1857272c98a522cede527/
lower-id  merged/   upper/
容器的存储里面默认会存放三个文件,lower-id纪录的是image的id,也就是上面提到的LowerDir,其次存在merged和upper目录,分别为容器层,和容器最终看到的merged层。overlayfs中的lower,upper,merged三者的关系看文首。