镜像是一个打包文件,里面包含了应用程序和依赖的环境,例如:文件系统、环境变量和配置参数等。
环境变量和配置参数比较简单一个manifest清单就可以管理,真正麻烦的是文件系统。为了保证容器运行环境的一致性,镜像必须把应用程序所在操作系统的根目录,也就是rootfs都包含进来。
容器是共享宿主机内核,文件系统不包含系统内核,假如有一千个镜像基于Ubuntu系统打包,那么这些镜像里就会重复一千次Ubuntu目录,对于磁盘存储、网络传输都是很大的浪费。
把重复的部分抽取出来存放到一份根目录文件,然后让其他镜像以某种方式共享这部分数据。这个思路正是容器的分层,Layer。
一个镜像是由许多的镜像层组成的,每层都是只读不可修改的一组文件,相同的层可以在镜像之间共享,多个层像搭积木一样推叠起来,再使用一种“Union FS联合文件系统”的技术把它们合并在一起,就形成了容器最终看到的文件系统。
docker inspect
可以查看镜像分层信息,比如nginx:alpine镜像
docker inspect nginx:alpine
在执行docker pull 或 docker rmi
命令时输出的信息其实就是镜像里的各个Layer,Docker会检查是否有重复的层,如果本地已经存在就不会重复下载,如果层被其他镜像共享就不会被删除,这样就可以节约磁盘和网络成本。
以上就是镜像的内部结构和基本原理。
Dockerfile如果是施工图纸,镜像就是由旋工图纸建造的房子,而容器就是住进人的房子。
Dockerfile就是一个纯文本文件,里面记录了构建指令,比如选择基础镜像、拷贝文件、运行脚本,每个指令都会生成一个Layer,Docker顺序执行这个文件里的所有指令,最终生成一个新的镜像文件。
最简单的Dockerfile
# filename:Dockerfile.busybox
FROM busybox
CMD echo "hello world"
第一条指令:选择基础镜像
第二条指令:启动容器时默认运行的命令
根据图纸建造房子是由施工团队完成的,这里就是docker build
docker build -f Dockerfile.busybox .
查看、运行镜像
docker images
docker inspect image_id
docker run image_id
选择基础镜像非常关键,如果关注镜像的安全和大小一般选择Alpine,如果关注应用运行的稳定性一般选择CentOS、Ubuntu、Debian。
FROM alpine:3.15
FROM ubunt:bionic
如果要将源码、配置文件打包进镜像,就需要COPY指令,注意复制的源文件路径必须是构建上下文里的路径,也就是用相对路径。
# 把构建上下文里的a.txt拷贝到镜像的/tmp目录
COPY ./a.txt /tmp/a.txt
# 下面方式不正确,不能用构建上下文之外的文件
COPY /etc/hosts /tmp
执行任意shell命令,就需要RUN指令,Dockerfile里一条指令只能是一行,所以RUN指令每行末尾用\
续行符,命令之间用&&
连接,这样就能保证在逻辑上是一行,减少Layer。
RUN apt-get update \
&& apt-get install -y \
build-essential \
curl \
make \
unzip \
&& cd /tmp \
&& curl -fSL xxx.tar.gz -o xxx.tar.gz\
&& tar xzf xxx.tar.gz \
&& cd xxx \
&& ./config \
&& make \
&& make clean
这样写一是不美观,二是一旦写错每次调试都要重新构建很麻烦,可以采用一种变通的技巧:把这些shell命令集中到一个脚本文件中,用COPY命令复制进去,再用RUN来执行。
COPY setup.sh /tmp/ # 拷贝脚本到/tmp目录
RUN cd /tmp && chmod +x setup.sh \ # 添加执行权限
&& ./setup.sh && rm setup.sh # 运行脚本然后再删除
ARG和ENV都是定义变量,区别是ARG定义的变量只能在镜像构建过程中可见,ENV创建的变量不仅能在构建镜像过程中使用,也能在容器运行时以环境变量的形式被应用程序使用
它用来声明容器对外服务的端口号,对基于Node.js、Tomcat、Nginx、Go等开发的微服务系统来说非常有用。
# 默认是TCP协议
EXPOSE 443
# 指定UDP协议
EXOPSE 53/udp
一个机制,docker是个客户端,真正的镜像构建工作是由Docker daemon来完成的,所以Docker会把构建上下文的目录打包上传,这样服务器才能获取本地文件。
如果构建上下文中一些文件不需要打包到镜像,docker也会全部打包上传,效率很低。
可以在构建上下文目录中创建一个.dockerignore文件,将那些不需要的文件写入
# docker ignore
*.swp
*.sh
用-f来指定Dockerfile文件,如果不指定默认文件名为Dockerfile
docker build -f xxx
用:
分割名字和标签,如果不指定标签默认为latest
1、容器镜像是由多个只读的Layer构成的,同一个Layer可以被不同的镜像共享,减少了存储和传输成本
2、Dockerfile中每个指令都会生成一个Layer
3、Dockerfile第一条指令必须是FROM
4、docker build使用-f来指定Dockerfile,不指定默认国为当前目录下的以Dockerfile为名的文件
5、尽量不要在构建上下文中存入多余的文件
6、尽量使用-t参数,为镜像起一个有意义的名字,方便管理