• 创建容器镜像:如何编写正确、高效的Dockerfile


    镜像的内部机制是什么

    镜像是一个打包文件,里面包含了应用程序和依赖的环境,例如:文件系统、环境变量和配置参数等。

    环境变量和配置参数比较简单一个manifest清单就可以管理,真正麻烦的是文件系统。为了保证容器运行环境的一致性,镜像必须把应用程序所在操作系统的根目录,也就是rootfs都包含进来。

    容器是共享宿主机内核,文件系统不包含系统内核,假如有一千个镜像基于Ubuntu系统打包,那么这些镜像里就会重复一千次Ubuntu目录,对于磁盘存储、网络传输都是很大的浪费。

    把重复的部分抽取出来存放到一份根目录文件,然后让其他镜像以某种方式共享这部分数据。这个思路正是容器的分层,Layer。

    一个镜像是由许多的镜像层组成的,每层都是只读不可修改的一组文件,相同的层可以在镜像之间共享,多个层像搭积木一样推叠起来,再使用一种“Union FS联合文件系统”的技术把它们合并在一起,就形成了容器最终看到的文件系统。

    docker inspect可以查看镜像分层信息,比如nginx:alpine镜像

    docker inspect nginx:alpine
    
    • 1

    在执行docker pull 或 docker rmi命令时输出的信息其实就是镜像里的各个Layer,Docker会检查是否有重复的层,如果本地已经存在就不会重复下载,如果层被其他镜像共享就不会被删除,这样就可以节约磁盘和网络成本。

    以上就是镜像的内部结构和基本原理。

    Dockerfile是什么

    Dockerfile如果是施工图纸,镜像就是由旋工图纸建造的房子,而容器就是住进人的房子。

    Dockerfile就是一个纯文本文件,里面记录了构建指令,比如选择基础镜像、拷贝文件、运行脚本,每个指令都会生成一个Layer,Docker顺序执行这个文件里的所有指令,最终生成一个新的镜像文件。

    最简单的Dockerfile

    # filename:Dockerfile.busybox
    FROM busybox
    CMD echo "hello world"
    
    • 1
    • 2
    • 3

    第一条指令:选择基础镜像

    第二条指令:启动容器时默认运行的命令

    根据图纸建造房子是由施工团队完成的,这里就是docker build

    docker build -f Dockerfile.busybox .
    
    • 1

    查看、运行镜像

    docker images
    docker inspect image_id
    docker run image_id
    
    • 1
    • 2
    • 3

    怎样编写正确、高效的Dockerfile

    选择镜像 - FROM指令

    选择基础镜像非常关键,如果关注镜像的安全和大小一般选择Alpine,如果关注应用运行的稳定性一般选择CentOS、Ubuntu、Debian

    FROM alpine:3.15
    FROM ubunt:bionic
    
    • 1
    • 2

    复制文件 - COPY指令

    如果要将源码、配置文件打包进镜像,就需要COPY指令,注意复制的源文件路径必须是构建上下文里的路径,也就是用相对路径。

    # 把构建上下文里的a.txt拷贝到镜像的/tmp目录
    COPY ./a.txt /tmp/a.txt
    
    # 下面方式不正确,不能用构建上下文之外的文件
    COPY /etc/hosts /tmp
    
    • 1
    • 2
    • 3
    • 4
    • 5

    执行命令 - RUN指令

    执行任意shell命令,就需要RUN指令,Dockerfile里一条指令只能是一行,所以RUN指令每行末尾用\续行符,命令之间用&&连接,这样就能保证在逻辑上是一行,减少Layer。

    
    RUN apt-get update \
        && apt-get install -y \
            build-essential \
            curl \
            make \
            unzip \
        && cd /tmp \
        && curl -fSL xxx.tar.gz -o xxx.tar.gz\
        && tar xzf xxx.tar.gz \
        && cd xxx \
        && ./config \
        && make \
        && make clean
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14

    这样写一是不美观,二是一旦写错每次调试都要重新构建很麻烦,可以采用一种变通的技巧:把这些shell命令集中到一个脚本文件中,用COPY命令复制进去,再用RUN来执行。

    COPY setup.sh  /tmp/                # 拷贝脚本到/tmp目录
    
    RUN cd /tmp && chmod +x setup.sh \  # 添加执行权限
        && ./setup.sh && rm setup.sh    # 运行脚本然后再删除
    
    • 1
    • 2
    • 3
    • 4

    定义变量 - ARG与ENV指令

    ARG和ENV都是定义变量,区别是ARG定义的变量只能在镜像构建过程中可见,ENV创建的变量不仅能在构建镜像过程中使用,也能在容器运行时以环境变量的形式被应用程序使用

    开放端口 - EXPOSE指令

    它用来声明容器对外服务的端口号,对基于Node.js、Tomcat、Nginx、Go等开发的微服务系统来说非常有用。

    # 默认是TCP协议
    EXPOSE 443
    # 指定UDP协议
    EXOPSE 53/udp
    
    • 1
    • 2
    • 3
    • 4

    docker build是怎么工作的

    排除文件 - .dockerignore

    一个机制,docker是个客户端,真正的镜像构建工作是由Docker daemon来完成的,所以Docker会把构建上下文的目录打包上传,这样服务器才能获取本地文件。

    如果构建上下文中一些文件不需要打包到镜像,docker也会全部打包上传,效率很低。

    可以在构建上下文目录中创建一个.dockerignore文件,将那些不需要的文件写入

    # docker ignore
    *.swp
    *.sh
    
    • 1
    • 2
    • 3

    指定文件

    用-f来指定Dockerfile文件,如果不指定默认文件名为Dockerfile

    docker build -f xxx
    
    • 1

    指定标签

    :分割名字和标签,如果不指定标签默认为latest

    小结

    1、容器镜像是由多个只读的Layer构成的,同一个Layer可以被不同的镜像共享,减少了存储和传输成本

    2、Dockerfile中每个指令都会生成一个Layer

    3、Dockerfile第一条指令必须是FROM

    4、docker build使用-f来指定Dockerfile,不指定默认国为当前目录下的以Dockerfile为名的文件

    5、尽量不要在构建上下文中存入多余的文件

    6、尽量使用-t参数,为镜像起一个有意义的名字,方便管理

  • 相关阅读:
    IDEA导入和删除第三方jar包
    基于Java+SpringBoot+vue+element实现物流管理系统
    盘盘在项目中你常用的那些数组API
    ElasticSearch深度分页解决方案
    macOS Ventura 正式版你确定不更新,好用到爆的功能你不想尝试一下?
    深度学习推荐系统(八)AFM模型及其在Criteo数据集上的应用
    网络安全-防火墙安全加固
    【Centos7】解决 CentOS 7 中出现 “xx: command not found“ 错误的全面指南
    Java面试题:@PostConstruct、init-method和afterPropertiesSet执行顺序?
    vue3 element plus表格导出为excel自定义表头
  • 原文地址:https://blog.csdn.net/ln_ydc/article/details/127418976