• 如何将Docker的构建时间减少40%


    与许多公司类似,我们为产品中使用的所有组件构建docker映像。随着时间的推移,其中一些映像变得越来越大,我们的CI构建花费的时间也越来越长。我的目标是CI构建不超过5分钟——差不多是喝杯咖啡休息的理想时间。如果构建花费的时间超过这个时间,就会降低开发人员的工作效率。

    造成生产力损失的原因是:

    1、开发人员需要等待构建完成,从而浪费时间。

    2、开发人员开始做一些新的东西,并在晚些时候再回来做。切换必然耗时,这通常也会导致效率低下。

    图片

    在这篇文章中,我想说明我们应用的2个小变化,两者极大地改善了我们的构建时间。当然,在关注这些改进之前,请确保你已经遵循编写dockerfile的最佳实践,比如尽量减少层数;使用多级构建;使用最小的基础图像等等。

    1、Buildkit vs Buildx  

    让我们从解释Buildkit和Buildx开始,因为这两个术语经常互换使用,但它们并不相同。

    Builkit

    Buildkit是经过改进的后端,用来取代旧的Docker构建器。它在2018年打包在Docker中,并成为docker engine 23.0的默认构建器。   

    它提供了许多有趣的功能:

    • 改进的缓存功能
    • 并行构建不同的层
    • 延迟拉取基础镜像(≥Buildkit 0.9)

    在使用Buildkit时,你很快就会注意到docker构建命令的输出看起来更清晰、更结构化。

    在docker版本低于23.0的情况下使用Buildkit的典型方法是设置Buildkit参数。如下所示:

    1. DOCKER_BUILDKIT=1 docker build --platform linux/amd64 . -t someImage:someVersion
    2. DOCKER_BUILDKIT=1 docker push someImage:someVersion

    Buildx

    Buildx是Docker的一个插件,它使你能够在Docker中使用Buildkit的全部潜力。之所以创建它,是因为Buildkit支持许多新的配置选项,这些选项不能全部以向后兼容的方式集成到docker构建命令中。

    除了构建镜像之外,Buildx还支持管理多个构建器。在CI中,这对于定义具有不同配置的作用域环境非常有用,因为它们不会修改共享Docker守护进程。

    你可以像下面这样开始使用Buildx:

    1. docker buildx create --bootstrap --name builder
    2. docker buildx use builder

    2、受益于远程缓存

    加快构建速度的第一种方法是在远程注册表中缓存镜像。这样,即使在不同的机器上执行构建,也可以从构建缓存中获益,这是CI中的典型情况。作为一种解决方法,许多人在构建新映像版本之前提取了映像的最新版本。这样做的好处是,你可以缓存未更改的图层,而代价是最初提取完整的图像。拉取完整的图像可能需要一段时间,但也不能保证图层可以被重用。为了说明这一点,我们使用了以下命令:

    图片

    使用Buildx,你可以将缓存信息存储在远程位置(例如容器注册表、blob存储等)。构建器检查给定层是否已经存在,如果是这种情况,它将重用它而不是再次创建它。这甚至可以在不拉动本地图层的情况下完成。为了从这个机制中受益,我们将之前的命令修改为:   

    图片

    模式“max”意味着我们将存储每一层的构建信息,甚至是生成图像中未使用的层(例如,当使用多阶段构建时)。默认模式下使用“min”,它只存储最终映像中存在的层的构建信息。

    缓存的一个特殊情况是“内联”存储缓存数据,这意味着它将与图像一起缓存。当使用Buildkit而不使用Buildx时,也支持此选项。它是最容易开始的,但在使用多阶段构建时就比较棘手了,而且它没有在工件输出和缓存之间提供明确的分离。内联存储缓存数据的命令如下:

    图片

    3、添加文件到Docker镜像的新方法

    Docker引入了新的dockerfile编写语法,即:

    #syntax= docker /dockerfile:1.4。它支持COPY和ADD命令的额外链接选项。

    以前,当你使用COPY或ADD命令时,构建器会创建一个新快照,它将新文件与现有文件系统合并。其结果是,在执行此操作之前,父层都需要存在,否则目标目录可能还不存在。最后,你的映像(构建命令的结果)将由每个层的tarball组成,其中包含各个快照之间的差异。

    图片

    当使用link选项时,新文件将被放入它们自己的快照中,而不依赖于以前的层。链接的文件存储在它们自己的tarball中,不同的tarball被链接在一起,不依赖于现有的文件系统,如下图所示。

    图片

    https://www.docker.com/blog/image-rebase-and-improved-remote-cache-support-in-new-buildkit/

    图片

    主要优点是文件不再依赖于以前的层。只要文件没有改变,即使父层改变了,层也可以被重用。

    此外,这还可以提高构建的速度,因为现在可以并行执行多层复制数据。

    4、结论

    本文描述了我们在优化CI管道后获得的一些新见解。我讨论了2个小的变化,导致我们的整体docker构建时间减少了40%:其一,远程存储构建缓存信息;其二,在添加、复制文件到docker镜像时使用link选项。

  • 相关阅读:
    微调大模型工具-LoRA
    鸿蒙开发Ability Kit(程序框架服务):【向用户申请单次授权】
    分布式锁,redis锁,执行的过程
    Spark_SQL-DataFrame数据写出以及读写数据库(以MySQl为例)
    iOS 那些不为人知的bug: Error Domain=NSCocoaErrorDomain Code=3840
    MacBook 访达使用技巧【mac 入门】
    Redis设计与实现(八)| 事务
    PHP伪协议详解
    centos安装mysql8
    建设一个互联网医院系统要花多少钱?
  • 原文地址:https://blog.csdn.net/Z__7Gk/article/details/134532786