• 如何创建高效的 Python Docker 镜像详解



    Docker是打包和部署容器中应用程序的行业标准软件。Docker镜像是构建和运行应用程序的基础,为了充分发挥Docker的潜力,您需要优化镜像以提高资源效率、安全性和性能。这将确保您的应用程序在Docker生态系统内无缝运行。

    通过一个实际示例来学习如何实现这一点,演示如何将Python计算器应用程序容器化。

    从最小的基础镜像开始

    影响Docker镜像效率的因素之一是基础镜像的选择。您应该从一个只包括运行应用程序所需的基本组件的最小镜像开始。

    您使用的镜像还应来自可信赖的来源,提供安全更新和补丁。它应该有一个活跃的社区和良好的文档。这在解决问题或寻求帮助时非常有帮助。

    对于计算器应用程序,选择python:3.11-slim-bookworm这个最小镜像可以减小镜像的大小,从而减小资源消耗并加快镜像的下载和部署速度。

    1. 从最小的基础镜像开始
    2. FROM python:3.11-slim-bookworm AS builder

    您还可以选择更小的Alpine Linux镜像,选择python:3.11-alpine。然而,这个镜像不包括Python解释器、包管理器和常见的Python库。

    以非root用户身份运行应用程序

    以root用户身份运行Docker容器可能会带来重大的安全风险。如果恶意行为者能够访问以root身份运行的容器,他们可以利用容器软件中的漏洞来升级其权限。然后,他们可以使用这些权限来执行对主机系统的完全控制的命令。

    解决方案是将应用程序以非root用户身份运行。计算器示例创建并配置了用户calculator。

    1. 为安全性设置非root用户
    2. RUN adduser calculator --system
    3. 将用户添加到calculator组
    4. RUN addgroup calculator && adduser calculator calculator

    为您的应用程序创建一个专用用户会限制潜在攻击者可用的权限。这会增加利用漏洞的难度。

    复制必要的文件并创建虚拟环境

    在Docker容器内创建虚拟环境可以隔离依赖关系。这可以防止与系统范围的软件包和其他应用程序的冲突。它还确保版本兼容性,因为您可以安装应用程序需要的确切版本的依赖项,而不会影响系统的其余部分。

    将必要的文件复制到容器中。然后,使用Python内置的venv模块为计算器应用程序创建一个虚拟环境。

    1. 设置工作目录并复制必要的文件
    2. WORKDIR /app
    3. COPY app.py .
    4. COPY requirements.txt .
    5. COPY config.json ./
    6. 从本地目录复制config.json
    7. 创建虚拟环境并安装依赖项
    8. RUN python -m venv /venv
    9. ENV PATH="/venv/bin:$PATH"
    10. RUN /venv/bin/pip install --upgrade pip --no-cache-dir --requirement requirements.txt

    虚拟环境是轻量级和高效的,因为它们不会复制系统范围的软件包。这有助于保持Docker镜像的较小大小,并在容器运行时减少资源消耗。

    为提高效率减少层

    Dockerfile中的每个指令都会在生成的镜像中创建一个新的层。Docker使用写时复制机制来管理这些层。减少Docker镜像中层次的数量显著提高了镜像的大小和构建性能。减少层次的一种方法是将多个命令合并到单个RUN指令中。

    1. # 为提高效率减少层
    2. # 合并命令以减少层的数量
    3. RUN echo "构建过程在这里" && \
    4. /venv/bin/python -m compileall . && \
    5. rm -rf __pycache__

    将上述命令合并起来可以减少在镜像构建过程中创建的中间层的数量。

    保护配置处理的安全性

    在Docker镜像中处理敏感信息会带来安全风险。为了增强安全性,您应该使用环境变量和外部配置文件。在计算器应用程序示例中,您可以创建一个名为/config的目录来存储配置文件,并设置适当的所有权。

    1. # 保护配置处理的安全性
    2. RUN mkdir /config && chown calculator:calculator /config

    然后将config.json文件复制到此目录中,确保它与应用程序代码分开。

    1. # 将config.json文件复制到容器中
    2. RUN cp config.json /config/config.json
    3. ENV CONFIG_PATH=/config/config.json

    将配置数据与代码分离并应用适当的权限可以增强Docker镜像的整体安全性。这确保只有授权的进程或用户可以访问关键的配置数据。

    使用多阶段构建
    多阶段构建允许您将构建环境与最终镜像分开。这会导致更小、更专注的生产镜像。它还通过从最终镜像中排除与构建相关的工具和文件来增强安全性。这减小了攻击面,减少了与不必要组件相关的潜在安全风险。

    1. # 利用多阶段构建
    2. FROM python:3.11-slim-bookworm
    3. COPY --from=builder /etc/passwd /etc/passwd
    4. COPY --from=builder /etc/group /etc/group
    5. COPY --from=builder /venv /venv
    6. COPY --from=builder /config /config
    7. COPY --from=builder /app /app
    8. # 复制应用程序代码

    上述代码只将构建阶段(builder)中的必要部分复制到最终镜像中。这通过排除运行计算器应用程序所需的构建相关工具和文件来减小镜像大小。

    通过镜像扫描增强安全性

    为了进一步增强Docker镜像的安全性,请使用像Trivy或Clair这样的镜像扫描工具。这些工具旨在识别图像层和依赖性中的漏洞。对于计算器应用程序,请使用Trivy进行漏洞扫描。

    1. # 为Debian/Ubuntu安装Trivy
    2. RUN apt-get update && \
    3. apt-get install -y wget apt-transport-https gnupg lsb-release && \
    4. wget -qO - https://aquasecurity.github.io/trivy-repo/deb/public.key | apt-key add - && \
    5. echo "deb https://aquasecurity.github.io/trivy-repo/deb bookworm main" \
    6. | tee -a /etc/apt/sources.list.d/trivy.list && \
    7. apt-get update && \
    8. apt-get install -y trivy

    将Trivy漏洞扫描添加到Docker镜像中非常重要。这是因为它使用通用漏洞和暴露(CVE)数据库,该数据库定期更新包含已知漏洞的信息。这有助于确保您的镜像始终使用最新的安全补丁,并保护您的应用程序免受已知攻击的影响。

    要获取有关您的镜像的漏洞报告,请使用以下命令。

    1. docker run --rm `
    2. -v /var/run/docker.sock:/var/run/docker.sock `
    3. -v $HOME/Library/Caches:/root/.cache/ `
    4. aquasec/trivy:0.18.3 `
    5. <your image name>

    上述命令将需要一些时间来运行。运行完毕后,将生成报告。

    严重性越高,您就应该更快地解决已识别的漏洞。

    以非 root 用户身份运行应用程序

    为了增强安全性,以calculator用户身份运行应用程序,以限制潜在的漏洞。

    1. # 以非根用户身份运行应用程序
    2. WORKDIR /app
    3. USER calculator
    4. # 激活虚拟环境并运行应用程序
    5. CMD ["/bin/bash", "-c", "source /venv/bin/activate && python app.py"]

    切换到非 root 用户可以最小化攻击面。

    容器化非Python应用程序

    使用其他编程语言开发的应用程序的Docker容器化方式有所不同。您应该熟悉如何容器化不同类型的应用程序。这将帮助您根据应用程序使用的语言类型决定采用的最佳策略。

      

  • 相关阅读:
    读《Gaitset: Regarding gait as a set for cross-view gait recognition》
    记一起小意外事件引起的批量重命名文件名
    springcloudalibaba架构(30):Dubbo的使用入门
    光伏电站逆变器数据采集对接第三方运维云平台的难点和挑战
    Hadoop的安装和使用,Windows使用shell命令简单操作HDFS
    怎么禁止WordPress后台加载谷歌字体?
    我对需求分析的理解
    C++ Reference: Standard C++ Library reference: C Library: cctype: isprint
    纵向导航栏使用navbar-nav-scroll溢出截断问题
    ubuntu|23 安装Gnome主题
  • 原文地址:https://blog.csdn.net/Rocky006/article/details/133924590