• 关于图像处理和Python深度学习的教程:第一部分


    介绍

    在这篇文章中,我们将学习如何执行图像处理。在整篇文章中,我们使用到的库是Scikit Image。

    基础知识

    1、什么是图像?

    图像数据可能是文本之后最常见的数据。那么,电脑如何理解你在埃菲尔铁塔前的自拍呢?

    它使用一个称为像素的小正方形网格。像素覆盖一个小区域,并具有表示颜色的值。图像中的像素越多,其质量越高,存储所需的内存越多。

    就是这样。图像处理主要是处理这些单独的像素(有时是像素组),以便计算机视觉算法可以从中提取更多信息。

    2、NumPy和Skimage的图像基础

    在Matplotlib和Skimage中,图像都作为NumPy ndarray加载。

    1. from skimage.io import imread  # pip install scikit-image
    2. image = imread("images/colorful_scenery.jpg")
    3. >>> type(image)
    4. numpy.ndarray

    NumPy数组带来灵活性、速度和力量。图像处理也不例外。

    Ndarrays可以轻松检索图像的一般详细信息,例如图像的尺寸:

    1. >>> image.shape
    2. (85312803)
    3. >>> image.ndim
    4. 3
    5. # The number of pixels
    6. >>> image.size  # 853 * 1280 * 3
    7. 3275520

    我们的图像高度为853像素,宽度为1280像素。第三维表示RGB(红、绿、蓝)颜色通道的值。最常见的图像格式是3D。

    你可以通过常规NumPy索引检索单个像素值。下面,我们尝试索引图像以检索三个颜色通道中的每一个通道:

    1. red = image[:, :, 0]
    2. compare(image, red, "Red Channel of the Image", cmap_type="Reds_r")
    492a95db5b0c51d24af4cf06a9d1cfa0.png
    1. green = image[:, :, 1]
    2. compare(image, green, "Green Channel of the Image""Greens_r")
    606b0456a464c55bfa2af03cb99efa91.png
    1. blue = image[:, :, 2]
    2. compare(image, blue, "Blue Channel of the Image""Blues_r")
    e64c6272b7dfe95057c98c795e819c2b.png

    0表示红色,1表示绿色,2表示蓝色通道-非常简单。

    创建了两个函数,show和compare,它们显示一个图像或并排显示其中两个进行比较。在整个教程中,我们将广泛使用这两个函数。

    按照约定,ndarray的第三维用于颜色通道,但并不总是遵循此约定。Skimage通常提供参数来指定这种行为。

    图像与通常的Matplotlib绘图不同。它们的原点不位于左下角,而是位于左上角的位置(0,0)。

    >>> show(image, axis=True)
    04aa668ec2d7eee033150e1e8f878b7b.png

    当我们在Matplotlib中绘制图像时,轴表示像素的顺序,但我们通常会隐藏它们。

    3、常见转换

    我们将要执行的最常见的图像转换是将彩色图像转换为灰度。许多图像处理算法需要灰度图像。因为颜色不是图片的定义特征,没有它,计算机仍然可以提取足够的信息。

    1. from skimage.color import rgb2gray
    2. image = imread("images/grayscale_example.jpg")
    3. # Convert image to grayscale
    4. gray = rgb2gray(image)
    5. compare(image, gray, "Grayscale Image")
    9e44acf8aa38ea704360fa507952c917.png
    1. >>> gray.shape
    2. (8531280)

    当将图像转换为灰度时,它们会丢失其第三维度-颜色通道。相反,图像数组中的每个单元格现在表示uint8类型的整数。它们的范围从0到255,提供256种灰度。

    你还可以使用np.flipud或者np.fliplr之类的NumPy函数,随心所欲地以任何方式操纵图像。

    1. kitten = imread("images/horizontal_flip.jpg")
    2. horizontal_flipped = np.fliplr(kitten)
    3. compare(kitten, horizontal_flipped, "Horizontally Flipped Image")
    bc2e97f93c835fdd7c91cf845f5d8afd.png
    1. ball = imread("images/upside_down.jpg")
    2. vertically_flipped = np.flipud(ball)
    3. compare(ball, vertically_flipped, "Vertically Flipped Image")
    0241f16b0508af9d0586cde0e252a6b2.png

    在“颜色”模块中,你可以找到许多其他变换函数来处理图像中的颜色。

    4、颜色通道直方图

    有时,查看每个颜色通道的强度有助于了解颜色分布。我们可以通过切片每个颜色通道并绘制它们的直方图来实现这一点。以下是执行此操作的函数:

    1. def plot_with_hist_channel(image, channel):
    2.   
    3.     channels = ["red""green""blue"]
    4.     channel_idx = channels.index(channel)
    5.     color = channels[channel_idx]
    6.     extracted_channel = image[:, :, channel_idx]
    7.     
    8.     fig, (ax1, ax2) = plt.subplots(
    9.         ncols=2, figsize=(186)
    10.     )
    11.     ax1.imshow(image)
    12.     ax1.axis("off")
    13.     
    14.     ax2.hist(extracted_channel.ravel(), bins=256, color=color)
    15.     
    16.     ax2.set_title(f"{channels[channel_idx]} histogram")

    除了Matplotlib的一些细节之外,你还应该注意hist函数的调用。提取颜色通道及其数组后,我们将其展平为1D数组,并将其传递给hist函数。

    bin数量应该是256个,每个像素值对应一个-0表示黑色,255表示完全白色。

    让我们使用彩色风景图像:

    1. colorful_scenery = imread("images/colorful_scenery.jpg")
    2. plot_with_hist_channel(colorful_scenery, "red")
    e33740f6ed774a5e828cef6893fff470.png
    >>> plot_with_hist_channel(colorful_scenery, "green")
    b2b1749cc2d7bd595f8b87ce20b8a5ea.png
    >>> plot_with_hist_channel(colorful_scenery, "blue")
    ceb4af69d996f09f5b2c902352e77848.png

    还可以使用直方图在将图像转换为灰度后找出图像中的亮度:

    1. gray_color_scenery = rgb2gray(colorful_scenery)
    2. plt.hist(gray_color_scenery.ravel(), bins=256);
    3363f8a0ca91907e88b5d1789bf76246.png

    大多数像素的值较低,因为景物图像较暗。

    我们将在以下部分探讨直方图的更多应用。

    过滤器

    1、手动阈值

    现在,我们来看看有趣的东西——过滤图像。我们将学习的第一个操作是阈值化。让我们加载一个示例图像:

    1. stag = imread("images/binary_example.jpg")
    2. >>> show(stag)
    18ac3351d58a8b88ac6703cc48cb4b75.png

    阈值分割在图像分割、目标检测、边缘或轮廓提取等方面有着广泛的应用,它主要用于区分图像的背景和前景。

    阈值处理在高对比度灰度图像上效果最好:

    1. # Convert to graysacle
    2. stag_gray = rgb2gray(stag)
    3. >>> show(stag_gray)
    3143297cb1620c5b938620170e876ece.png

    我们将从基本的手动阈值设置开始,然后转到自动阈值设置。

    首先,我们查看灰度图像中所有像素的平均值:

    1. >>> stag_gray.mean()
    2. 0.20056262759859955

    请注意,通过将所有灰度图像的值除以256,上述灰度图像的像素在0和1之间归一化。

    我们得到的平均值为0.2,这为我们提供了可能要使用的阈值的初步想法。

    现在,我们使用这个阈值来进行掩码操作。如果像素值低于阈值,否则其值将变为0-黑色或1-白色。换句话说,我们得到一个黑白二值图像:

    1. # Set threshold
    2. threshold = 0.35
    3. # Binarize
    4. binary_image = stag_gray > threshold
    5. compare(stag, binary_image, "Binary image")
    d86791ed383e6b85b68f99f2ea7a0ef4.png

    在这个版本中,我们可以更清楚地区分鹿的轮廓。我们可以反转遮罩,使背景变为白色:

    1. inverted_binary = stag_gray <= threshold
    2. >>> compare(stag, inverted_binary, "Binary image inverted")
    3caff131baec10dc7048c4ef20e9d764.png

    2、阈值-全局

    虽然尝试不同的阈值并观察它们对图像的影响可能很有趣,但我们通常使用比我们的眼球估计更稳健的算法来执行阈值分割。

    有很多阈值算法,所以可能很难选择一种。在这种情况下,skimage具有try_all_threshold函数,该函数在给定的灰度图像上运行七种阈值算法。让我们加载一个示例并进行转换:

    1. flower = imread("images/global_threshold_ex.jpg")
    2. flower_gray = rgb2gray(flower)
    3. compare(flower, flower_gray)
    626f8dad5ddd984e22e6db3f185e4e5b.png

    我们将看看是否可以使用阈值优化郁金香的特征:

    1. from skimage.filters import try_all_threshold
    2. fig, ax = try_all_threshold(
    3.     flower_gray, figsize=(108), verbose=False
    4.   )
    be13a2d7cc1f893b247922991f440cf6.png

    正如你所看到的,一些算法在这张图像上工作得更好,而其他算法则很糟糕。otsu算法看起来更好,所以我们将继续使用它。

    在这一点上,我想提请你注意郁金香的原始图像:

    >>> show(flower)
    40ade3e962d5660c96f34854cbf1276e.png

    图像背景不均匀,因为有太多光线从后面的窗口射进来。我们可以通过绘制灰色郁金香的直方图来证实这一点:

    >>> plt.hist(flower_gray.ravel(), bins=256);
    bc0ccf8d5e4a55ec3b97d4d473d779ec.png

    正如预期的那样,大多数像素的值都位于直方图的远端,这证实了它们大部分都是明亮的。

    为什么这很重要?根据图像的亮度,阈值算法的性能也会发生变化。因此,阈值算法通常有两种类型:

    1. 全局-适用于具有均匀、统一背景的照片

    2. 局部-用于不同图片区域中具有不同亮度级别的图像。

    郁金香图像属于第二类,因为右侧部分比另一半亮得多,使其背景不均匀。我们不能在其上使用全局阈值算法,这就是为什么try_all_threshold中所有算法的性能都很差的原因。

    稍后我们将回到郁金香示例和局部阈值。现在,我们将加载另一个亮度更精确的实例,并尝试自动设置阈值:

    1. spiral = imread("images/otsu_example.jpg")
    2. spiral_gray = rgb2gray(spiral)
    3. compare(spiral, spiral_gray)
    e6e8f20969a178219dc530f68100f632.png

    我们将在Skimage中使用通用的全局阈值算法threshold_otsu:

    1. from skimage.filters import threshold_otsu
    2. # Find optimal threshold with `threshold_otsu`
    3. threshold = threshold_otsu(spiral_gray)
    4. # Binarize
    5. binary_spiral = spiral_gray > threshold
    6. compare(spiral, binary_spiral, "Binarized Image w. Otsu Thresholding")
    d5a77d65f1e2023998d402afc05ce422.png

    它工作得更好!

    3、阈值-局部

    现在,我们将使用局部阈值算法。

    局部算法不关注整个图像,而是关注像素邻域,以解释不同区域的亮度不均匀。skimage中常见的局部算法为threshold_local函数:

    1. from skimage.filters import threshold_local
    2. local_thresh = threshold_local(flower_gray, block_size=3, offset=0.0002)
    3. binary_flower = flower_gray > local_thresh
    4. compare(flower, binary_flower, "Tresholded flower image")
    da6e4ec728ed7c12be1a4d610a42cce9.png

    你必须使用offset参数来找到符合你需要的最佳图像。offset是从局部像素邻域的平均值中减去的常数。该“像素邻域”由local_threshold中的block_size参数确定,该参数表示算法在每个方向上围绕每个点查看的像素数。

    显然,同时调整offset和block_size是一个缺点,但局部阈值是唯一比手动或全局阈值产生更好结果的选项。

    让我们再举一个例子:

    1. from skimage.filters import threshold_local
    2. handwriting = imread("images/chalk_writing.jpg")
    3. handwriting_gray = rgb2gray(handwriting)
    4. # Find optimal threshold using local
    5. local_thresh = threshold_local(handwriting_gray, offset=0.0003)
    6. # Binarize
    7. binary_handwriting = handwriting_gray > local_thresh
    8. compare(handwriting, binary_handwriting, 
    9.         "Binarized image with local thresholding")
    09a2d6f1d5d034d7cf62383e62e9a353.png

    正如你所看到的,经过阈值处理后,黑板上的笔迹更加精细。

    4、边缘检测

    边缘检测在很多方面都很有用,例如识别对象、从中提取特征、对其进行计数等等。

    我们将从基本的Sobel滤波器开始,它在灰度图像中查找对象的边缘。我们将加载一张硬币图片,并对其使用Sobel滤波器:

    1. from skimage.filters import sobel
    2. coins = imread("images/coins_2.jpg")
    3. coins_gray = rgb2gray(coins)
    4. coins_edge = sobel(coins_gray)
    5. compare(coins, coins_edge, "Images of coins with edges detected")
    2e7d8f25ff0fb9a84fbd2d3bcfb34b6e.png

    sobel很直截了当;你只需在灰色图像上调用它即可获得如上所述的输出。我们将在后面的部分中看到Sobel的更复杂版本。

    5、平滑

    另一种图像过滤技术是平滑。许多像下面的鸡一样的图像可能包含随机噪声,而对ML和DL算法没有任何有价值的信息。

    例如,鸡周围的毛发会给图像添加噪声,这可能会使ML模型的注意力偏离主要对象本身。在这种情况下,我们使用平滑来模糊噪声或边缘并降低对比度。

    1. chickens = imread("images/chickens.jpg")
    2. >>> show(chickens)
    79aba186956e612eb257cdc3dd52294d.png

    高斯平滑是最流行和最强大的平滑技术之一:

    1. from skimage.filters import gaussian
    2. smoothed = gaussian(chickens, multichannel=True, sigma=2)
    3. compare(chickens, smoothed, "An image smoothed with Gaussian smoothing")
    df588fcf0f01fd09ea97d0795af98af6.png

    你可以通过调整sigma参数来控制模糊的效果。如果你正在处理RGB图像,请不要忘记将multichannel设置为True。

    如果图像分辨率太高,平滑效果可能肉眼看不到,但仍然有效。

    ☆ END ☆

    如果看到这里,说明你喜欢这篇文章,请转发、点赞。微信搜索「uncle_pn」,欢迎添加小编微信「 woshicver」,每日朋友圈更新一篇高质量博文。

    扫描二维码添加小编↓

    45aded40c7b2350739312505ca953594.jpeg

  • 相关阅读:
    spring的七大模块和使用spring框架的七种好处
    javaee thymeleaf简介
    蓄势迎接 Google 谷歌开发者大会:开发者,你准备好了吗?
    14-js正则表达式
    SQL SERVER安装配置及问题解决方案
    魔兽世界安装插件后进游戏闪退的一个原因。
    2022-08-24 mysql/stonedb-通过知识网格获取数据的流程
    java-net-php-python-jspm生活百汇线上超市系统计算机毕业设计程序
    【网络安全入门】学习网络安全必须知道的100 个网络基础知识
    2022十三届蓝桥杯国赛题解
  • 原文地址:https://blog.csdn.net/woshicver/article/details/125863407