• OpenCV官方教程中文版 —— 图像的基础操作


    前言

    目标
    获取像素值并修改
    获取图像的属性(信息)
    图像的 ROI()
    图像通道的拆分及合并

    几乎所有这些操作与 Numpy 的关系都比与 OpenCV 的关系更加紧密,因此熟练 Numpy 可以帮助我们写出性能更好的代码。

    一、获取并修改像素

    首先我们需要读入一幅图像

    import cv2
    import numpy as np
    img = cv2.imread('lena512.png')
    
    • 1
    • 2
    • 3

    你可以根据像素的行和列的坐标获取他的像素值。对 BGR 图像而言,返回值为 B,G,R 的值。对灰度图像而言,会返回他的灰度值。

    import cv2
    import numpy as np
    img = cv2.imread('lena512.png')
    px=img[100,100]  # 表示获取坐标(100, 100)处的 BGR 像素
    print(px)
    blue=img[100,100,0]  # 表示获取坐标(100, 100)处的 Blue 像素
    print(blue)
    
    --->[ 78  68 178]
    --->78
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10

    你可以以类似的方式修改像素值

    import numpy as np
    import cv2
    img = cv2.imread('lena512.png')
    img[100,100] = [255, 255, 255]
    print(img[100,100])
    
    • 1
    • 2
    • 3
    • 4
    • 5

    注意:上面提到的方法被用来选取矩阵的一个区域,比如说前 5 行的后 3 列。对于获取每一个像素值,也许使用 Numpy 的 array.item() 和 array.itemset() 会更好。但是返回值是标量。如果你想获得所有 B,G,R 的值,你需要使用 array.item() 分割他们。

    import cv2
    import numpy as np
    img = cv2.imread('lena512.png')
    print img.item(10,10,2)
    img.itemset((10,10,2),100)
    print img.item(10,10,2)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    二、获取图像属性

    图像的属性包括:行,列,通道图像数据类型像素数目等img.shape 可以获取图像的形状。他的返回值是一个包含行数,列数,通道数的元组。

    # -*- coding: utf-8 -*-
    import numpy as np
    import cv2
    img = cv2.imread('lena512.png')
    print(img.shape)
    ---> (512, 512, 3)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    注意:如果图像是灰度图,返回值仅有行数和列数。所以通过检查这个返回值就可以知道加载的是灰度图还是彩色图。

    img.size 可以返回图像的像素数目:

    import numpy as np
    import cv2
    img = cv2.imread('lena512.png')
    print(img.size)
    ---> 786432
    
    • 1
    • 2
    • 3
    • 4
    • 5

    img.dtype 返回的是图像的数据类型:

    import numpy as np
    import cv2
    img = cv2.imread('lena512.png')
    print(img.dtype)
    ---> uint8
    
    • 1
    • 2
    • 3
    • 4
    • 5

    三、图像 ROI

    有时你需要对一幅图像的特定区域进行操作。例如我们要检测一副图像中眼睛的位置,我们首先应该在图像中找到脸,再在脸的区域中找眼睛,而不是直接在一幅图像中搜索。这样会提高程序的准确性和性能。
    ROI 也是使用 Numpy 索引来获得的。现在我们选择球的部分并把他拷贝到图像的其他区域。

    在这里插入图片描述

    import numpy as np
    import cv2
    img = cv2.imread('ball.png')
    ball=img[378:457,448:520]
    img[273:352,100:172] = ball
    cv2.imshow('image',img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    看看结果吧:
    在这里插入图片描述

    四、拆分及合并图像通道

    有时我们需要对 BGR 三个通道分别进行操作。这是你就需要把 BGR 拆分成单个通道。有时你需要把独立通道的图片合并成一个 BGR 图像。你可以这样做

    import numpy as np
    import cv2
    from matplotlib import pyplot as plt
    img = cv2.imread('ball.png')
    b, g, r = cv2.split(img)
    img = cv2.merge([b, g, r])
    plt.figure()
    plt.subplot(131);plt.imshow(b) # expects distorted color
    plt.xticks([]), plt.yticks([]) # to hide tick values on X and Y axis
    plt.title("blue channel")
    plt.subplot(132);plt.imshow(g) # expect true color
    plt.xticks([]), plt.yticks([]) # to hide tick values on X and Y axis
    plt.title("green channel")
    plt.subplot(133);plt.imshow(r) # expect true color
    plt.xticks([]), plt.yticks([]) # to hide tick values on X and Y axis
    plt.title("red channel")
    plt.show()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17

    在这里插入图片描述

    假如你想使所有像素的红色通道值都为 0,你不必先拆分再赋值。你可以直接使用 Numpy 索引,这会更快。

    import cv2
    import numpy as np
    img = cv2.imread('ball.png')
    img[:,:,2]=0
    
    • 1
    • 2
    • 3
    • 4

    警告:cv2.split() 是一个比较耗时的操作。只有真正需要时才用它,能用Numpy 索引就尽量用。

    五、为图像扩边(填充)

    如果你想在图像周围创建一个边,就像相框一样,你可以使用 cv2.copyMakeBorder()函数。这经常在卷积运算或 0 填充时被用到。这个函数包括如下参数:

    • src 输入图像

    • top, bottom, left, right 对应边界的像素数目。

    • borderType 要添加那种类型的边界,类型如下
    – cv2.BORDER_CONSTANT 添加有颜色的常数值边界,还需要下一个参数(value)。
    – cv2.BORDER_REFLECT 边界元素的镜像。比如: fedcba|abcdefgh|hgfedcb
    – cv2.BORDER_REFLECT_101 or cv2.BORDER_DEFAULT跟上面一样,但稍作改动。例如: gfedcb|abcdefgh|gfedcba
    – cv2.BORDER_REPLICATE 重复最后一个元素。例如: aaaaaa|abcdefgh|hhhhhhh
    – cv2.BORDER_WRAP 不知道怎么说了, 就像这样: cdefgh|abcdefgh|abcdefg

    • value 边界颜色,如果边界的类型是

    为了更好的理解这几种类型请看下面的演示程序。

    import cv2
    from matplotlib import pyplot as plt
    BLUE=[0,0,255]
    img1=cv2.imread('opencv_logo.png')
    replicate = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REPLICATE)
    reflect = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REFLECT)
    reflect101 = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REFLECT_101)
    wrap = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_WRAP)
    constant= cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_CONSTANT,value=BLUE)
    plt.subplot(231),plt.imshow(img1,'gray'),plt.title('ORIGINAL')
    plt.xticks([]), plt.yticks([]) # to hide tick values on X and Y axis
    plt.subplot(232),plt.imshow(replicate,'gray'),plt.title('REPLICATE')
    plt.xticks([]), plt.yticks([]) # to hide tick values on X and Y axis
    plt.subplot(233),plt.imshow(reflect,'gray'),plt.title('REFLECT')
    plt.xticks([]), plt.yticks([]) # to hide tick values on X and Y axis
    plt.subplot(234),plt.imshow(reflect101,'gray'),plt.title('REFLECT_101')
    plt.xticks([]), plt.yticks([]) # to hide tick values on X and Y axis
    plt.subplot(235),plt.imshow(wrap,'gray'),plt.title('WRAP')
    plt.xticks([]), plt.yticks([]) # to hide tick values on X and Y axis
    plt.subplot(236),plt.imshow(constant,'gray'),plt.title('CONSTANT')
    plt.xticks([]), plt.yticks([]) # to hide tick values on X and Y axis
    plt.show()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22

    在这里插入图片描述

  • 相关阅读:
    多线程CAS机制(图解)
    【Linux】第六章 进程地址空间(程序在内存中存储+虚拟地址+页表+mm_struct+写实拷贝+解释fork返回值)
    报表控件Stimulsoft Report中的 自定义QR 码教程
    系统架构设计:11 论湖仓一体架构及其应用
    视频语音转文字工具用哪个好?推荐6款优质的视频转文字工具
    ZigBee 3.0理论教程-通用-1-06:协议架构-应用层(APP)
    linux驱动开发:中断和时间管理
    基于java+SpringBoot+HTML+Mysql纪念币抢购销售网站
    [附源码]计算机毕业设计Springboot大学生志愿者服务管理系统
    Kafka生产者使用案例
  • 原文地址:https://blog.csdn.net/weixin_42207434/article/details/133234766