• OpenCV快速入门:初探


    一、什么是OpenCV

    OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉库,广泛应用于计算机视觉和机器学习领域。它提供了丰富的功能,包括图像处理、计算机视觉、机器学习等,是许多计算机视觉项目的首选工具。
    OpenCVlogo

    二、安装OpenCV

    在开始学习OpenCV之前,首先需要安装OpenCV库。安装过程因操作系统而异,但通常可以通过包管理器(如pip)轻松完成。以下是在Python中使用pip安装OpenCV的示例:

    pip install opencv-python
    
    • 1

    确保环境中已经配置好Python,并且具备良好的网络连接。安装完成后,就可以开始使用OpenCV了。

    在安装OpenCV后,可以通过简单的代码测试是否安装成功。以下是一个简单的Python脚本,用于检验OpenCV的安装:

    import cv2
    
    # 输出OpenCV的版本信息
    print("OpenCV version:", cv2.__version__)
    
    • 1
    • 2
    • 3
    • 4

    执行这个脚本,如果成功输出OpenCV的版本信息,那么OpenCV安装就是成功的。如果遇到任何错误或没有输出,可能是安装过程中出现了问题,需要重新检查安装步骤。

    三、图像读取与显示

    使用OpenCV读取和显示图像是学习的第一步。下面是一个简单的示例代码:

    import cv2
    
    # 读取图像
    image = cv2.imread('test_image.jpg')
    
    # 显示图像
    cv2.imshow('Image', image)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9

    读取图像

    首先,我们需要明白如何读取图像。在OpenCV中,可以使用cv2.imread()函数来实现。下面是一个简单的代码示例:

    import cv2
    
    # 读取图像
    image = cv2.imread('test_image.jpg')
    
    • 1
    • 2
    • 3
    • 4

    在这里,我们使用cv2.imread()函数读取了名为 test_image.jpg 的图像。请确保已经将测试图像放到项目根目录,并重命名为 'test_image.jpg'

    显示图像

    读取图像之后,我们通常希望查看图像的内容。这时候就需要使用cv2.imshow()函数来显示图像:

    # 显示图像
    cv2.imshow('Image', image)
    
    • 1
    • 2

    这行代码将图像显示在一个名为 ‘Image’ 的窗口中。窗口的名字可以根据需求自定义。

    等待按键与关闭窗口

    为了能够观察图像,我们需要等待用户按下一个键。使用cv2.waitKey()函数来实现,它会暂停程序,直到键盘有按键输入。通常,我们在按下任意键之后,使用cv2.destroyAllWindows()关闭图像窗口。

    # 等待按键
    cv2.waitKey(0)
    
    # 关闭窗口
    cv2.destroyAllWindows()
    
    • 1
    • 2
    • 3
    • 4
    • 5

    这样,我们就完成了图像读取与显示的整个过程。当运行这段代码时,应该能够看到弹出的窗口显示了测试图像。

    四、视频加载与摄像头调用

    在计算机视觉和图像处理中,处理静态图像只是冰山一角,实际应用中,我们经常需要处理动态的视频流。OpenCV提供了强大的功能,可以轻松地从视频文件中读取帧或者调用摄像头实时捕捉图像。在这一章中,我们将介绍如何使用OpenCV加载视频文件和调用摄像头,实时显示视频帧。

    从视频文件中读取

    首先,我们看一下如何从视频文件中读取帧。下面是一个简单的代码示例:

    import cv2
    
    # 从视频文件中读取
    cap = cv2.VideoCapture('video.mp4')
    
    while True:
        ret, frame = cap.read()
    
        if not ret:
            break
    
        cv2.imshow('Video', frame)
    
        if cv2.waitKey(30) & 0xFF == 27:  # 按ESC键退出
            break
    
    cap.release()
    cv2.destroyAllWindows()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18

    在这里,我们使用cv2.VideoCapture()函数创建了一个视频捕捉对象,它可以从指定路径的视频文件中读取帧。然后,我们通过循环不断读取视频的每一帧,使用cv2.imshow()函数实时显示。
    请确保已经将测试视频放到项目根目录,并重命名为 'video.mp4'

    从摄像头中读取

    如果想实时从摄像头中获取图像,只需稍作修改即可:

    import cv2
    
    # 从摄像头中读取
    cap = cv2.VideoCapture(0)
    
    while True:
        ret, frame = cap.read()
    
        cv2.imshow('Video', frame)
    
        if cv2.waitKey(30) & 0xFF == 27:  # 按ESC键退出
            break
    
    cap.release()
    cv2.destroyAllWindows()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15

    在这里,我们将cv2.VideoCapture()的参数设置为0,表示使用默认摄像头。如果有多个摄像头,可以尝试不同的参数值。

    关闭窗口与释放资源

    在处理视频时,及时关闭窗口和释放资源是很重要的。在循环结束后,我们使用cap.release()释放摄像头或视频文件的资源,并使用cv2.destroyAllWindows()关闭所有窗口。

    五、图像的基本存储方式

    在图像处理中,图像被看作是一个由像素组成的矩阵。每个像素包含了图像在特定位置的颜色信息。理解图像的存储方式对于图像处理算法的实现至关重要。在OpenCV中,图像以矩阵的形式进行存储,其中矩阵的行和列对应于图像的高度和宽度,而矩阵的元素则是像素的颜色值。

    RGB矩阵

    对于彩色图像,通常有三个矩阵对应于红、绿、蓝三个颜色通道。每个矩阵中的元素表示图像相应位置上对应颜色通道的强度值。可以表示为:

    I = [ R G B ] I =

    [RGB]" role="presentation" style="position: relative;">[RGB]
    I=[RGB]

    其中, R , G , B R, G, B R,G,B 分别是红、绿、蓝颜色通道的矩阵。这是一个三维矩阵,每个元素是一个标量,表示对应位置的像素值。

    矩阵操作与像素访问

    通过矩阵操作,我们可以对图像进行各种操作,例如裁剪、旋转和缩放。图像处理算法通常涉及对矩阵进行一系列数学运算,以实现各种效果。

    在OpenCV中,我们可以使用NumPy库来处理图像矩阵。例如,要访问图像的特定像素,可以使用以下代码:

    import cv2
    
    # 读取图像
    image = cv2.imread('test_image.jpg')
    
    # 获取图像大小
    height, width = image.shape[:2]
    
    # 访问特定像素(假设坐标为(50, 100))
    pixel_value = image[50, 100]
    
    # 修改像素值
    image[50, 100] = [255, 255, 255]  # 将该像素设为白色
    
    # 显示修改后的图像
    cv2.imshow('Modified Image', image)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18

    使用矩阵来显示图像

    在OpenCV中,可以使用cv2.imshow()函数来显示图像,但是图像的显示是基于实际的图像文件,而不是直接基于矩阵。因此,我们需要通过NumPy库创建一个示例矩阵,将其保存为图像文件,然后再显示。

    以下是一个示例代码,演示了如何创建一个简单的矩阵并将其显示:

    import cv2
    import numpy as np
    
    # 创建一个示例矩阵(红色正方形)
    example_matrix = np.zeros((300, 300, 3), dtype=np.uint8)
    example_matrix[50:250, 50:250] = [0, 0, 255]  # 设置矩阵中的一部分为红色
    
    
    cv2.imshow('Example Image', example_matrix)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11

    在这个例子中,我们创建了一个大小为300x300的示例矩阵,将其中一部分设置为红色,并使用cv2.imshow()显示它。
    Example Image

    六、图像保存

    在图像处理和计算机视觉的应用中,图像的保存是一个常见而重要的操作。OpenCV提供了简便的方法,使得图像保存变得非常容易。

    读取图像

    首先,我们需要一个图像来进行保存操作。在这里,我们使用了cv2.imread()函数读取一张图像:

    import cv2
    
    image = cv2.imread('test_image.jpg')
    
    • 1
    • 2
    • 3

    这行代码将名为 test_image.jpg 的图像加载到内存中,作为我们后续保存的对象。确保已经将测试图像放到项目根目录,并重命名为 'test_image.jpg'

    保存图像

    接下来,我们使用cv2.imwrite()函数将图像保存为新的文件。以下是保存图像的示例代码:

    # 保存图像
    cv2.imwrite('output_image.jpg', image)
    
    • 1
    • 2

    这行代码将读取的图像保存为名为 'output_image.jpg' 的新文件。这个文件会被保存在当前工作目录中。

    完整代码

    下面是一个完整的代码示例,包含了图像的读取和保存操作:

    import cv2
    
    # 读取图像
    image = cv2.imread('test_image.jpg')
    
    # 保存图像
    cv2.imwrite('output_image.jpg', image)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    七、图像颜色空间

    图像的颜色空间是指用于表示和描述图像颜色的一种数学模型。在OpenCV中,图像通常以BGR(蓝绿红)格式存储,其中每个像素由三个分量组成。在图像处理过程中,经常需要转换颜色空间以满足特定的需求。本章将介绍一些常见的图像颜色空间以及在OpenCV中的相应操作。
    郁金香

    1. RGB颜色空间

    在RGB颜色空间中,每个像素由红色(R)、绿色(G)和蓝色(B)三个分量组成。RGB颜色表示使用三个值来描述一种颜色,每个值通常在0到255的范围内,表示对应颜色通道的强度。

    RGB颜色空间的颜色表示公式如下:

    颜色 = ( R , G , B ) \text{颜色} = (R, G, B) 颜色=(R,G,B)

    其中, R R R G G G B B B
    表示红、绿、蓝通道的颜色强度。这种表示方式是直接的物理表示,即每个通道的值越大,对应颜色的强度越高。

    在实际计算机图形处理中,通常将RGB值归一化到范围[0, 1]之间,公式如下:

    ( R , G , B ) = ( r 255 , g 255 , b 255 ) (R, G, B) = \left(\frac{r}{255}, \frac{g}{255}, \frac{b}{255}\right) (R,G,B)=(255r,255g,255b)

    其中, r r r g g g b b b 分别是0到255范围内的整数值。这样,RGB值的范围就被映射到[0,
    1]之间,方便进行计算和处理。

    在OpenCV中,我们可以通过以下方式将图像从BGR转换为RGB:

    import cv2
    
    # 读取图像
    image_bgr = cv2.imread('test_image.jpg')
    
    # 将BGR转换为RGB
    image_rgb = cv2.cvtColor(image_bgr, cv2.COLOR_BGR2RGB)
    
    # 显示图像
    cv2.imshow('Image', image_rgb)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12

    郁金香COLOR_BGR2RGB

    2. 灰度颜色空间

    灰度颜色空间是一种单通道的颜色表示方式,每个像素只有一个灰度值,表示图像的亮度。在灰度图像中,每个像素的值表示灰度级别,通常在0到255之间。

    对于彩色图像,可以通过一些加权和来将其转换为灰度图像。最常见的灰度化公式是加权平均法,其中红、绿、蓝通道的值分别乘以一组权重系数,然后将它们相加。常用的加权平均法是:

    灰度值 = 0.299 ⋅ 红色通道 + 0.587 ⋅ 绿色通道 + 0.114 ⋅ 蓝色通道 \text{灰度值} = 0.299 \cdot \text{红色通道} + 0.587 \cdot \text{绿色通道} + 0.114 \cdot \text{蓝色通道} 灰度值=0.299红色通道+0.587绿色通道+0.114蓝色通道

    这个公式是基于人眼对不同颜色敏感度的权重,使得亮度在人眼感知中更为准确。这是因为人眼对于绿色的感知更为敏感,所以在计算灰度值时对绿色的权重较高。

    在OpenCV中,可以使用以下方式将图像转换为灰度:

    # 将BGR转换为灰度
    image_gray = cv2.cvtColor(image_bgr, cv2.COLOR_BGR2GRAY)
    
    • 1
    • 2

    郁金香COLOR_BGR2GRAY

    3. HSV颜色空间

    HSV颜色空间(色调 - 饱和度 - 明度)是一种将颜色信息以更直观的方式表示的颜色模型。在HSV中,颜色由三个分量组成:色调(Hue)、饱和度(Saturation)和明度(Value)。

    HSV的颜色表示公式如下:

    ( H , S , V ) (H, S, V) (H,S,V)

    其中, H H H 表示色调, S S S 表示饱和度, V V V 表示明度。

    具体的计算公式如下:

    V = max ⁡ ( R , G , B ) V = \max(R, G, B) V=max(R,G,B)

    S = { V − min ⁡ ( R , G , B ) V if  V ≠ 0 0 if  V = 0 S =

    {Vmin(R,G,B)Vif V00if V=0" role="presentation" style="position: relative;">{Vmin(R,G,B)Vif V00if V=0
    S={VVmin(R,G,B)0if V=0if V=0

    H = { 0 if  R = G = B 60 ⋅ ( G − B ) V − min ⁡ ( R , G , B ) if  V = R 120 + 60 ⋅ ( B − R ) V − min ⁡ ( R , G , B ) if  V = G 240 + 60 ⋅ ( R − G ) V − min ⁡ ( R , G , B ) if  V = B H =

    {0if R=G=B60(GB)Vmin(R,G,B)if V=R120+60(BR)Vmin(R,G,B)if V=G240+60(RG)Vmin(R,G,B)if V=B" role="presentation" style="position: relative;">{0if R=G=B60(GB)Vmin(R,G,B)if V=R120+60(BR)Vmin(R,G,B)if V=G240+60(RG)Vmin(R,G,B)if V=B
    H= 0Vmin(R,G,B)60(GB)120+Vmin(R,G,B)60(BR)240+Vmin(R,G,B)60(RG)if R=G=Bif V=Rif V=Gif V=B

    在处理8位和16位图像时,RGB通道的值会被转换为浮点数格式,并进行缩放以适应0到1的范围。
    在这里,如果 H < 0 H < 0 H<0,则 H = H + 360 H=H + 360 H=H+360 H H H 的取值范围是 [0, 360] 度, S S S V V V 的取值范围是 [0, 1]。

    在OpenCV中,这些值将被转换为目标数据类型:

    • 对于8位图像 V = 255 V , S = 255 S , H = H 2 V = 255V, S = 255S, H = \frac{H}{2} V=255V,S=255S,H=2H(以适应0到255的范围)。
    • 对于16位图像:(目前不支持)。
    • 对于32位图像 H , S , V H, S, V H,S,V 保持不变。

    在OpenCV中,可以使用以下方式将图像从BGR转换为HSV:

    # 将BGR转换为HSV
    image_hsv = cv2.cvtColor(image_bgr, cv2.COLOR_BGR2HSV)
    
    • 1
    • 2

    郁金香COLOR_BGR2HSV

    4. LAB颜色空间

    LAB颜色空间是一种颜色模型,它包含三个分量:亮度(L,Luminance)和两个色度分量(a和b)。LAB颜色空间相较于RGB颜色空间更符合人眼感知。

    Lab颜色空间的计算公式如下:

    [ X Y Z ] = [ 0.412453 0.212671 0.019334 0.357580 0.715160 0.119193 0.180423 0.072169 0.950227 ] ⋅ [ R G B ]

    [XYZ]" role="presentation" style="position: relative;">[XYZ]
    =
    [0.4124530.2126710.0193340.3575800.7151600.1191930.1804230.0721690.950227]" role="presentation" style="position: relative;">[0.4124530.2126710.0193340.3575800.7151600.1191930.1804230.0721690.950227]
    \cdot
    [RGB]" role="presentation" style="position: relative;">[RGB]
    XYZ = 0.4124530.3575800.1804230.2126710.7151600.0721690.0193340.1191930.950227 RGB

    X = X X n , 其中  X n = 0.950456 X = \frac{X}{X_n}, \text{其中 } X_n = 0.950456 X=XnX,其中 Xn=0.950456

    Z = Z Z n , 其中  Z n = 1.088754 Z = \frac{Z}{Z_n}, \text{其中 } Z_n = 1.088754 Z=ZnZ,其中 Zn=1.088754

    L = { 116 ( Y 1.3 ) 1 / 3 − 16 当  Y > 0.008856 903.3 Y 当  Y ≤ 0.008856 L =

    {116(Y1.3)1/316当 Y>0.008856903.3Y当 Y0.008856" role="presentation" style="position: relative;">{116(Y1.3)1/316当 Y>0.008856903.3Y当 Y0.008856
    L={116(1.3Y)1/316903.3Y Y>0.008856 Y0.008856

    a = 500 ( f ( X ) − f ( Y ) ) + delta a = 500(f(X) - f(Y)) + \text{delta} a=500(f(X)f(Y))+delta

    b = 200 ( f ( Y ) − f ( Z ) ) + delta b = 200(f(Y) - f(Z)) + \text{delta} b=200(f(Y)f(Z))+delta

    其中,

    f ( t ) = { t 1 / 3 当  t > 0.008856 t 3.787 + 16 116 当  t ≤ 0.008856 f(t) =

    {t1/3当 t>0.008856t3.787+16116当 t0.008856" role="presentation" style="position: relative;">{t1/3当 t>0.008856t3.787+16116当 t0.008856
    f(t)={t1/33.787t+11616 t>0.008856 t0.008856

    delta = { 128 当 8位图像 0 当 浮点图像 \text{delta} =

    {128当 8位图像0当 浮点图像" role="presentation" style="position: relative;">{128当 8位图像0当 浮点图像
    delta={1280 8位图像 浮点图像

    在处理8位和16位图像时,RGB通道的值会被转换为浮点数格式,并进行缩放以适应0到1的范围。
    这将输出 0 ≤ L ≤ 100 , − 127 ≤ a ≤ 127 , − 127 ≤ b ≤ 127 0 \leq L \leq 100, -127 \leq a \leq 127, -127 \leq b \leq 127 0L100,127a127,127b127。然后,这些值将根据目标数据类型进行转换:

    • 对于8位图像 L = L × 255 100 , a = a + 128 , b = b + 128 L = \frac{L \times 255}{100}, a = a + 128, b = b + 128 L=100L×255,a=a+128,b=b+128
    • 对于16位图像:(目前不支持)
    • 对于32位图像 L , a , b L, a, b L,a,b 保持不变。

    在OpenCV中,可以使用以下方式将图像从BGR转换为LAB:

    # 将BGR转换为LAB
    image_lab = cv2.cvtColor(image_bgr, cv2.COLOR_BGR2LAB)
    
    • 1
    • 2

    郁金香COLOR_BGR2LAB

    5. YUV颜色空间

    YUV颜色空间是一种将亮度(Y)和色度(UV)分离的表示方式。YUV颜色空间的使用可以带来一些优势,例如更好地适应人眼感知、在视频压缩中提供更好的效果等。在视频编码中,通过将图像分为亮度和色度两个分量,可以更高效地压缩视频信息。

    YUV颜色空间是一种将亮度(Luminance)和色度(Chrominance)分开表示的颜色空间。在YUV中,Y表示亮度,而UV表示色度。

    公式如下:

    • Y(亮度): 表示图像的亮度,即灰度信息。

    Y = 0.299 ⋅ R + 0.587 ⋅ G + 0.114 ⋅ B Y = 0.299 \cdot R + 0.587 \cdot G + 0.114 \cdot B Y=0.299R+0.587G+0.114B

    • U(蓝色色度): 表示蓝色与亮度之间的差异。

    U = − 0.14713 ⋅ R − 0.288862 ⋅ G + 0.436 ⋅ B U = -0.14713 \cdot R - 0.288862 \cdot G + 0.436 \cdot B U=0.14713R0.288862G+0.436B

    • V(红色色度): 表示红色与亮度之间的差异。

    V = 0.615 ⋅ R − 0.51498 ⋅ G − 0.10001 ⋅ B V = 0.615 \cdot R - 0.51498 \cdot G - 0.10001 \cdot B V=0.615R0.51498G0.10001B

    其中,R、G、B分别为图像的红、绿、蓝通道的亮度值。这些系数是根据人眼对不同颜色敏感度的权重而确定的。

    在OpenCV中,可以使用以下方式将图像从BGR转换为YUV:

    # 将BGR转换为YUV
    image_yuv = cv2.cvtColor(image_bgr, cv2.COLOR_BGR2YUV)
    
    • 1
    • 2

    郁金香COLOR_BGR2YUV


    总结

    通过本文,我们初步了解了OpenCV的基础知识,包括安装、图像读取与显示、图像存储方式、视频加载与摄像头调用、图像保存以及颜色空间。这些只是OpenCV功能的冰山一角,它有着更强大的能力,能够支持各种计算机视觉和图像处理任务。在未来的学习中,我们将深入挖掘OpenCV的更多功能和应用。

  • 相关阅读:
    如何设计一个好的游戏剧情(Part 1:主题的设定)
    关于argument invalid! data.time2.value is empty rid的解决方法
    A * 算法(机器人路径避障规划)
    实战 | 记一次曲折的钓鱼溯源反制
    利用PCA科学确定各个指标的权重系数
    redis集群中节点fail,noaddr
    爆火的无人驾驶萝卜快跑,背后有哪些隐忧?
    JNI调用NoSuchMethodError: no non-static method错误
    读书笔记之C Primer Plus 6
    蓝桥杯1043
  • 原文地址:https://blog.csdn.net/qq_31463571/article/details/134431514