OpenCV快速入门：初探

一、什么是OpenCV

OpenCV（Open Source Computer Vision Library）是一个开源的计算机视觉库，广泛应用于计算机视觉和机器学习领域。它提供了丰富的功能，包括图像处理、计算机视觉、机器学习等，是许多计算机视觉项目的首选工具。
OpenCVlogo

二、安装OpenCV

在开始学习OpenCV之前，首先需要安装OpenCV库。安装过程因操作系统而异，但通常可以通过包管理器（如pip）轻松完成。以下是在Python中使用pip安装OpenCV的示例：

pip install opencv-python
1

确保环境中已经配置好Python，并且具备良好的网络连接。安装完成后，就可以开始使用OpenCV了。

在安装OpenCV后，可以通过简单的代码测试是否安装成功。以下是一个简单的Python脚本，用于检验OpenCV的安装：

import cv2

# 输出OpenCV的版本信息
print("OpenCV version:", cv2.__version__)
1
2
3
4

执行这个脚本，如果成功输出OpenCV的版本信息，那么OpenCV安装就是成功的。如果遇到任何错误或没有输出，可能是安装过程中出现了问题，需要重新检查安装步骤。

三、图像读取与显示

使用OpenCV读取和显示图像是学习的第一步。下面是一个简单的示例代码：

import cv2

# 读取图像
image = cv2.imread('test_image.jpg')

# 显示图像
cv2.imshow('Image', image)
cv2.waitKey(0)
cv2.destroyAllWindows()
1
2
3
4
5
6
7
8
9

读取图像

首先，我们需要明白如何读取图像。在OpenCV中，可以使用cv2.imread()函数来实现。下面是一个简单的代码示例：

import cv2

# 读取图像
image = cv2.imread('test_image.jpg')
1
2
3
4

在这里，我们使用cv2.imread()函数读取了名为 test_image.jpg 的图像。请确保已经将测试图像放到项目根目录，并重命名为 'test_image.jpg'。

显示图像

读取图像之后，我们通常希望查看图像的内容。这时候就需要使用cv2.imshow()函数来显示图像：

# 显示图像
cv2.imshow('Image', image)
1
2

这行代码将图像显示在一个名为 ‘Image’ 的窗口中。窗口的名字可以根据需求自定义。

等待按键与关闭窗口

为了能够观察图像，我们需要等待用户按下一个键。使用cv2.waitKey()函数来实现，它会暂停程序，直到键盘有按键输入。通常，我们在按下任意键之后，使用cv2.destroyAllWindows()关闭图像窗口。

# 等待按键
cv2.waitKey(0)

# 关闭窗口
cv2.destroyAllWindows()
1
2
3
4
5

这样，我们就完成了图像读取与显示的整个过程。当运行这段代码时，应该能够看到弹出的窗口显示了测试图像。

四、视频加载与摄像头调用

在计算机视觉和图像处理中，处理静态图像只是冰山一角，实际应用中，我们经常需要处理动态的视频流。OpenCV提供了强大的功能，可以轻松地从视频文件中读取帧或者调用摄像头实时捕捉图像。在这一章中，我们将介绍如何使用OpenCV加载视频文件和调用摄像头，实时显示视频帧。

从视频文件中读取

首先，我们看一下如何从视频文件中读取帧。下面是一个简单的代码示例：

import cv2

# 从视频文件中读取
cap = cv2.VideoCapture('video.mp4')

while True:
    ret, frame = cap.read()

    if not ret:
        break

    cv2.imshow('Video', frame)

    if cv2.waitKey(30) & 0xFF == 27:  # 按ESC键退出
        break

cap.release()
cv2.destroyAllWindows()
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

在这里，我们使用cv2.VideoCapture()函数创建了一个视频捕捉对象，它可以从指定路径的视频文件中读取帧。然后，我们通过循环不断读取视频的每一帧，使用cv2.imshow()函数实时显示。
请确保已经将测试视频放到项目根目录，并重命名为 'video.mp4'。

从摄像头中读取

如果想实时从摄像头中获取图像，只需稍作修改即可：

import cv2

# 从摄像头中读取
cap = cv2.VideoCapture(0)

while True:
    ret, frame = cap.read()

    cv2.imshow('Video', frame)

    if cv2.waitKey(30) & 0xFF == 27:  # 按ESC键退出
        break

cap.release()
cv2.destroyAllWindows()
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

在这里，我们将cv2.VideoCapture()的参数设置为0，表示使用默认摄像头。如果有多个摄像头，可以尝试不同的参数值。

关闭窗口与释放资源

在处理视频时，及时关闭窗口和释放资源是很重要的。在循环结束后，我们使用cap.release()释放摄像头或视频文件的资源，并使用cv2.destroyAllWindows()关闭所有窗口。

五、图像的基本存储方式

在图像处理中，图像被看作是一个由像素组成的矩阵。每个像素包含了图像在特定位置的颜色信息。理解图像的存储方式对于图像处理算法的实现至关重要。在OpenCV中，图像以矩阵的形式进行存储，其中矩阵的行和列对应于图像的高度和宽度，而矩阵的元素则是像素的颜色值。

RGB矩阵

对于彩色图像，通常有三个矩阵对应于红、绿、蓝三个颜色通道。每个矩阵中的元素表示图像相应位置上对应颜色通道的强度值。可以表示为：

[\begin{matrix} R & G & B \end{matrix}]

I = [R G B]

其中， $R, G, B$ 分别是红、绿、蓝颜色通道的矩阵。这是一个三维矩阵，每个元素是一个标量，表示对应位置的像素值。

矩阵操作与像素访问

通过矩阵操作，我们可以对图像进行各种操作，例如裁剪、旋转和缩放。图像处理算法通常涉及对矩阵进行一系列数学运算，以实现各种效果。

在OpenCV中，我们可以使用NumPy库来处理图像矩阵。例如，要访问图像的特定像素，可以使用以下代码：

import cv2

# 读取图像
image = cv2.imread('test_image.jpg')

# 获取图像大小
height, width = image.shape[:2]

# 访问特定像素（假设坐标为(50, 100)）
pixel_value = image[50, 100]

# 修改像素值
image[50, 100] = [255, 255, 255]  # 将该像素设为白色

# 显示修改后的图像
cv2.imshow('Modified Image', image)
cv2.waitKey(0)
cv2.destroyAllWindows()
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

使用矩阵来显示图像

在OpenCV中，可以使用cv2.imshow()函数来显示图像，但是图像的显示是基于实际的图像文件，而不是直接基于矩阵。因此，我们需要通过NumPy库创建一个示例矩阵，将其保存为图像文件，然后再显示。

以下是一个示例代码，演示了如何创建一个简单的矩阵并将其显示：

import cv2
import numpy as np

# 创建一个示例矩阵（红色正方形）
example_matrix = np.zeros((300, 300, 3), dtype=np.uint8)
example_matrix[50:250, 50:250] = [0, 0, 255]  # 设置矩阵中的一部分为红色


cv2.imshow('Example Image', example_matrix)
cv2.waitKey(0)
cv2.destroyAllWindows()
1
2
3
4
5
6
7
8
9
10
11

在这个例子中，我们创建了一个大小为300x300的示例矩阵，将其中一部分设置为红色，并使用cv2.imshow()显示它。
Example Image

六、图像保存

在图像处理和计算机视觉的应用中，图像的保存是一个常见而重要的操作。OpenCV提供了简便的方法，使得图像保存变得非常容易。

读取图像

首先，我们需要一个图像来进行保存操作。在这里，我们使用了cv2.imread()函数读取一张图像：

import cv2

image = cv2.imread('test_image.jpg')
1
2
3

这行代码将名为 test_image.jpg 的图像加载到内存中，作为我们后续保存的对象。确保已经将测试图像放到项目根目录，并重命名为 'test_image.jpg'。

保存图像

接下来，我们使用cv2.imwrite()函数将图像保存为新的文件。以下是保存图像的示例代码：

# 保存图像
cv2.imwrite('output_image.jpg', image)
1
2

这行代码将读取的图像保存为名为 'output_image.jpg' 的新文件。这个文件会被保存在当前工作目录中。

完整代码

下面是一个完整的代码示例，包含了图像的读取和保存操作：

import cv2

# 读取图像
image = cv2.imread('test_image.jpg')

# 保存图像
cv2.imwrite('output_image.jpg', image)
1
2
3
4
5
6
7

七、图像颜色空间

图像的颜色空间是指用于表示和描述图像颜色的一种数学模型。在OpenCV中，图像通常以BGR（蓝绿红）格式存储，其中每个像素由三个分量组成。在图像处理过程中，经常需要转换颜色空间以满足特定的需求。本章将介绍一些常见的图像颜色空间以及在OpenCV中的相应操作。
郁金香

1. RGB颜色空间

在RGB颜色空间中，每个像素由红色（R）、绿色（G）和蓝色（B）三个分量组成。RGB颜色表示使用三个值来描述一种颜色，每个值通常在0到255的范围内，表示对应颜色通道的强度。

RGB颜色空间的颜色表示公式如下：

$\text{颜色} = (R, G, B)$

其中， $R$ 、 $G$ 、 $B$
表示红、绿、蓝通道的颜色强度。这种表示方式是直接的物理表示，即每个通道的值越大，对应颜色的强度越高。

在实际计算机图形处理中，通常将RGB值归一化到范围[0, 1]之间，公式如下：

$\left(\frac{r}{255}, \frac{g}{255}, \frac{b}{255}\right)$

其中， $r$ 、 $g$ 、 $b$ 分别是0到255范围内的整数值。这样，RGB值的范围就被映射到[0,
1]之间，方便进行计算和处理。

在OpenCV中，我们可以通过以下方式将图像从BGR转换为RGB：

import cv2

# 读取图像
image_bgr = cv2.imread('test_image.jpg')

# 将BGR转换为RGB
image_rgb = cv2.cvtColor(image_bgr, cv2.COLOR_BGR2RGB)

# 显示图像
cv2.imshow('Image', image_rgb)
cv2.waitKey(0)
cv2.destroyAllWindows()
1
2
3
4
5
6
7
8
9
10
11
12

郁金香COLOR_BGR2RGB

2. 灰度颜色空间

灰度颜色空间是一种单通道的颜色表示方式，每个像素只有一个灰度值，表示图像的亮度。在灰度图像中，每个像素的值表示灰度级别，通常在0到255之间。

对于彩色图像，可以通过一些加权和来将其转换为灰度图像。最常见的灰度化公式是加权平均法，其中红、绿、蓝通道的值分别乘以一组权重系数，然后将它们相加。常用的加权平均法是：

$\text{灰度值} = 0.299 \cdot \text{红色通道} + 0.587 \cdot \text{绿色通道} + 0.114 \cdot \text{蓝色通道}$

这个公式是基于人眼对不同颜色敏感度的权重，使得亮度在人眼感知中更为准确。这是因为人眼对于绿色的感知更为敏感，所以在计算灰度值时对绿色的权重较高。

在OpenCV中，可以使用以下方式将图像转换为灰度：

# 将BGR转换为灰度
image_gray = cv2.cvtColor(image_bgr, cv2.COLOR_BGR2GRAY)
1
2

郁金香COLOR_BGR2GRAY

3. HSV颜色空间

HSV颜色空间（色调 - 饱和度 - 明度）是一种将颜色信息以更直观的方式表示的颜色模型。在HSV中，颜色由三个分量组成：色调（Hue）、饱和度（Saturation）和明度（Value）。

HSV的颜色表示公式如下：

$(H, S, V)$

其中， $H$ 表示色调， $S$ 表示饱和度， $V$ 表示明度。

具体的计算公式如下：

$\max(R, G, B)$

${\begin{cases} \frac{V - min (R, G, B)}{V} & if V \neq 0 \\ 0 & if V = 0 \end{cases}$ $S = {\frac{V - m i n ( R , G , B )}{V} 0 if V \neq = 0 if V = 0$

${\begin{cases} 0 & if R = G = B \\ \frac{60 \cdot (G - B)}{V - min (R, G, B)} & if V = R \\ 120 + \frac{60 \cdot (B - R)}{V - min (R, G, B)} & if V = G \\ 240 + \frac{60 \cdot (R - G)}{V - min (R, G, B)} & if V = B \end{cases}$ $H = ⎩ ⎨ ⎧ 0 \frac{60 \cdot ( G - B )}{V - m i n ( R , G , B )} 120 + \frac{60 \cdot ( B - R )}{V - m i n ( R , G , B )} 240 + \frac{60 \cdot ( R - G )}{V - m i n ( R , G , B )} if R = G = B if V = R if V = G if V = B$

在处理8位和16位图像时，RGB通道的值会被转换为浮点数格式，并进行缩放以适应0到1的范围。
在这里，如果 $H < 0$ ，则 $H = H + 360$ 。 $H$ 的取值范围是 [0, 360] 度， $S$ 和 $V$ 的取值范围是 [0, 1]。

在OpenCV中，这些值将被转换为目标数据类型：

对于8位图像： $\frac{H}{2}$ （以适应0到255的范围）。
对于16位图像：（目前不支持）。
对于32位图像： $H, S, V$ 保持不变。

在OpenCV中，可以使用以下方式将图像从BGR转换为HSV：

# 将BGR转换为HSV
image_hsv = cv2.cvtColor(image_bgr, cv2.COLOR_BGR2HSV)
1
2

郁金香COLOR_BGR2HSV

4. LAB颜色空间

LAB颜色空间是一种颜色模型，它包含三个分量：亮度（L，Luminance）和两个色度分量（a和b）。LAB颜色空间相较于RGB颜色空间更符合人眼感知。

Lab颜色空间的计算公式如下：

$[\begin{matrix} X \\ Y \\ Z \end{matrix}]$ = $[\begin{matrix} 0.412453 & 0.212671 & 0.019334 \\ 0.357580 & 0.715160 & 0.119193 \\ 0.180423 & 0.072169 & 0.950227 \end{matrix}]$ \cdot $[\begin{matrix} R \\ G \\ B \end{matrix}]$ $X Y Z = 0.412453 0.357580 0.180423 0.212671 0.715160 0.072169 0.019334 0.119193 0.950227 \cdot R G B$

$\frac{X}{X_n}, \text{其中 } X_n = 0.950456$

$\frac{Z}{Z_n}, \text{其中 } Z_n = 1.088754$

${\begin{cases} 116 {(\frac{Y}{1.3})}^{1 / 3} - 16 & 当 Y > 0.008856 \\ 903.3 Y & 当 Y \leq 0.008856 \end{cases}$ $L = {116 (\frac{Y}{1.3})^{1/3} - 16 903.3 Y 当 Y > 0.008856 当 Y \leq 0.008856$

$\text{delta}$

$\text{delta}$

其中，

${\begin{cases} t^{1 / 3} & 当 t > 0.008856 \\ \frac{t}{3.787} + \frac{16}{116} & 当 t \leq 0.008856 \end{cases}$ $f (t) = {t^{1/3} \frac{t}{3.787} + \frac{16}{116} 当 t > 0.008856 当 t \leq 0.008856$

和

$\text{delta} =$
${\begin{cases} 128 & 当 8位图像 \\ 0 & 当浮点图像 \end{cases}$ $delta = {1280 当 8 位图像当浮点图像$

在处理8位和16位图像时，RGB通道的值会被转换为浮点数格式，并进行缩放以适应0到1的范围。
这将输出 $\leq L \leq 100, -127 \leq a \leq 127, -127 \leq b \leq 127$ 。然后，这些值将根据目标数据类型进行转换：

对于8位图像： $\frac{L \times 255}{100}, a = a + 128, b = b + 128$
对于16位图像：（目前不支持）
对于32位图像： $L, a, b$ 保持不变。

在OpenCV中，可以使用以下方式将图像从BGR转换为LAB：

# 将BGR转换为LAB
image_lab = cv2.cvtColor(image_bgr, cv2.COLOR_BGR2LAB)
1
2

郁金香COLOR_BGR2LAB

5. YUV颜色空间

YUV颜色空间是一种将亮度（Y）和色度（UV）分离的表示方式。YUV颜色空间的使用可以带来一些优势，例如更好地适应人眼感知、在视频压缩中提供更好的效果等。在视频编码中，通过将图像分为亮度和色度两个分量，可以更高效地压缩视频信息。

YUV颜色空间是一种将亮度（Luminance）和色度（Chrominance）分开表示的颜色空间。在YUV中，Y表示亮度，而UV表示色度。

公式如下：

Y（亮度）： 表示图像的亮度，即灰度信息。

$\cdot R + 0.587 \cdot G + 0.114 \cdot B$

U（蓝色色度）： 表示蓝色与亮度之间的差异。

$\cdot R - 0.288862 \cdot G + 0.436 \cdot B$

V（红色色度）： 表示红色与亮度之间的差异。

$\cdot R - 0.51498 \cdot G - 0.10001 \cdot B$

其中，R、G、B分别为图像的红、绿、蓝通道的亮度值。这些系数是根据人眼对不同颜色敏感度的权重而确定的。

在OpenCV中，可以使用以下方式将图像从BGR转换为YUV：

# 将BGR转换为YUV
image_yuv = cv2.cvtColor(image_bgr, cv2.COLOR_BGR2YUV)
1
2

郁金香COLOR_BGR2YUV

总结

通过本文，我们初步了解了OpenCV的基础知识，包括安装、图像读取与显示、图像存储方式、视频加载与摄像头调用、图像保存以及颜色空间。这些只是OpenCV功能的冰山一角，它有着更强大的能力，能够支持各种计算机视觉和图像处理任务。在未来的学习中，我们将深入挖掘OpenCV的更多功能和应用。

相关阅读:
如何设计一个好的游戏剧情（Part 1：主题的设定）
关于argument invalid! data.time2.value is empty rid的解决方法
A * 算法（机器人路径避障规划）
实战｜记一次曲折的钓鱼溯源反制
利用PCA科学确定各个指标的权重系数
redis集群中节点fail,noaddr
爆火的无人驾驶萝卜快跑，背后有哪些隐忧？
JNI调用NoSuchMethodError: no non-static method错误
读书笔记之C Primer Plus 6
蓝桥杯1043

原文地址：https://blog.csdn.net/qq_31463571/article/details/134431514

OpenCV快速入门：初探

文章目录

一、什么是OpenCV

二、安装OpenCV

三、图像读取与显示

读取图像

显示图像

等待按键与关闭窗口

四、视频加载与摄像头调用

从视频文件中读取

从摄像头中读取

关闭窗口与释放资源

五、图像的基本存储方式

RGB矩阵

矩阵操作与像素访问

使用矩阵来显示图像

六、图像保存

读取图像

保存图像

完整代码

七、图像颜色空间

1. RGB颜色空间

2. 灰度颜色空间

3. HSV颜色空间

4. LAB颜色空间

5. YUV颜色空间

总结