常见的数字图像格式有 RGB, RGBA, YCbCr 等,RGB/RGBA 格式适合存储,而 YCbCr 格式适合图像处理。在数字图像处理中,通常需要将 RGB 格式的图像变换为灰度图,再进行后续的处理,例如边缘检测、锐化等。本文主要介绍数字图像 RGB 转灰度图的基本原理,并记录在紫光同创 PGL22G FPGA 平台的布署与实现过程。

目录
在研究生物视觉的过程中,人们发现人眼视网膜中包含三种视锥细胞,这三种视锥细胞的光谱吸收峰值不同,对应光的波长分别处于 450 nm, 530nm 和 570 nm 附近,对应光的颜色分别为蓝、绿、红。

考虑人眼对不同颜色光的感知程度不同,对红、绿、蓝 3 个颜色分量分别设定一个权重,颜色分量值与对应权重相乘再累加,就得到灰度值。
目前关于颜色权重的选取,仍存在一些争议,但总的偏差不大。常用的 RGB 转灰度图的公式如下:

使用 Matlab 进行验证。
- clc, clear
-
- % 读取图像
- im = imread('./loopy.png');
- im = im2double(im);
-
- % RGB转灰度图
- im_r = im(:,:,1);
- im_g = im(:,:,2);
- im_b = im(:,:,3);
- im_new = 0.299*im_r +0.587*im_g +0.114*im_b;
-
- % 查看图像
- subplot(121)
- imshow(im)
- title('原图像')
- subplot(122)
- imshow(im_new)
- title('处理后图像')

使用紫光同创 FPGA 平台实现 RGB 转灰度图功能,FPGA 需要实现的功能与指标如下:
(1)与电脑的串口通信,用于接收用户下发的图像,波特率为 256000 Bd/s;
(2)RGB 转灰度图处理,使用 FPGA 内部的乘法器,实现颜色分量的加权;
(3)DDR3 读写控制,将处理前后的图像数据分别写入 DDR3 的不同区域,实现图像的拼接;
(4)HDMI 输出,输出一路 HDMI 信号源,用于将拼接后的图像显示在外接显示器上,分辨率为 1024×768。
主要的设计模块功能划分如下:
top_uart 模块
· uart_rx_slice 模块,UART 串口接收驱动模块
· uart_rx_parse 模块,UART 串口数据解析模块,从上位机接收 RGB 8bit 图像
top_vidin 模块
· vidin_pipeline 模块,缓存两行图像(使用乒乓操作),并将数据提交到 ddr3 用户数据调度模块
· mult_9x9_uaub IP,乘法器 IP,输入为 2 个 9bit 无符号数,输出为 18bit 无符号数
merge_out 模块
· dvi_timing_gen 模块,根据定义的分辨率,产生 HDMI 视频控制时序
· dvi_ddr_rd 模块,根据 HDMI 控制信号,提交读指令到 ddr3 用户数据调度模块
· dvi_encoder 模块,HDMI 输出编码(8b10b 编码)与输出驱动
· dvi_pll IP,PLL IP,将参考时钟倍频,产生需要的像素时钟信号
其中,乘法器的输入为 2 个 9bit 无符号数,RGB 颜色分量为 8bit,颜色分量系数需要扩大 512 倍再取整,由


得 RGB 乘法器相乘系数分别取:153,301 和 58。
FPGA 工程资源使用率如下:

使用 PyQt5 和 OpenCV 库,编写上位机程序,实现以下功能:
(1)使用 OpenCV 库加载图像,并截取左上角 512 × 384 的区域;
(2)通过串口发送给 PGL22G 开发板。
- # -*- Coding: UTF-8 -*-
- import cv2
- import sys
- import struct
- from PyQt5 import Qt, QtGui, QtCore, QtWidgets, QtSerialPort
-
- class mainWindow(Qt.QWidget):
- def __init__(self, com_port, parent=None):
- super(mainWindow, self).__init__(parent)
- #self.setGeometry(720, 300, 512, 384)
- self.setFixedSize(530, 384)
- self.setWindowTitle("PGL OpenCV Tool")
-
- # 创建标签与按钮
- self.img_widget = QtWidgets.QLabel()
- self.btn1 = QtWidgets.QPushButton("打开")
- self.btn1.clicked.connect(self.getfile)
- self.btn2 = QtWidgets.QPushButton("关闭")
- self.btn2.clicked.connect(self.close)
-
- # 创建布局
- centralLayout = QtWidgets.QVBoxLayout()
- centralLayout.addWidget(self.img_widget)
- bottomLayout = QtWidgets.QHBoxLayout()
- bottomLayout.addWidget(self.btn1)
- bottomLayout.addWidget(self.btn2)
- centralLayout.addLayout(bottomLayout)
- self.setLayout(centralLayout)
-
- # 串口对象
- self.COM = QtSerialPort.QSerialPort()
- self.COM.setPortName(com_port)
- self.COM.setBaudRate(256000)
- self.open_status = False
- self.row_cnt = 0
- self.img = None
- self.timer = QtCore.QTimer()
- self.timer.timeout.connect(self.sendImage)
- self.startup()
-
- def startup(self):
- """Write code here to run once"""
- for com_port in QtSerialPort.QSerialPortInfo.availablePorts():
- print(com_port.portName())
-
- # Try open serial port
- if not self.COM.open(QtSerialPort.QSerialPort.ReadWrite):
- self.open_status = False
- print("Open Serial Port failed.")
- else:
- self.open_status = True
-
- def getfile(self):
- """获取图像路径"""
- fname = QtWidgets.QFileDialog.getOpenFileName(self, 'Open file',
- 'C:\\Users\\Administrator\\Pictures', "Image files(*.jpg *.png)")
- self.clipImage(fname[0])
- self.updateImage()
- self.sendImage()
-
- def clipImage(self, fname):
- """读取并裁剪图片至512x384大小"""
- if fname:
- img = cv2.imread(fname, cv2.IMREAD_COLOR)
- img_roi = img[:384,:512,:]
- print(img_roi.shape)
- cv2.imwrite('./img_roi.png', img_roi)
-
- def updateImage(self):
- """显示裁剪后的图像"""
- self.img_widget.setPixmap(QtGui.QPixmap('./temp/img_roi.png'))
- self.img = cv2.imread('./img_roi.png')
- self.timer.start(100)
-
- def sendImage(self):
- """通过串口发送图片"""
- pattern = ">4H{:d}B".format(512*3)
-
- if self.open_status:
- if self.row_cnt == 384:
- self.row_cnt = 0
- self.timer.stop()
- else:
- args1 = [self.row_cnt, self.img.shape[0], 0, 0]
- args2 = [rgb for rgb in self.img[self.row_cnt,:].reshape(-1)]
- send_data = struct.pack(pattern, *(args1+args2))
- self.row_cnt += 1
- self.COM.write(send_data)
-
- def main():
- app = QtWidgets.QApplication(sys.argv)
- window = mainWindow('COM21')
- window.show()
- sys.exit(app.exec_())
-
- if __name__ == "__main__":
- main()

在电脑端发送图像,就可以看到 FPGA 处理结果了 ~
