【数字图像处理】RGB 转灰度图

常见的数字图像格式有 RGB, RGBA, YCbCr 等,RGB/RGBA 格式适合存储,而 YCbCr 格式适合图像处理。在数字图像处理中,通常需要将 RGB 格式的图像变换为灰度图,再进行后续的处理,例如边缘检测、锐化等。本文主要介绍数字图像 RGB 转灰度图的基本原理,并记录在紫光同创 PGL22G FPGA 平台的布署与实现过程。

【数字图像处理】RGB 转灰度图_第1张图片

目录

1. RGB 转灰度图原理

2. FPGA 布署与实现

2.1 功能与指标定义

2.2 模块设计

2.3 上板调试


1. RGB 转灰度图原理

        在研究生物视觉的过程中,人们发现人眼视网膜中包含三种视锥细胞,这三种视锥细胞的光谱吸收峰值不同,对应光的波长分别处于 450 nm, 530nm 和 570 nm 附近,对应光的颜色分别为蓝、绿、红。

【数字图像处理】RGB 转灰度图_第2张图片

        考虑人眼对不同颜色光的感知程度不同,对红、绿、蓝 3 个颜色分量分别设定一个权重,颜色分量值与对应权重相乘再累加,就得到灰度值。

        目前关于颜色权重的选取,仍存在一些争议,但总的偏差不大。常用的 RGB 转灰度图的公式如下:

Gray = 0.299 \times R + 0.587 \times G + 0.114 \times B

使用 Matlab 进行验证。

clc, clear

% 读取图像
im = imread('./loopy.png');
im = im2double(im);

% RGB转灰度图
im_r = im(:,:,1);
im_g = im(:,:,2);
im_b = im(:,:,3);
im_new = 0.299*im_r +0.587*im_g +0.114*im_b;

% 查看图像
subplot(121)
imshow(im)
title('原图像')
subplot(122)
imshow(im_new)
title('处理后图像')

【数字图像处理】RGB 转灰度图_第3张图片

2. FPGA 布署与实现

2.1 功能与指标定义

        使用紫光同创 FPGA 平台实现 RGB 转灰度图功能,FPGA 需要实现的功能与指标如下:

(1)与电脑的串口通信,用于接收用户下发的图像,波特率为 256000 Bd/s;

(2)RGB 转灰度图处理,使用 FPGA 内部的乘法器,实现颜色分量的加权;

(3)DDR3 读写控制,将处理前后的图像数据分别写入 DDR3 的不同区域,实现图像的拼接;

(4)HDMI 输出,输出一路 HDMI 信号源,用于将拼接后的图像显示在外接显示器上,分辨率为 1024×768。

2.2 模块设计

        主要的设计模块功能划分如下:


top_uart 模块

· uart_rx_slice 模块,UART 串口接收驱动模块

· uart_rx_parse 模块,UART 串口数据解析模块,从上位机接收 RGB 8bit 图像

top_vidin 模块

· vidin_pipeline 模块,缓存两行图像(使用乒乓操作),并将数据提交到 ddr3 用户数据调度模块

· mult_9x9_uaub IP,乘法器 IP,输入为 2 个 9bit 无符号数,输出为 18bit 无符号数

merge_out 模块

· dvi_timing_gen 模块,根据定义的分辨率,产生 HDMI 视频控制时序

· dvi_ddr_rd 模块,根据 HDMI 控制信号,提交读指令到 ddr3 用户数据调度模块

· dvi_encoder 模块,HDMI 输出编码(8b10b 编码)与输出驱动

· dvi_pll IP,PLL IP,将参考时钟倍频,产生需要的像素时钟信号

其中,乘法器的输入为 2 个 9bit 无符号数,RGB 颜色分量为 8bit,颜色分量系数需要扩大 512 倍再取整,由

0.299 \times 512 = 153.088 

0.587 \times 512 = 300.544

0.114 \times 512 = 58.368

得 RGB 乘法器相乘系数分别取:153,301 和 58。

FPGA 工程资源使用率如下:

【数字图像处理】RGB 转灰度图_第4张图片

2.3 上板调试

使用 PyQt5 和 OpenCV 库,编写上位机程序,实现以下功能:

(1)使用 OpenCV 库加载图像,并截取左上角 512 × 384 的区域;

(2)通过串口发送给 PGL22G 开发板。

# -*- Coding: UTF-8 -*-
import cv2
import sys
import struct
from PyQt5 import Qt, QtGui, QtCore, QtWidgets, QtSerialPort

class mainWindow(Qt.QWidget):
   def __init__(self, com_port, parent=None):
      super(mainWindow, self).__init__(parent)
      #self.setGeometry(720, 300, 512, 384)
      self.setFixedSize(530, 384)
      self.setWindowTitle("PGL OpenCV Tool")

      # 创建标签与按钮
      self.img_widget = QtWidgets.QLabel()
      self.btn1 = QtWidgets.QPushButton("打开")
      self.btn1.clicked.connect(self.getfile)
      self.btn2 = QtWidgets.QPushButton("关闭")
      self.btn2.clicked.connect(self.close)

      # 创建布局
      centralLayout = QtWidgets.QVBoxLayout()
      centralLayout.addWidget(self.img_widget)
      bottomLayout = QtWidgets.QHBoxLayout()
      bottomLayout.addWidget(self.btn1)
      bottomLayout.addWidget(self.btn2)
      centralLayout.addLayout(bottomLayout)
      self.setLayout(centralLayout)

      # 串口对象
      self.COM = QtSerialPort.QSerialPort()
      self.COM.setPortName(com_port)
      self.COM.setBaudRate(256000)
      self.open_status = False
      self.row_cnt = 0
      self.img = None
      self.timer = QtCore.QTimer()
      self.timer.timeout.connect(self.sendImage)
      self.startup()

   def startup(self):
      """Write code here to run once"""
      for com_port in QtSerialPort.QSerialPortInfo.availablePorts():
         print(com_port.portName())

      # Try open serial port
      if not self.COM.open(QtSerialPort.QSerialPort.ReadWrite):
         self.open_status = False
         print("Open Serial Port failed.")
      else:
         self.open_status = True

   def getfile(self):
      """获取图像路径"""
      fname = QtWidgets.QFileDialog.getOpenFileName(self, 'Open file',
         'C:\\Users\\Administrator\\Pictures', "Image files(*.jpg *.png)")
      self.clipImage(fname[0])
      self.updateImage()
      self.sendImage()

   def clipImage(self, fname):
      """读取并裁剪图片至512x384大小"""
      if fname:
         img = cv2.imread(fname, cv2.IMREAD_COLOR)
         img_roi = img[:384,:512,:]
         print(img_roi.shape)
         cv2.imwrite('./img_roi.png', img_roi)

   def updateImage(self):
      """显示裁剪后的图像"""
      self.img_widget.setPixmap(QtGui.QPixmap('./temp/img_roi.png'))
      self.img = cv2.imread('./img_roi.png')
      self.timer.start(100)

   def sendImage(self):
      """通过串口发送图片"""
      pattern = ">4H{:d}B".format(512*3)

      if self.open_status:
         if self.row_cnt == 384:
            self.row_cnt = 0
            self.timer.stop()
         else:
            args1 = [self.row_cnt, self.img.shape[0], 0, 0]
            args2 = [rgb for rgb in self.img[self.row_cnt,:].reshape(-1)]
            send_data = struct.pack(pattern, *(args1+args2))
            self.row_cnt += 1
            self.COM.write(send_data)

def main():
   app = QtWidgets.QApplication(sys.argv)
   window = mainWindow('COM21')
   window.show()
   sys.exit(app.exec_())

if __name__ == "__main__":
   main()

 【数字图像处理】RGB 转灰度图_第5张图片

        在电脑端发送图像,就可以看到 FPGA 处理结果了 ~

【数字图像处理】RGB 转灰度图_第6张图片

你可能感兴趣的:(【数字图像处理】,fpga开发,图像处理,紫光同创)