基于FPGA的图像处理1–图像处理基础IP设计

2023年6月20日下午12:22 • 人工智能 • 阅读 130

Github代码地址:https://github.com/zgw598243565/MapTec4

1.1 图像行列计数 Module

图像行列计数在图像处理中非常常见。大部分算法都需要做到精准的像素定位，行列计数法是像素定位的基本方法。另外一个方法是像素计数，通常不会这样做，因为它将会给调试工作带来不便(庞大的像素计数当然没有较小的行列计数来得直观些)。

行列计数的最简单的方法是通过输入场行同步信号和像素有效信号进行计数。设计原则如下:

（1）每一场信号到来时清空行列计数。

（2）每一个行同步信号到来时行计数加1，同时清空列计数。

（3）像素有效信号有效时列计数加1。

具体实现如下，通过像素有效信号进行有效像素区域的行列计数。仿真结果如图1和图2所示。输入的测试图像分辨率是640×480大小，关于如何产生各种分辨率的图像信号，将在(基于FPGA的图像处理2–图像时序产生IP)讲述。

图 1

图 2

module ImageCounter #
(
    parameter IW = 640,
    parameter IH = 480,
    parameter DW = 8,
    parameter IW_DW = 12, /* Width of the column counter */
    parameter IH_DW = 12 /* Width of the line counter */
)
(clk,arstn,vsync,hsync,dvalid,line_counter,column_counter);

input clk;
input arstn;
input vsync;
input hsync;
input dvalid;

output reg [IH_DW-1:0]line_counter;
output reg [IW_DW-1:0]column_counter;

reg rst_all; /* reset signal for line_counter and column_counter when vsync valid*/
always@(posedge clk or negedge arstn)
    begin
        if(~arstn)
            rst_all

1.2 行缓存Linebuffer Module

图 3

如图3所示是一个典型的二维的3×3卷积运算的结构图。二维卷积通常会对图像进行开窗，以3×3的窗口为例，至少需要得到当前窗口的9个像素值，卷积操作的流水线性质决定了一个时刻只能得到一个像素值。如果要得到前两行的像素，就必须要对前两行的像素值进行缓存。

行缓存通常会放在FPGA片内，这是由于行缓存通常不会很大，对于一个确定的算法，窗口尺寸往往已经确定。实际上，对于一个窗口尺寸为3×3的二维卷积算法，我们至少需要2个行缓存。这里为了设计的简单，我采用了3个行缓存，进行时序对齐后，进行移位开窗。采用3个行缓存是因为，在对图像进行滤波是，图像下边界和右边界会出现边界越界的问题，使用3个行缓存，便在行列对齐中解决了图像下边界越界的问题。图像右边界越界的问题由后续的滤波算法取数据时来解决。

图 4

对于多行图像的对齐，一个简单的方法就是将行缓存连接成菊花链式，即将前一个行缓存的输出接入下一个行缓存的输入，如图4所示。行缓存Linebuffer Module类似于一个同步FIFO，但是因为COLOR_DEPTH关系，FIFO的数据位宽不一定是8的整数位。因此，我们首先完成一个同步FIFO Module的设计，然后通过例化这个同步FIFO Module来设计行缓存Linebuffer Module。尽管FIFO这种IP都是已经有设计好的，但是为了理解设计细节，我用编译约束，来使得设计的FIFO Module中的存储单元采用BRAM而不是使用寄存器(FF)。

1.2.1 同步FIFO Module的设计

图 5

图5所示为同步FIFO Module的电路结构引脚图。其输入信号分别为clk(同步时钟信号),arstn(异步复位信号-低电平有效),data_in(输入数据),wr_req(写请求-高有效),rd_req(读请求-高有效),data_out(输出数据),usedw(FIFO中被写入了多少个数据的计数值),empty(FIFO空标志-高为空),full(FIFO满标志-高为满)。其具体实现代码如下所示，设计思路是采用了循环数组的设计思想，循环数组使用空递增的方式。

module SynFifo #
(
    parameter DATA_WIDTH = 8,
    parameter FIFO_DEPTH = 256
)
(clk,arstn,data_in,wrreq,rdreq,data_out,usedw,empty,full);

function integer clogb2 (input integer bit_depth);
begin
    for(clogb2=0;bit_depth>0;clogb2=clogb2+1)
        bit_depth=bit_depth>>1;
end
endfunction

localparam clog2_FIFO_DEPTH=clogb2(FIFO_DEPTH-1);

input clk;
input arstn;
input [DATA_WIDTH-1:0]data_in;
input wrreq;
input rdreq;
output [DATA_WIDTH-1:0]data_out;
output reg [clog2_FIFO_DEPTH:0]usedw;
output empty;
output full;

(* ram_style = "bram" *) reg [DATA_WIDTH-1:0]mem[FIFO_DEPTH-1:0];

reg [clog2_FIFO_DEPTH-1:0]w_pointer;
reg w_phase;
reg [clog2_FIFO_DEPTH-1:0]r_pointer;
reg r_phase;
wire wr_en;
wire rd_en;
assign wr_en = wrreq & (~full);
assign rd_en = rdreq & (~empty);

/* Write Data */
always@(posedge clk or negedge arstn)
    begin
        if(~arstn)
           begin
                w_phase <= 1'b0; w_pointer <="0;" end else begin if(wr_en) if(w_pointer="=" fifo_depth - 1'b1) b1; always@(posedge clk) mem[w_pointer]<="data_in;" * read data clk or negedge arstn) if(~arstn) r_pointer r_phase if(rd_en) if(r_pointer="=" assign data_out="mem[r_pointer];" wire empty="(w_pointer==r_pointer)&&(w_phase^~r_phase);" full="(w_pointer==r_pointer)&&(w_phase^r_phase);" always@(*) if(w_phase="=" r_phase) usedw="w_pointer" r_pointer; + w_pointer; endmodule< code></=>

1.2.2 行缓存Linebuffer Module的设计

图 6

图6所示是一个行缓存LineBuffer Module的电路结构图，图中只画出了一个同步FIFO，因为在设计时，我将FIFO的大小固定为8位位宽，因此，如果LineBuffer的pixel_data的位宽为14位，则需要进行(14+8-1)/8 = 2的向上取整运算，计算实现一个LineBuffer所需要的FIFO的个数，然后这些FIFO并连，即以8 bit位为基本总线位宽，将输入的pixel_data的数据进行分割。这里要注意行缓存模块的读有效条件，很自然的，我们可以设置为一行数据的IMAGE_WIDTH的大小，当缓存了一行数据大小后，就可以读出数据了。依据这种思想设计的出的行缓存LineBuffer的具体代码如下所示。

module LineBuffer #
(
    parameter DATA_WIDTH = 14,
    parameter BUFFER_DEPTH = 256,
    parameter FIFO_WIDTH = 8
)
(clk,arstn,data_in,wrreq,data_out,rdreq,usedw,empty,full);

function integer clogb2(input integer bit_depth);
    begin
        for(clogb2 = 0;bit_depth > 0;clogb2 = clogb2 + 1)
            bit_depth = bit_depth >> 1;
    end
endfunction

localparam clog2_BUFFER_DEPTH = clogb2(BUFFER_DEPTH - 1);
localparam clog2_FIFO_WIDTH = clogb2(FIFO_WIDTH - 1);
localparam FIFO_NUM = ((DATA_WIDTH + FIFO_WIDTH -1)>>clog2_FIFO_WIDTH);

input clk;
input arstn;
input [DATA_WIDTH-1:0]data_in;
output [DATA_WIDTH-1:0]data_out;
input wrreq;
input rdreq;
output [clog2_BUFFER_DEPTH:0]usedw;
output empty;
output full;
wire [FIFO_WIDTH-1:0]din_temp[FIFO_NUM-1:0];
wire [FIFO_WIDTH*FIFO_NUM-1:0]dout_temp;

assign data_out[DATA_WIDTH-1:0] = dout_temp[DATA_WIDTH-1:0];

/* Generate the first FIFO */
assign din_temp[0] = data_in[FIFO_WIDTH-1:0];
SynFifo #
(
    .DATA_WIDTH(FIFO_WIDTH),
    .FIFO_DEPTH(BUFFER_DEPTH)
)Fifo_inst_0(
    .clk(clk),
    .arstn(arstn),
    .data_in(din_temp[0]),
    .wrreq(wrreq),
    .rdreq(rdreq),
    .data_out(dout_temp[FIFO_WIDTH-1:0]),
    .usedw(usedw),
    .empty(empty),
    .full(full)
);

generate
    begin:fifo_generate
        genvar i;
        if(FIFO_NUM > 1)
            begin
                for(i=1;i<fifo_num - 1;i="i+1)" begin assign din_temp[i]="data_in[(FIFO_WIDTH*i)+:FIFO_WIDTH];" end din_temp[fifo_num-1]="{{(FIFO_WIDTH*FIFO_NUM-DATA_WIDTH){1'b0}},data_in[DATA_WIDTH-1:FIFO_WIDTH*(FIFO_NUM-1)]};" for(i="1;i<FIFO_NUM;i=i+1)" synfifo #( .data_width(fifo_width), .fifo_depth(buffer_depth) )fifo_inst( .clk(clk), .arstn(arstn), .data_in(din_temp[i]), .wrreq(wrreq), .rdreq(rdreq), .data_out(dout_temp[fifo_width*i+:fifo_width]), .usedw(), .empty(), .full() ); endgenerate endmodule< code></fifo_num>

1.3 行列对齐LineAlign Module

图 7

现在，我们完成了LineBuffer Module的设计，这是我们只需要按照图4所示的菊花链式结构进行设计行列对齐LineAlign模块，行列对齐LineAlign模块的电路结构图如图7所示。图7所示是实现的两行对齐的结构图，将两个行缓存模块进行了菊花链式的连接。对于行列对齐模块，我们需要注意的是首行的读出条件，第一个条件是:当LineBuffer缓存好一行后，后续输入的数据是有效图像像素数据，那么是可以读出的；第二个条件是:之前提到过，图像滤波操作时，会出现图像右边界和下边界出现越界的情况，如图8所示，用一个半径为radiu的core去滤波大小为IH*IW大小图像，会有一个大小为radius的boarder，图8显示了上，下，左，右四个边界，因为行列对齐中的数据有效信号的作用，解决了上边界和左边界的问题，而对于下边界，则是当最后一行数据全部滤波完成后，就达到了滤波运算的下边界。这就是在图7结构中首行读出的第二个条件：当首个LineBuffer中有数据(即FIFO不空)且后续图像数据无效时读出，一直到将首个LineBuffer中的数据全部读出为止。

图 8

如下所示为行列对齐LineAlign模块的具体实现代码。

module LineAlign #(
    parameter DATA_WIDTH = 14,
    parameter BUFFER_DEPTH = 256,
    parameter FIFO_WIDTH = 8,
    parameter LINE_NUM = 3,
    parameter IMAGE_WIDTH = 128

)(clk,arstn,data_in,datain_valid,data_out,dataout_valid);
function integer clogb2(input integer bit_depth);
    begin
        for(clogb2 = 0;bit_depth >0; clogb2 = clogb2+1)
            bit_depth = bit_depth >> 1;
    end
endfunction

localparam DATAOUT_WIDTH = DATA_WIDTH*LINE_NUM;
localparam clog2_BUFFER_DEPTH = clogb2(BUFFER_DEPTH - 1);

input clk;
input arstn;
input [DATA_WIDTH - 1:0]data_in;
input datain_valid;
output [DATAOUT_WIDTH-1:0]data_out;
output dataout_valid;
wire [DATA_WIDTH-1:0]temp_dout[LINE_NUM-1:0];
wire [clog2_BUFFER_DEPTH:0]temp_usedw[LINE_NUM-1:0];
wire [LINE_NUM-1:0]temp_rd_req;
wire [LINE_NUM-1:0]temp_wr_req;
wire [LINE_NUM-1:0]temp_empty;
wire [LINE_NUM-1:0]temp_valid;
wire [LINE_NUM-2:0]temp_dout_valid;
wire temp_rd_req0;
wire temp_rd_req1;

/* The First Line Buffer */
assign data_out[DATA_WIDTH-1:0] = temp_dout[0];
LineBuffer #(
    .DATA_WIDTH(DATA_WIDTH),
    .BUFFER_DEPTH(BUFFER_DEPTH),
    .FIFO_WIDTH(FIFO_WIDTH)
)Inst_LineBuffer_first(
    .clk(clk),
    .arstn(arstn),
    .data_in(data_in),
    .wrreq(temp_wr_req[0]),
    .data_out(temp_dout[0]),
    .rdreq(temp_rd_req[0]),
    .usedw(temp_usedw[0]),
    .empty(temp_empty[0]),
    .full()
);

assign temp_rd_req0 = temp_valid[0] & temp_wr_req[0];
assign temp_rd_req1 = ~(datain_valid | temp_empty[0]);
assign temp_wr_req[0] = datain_valid;
assign temp_valid[0] = (IMAGE_WIDTH == temp_usedw[0]) ? 1:0;
assign temp_rd_req[0] = temp_rd_req0 | temp_rd_req1;

/* generate Other Line Buffer */
generate
    begin
        genvar i;
        for(i=1;i<line_num;i=i+1) begin assign data_out[(data_width*i)+:data_width]="temp_dout[i];" linebuffer #( .data_width(data_width), .buffer_depth(buffer_depth), .fifo_width(fifo_width) )inst_linebuffer( .clk(clk), .arstn(arstn), .data_in(temp_dout[i-1]), .wrreq(temp_wr_req[i]), .data_out(temp_dout[i]), .rdreq(temp_rd_req[i]), .usedw(temp_usedw[i]), .empty(temp_empty[i]), .full() ); temp_valid[i]="(IMAGE_WIDTH" =="temp_usedw[i])" ? 1:0; temp_wr_req[i]="(~temp_empty[i-1])" & temp_rd_req[i-1]; temp_rd_req[i]="temp_valid[i]" temp_wr_req[i]; temp_dout_valid[i-1]="temp_rd_req[i];" end endgenerate dataout_valid="(~temp_empty[0])" (&temp_dout_valid[line_num-2:0]); endmodule< code></line_num;i=i+1)>

图9所示为进行3行行列对齐LineAlign模块的仿真波形图。测试输入的图像IMAGE_WIDTH=240，每行数据都是从1到240，因此图9所示的3行对齐输出数据波形数据正确。

图 9

Original: https://blog.csdn.net/Archar_Saber/article/details/122830173
Author: 被选召的孩子
Title: 基于FPGA的图像处理1–图像处理基础IP设计

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/641269/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Git入门

一、Git介绍概述：工作流程二、Git安装三、Git使用 1.本地仓库 1.1 Git本地操作的三个区域： 1.2工作流程： 1.3基本配置： 1.4创建仓库： 1.5Gi…

人工智能 2023年7月20日
0059
Python日记（7）——主成分分析

Python日记（7）——主成分分析每天做一个Python小练习，顺便记录一些小技巧。主成分分析（PCA）是一个比较常见的特征降维，在许多领域都被广泛运用。主成分分析原理主成分…

人工智能 2023年7月17日
0063
回归分析大法

函数时从自变量到因变量的一种映射关系，在一些问题当中，常常子网根据已有数据确定目标变量（输出及因变量）与其他变量（输入及自变量）当观测到新的输入时，预测其可能的输出值。回归分…

人工智能 2023年6月18日
00107
MongoDB是什么？非关系型数据库的优点？安装使用教程

哈喽！大家好，我是小奇，一位热爱分享的程序员小奇打算以轻松幽默的对话方式来分享一些技术，如果你觉得通过小奇的文章学到了东西，那就给小奇一个赞吧文章持续更新，可以微信搜索【小奇JAV…

人工智能 2023年7月29日
0067
【目标检测】目标检测界的扛把子YOLOv5（原理详解+修炼指南）

文章目录 1.YOLO输入端 * 1.1 Mosaic数据增强 1.2 自适应锚框计算 1.3 自适应图片缩放 2.YOLO总体架构图 * 2.1 BackBone –…

人工智能 2023年7月26日
0065
PyTorch搭建图卷积神经网络（GCN）完成对论文分类及预测实战（附源码和数据集）

需要数据集和源码请点赞关注收藏后评论区留言~~~ 一、数据集简介我们将使用Cora数据集。该数据集共2708个样本点，每个样本点都是一篇科学论文，所有样本点被分为7个类别，类…

人工智能 2023年6月29日
0095
老司机必备的手机浏览器，比UC浏览器还好用

各位听得最多的段子：老司机们，上车了。没错，不管是在电脑端还是移动端，都需要一款好用的浏览器。那么，老司机们都用什么浏览器，什么样的浏览器才是老司机必备的浏览器呢？来咯，这些手机浏…

人工智能 2023年6月28日
00320
机器学习-分类-线性分类器

在一个机器学习任务中，如果每一条数据的目标值是离散的，则该任务是一个分类任务。解决分类问题基本的方法有：线性分类器、决策树、朴素贝叶斯、人工神经网络、K近邻（KNN）、支持向量机…

人工智能 2023年6月30日
0092
信道估计之LMMSE估计

之前的内容讲到了MMSE信道估计，并推导了基于MMSE优化准则的估计结果，该方法是对LS信道估计的进一步优化，适用于低信噪比场合，但由于其计算复杂，所以并不实用。因此又有了LMMS…

人工智能 2023年6月17日
0072
【go微服务】RPC的原理与Go RPC

本文介绍了RPC的概念以及Go语言中标准库rpc的基本使用。什么是RPC RPC（Remote Procedure Call），即远程过程调用。它允许像调用本地服务一样调用远程服…

人工智能 2023年6月26日
0091
ROS C++调用osqp-eigen库的具体操作步骤

odqp作为二次规划库具有非常重要的作用，可以运用于模型预测控制算法（MPC）目前在网站上面已经有很多相关的源码，也有结合Eigen的osqp-eigen代码包，但是很多小伙伴们…

人工智能 2023年6月2日
00106
python+pywinauto—PC端自动化(一)启动程序及菜单控件操作

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月6日
0060
使用PyTorch搭建VGG模型进行图像风格迁移实战（附源码和数据集）

需要源码和图片集请点赞关注收藏后评论区留言或者私信~~~ 一、VGG模型 VGG模型是科学家们提出的图像分类模型，这一模型采用了简单粗暴的堆砌3×3卷积层的方式构建模型，并花费大量…

人工智能 2023年6月28日
0083
SAP Commerce Cloud 里的 User 模型和 Restriction 的关系

SAP Hybris 的 MENU item 可以被分配一个叫做 User Group restriction 的属性。如果一个用户属于一个特殊的用户组，那么菜单项(menu i…

人工智能 2023年6月29日
0071
目标检测学习笔记11——FPN学习与论文解读

文章目录一、引言二、结构对比三、实现细节四、实验结果一、引言论文链接：https://arxiv.org/abs/1612.03144 FPN：Feature Pyra…

人工智能 2023年7月12日
0059
使用Python结合mne.CSP官方样例处理BBCI 2003 二分类MI EEG，并通过SVM进行分类

0.关于数据使用的数据： BBCI 2003：dataset_BCIcomp1.mat 可以通过官网下载官方描述文件： Data set provided by Departm…

人工智能 2023年7月2日
00111

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

基于FPGA的图像处理1–图像处理基础IP设计

1.2.1 同步FIFO Module的设计

1.2.2 行缓存Linebuffer Module的设计

大家都在看