在FPGA开发中,我们经常会遇到数据跨时钟域的情况,在不需要缓存的情况下,直接对clk1域下的数据,使用clk2打两拍以消除亚稳态,即可实现数据的跨时钟域,而如果遇到需要数据缓存的情况,一般会使用异步FIFO。
本文首先对异步FIFO的跨时钟域同步原理进行介绍,然后给出异步FIFO的verilog实现。
对于FPGA实现队列,一般使用循环队列这种数据结构进行实现,通过 head、tail 两个指针标识队列的头部元素和尾部元素。头指针 head 指向即将读取的元素,tail 指向即将写入的位置。关于循环队列本身这里不再过多解释。
在 c 语言中实现的循环队列,由于写入、读取都是顺序进行的,不存在数据跨时钟域的情况,因此其 head、tail 指针在写入、读取过程中都是共用的。而在异步 FIFO 中,由于读写跨时钟域,因此在写时钟域更新 tail 指针,而在读时钟域更新 head 指针,因此若要在写时钟域判断队列满(在读时钟域判断队列空),就要把读(写)时钟域的 head (tail) 指针同步到写(读)时钟域。为了保证数据传输的稳定性,在数据同步中一般使用格雷码(Gray Code),即通过如下过程进行指针的跨时钟域数据同步:
FIFO 常用的一些信号如下:
上述信号分属读/写两个时钟域,其中在写时钟域的信号,均应使用 head_wr、tail_wr 构建,与 clk_wr 保持同步;而属于读时钟域的信号,均应使用 head_rd、tail_rd 构建,与 clk_rd 保持同步。
信号含义及产生方式详见下方代码实现。
/*
* file : FIFO.v
* author : 今朝无言
* date : 2022-10-01
* description : 异步FIFO,进行了读时钟域、写时钟域间的数据同步(head以及tail),Gray Code
*/
module FIFO(
input rst_n, //复位信号,清空队列
input wr_clk, //写时钟
input wr_en, //写使能信号,=1时每个wr_clk上升沿将数据din加入队尾
input [Width-1:0] din, //写入数据,wr域
input rd_clk, //读时钟
input rd_en, //读使能信号,=1时每个rd_clk上升沿将队首元素输出至dout
output reg [Width-1:0] dout, //读出数据,rd域
output reg full, //写满标志,wr域
output reg empty, //读空标志,rd域
output reg almost_full, //将满标志,wr域
output reg almost_empty, //将空标志,rd域
output reg overflow, //写溢出标志,wr域
output reg underflow, //读越界标志,rd域
output reg ack, //写应答标志,表示本次成功写入,wr域
output reg valid, //读有效标志,表示本次成功读取,rd域
output reg [W_cnt-1:0] cnt_element_wr, //队列元素计数,wr域
output reg [W_cnt-1:0] cnt_element_rd //队列元素计数,rd域
);
//实现技术:循环队列
parameter Width = 8; //数据位宽
parameter Deepth = 64; //此为RAM大小,实际容量减一 为保证Gray码的循环,应保证为2的次幂
localparam W_cnt = clogb2(Deepth-1); //计数器位宽
wire [W_cnt-1:0] head_wr; //队首指针,wr_clk时钟域,由head_rd同步到写时钟域
reg [W_cnt-1:0] tail_wr = 0; //队尾指针,指向即将写入的地址,wr_clk时钟域
reg [W_cnt-1:0] head_rd = 0; //队首指针,指向即将读出的数据地址,rd_clk时钟域
wire [W_cnt-1:0] tail_rd; //队尾指针,rd_clk时钟域,由tail_wr同步到读时钟域
reg [Width-1:0] Queue [0:Deepth-1]; //RAM
//这样的RAM是分布式RAM,消耗资源会比较多,可能的话可以转换成使用IP核创建的Block RAM,那样要加控制时序,复杂些
//--------------------------------数据同步----------------------------------
//-----------------tail同步---------------------
wire [W_cnt-1:0] tail_gray_wr;
reg [W_cnt-1:0] tail_gray_rd;
reg [W_cnt-1:0] tail_gray_reg1;
// bin -> gray
Binary2Gray #(.Width(W_cnt))
Binary2Gray_tail(
.bin (tail_wr),
.gray (tail_gray_wr)
);
//打两拍,同步至rd域
always @(posedge rd_clk)begin
tail_gray_reg1 <= tail_gray_wr;
tail_gray_rd <= tail_gray_reg1;
end
// gray -> bin
Gray2Binary #(.Width(W_cnt))
Gray2Binary_tail(
.gray (tail_gray_rd),
.bin (tail_rd)
);
//-----------------head同步---------------------
wire [W_cnt-1:0] head_gray_rd;
reg [W_cnt-1:0] head_gray_wr;
reg [W_cnt-1:0] head_gray_reg1;
// bin -> gray
Binary2Gray #(.Width(W_cnt))
Binary2Gray_head(
.bin (head_rd),
.gray (head_gray_rd)
);
//打两拍,同步至wr域
always @(posedge wr_clk)begin
head_gray_reg1 <= head_gray_rd;
head_gray_wr <= head_gray_reg1;
end
// gray -> bin
Gray2Binary #(.Width(W_cnt))
Gray2Binary_head(
.gray (head_gray_wr),
.bin (head_wr)
);
//--------------------------------读写控制----------------------------------
//write
always @(posedge wr_clk or negedge rst_n) begin
if(~rst_n) begin
tail_wr <= 0;
end
else begin
if(wr_en && ~full) begin
Queue[tail_wr] <= din;
tail_wr <= (tail_wr == Deepth - 1)? 0 : tail_wr + 1'b1;
ack <= 1'b1;
overflow <= 1'b0;
end
else if(wr_en && full) begin
overflow <= 1'b1;
ack <= 1'b0;
end
else begin
overflow <= 1'b0;
ack <= 1'b0;
end
end
end
//read
always @(posedge rd_clk or negedge rst_n) begin
if(~rst_n) begin
head_rd <= 0;
end
else begin
if(rd_en && ~empty) begin
dout <= Queue[head_rd];
head_rd <= (head_rd == Deepth - 1)? 0 : head_rd + 1'b1;
valid <= 1'b1;
underflow <= 1'b0;
end
else if(rd_en && empty) begin
underflow <= 1'b1;
valid <= 1'b0;
end
else begin
underflow <= 1'b0;
valid <= 1'b0;
end
end
end
//--------------------------------flags----------------------------------
always @(*) begin
//empty标志,rd域
if(head_rd == tail_rd) begin
empty <= 1;
end
else begin
empty <= 0;
end
//full标志,wr域
if((head_wr == tail_wr + 1) || ((tail_wr == Deepth) && (head_wr == 0))) begin
full <= 1;
end
else begin
full <= 0;
end
//元素计数,wr域
if(tail_wr > head_wr) begin
cnt_element_wr <= tail_wr - head_wr;
end
else begin
cnt_element_wr <= tail_wr + Deepth - head_wr;
end
//元素计数,rd域
if(tail_rd > head_rd) begin
cnt_element_rd <= tail_rd - head_rd;
end
else begin
cnt_element_rd <= tail_rd + Deepth - head_rd;
end
//将满标志almost_full,wr域
if((head_wr == tail_wr + 2) || ((tail_wr == Deepth) && (head_wr == 1))
|| ((tail_wr == Deepth - 1) && (head_wr == 0))) begin
almost_full <= 1'b1;
end
else begin
almost_full <= full; //将满标志覆盖满标志,如果希望full时almost_full为L,将这里改成0即可
end
//将空标志almost_empty,rd域
if((head_rd + 1 == tail_rd) || ((head_rd == Deepth) && (tail_rd == 0))) begin
almost_empty <= 1'b1;
end
else begin
almost_empty <= empty; //将空标志覆盖空标志,如果希望empty时almost_empty为L,将这里改成0即可
end
end
//------------------------log2-----------------------------
function integer clogb2 (input integer depth);
begin
for (clogb2=0; depth>0; clogb2=clogb2+1)
depth = depth >> 1;
end
endfunction
endmodule
/*
* file : Gray2Binary.v
* author : 今朝无言
* date : 2022-10-01
*/
module Binary2Gray(
input [Width-1:0] bin,
output reg [Width-1:0] gray
);
parameter Width = 8; //二进制与格雷码位宽
// 对于二进制码 B_{n-1},B_{n-2},...B_1,B_0
// 格雷码 G_{n-1},G_{n-2},...,G_1,G_0
// 对于最高位,G_{n-1} = B_{n-1}
// 对于其他位,G_i = B_{i+1} ^ B_i,i=0,1,2,...,n-2
// 其实最高位相当于 G_{n-1} = B_n ^ B_{n-1},而 B_n=0,因此 G_{n-1} = 0 ^ B_{n-1} = B_{n-1}
integer i;
always @(bin) begin
gray[Width-1] <= bin[Width-1];
for(i=0; i> 1) ^ bin;
endmodule
/*
* file : Gray2Binary.v
* author : 今朝无言
* date : 2022-10-01
*/
module Gray2Binary(
input [Width-1:0] gray,
output reg [Width-1:0] bin
);
parameter Width = 8; //二进制与格雷码位宽
// 对于二进制码 B_{n-1},B_{n-2},...B_1,B_0
// 格雷码 G_{n-1},G_{n-2},...,G_1,G_0
// 对于最高位,B_{n-1} = G_{n-1}
// 对于其他位,B_i = G_i ^ B_{i+1},i=0,1,2,...,n-2
// 最高位相当于 B_{n-1} = G_{n-1} ^ B_n,而 B_n=0,因此 B_{n-1} = G_{n-1} ^ 0 = G_{n-1}
integer i;
always @(gray) begin
bin[Width-1] = gray[Width-1]; //注意要使用阻塞赋值,因为使用到了本轮计算的高位结果
for(i=Width-2; i>=0; i=i-1) begin
bin[i] = bin[i+1] ^ gray[i];
end
end
endmodule
`timescale 1ns / 1ps
//FIFO.v 测试
module FIFO_tb();
//------------------------------变量声明---------------------------------
reg wr_clk = 0;
reg rd_clk = 0;
reg [7:0] din;
reg wr_en;
reg rd_en;
wire [7:0] dout;
wire full;
wire almost_full;
wire ack;
wire overflow;
wire empty;
wire almost_empty;
wire valid;
wire underflow;
wire [6:0] cnt_element_wr;
wire [6:0] cnt_element_rd;
//-------------------------------test--------------------------------
always #6 begin
wr_clk <= ~wr_clk;
end
always #5 begin
rd_clk <= ~rd_clk;
end
initial begin
din <= 0;
wr_en <= 0;
rd_en <= 0;
#200;
wr_func(32); //写32个数据
#100;
rd_func(35); //读35个数据,测试empty、almost_empty信号
#100;
wr_func(130); //写130(超出数据容量上限127),测试full、almost_full信号
#100;
rd_func(30); //读30个数据
#100;
$stop;
end
//-----------测试写入功能---------------
task wr_func;
input [7:0] cnt; //写入 0~cnt-1 共 cnt 个数据
integer i;
begin
din <= 0;
wr_en <= 1;
wait(~wr_clk);
for(i=0; i
testbench中,初始化队列长度128,因此最多可写入127个数据。以下对写入过程以及读取过程 flags 信号的变化进行测试分析。
如图所示,当写域时钟 wr_clk 上升沿到达时,检测写使能信号 wr_en ,若为 H,则进行数据写入。由于此时队列非满,成功写入数据,因此同时给出写应答信号 ack=H 表示数据成功写入。写域数据个数 cnt_element_wr 也同步更新。
如图所示,由于队列大小128,最大可装填数据个数为127,因此当写入第126个数据(125)后,队列将满,因此将满信号 almost_full 置高。由于数据成功写入,因此给出写入成功标志 ack=H,同时更新写域数据个数 cnt_element_wr 。
如图所示,写入第127个数据(126)后,队列满,因此给出满信号 full=H。由于数据成功写入,因此给出写入成功标志 ack=H,同时更新写域数据个数 cnt_element_wr 。
如图所示,由于此时队列已满,无法继续向 FIFO 中写入数据,因此写入失败,给出写失败标志 ack=L ,同时给出写溢出标志 overflow=H 。
如图所示,在读域时钟 rd_clk 的上升沿,若读使能信号有效(rd_en=H),进行数据读取。由于此情况下成功读到数据,因此给出读有效信号 valid=H,同时更新读域元素个数 cnt_element_rd。
如图所示,由于之前写入了32个数据(0~31),因此进行第31次读取后,队列中仅剩最后一个元素,此时给出将空信号 almost_empty=H。由于成功读取,因此给出读有效信号 valid=H,同时更新读域元素个数 cnt_element_rd,此时 cnt_element_rd 将等于1,表示还剩最后一个可读取元素。
如图所示,读取最后一个元素,读取后队列空,因此给出队空信号 empty=H。由于成功读取,因此给出读有效信号 valid=H,同时更新读域元素个数 cnt_element_rd,此时 cnt_element_rd 将等于0,表示队列已无可继续读取的数据。
如图所示,由于队列已空,已无可读取数据,因此读取失败,给出读无效标志 valid=L,同时给出读溢出标志 underflow=H。