“乒乓操作”是一种常用于数据流控制的处理技巧,可以实现无缝高速数据流缓存。首先“乒乓操作”这个名字本身就很吸引人,其结构一般是由数据选择器和数据缓冲器构成的,数据缓冲模块可以为任何存储模块,比较常用的存储单元为双口 RAM(DPRAM) 、单口 RAM(SPRAM) 、FIFO等。乒乓ram结构:这种结构是将输入数据流通过输入数据选择单元等时地将数据流分配到两个数据缓冲区。通过两个数据缓冲区的读和写的切换,来实现数据的流水式传输。
乒乓操作原理:就是打乒乓球一样,一个球(数据流),两个拍子(缓存),两个拍子相互击球(轮流读写数据,写1读2,写2读1)这样就可以做到球不停一直移动(数据流不会停,数据无丢失)。
其实就是把数据流轮流加载进两个数据缓冲器中,注意这里的数据流始终是要从输入端移动到输出端,只是不同时间选取的路径不同,而不要理解成“乒乓操作”是数据在两端来回传输。换句话说,我们这里的“拍子”是两个缓存器,而不是两端的数据选择器。
(1)第一个缓冲周期:输入数据流缓存入数据缓冲器ram A
(2)第二个缓冲周期:通过输入数据选择单元的切换,输入数据流缓存入数据缓冲器ram B,同时将ram A缓存的第1个周期数据传给输出数据选择单元
(3)第三个缓冲周期:通过输入数据选择单元的切换,输入数据流缓存如数据缓冲器ram A,同时将ram B缓存的第2个周期数据传给输出数据选择单元
…………
乒乓操作的最大特点是通过“输入数据选择单元”和“输出数据选择单元”按节拍、相互配合的切换,将经过缓冲的数据流没有停顿地送到“数据流运算处理模块”进行运算与处理。通过乒乓操作实现低速模块处理高速数据的实质是:通过缓存单元实现了数据流的串并转换,并行用 “ 数据缓冲器ram A” 和 “ 数据缓冲器ram B” 处理分流的数据,是面积与速度互换原则的体现。
在低速处理高速数据流时,可以使用乒乓操作,举个栗子,10M的数据流,用乒乓操作,分流成两个FIFO,一个FIFO的吞吐速度只有原来的一半5M,就可以满足低速的处理方法,处理高速的数据,处理后在用合并成一个10M的数据流,数据就被不丢失且高速的处理过了,top层看起就是10M的处理速度了。
我们在这里就尝试实现上文提到的“乒乓操作”的例子,10M的数据流,用乒乓操作,分流成两个FIFO,一个FIFO的吞吐速度只有原来的一半5M,就可以满足低速的处理方法,处理高速的数据,处理后在用合并成一个10M的数据流。
在进行代码编写之前要做的就是明确接口信号和模块划分,在之前的内容中我们已经明确了“乒乓操作”的结构及具体功能,那首先就可以进行模块的划分:
(1)ramA,ramB:这个独立的两个数据缓冲器,这里考虑使用xilinx提供的IP核实现单口RAM。
(2)ram_ctrl:用作RAM的控制,对应结构中的输入数据选择器和输出数据选择器结构,这里选择把这两个部分写在同一个模块中了。
(3)data_gen:数据生成模块,由于我们这只是一个“乒乓操作”的测试代码,所以需要自己编写数据生成模块,实现数据的产生。
(4)clk_gen:时钟生成模块,生成5M和10M时钟,也是用IP核的方式实现
通过BRAM资源,使用的是简单双口RAM,读写位宽设置为8,深度设置为32.
设计系统输入时钟是100MHZ,输出时钟有2个分别为clk_5M和clk_10M。
数据生成模块的设计,这里我们可以设计数据从0开始在10MHZ时钟的驱动下,逐渐加1。
//-----------------------------<数据生成模块>-----------------------------
module data_gen(
input clk,
input rst,
output data_en,
output reg [7:0] data_gen
);
always@(posedge clk or posedge rst)begin
if(rst)
data_gen <= 8'b0;
else if (data_gen == 8'd31)
data_gen <= 8'b0;
else
data_gen <= data_gen + 1'b1;
end
assign data_en = (rst == 1'b1) ? 1'b0 : 1'b1;
endmodule
module ram_ctrl(
input clk_5M,
input clk_10M,
input rst,
input [7:0] data_gen, //数据生成模块生成的数据
input data_en, //数据使能信号,表示数据是否有效
input [7:0]ram1_data, //ram1中读出的数据
input [7:0]ram2_data, //ram2中读出的数据
output ram1_ena,
output ram1_wea,
output ram1_enb,
output reg [4:0] ram1_addra,
output reg [4:0] ram1_addrb,
output [7:0] ram1_din,
output ram2_ena,
output ram2_wea,
output ram2_enb,
output reg [4:0] ram2_addra,
output reg [4:0] ram2_addrb,
output [7:0] ram2_din,
output reg [7:0] dout
);
//----------------------------<状态定义>---------------------------------
parameter IDLE = 4'b0001; //初始状态
parameter WRAM1 = 4'b0010; //写RAM1
parameter R1_W2 = 4'b0100; //写RAM2,读RAM1
parameter W1_R2 = 4'b1000; //写RAM1,读RAM2
reg [3:0] state,next_state; //状态寄存器
always@(posedge clk_10M or posedge rst)begin
if(rst)
state <= IDLE;
else
state <= next_state;
end
always@(*)begin
case(state)
IDLE : next_state = data_en ? WRAM1 : IDLE ;
WRAM1 : next_state = (ram1_addra == 5'd31) ? R1_W2 : WRAM1 ;
R1_W2 : next_state = (ram2_addra == 5'd31) ? W1_R2 : R1_W2 ;
W1_R2 : next_state = (ram1_addra == 5'd31) ? R1_W2 : W1_R2 ;
default : next_state = IDLE;
endcase
end
assign ram1_ena = data_en;
assign ram1_enb = data_en;
assign ram2_ena = data_en;
assign ram2_enb = data_en;
assign ram1_wea = (state == WRAM1 || state == W1_R2) ? 1'b1 : 1'b0 ;
assign ram2_wea = (state == R1_W2) ? 1'b1 : 1'b0 ;
always@(posedge clk_10M or posedge rst)begin
if(rst) begin
ram1_addra <= 0;
ram2_addra <= 0;
end
else if (ram1_addra == 'd31 || ram1_addra == 'd31)begin
ram1_addra <= 0;
ram2_addra <= 0;
end
else begin
case(state)
WRAM1 : ram1_addra <= ram1_addra + 1'b1;
R1_W2 : ram2_addra <= ram2_addra + 1'b1;
W1_R2 : ram1_addra <= ram1_addra + 1'b1;
default : begin
ram1_addra <= ram1_addra;
ram2_addra <= ram2_addra;
end
endcase
end
end
always@(posedge clk_10M or posedge rst)begin
if(rst) begin
ram1_addrb <= 0;
ram2_addrb <= 0;
end
else if (ram1_addrb == 'd31 || ram2_addrb == 'd31)begin
ram1_addrb <= 0;
ram2_addrb <= 0;
end
else begin
case(state)
R1_W2 : ram1_addrb <= ram1_addrb + 1'b1;
W1_R2 : ram2_addrb <= ram2_addrb + 1'b1;
default : begin
ram1_addrb <= ram1_addrb;
ram2_addrb <= ram2_addrb;
end
endcase
end
end
assign ram1_din = (state == WRAM1 || state == W1_R2) ? data_gen : 8'b0;
assign ram2_din = (state == R1_W2) ? data_gen : 8'b0;
//打一拍来获得正确的输出
reg [3:0] state_reg;
always@(posedge clk_10M)begin
state_reg <= state;
end
always@(*)begin
case(state_reg)
R1_W2 : dout = ram1_data;
W1_R2 : dout = ram2_data;
default : dout = 8'b0;
endcase
end
endmodule
module pingpang(
input sys_clk,
input rst,
output [7:0] dout
);
wire clk_5M,clk_10M;
wire data_en;
wire [7:0] data_gen;
wire ram1_ena,ram1_enb,ram2_ena,ram2_enb;
wire ram1_wea,ram2_wea;
wire [4:0] ram1_addra,ram2_addra;
wire [4:0] ram1_addrb,ram2_addrb;
wire [7:0] ram1_data,ram2_data;
wire [7:0] ram1_din,ram2_din;
clk_div clk_div_u1(
.clk_5M ( clk_5M ),
.clk_10M ( clk_10M ),
.reset ( rst ),
.clk_in1 ( sys_clk )
);
data_gen data_gen_u1(
.clk ( clk_10M ),
.rst ( rst ),
.data_en ( data_en ),
.data_gen ( data_gen )
);
ram ram1(
.clka ( clk_10M ), // input wire clka
.ena ( ram1_ena ), // input wire ena
.wea ( ram1_wea ), // input wire [0 : 0] wea
.addra ( ram1_addra ), // input wire [4 : 0] addra
.dina ( ram1_din ), // input wire [7 : 0] dina
.clkb ( clk_10M ), // input wire clkb
.enb ( ram1_enb ), // input wire enb
.addrb ( ram1_addrb ), // input wire [4 : 0] addrb
.doutb ( ram1_data ) // output wire [7 : 0] doutb
);
ram ram2(
.clka ( clk_10M ), // input wire clka
.ena ( ram2_ena ), // input wire ena
.wea ( ram2_wea ), // input wire [0 : 0] wea
.addra ( ram2_addra ), // input wire [4 : 0] addra
.dina ( ram2_din ), // input wire [7 : 0] dina
.clkb ( clk_10M ), // input wire clkb
.enb ( ram2_enb ), // input wire enb
.addrb ( ram2_addrb ), // input wire [4 : 0] addrb
.doutb ( ram2_data ) // output wire [7 : 0] doutb
);
ram_ctrl ram_ctrl_u1(
.clk_5M ( clk_5M ),
.clk_10M ( clk_10M ),
.rst ( rst ),
.data_gen ( data_gen ),
.data_en ( data_en ),
.ram1_data ( ram1_data ),
.ram2_data ( ram2_data ),
.ram1_ena ( ram1_ena ),
.ram1_wea ( ram1_wea ),
.ram1_enb ( ram1_enb ),
.ram1_addra ( ram1_addra ),
.ram1_addrb ( ram1_addrb ),
.ram1_din ( ram1_din ),
.ram2_ena ( ram2_ena ),
.ram2_wea ( ram2_wea ),
.ram2_enb ( ram2_enb ),
.ram2_addra ( ram2_addra ),
.ram2_addrb ( ram2_addrb ),
.ram2_din ( ram2_din ),
.dout ( dout )
);
endmodule
`timescale 1ns / 1ps
module tb_pingpang();
reg sys_clk;
reg rst;
wire [7:0] dout;
always #5 sys_clk = ~sys_clk;
initial begin
sys_clk <= 0;
rst <= 0;
#15
rst <= 1;
#10
rst <= 0;
end
pingpang pingpang_u1(
.sys_clk ( sys_clk ),
.rst ( rst ),
.dout ( dout )
);
endmodule