背景:卷积的c程序用于FPGA生成IPcore,其中参数的传输用的stream格式。
目的:读懂这个程序
相应的单片机程序参考。文档UG902相关内容。
DMA在linux下PS端c语言相关内容
目录
1. template 模板
1.1函数模板
1.2类模板
1.3参数模板
1.4模板专门化
2.#ifndef,防止重复编译
3. iostream
4. C++中的&
4.1 取址&
4.2 引用&
主程序解析
5.全局变量与局部变量
6. IPcore主函数的核心:输入输出
读懂相关程序
//top.h
#ifndef __TOP_H
#define __TOP_H
template
struct ap_axif{
float data;
ap_uint<(D+7)/8> keep;
ap_uint<(D+7)/8> strb;
ap_uint user;
ap_uint<1> last;
ap_uint id;
ap_uint dest;
};
typedef ap_axiu<32,1,1,1> AXI_VALUE;
typedef hls::stream AXI_STREAM;
void axi_stream_top(AXI_STREAM &inStream, AXI_STREAM &outStream);
#endif
1. template 模板
模板(Template)指C++程序设计设计语言中采用类型作为参数的程序设计,支持通用程序设计。C++ 的标准库提供许多有用的函数大多结合了模板的观念,如STL以及IO Stream。
c++模板总结https://blog.csdn.net/qq_35637562/article/details/55194097
-
1.1函数模板
Template
返回类型 函数名(形参表)
{//函数定义体 }
template是一个声明模板的关键字,在模板定义语法中关键字class与typename的作用完全一样。声明一个模板关键字class不能省略,如果类型形参多余一个 ,每个形参前都要加class <类型 形参表>可以包含基本数据类型也可以包含类类型.
//exmaple
template
T min(T x,T y)
{ return(x
程序分析:main()函数中定义了两个整型变量n1 , n2 两个双精度类型变量d1 , d2然后调用min( n1, n2); 即实例化函数模板T min(T x, T y)其中T为int型,求出n1,n2中的最小值.同理调用min(d1,d2)时,,T为double型,求出d1,d2中的最小值.
-
1.2类模板
类模板的写法
Template < class或者也可以用typename T >
class类名{
//类定义......
};
关于类模板的使用:类模板的使用实际上是将类模板实例化成一个具体的类,它的格式为:类名<实际的类型>
-
1.3参数模板
模板可以有类型参数,也可以有常规的类型参数int,也可以有默认模板参数,
-
1.4模板专门化
当我们要定义模板的不同实现,我们可以使用模板的专门化。例如我们定义的stack类模板,如果是char*类型的栈,我们希望可以复制char的所有数据到stack类中,因为只是保存char指针,char指针指向的内存有可能会失效,stack弹出的堆栈元素char指针,指向的内存可能已经无效了。还有我们定义的swap函数模板,在vector或者list等容器类型时,如果容器保存的对象很大,会占用大量内存,性能下降,因为要产生一个临时的大对象保存a,这些都需要模板的专门化才能解决。
2.#ifndef,防止重复编译
2.1 #ifndef x //先测试x是否被宏定义过
2.2 #define x ... //如果没有宏定义下面就宏定义x并编译下面的语句
2.3 #endif //如果已经定义了则编译#endif后面的语句
条件指示符#ifndef检查预编译常量在前面是否已经被宏定义。如果在前面没有被宏定义,则条件指示符的值为真,于是从#ifndef到#endif之间的所有语句都被包含进来进行编译处理。相反,如果#ifndef指示符的值为假,则它与#endif指示符之间的行将被忽略。条件指示符#ifndef 的最主要目的是防止头文件的重复包含和编译。
3. iostream
iostream 库的基础是两种命名为 istream 和 ostream 的类型,分别表示输入流和输出流。流是指要从某种 IO 设备上读出或写入的字符序列。术语“流”试图说明字符是随着时间顺序生成或消耗的。
标准库定义了 4 个 IO 对象。处理输入时使用命名为 cin(读作 see-in)的 istream 类型对象。这个对象也称为标准输入。处理输出时使用命名为 cout(读作 see-out)的 ostream 类型对象,这个对象也称为标准输出。标准库还定义了另外两个 ostream 对象,分别命名为 cerr 和 clog(分别读作“see-err”和“see-log”)。cerr 对象又叫作标准错误,通常用来输出警告和错误信息给程序的使用者。而 clog 对象用于产生程序执行的一般信息。
因此,当使用时,相当于在c中调用库函数,使用的是全局命名空间,也就是早期的c++实现;当使用的时候,该头文件没有定义全局命名空间,必须使用namespace std;这样才能正确使用cout。
>>运算符,用来从一个istream对象读取输入数据;
<<运算符,用来向一个ostream对象写入输出数据;
//iostream example
int test_iostream_cin()
{
char name[50];
std::cout << "Please enter your name: ";
std::cin >> name;
std::cout << "Your name is: " << name << std::endl;
return 0;
}
4. C++中的&
&符号可以用于位与,取址,引用。
4.1 取址&
变量前面加上&即可。
int i = 0 , *pi = &i; //指针pi获得了i的地址
int ** p_pi = π //指针p_pi获得了pi的地址
cout << &i << endl
<< &pi << endl << &p_pi; //可以输出地址
4.2 引用&
引用就是被引变量的另一个名字 , 当改变引用值时 , 被引值也会改变 , 因为它们两就是同一个值 , 另外 , 引用不能脱离对象单独存在 , 引用是依附与对象存在的 , 因为引用在定义后可能被使用 , 所以引用不能是无对象的 , 所以引用在定义时必须初始化。
int i = 0 , &ri = i; //定义并初始化一个引用
ri++; //使i的值加1
//int &ri2; 这里是非法的 , 因为定义了引用ri2却没有初始化它 , 在这行代码和下一行之间可能使用无对象的引用
//ri2 = i;
//int &ri3 = 10;
//错误 , 引用必须有对象 , 常量没有对象int i = 0 , j = 0;
int & ri = i; //合法 , ri是i的引用
ri = j; //合法 , ri是j的引用int i = 0;
int &ri = i , *pi = &i; //前一个&是引用 , 与类型名绑定在一起 , 后一个是取地址
cout << ri << endl; //输出i的值
cout << &i << endl; //输出i的地址
cout << &ri << endl; //输出ri的地址
cout << &pi << endl; //输出pi的地址
为什么要有引用 , 在C++这样一种重视效率的语言里 , 必然需要这样一种类型 , 但我们调用一个函数时 , 就必须把参数全部复制一次 , 这样既浪费时间又浪费空间 , 但当我们把函数列表中的形参改为该类型的引用时 , 编译器就不会把整个对象复制进去 , 而只是把对象的地址传过去 , 这样在函数里使用的就是实参本身了 , 也能够修改它的值。
void reference_test(int &i){ //传入的是引用,不是地址!
cout << i <
主程序解析
//cnn.cpp
#include
#include
#include
#include "parameters.h"
#include "necstream.hpp"
#define REAL float
#define BIT_WIDTH 32
/* DMA constants */
float weights[16*27] = {}
void cnn(FloatStream streamIn, FloatStream streamOut)
{
FloatAxis tmp;
int i, j, k;
int sof = 1;
//DMA buffer and pointers
REAL buf_in[27*600];
REAL buf_out[16*600];
//REAL weights[16*27];
REAL temp, result;
//Load input image data
for (i = 0; i < 27 * 600; i++) {
#pragma HLS PIPELINE II=1
buf_in[i] = streamPop < float, FloatAxis, FloatStream > (streamIn);
}
for (i = 0; i < 16; i++) {
for (j = 0; j < 600; j++) {
result = 0;
for (k = 0; k < 27; k++) {
temp = weights[i*27+k] * buf_in[k*600+j];
result += temp;
}
buf_out[i*600+j] = result;
}
}
for (i = 0; i < 16 * 600; i++) {
//#pragma HLS PIPELINE II=1
FloatAxis d;
d.data = buf_out[i];
if (sof) {
d.user = 1;
sof = 0;
} else {
d.user = 0;
}
if (i == 16*600 - 1)
d.last = 1;
else
d.last = 0;
d.keep = -1;
streamOut << d;
}
}
5.全局变量与局部变量
//example
int a,b; /*外部变量*/
void f1() /*函数f1*/
{
……
}
float x,y; /*外部变量*/
int f2() /*函数f2*/
{
……
}
main() /*主函数*/
{
int maomi();
……
}/*全局变量x,y作用域 全局变量a,b作用域*/
- 从上例可以看出a、b、x、y 都是在函数外部定义的外部变量,都是全局变量。但x,y 定义在函数f1之后,而在f1内又无对x,y的说明,所以它们在f1内无效。 a,b定义在源程序最前面,因此在f1,f2及main内不加说明也可使用。
- 全局变量是使用相同的内存块在整个类中存储一个值.
- 全局变量extern与static:extern在其他源程序中也可以使用;static只能在本程序中使用。
- 所以程序中的weights算是全局变量,(存储在DMA constants中?)主函数中可以调用。
6. IPcore主函数的核心:输入输出
输入:buf_in[i] = streamPop < float, FloatAxis, FloatStream> (streamIn);
streamPop是个类模板。其中有三个参数,float,FloatAxis,FloatStream
6.1 FloatStream和UIntStream分别表示float和unsigned int类型的数据流。
在necstream.hpp程序中的定义:
typedef my_ap_axis FloatAxis;
typedef my_ap_axis UIntAxis;
typedef hls::stream FloatStream;
typedef hls::stream UIntStream;
6.2 streamPop 是一个函数,它的定义也在necstream.hpp中
template
RET streamPop(STREAM &stream){
RET value;
DATA axisData;
stream >> axisData;
value = axisData.data;
return value;
}
这个函数的的意思就是把单片机送来的stream送给axisData,然后把axisData.data给value,从而实现从单片机中送来的数据读入IPcore。这样看来单片机中的数据不止是数据,有其他的内容,而IPcore中程序需要用的value只是单片机送来的stream中的一部分。
所以相应的template
分别对应streamPop < float, FloatAxis, FloatStream> (streamIn);
主函数后面的参数(streamIn)对应于模板里面RET streamPop(STREAM &stream)中的(STREAM &stream)
6.3 输入和输出中,IPcore需要用于运算的数据仅仅是数据data,而与单片机通信的是stream,stream中包括data,但比data多一些其他的内容。
输出时,除了相应的d.data是需要的数据外,多一个d.user和d.last,这个在数据流之中,意思是当d.user为1时意思是数据流的开始,d.last为1时表示数据流的结束。
6.4 具体的输入输出流操作
输入输出参见上面3
>>运算符,用来从一个istream对象读取输入数据;
<<运算符,用来向一个ostream对象写入输出数据;
6.4.1 数据传入中,用streamPop函数来向IPcore传数据,stream>>axisData
template
RET streamPop(STREAM &stream){
RET value;
DATA axisData;
stream >> axisData;
value = axisData.data;
return value;
}
6.4.2 数据传出中,加一个d.user和d.last之后,直接<<,把数据传给输出流streamOut
FloatAxis d;
d.data = buf_out[i];//定义d.data
//定义d.user和d.last和d.keep
streamOut << d;