HLS函数层面优化

1 代码风格

代码风格主要说的就是函数的参数,针对参数要看的就是数据类型
C++里面定义的数据类型是以 8 为边界的,如 char、short 等,但在实际硬件上可能会遇到任意精度的数据类型。所以如果算法使用到的数据是任意精度那么一定要将其定义为任意精度。

HLS函数层面优化_第1张图片

2 Inline

对函数的 inline 就是去除了函数的层次化,可以通过 INLINE 这个 directive 来实现。对函数 inlining 的好处是可以改善资源消耗,因为 inline 之后就不再需要调用函数的相关逻辑。

Inlinin 之后在综合后的 RTL 代码中相应的函数结构就没有了。 可以改善相应的 QoR(quality of results)

3 Allocation

Allocation 实际上是定义了函数和相应的 RTL module 之间的关系,也就是定义了在 RTL代码中实现某个具体函数或者操作的实例数量。这个功能可以通过 ALLOCATION 这个directive 来实现。

Allocation 的主要作用就是使相同函数被多次调用时可以有多个实例,这样可以使之并行执行,能够改善 latency 并提高吞吐率,但是要占用更多的资源。
limit RTL个数。

折中latency area

4 Dataflow

Dataflow 在 for 循环优化中用到过,在这里应用于函数。

在默认情况下,数据相关的函数之间是按顺序执行的,当 Dataflow 之后,顺序处理就变成了并行处理。函数之间通过 Channel 连接,channel 可以时 ping-pong RAM 也可以是 FIFO。

DATAFLOW 允许任务之间有交叠(overlap),这里的重叠就是上述的并行处理(parallel process),这种机制可以降低 latency。

你可能感兴趣的:(HLS)