vacajk

【XRT Vitis-Tutorials】视频处理加速（Kernel+VCU）

1 前言

前面文章导航：
ZCU106 XRT环境搭建
ZCU106 XRT Vivado工程分析
ZCU106 XRT PetaLinux工程分析
【XRT Vitis-Tutorials】RTL Kernels测试
【XRT Vitis-Tutorials】C++/RTL Kernel混合编程测试
【XRT Vitis-Tutorials】图像并行计算
【XRT Vitis-Tutorials】cl调度优化

官方文档：
2019.2 Vitis™ Application Acceleration Development Flow Tutorials
Vitis Unified Software Platform Documentation Application Acceleration Development
Vitis Unified Software Platform Documentation Embedded Software Development

Vitis ZCU106 Platform
ZCU106 Vitis Platform

pre-built，直接下载并复制到SD卡即可测试：
ZCU106 Test Image

使用VCU的代码：
zcu106_codec

2 创建Vitis工程

本篇文章来测试Tutorials中的第4个例子：Convolution Example
该例子中主要目的是对视频进行处理，其中进行了多个实验，从CPU单独运行到最后的RTL加速运行。

2.1 CPU Only

该实验使用纯CPU的方法对视频图像处理进行了测试。

2.1.1 新建工程

在Vitis中创建一个新的Application Project
平台：zcu106vcu_base并命名为conv_system
APP：conv_cpu

2.1.2 添加源码

我们将需要编译的内容直接添加到src目录下，包括：
design/cpu_src目录下的所有内容
最终的工程目录结构如下图：

2.1.3 代码分析

创建两个ffmpeg实例，一个用于读取MP4文件并解码读出，一个用于编码后写入新的MP4文件
读取MP4文件并解码出图像
将解码出的图像进行conv计算
将conv输出的图像灰度化
将灰度化的图像写入MP4文件

2.1.4 固件编译

由于该实验是CPU Only，所以没有需要进行加速的RTL部分。所以直接使用Vitis进行交叉编译即可。为了更快速的运行程序，将优化编译选项配置成 -O3

2.1.5 测试验证

将固件复制到SD卡，然后运行命令进行测试

A53 CPU运行测试：

root@zcu106vcu_base:~# cp /mnt/conv_cpu.exe ./conv_cpu.exe
root@zcu106vcu_base:~# cp /mnt/video.mp4 ./video.mp4
root@zcu106vcu_base:~# ./conv_cpu.exe --gray true ./video.mp4 -o ./video_out.mp4
input: ./video.mp4
output: ./video_out.mp4
video size: 1920x1080
nframes: 132
IN COMMAND:  ffmpeg -v error -hide_banner -i ./video.mp4 -f image2pipe -vcodec rawvideo -vf scale=w=1920:h=1080 -vframes 132 -
OUT COMMAND: ffmpeg -v error -hide_banner -y -f rawvideo -vcodec rawvideo -pix_fmt gray -s 1920x1080 -framerate 25 -i - -f mp4
Processing 132 frames of ./video.mp4 ...
[###################################] 100 %

Processed 7.91 MB in 49.259s (21.20 MBps)

root@zcu106vcu_base:~#

由于暂时没有找到方法在A53中运行gprof来分析性能，因此在PC中进行测试。
i5 CPU运行测试：

convolution-tutorial/design/cpu_src$ ./convolve --gray true ./video.mp4 -o ./video_out.mp4
input: ./video.mp4
output: ./video_out.mp4
video size: 1920x1080
nframes: 132
IN COMMAND:  ffmpeg -v error -hide_banner -i ./video.mp4 -f image2pipe -vcodec rawvideo -vf scale=w=1920:h=1080 -vframes 132 -pix_fmt rgba -
OUT COMMAND: ffmpeg -v error -hide_banner -y -f rawvideo -vcodec rawvideo -pix_fmt gray -s 1920x1080 -framerate 25 -i - -f mp4 -q:v 5 -an -codec mpeg4 ./video_out.mp4
Processing 132 frames of ./video.mp4 ...
[###################################] 100 %

Processed 7.91 MB in 8.927s (116.97 MBps)

convolution-tutorial/design/cpu_src$ gprof convolve gmon.out> gprofresult.txt
convolution-tutorial/design/cpu_src$ cat gprofresult.txt 
Flat profile:

Each sample counts as 0.01 seconds.
  %   cumulative   self              self     total           
 time   seconds   seconds    calls  ms/call  ms/call  name    
 93.43      7.53     7.53      132    57.05    57.05  convolve_cpu
  6.71      8.07     0.54      132     4.10     4.10  grayscale_cpu
  0.00      8.07     0.00      132     0.00     0.00  print_progress(int, int)
  0.00      8.07     0.00        1     0.00     0.00  _GLOBAL__sub_I_default_output
***
convolution-tutorial/design/cpu_src$ sudo apt-get install graphivz
convolution-tutorial/design/cpu_src$ pip3 install gprof2dot
convolution-tutorial/design/cpu_src$ gprof2dot gprofresult.txt > gprof_graph.dot
convolution-tutorial/design/cpu_src$ dot -Tpng gprof_graph.dot -o gprof_graph.png

使用graphviz的dot工具分析了程序运行流程，可以看到convolve_cpu函数消耗了大量的时间。

2.1.6 结果分析

可以看到A53的运行速度1920×1080分辨率，132帧，然后进行conv和灰度计算，总共消耗了49秒的时间，这时间中还包含了编解码消耗的时间。相对于PC运算，效率还是太低了。
A53 CPU的处理速度：132/49 = 2.69 FPS，这与实时视频处理需求的30 FPS，还差的太远了。
我们需要依赖A53的硬件至少实现12倍的加速才能够实现30 FPS的速度。

2.2 Convolution加速

2.2.1 新建工程

在Vitis中创建一个新的Application Project
平台：conv_system
APP：conv_kernel

2.2.2 添加源码

我们将需要编译的内容直接添加到src目录下，包括：
design/multi_cu目录下的所有内容
最终的工程目录结构如下图：

2.2.3 代码分析

创建两个ffmpeg实例，一个用于读取MP4文件并解码读出，一个用于编码后写入新的MP4文件
读取MP4文件并解码出图像
将解码出的图像进行conv计算，使用OpenCL调用C++ Kernel实现
将conv输出的图像灰度化
将灰度化的图像写入MP4文件

注：斜体加粗 部分是与上一个测试不同的地方

2.2.4 固件编译

按照例程中的设置，将Conv模块的CU数量设置为4，提高并行处理速度

2.2.5 测试验证

将固件复制到SD卡，然后运行命令进行测试

A53 CPU运行测试：

root@zcu106vcu_base:~# ./conv_kernel.exe ./conv_kernel.xclbin --gray true --kernel_name convolve_fpga ./video.mp4 -o ./video_out.mp4
input: ./video.mp4
output: ./video_out.mp4
video size: 1920x1080
nframes: 132
IN COMMAND:  ffmpeg -v error -hide_banner -i ./video.mp4 -f image2pipe -vcodec rawvideo -vf scale=w=1920:h=1080 -vframes 132 -
OUT COMMAND: ffmpeg -v error -hide_banner -y -f rawvideo -vcodec rawvideo -pix_fmt gray -s 1920x1080 -framerate 25 -i - -f mp4
[ 3829.312242] [drm] Pid 12273 opened device
Binary Path: ./conv_kernel.xclbin
Processing 132 frames of ./vi[ 3829.318928] [drm] Pid 12273 closed device
deo.mp4 ...
[ 3829.328709] [drm] Pid 12273 opened device
platform Name: Xilinx
Vendor Name : Xilinx
Found Platform
INFO: Importing ./conv_kernel.xclbin
Loading: './conv_kernel.xclbin'
[ 3829.430157] [drm] The XCLBIN already loaded. Don't need to reload.
[ 3829.435742] [drm] Reconfiguration not supported
[###################################] 100 %                 
FPGA Time:       22.5645 s
FPGA Throughput: 46.2735 MB/s


Processed 7.91 MB in 22.761s (45.87 MBps)

[ 3852.037993] [drm] zocl_free_userptr_bo: obj 0x0000000099078c8b
root@zcu106vcu_base:~#

2.2.6 结果分析

通过运算时间可以看到处理速度从49秒降低到了22.5秒，总时间减小了一半多。
这个CU=4的配置感觉没有生效，需要考虑一下原因（可能是编码速度太慢？）
A53 CPU的处理速度：132/22.56 = 5.85 FPS

2.3 GrayScale加速

这个工程的代码是自己手动添加的，原有例程中没有

2.3.1 新建工程

在Vitis中创建一个新的Application Project
平台：conv_system
APP：conv_gray

2.3.2 添加源码

我们将grayscale在RTL中实现

void grayscale_compute_dataflow(hls::stream& write_stream,
								hls::stream& read_stream,
                        		int elements) {
	RGBPixel pix_rgb;
	GrayPixel pix_gray;
	fixed cr(0.30);
	fixed cg(0.59);
	fixed cb(0.11);
	while(elements--) {
		read_stream >> pix_rgb;
		pix_gray = 	(pix_rgb.r * cr) + //red
					(pix_rgb.g * cg) + // green
					(pix_rgb.b * cb);  // blue
		write_stream << pix_gray;
	}
}

2.3.3 代码分析

创建两个ffmpeg实例，一个用于读取MP4文件并解码读出，一个用于编码后写入新的MP4文件
读取MP4文件并解码出图像
将解码出的图像进行conv计算，使用OpenCL调用C++ Kernel实现
将conv输出的图像灰度化，使用OpenCL调用C++ Kernel实现
将灰度化的图像写入MP4文件

注：斜体加粗 部分是与上一个测试不同的地方

2.3.4 固件编译

因为AXI_Slave Number小于等于16的限制，将Conv和Gray模块的CU数量都设置为1

2.3.5 测试验证

将固件复制到SD卡，然后运行命令进行测试

A53 CPU运行测试：
软件计算grayscale

root@zcu106vcu_base:~# 
root@zcu106vcu_base:~# /mnt/conv_gray.exe /mnt/conv_gray.xclbin --gray true /mnt/video.mp4 -o ./video_gray_g.mp4
input: /mnt/video.mp4
output: ./video_gray_g.mp4
video size: 1920x1080
nframes: 132
IN COMMAND:  ffmpeg -v error -hide_banner -i /mnt/video.mp4 -f image2pipe -vcodec rawvideo -vf scale=w=1920:h=1080 -vframes 132 -pi-
OUT COMMAND: ffmpeg -v error -hide_banner -y -f rawvideo -vcodec rawvideo -pix_fmt gray -s 1920x1080 -framerate 25 -i - -f mp4 -q:v4
Binary Path: /mnt/conv_gray.xclbin
Processing 132 frames of /mnt/video.mp4 ...
[   81.273251] [drm] Pid 2671 opened device
[   81.277212] [drm] Pid 2671 closed device
[   81.281354] [drm] Pid 2671 opened device
platform Name: Xilinx
Vendor Name : Xilinx
Found Platform
INFO: Importing /mnt/conv_gray.xclbin
Loading: '/mnt/conv_gray.xclbin'
[   81.383444] [drm] The XCLBIN already loaded. Don't need to reload.
[   81.386711] [drm] Reconfiguration not supported
            compute_units = 1 1
   lines_per_compute_unit = 1080
                     gray = 1 0
[##                                 ]   6 %[   82.924773] print_req_error: I/O error, dev mmcblk0, sector 7689
[   82.930848] Buffer I/O error on dev mmcblk0p1, logical block 7554, lost async page write
[###################################] 100 %                 
FPGA Time:       23.4527 s
FPGA Throughput: 44.5211 MB/s


Processed 7.91 MB in 23.664s (44.12 MBps)

[  104.869503] [drm] zocl_free_userptr_bo: obj 0x00000000c51e768b
[  104.883850] [drm] Pid 2671 closed device
root@zcu106vcu_base:~#

硬件加速计算grayscale

root@zcu106vcu_base:~# /mnt/conv_gray.exe /mnt/conv_gray.xclbin --gray true --gray_acc true /mnt/video.mp4 -o ./video_gray_g.mp4
input: /mnt/video.mp4
output: ./video_gray_g.mp4
video size: 1920x1080
nframes: 132
IN COMMAND:  ffmpeg -v error -hide_banner -i /mnt/video.mp4 -f image2pipe -vcodec rawvideo -vf scale=w=1920:h=1080 -vframes 132 -pi-
OUT COMMAND: ffmpeg -v error -hide_banner -y -f rawvideo -vcodec rawvideo -pix_fmt gray -s 1920x1080 -framerate 25 -i - -f mp4 -q:v4
Binary Path: /mnt/conv_gray.xclbin
Processing 132 frames of /mnt/video.mp4 ...
[  169.665196] [drm] Pid 2959 opened device
[  169.669156] [drm] Pid 2959 closed device
[  169.673512] [drm] Pid 2959 opened device
platform Name: Xilinx
Vendor Name : Xilinx
Found Platform
INFO: Importing /mnt/conv_gray.xclbin
Loading: '/mnt/conv_gray.xclbin'
[  169.773466] [drm] The XCLBIN already loaded. Don't need to reload.
[  169.777814] [drm] Reconfiguration not supported
            compute_units = 1 1
   lines_per_compute_unit = 1080
                     gray = 1 1
[###################################] 100 %                 
FPGA Time:       21.2221 s
FPGA Throughput: 49.2006 MB/s


Processed 7.91 MB in 21.441s (48.70 MBps)

[  191.037663] [drm] zocl_free_userptr_bo: obj 0x00000000940c51e8
[  191.052737] [drm] Pid 2959 closed device
root@zcu106vcu_base:~#

2.3.6 结果分析

由于CU数量改为了1，速度与前一个实验不具备可比性，因此该实验运行了两次，区别是有没有开启–gray_acc这个参数。
开启这个参数时处理时间为21.22秒，不开启时处理时间为23.45秒，计算时间能够降低9.5%左右。
A53 CPU的处理速度：132/21.22 = 6.22 FPS

2.4 Codec加速

这个工程的代码是自己手动添加的，原有例程中没有

2.4.1 新建工程

在Vitis中创建一个新的Application Project
平台：conv_system
APP：conv_codec

2.4.2 添加源码

2.4.3 代码分析

创建两个基于gstreamer的opencv实例，一个用于读取MP4文件并解码读出，一个用于编码后写入新的MP4文件
读取MP4文件并解码出图像，使用VCU解码器
将解码出的图像进行conv计算，使用OpenCL调用C++ Kernel实现
将conv输出的图像灰度化，使用OpenCL调用C++ Kernel实现
将灰度化的图像写入MP4文件，使用VCU编码器

注：斜体加粗 部分是与全部CPU运行测试不同的地方

2.4.4 固件编译

2.4.5 测试验证

将固件复制到SD卡，然后运行命令进行测试

A53 CPU运行测试：

纯CPU运行

root@zcu106vcu_base:~# ./conv.exe ./conv.xclbin --cpu true ./video.mp4 -o ./video_color_cpu.mp4
input: ./video.mp4
output: ./video_color_cpu.mp4
video size: 1920x1080
nframes: 132
Accel:OFF
VCU decoder:OFF encoder:OFF
IN COMMAND:  ffmpeg -v error -hide_banner -i ./video.mp4 -f image2pipe -vcodec rawvideo -vf scale=w=1920:h=1080 -vframes 132 -pix_fmt rgba -
OUT COMMAND: ffmpeg -v error -hide_banner -y -f rawvideo -vcodec rawvideo -pix_fmt rgba -s 1920x1080 -framerate 25 -i - -f mp4 -q:v 5 -an -codec mpeg4 ./video_color_cpu.mp4
Binary Path: ./conv.xclbin
Processing 132 frames of ./video.mp4 ...
[###################################] 100 %

Processed 7.91 MB in 54.541s (19.14 MBps)

root@zcu106vcu_base:~# mkdir video_color_cpu
root@zcu106vcu_base:~# cp xclbin.run_summary video_color_cpu && cp timeline_trace.csv video_color_cpu && cp profile_summary.csv video_color_cpu && cp video_color_cpu.mp4 video_color_cpu
root@zcu106vcu_base:~# 
root@zcu106vcu_base:~# ./conv.exe ./conv.xclbin --cpu true --gray true ./video.mp4 -o ./video_gray_cpu.mp4
input: ./video.mp4
output: ./video_color_cpu.mp4
video size: 1920x1080
nframes: 132
Accel:OFF
VCU decoder:OFF encoder:OFF
IN COMMAND:  ffmpeg -v error -hide_banner -i ./video.mp4 -f image2pipe -vcodec rawvideo -vf scale=w=1920:h=1080 -vframes 132 -pix_fmt rgba -
OUT COMMAND: ffmpeg -v error -hide_banner -y -f rawvideo -vcodec rawvideo -pix_fmt gray -s 1920x1080 -framerate 25 -i - -f mp4 -q:v 5 -an -codec mpeg4 ./video_gray_cpu.mp4
Binary Path: ./conv.xclbin
Processing 132 frames of ./video.mp4 ...
[###################################] 100 %

Processed 7.91 MB in 58.208s (17.94 MBps)

root@zcu106vcu_base:~# mkdir video_gray_cpu
root@zcu106vcu_base:~# cp xclbin.run_summary video_gray_cpu && cp timeline_trace.csv video_gray_cpu && cp profile_summary.csv video_gray_cpu && cp video_gray_cpu.mp4 video_gray_cpu
root@zcu106vcu_base:~#

不使能VCU

root@zcu106vcu_base:~# ./conv.exe ./conv.xclbin ./video.mp4 -o ./video_color_vcu_none.mp4
input: ./video.mp4
output: ./video_color_vcu_none.mp4
video size: 1920x1080
nframes: 132
Accel:ON
VCU decoder:OFF encoder:OFF
IN COMMAND:  ffmpeg -v error -hide_banner -i ./video.mp4 -f image2pipe -vcodec rawvideo -vf scale=w=1920:h=1080 -vframes 132 -pix_fmt rgba -
OUT COMMAND: ffmpeg -v error -hide_banner -y -f rawvideo -vcodec rawvideo -pix_fmt rgba -s 1920x1080 -framerate 25 -i - -f mp4 -q:v 5 -an -codec mpeg4 ./video_color_vcu_none.mp4
Binary Path: ./conv.xclbin
Processing 132 frames of ./video.mp4 ...
Found Platform Number: 1
platform Name: Xilinx
Vendor Name : Xilinx
Found Platform
devices number : 1
INFO: Importing ./conv.xclbin
Loading: './conv.xclbin'
            compute_units = 1 1
   lines_per_compute_unit = 1080
                     gray = 0 0
[###################################] 100 %                 
FPGA Time:       45.9614 s
FPGA Throughput: 22.7178 MB/s

Processed 7.91 MB in 46.137s (22.63 MBps)

root@zcu106vcu_base:~# mkdir video_color_vcu_none
root@zcu106vcu_base:~# cp xclbin.run_summary video_color_vcu_none && cp timeline_trace.csv video_color_vcu_none && cp profile_summary.csv video_color_vcu_none && cp video_color_vcu_none.mp4 video_color_vcu_none
root@zcu106vcu_base: 
root@zcu106vcu_base:~# ./conv.exe ./conv.xclbin --gray true --gray_acc true ./video.mp4 -o ./video_gray_vcu_none.mp4
input: ./video.mp4
output: ./video_gray_vcu_none.mp4
video size: 1920x1080
nframes: 132
Accel:ON
VCU decoder:OFF encoder:OFF
IN COMMAND:  ffmpeg -v error -hide_banner -i ./video.mp4 -f image2pipe -vcodec rawvideo -vf scale=w=1920:h=1080 -vframes 132 -pix_fmt rgba -
OUT COMMAND: ffmpeg -v error -hide_banner -y -f rawvideo -vcodec rawvideo -pix_fmt gray -s 1920x1080 -framerate 25 -i - -f mp4 -q:v 5 -an -codec mpeg4 ./video_gray_vcu_none.mp4
Binary Path: ./conv.xclbin
Processing 132 frames of ./video.mp4 ...
Found Platform Number: 1
platform Name: Xilinx
Vendor Name : Xilinx
Found Platform
devices number : 1
INFO: Importing ./conv.xclbin
Loading: './conv.xclbin'
            compute_units = 1 1
   lines_per_compute_unit = 1080
                     gray = 1 1
[###################################] 100 %                 
FPGA Time:       21.1492 s
FPGA Throughput: 49.3702 MB/s

Processed 7.91 MB in 21.328s (48.96 MBps)

root@zcu106vcu_base:~# mkdir video_gray_vcu_none
root@zcu106vcu_base:~# cp xclbin.run_summary video_gray_vcu_none && cp timeline_trace.csv video_gray_vcu_none && cp profile_summary.csv video_gray_vcu_none && cp video_gray_vcu_none.mp4 video_gray_vcu_none
root@zcu106vcu_base:~#

打开VCU Encoder and Decoder

root@zcu106vcu_base:~# 
root@zcu106vcu_base:~# ./conv.exe ./conv.xclbin --enc true --dec true ./video.mp4 -o ./video_color_vcu_all.mp4
input: ./video.mp4
output: ./video_color_vcu_all.mp4
video size: 1920x1080
nframes: 132
Accel:ON
VCU decoder:ON encoder:ON
IN COMMAND:  filesrc location=./video.mp4 ! queue ! qtdemux ! queue ! h264parse ! video/x-h264, alignment=au ! queue ! omxh264dec ! video/x-raw,format=NV12,width=1920,height=1080 ! queue ! appsink
OUT COMMAND: appsrc ! queue ! videoconvert ! video/x-raw,width=1920,height=1080 ! queue ! omxh264enc target-bitrate=2000 ! video/x-h264, alignment=au ! queue ! capsfilter ! h264parse ! queue ! qtmux ! queue ! filesink location=./video_color_vcu_all.mp4
Binary Path: ./conv.xclbin
Processing 132 frames of ./video.mp4 ...
Found Platform Number: 1
platform Name: Xilinx
Vendor Name : Xilinx
Found Platform
devices number : 1
INFO: Importing ./conv.xclbin
Loading: './conv.xclbin'
            compute_units = 1 1
   lines_per_compute_unit = 1080
                     gray = 0 0
inFrameMatNV12 1920 1620 1 0
outFrameMatRGBA 1920 1080 4 24
[                                   ]   1 %!! Warning : Adapting profile to support bitdepth and chroma mode
!! The specified Level is too low and will be adjusted !!
[################################## ]  99 %
Error: partial frame 131 read failed                 
FPGA Time:       9.29383 s
FPGA Throughput: 112.348 MB/s

Processed 7.91 MB in 9.467s (110.29 MBps)

root@zcu106vcu_base:~# mkdir video_color_vcu_all
root@zcu106vcu_base:~# cp xclbin.run_summary video_color_vcu_all && cp timeline_trace.csv video_color_vcu_all && cp profile_summary.csv video_color_vcu_all && cp video_color_vcu_all.mp4 video_color_vcu_all
root@zcu106vcu_base:~# 
root@zcu106vcu_base:~# ./conv.exe ./conv.xclbin --gray true --gray_acc true --enc true --dec true ./video.mp4 -o ./video_gray_vcu_all.mp4
input: ./video.mp4
output: ./video_gray_vcu_all.mp4
video size: 1920x1080
nframes: 132
Accel:ON
VCU decoder:ON encoder:ON
IN COMMAND:  filesrc location=./video.mp4 ! queue ! qtdemux ! queue ! h264parse ! video/x-h264, alignment=au ! queue ! omxh264dec ! video/x-raw,format=NV12,width=1920,height=1080 ! queue ! appsink
OUT COMMAND: appsrc ! queue ! videoconvert ! video/x-raw,width=1920,height=1080 ! queue ! omxh264enc target-bitrate=2000 ! video/x-h264, alignment=au ! queue ! capsfilter ! h264parse ! queue ! qtmux ! queue ! filesink location=./video_gray_vcu_all.mp4
Binary Path: ./conv.xclbin
Processing 132 frames of ./video.mp4 ...
Found Platform Number: 1
platform Name: Xilinx
Vendor Name : Xilinx
Found Platform
devices number : 1
INFO: Importing ./conv.xclbin
Loading: './conv.xclbin'
            compute_units = 1 1
   lines_per_compute_unit = 1080
                     gray = 1 1
inFrameMatNV12 1920 1620 1 0
outFrameMatGRAY 1920 1080 1 0
[                                   ]   1 %!! Warning : Adapting profile to support bitdepth and chroma mode
!! The specified Level is too low and will be adjusted !!
[################################## ]  99 %
Error: partial frame 131 read failed                 
FPGA Time:       10.6679 s
FPGA Throughput: 97.8773 MB/s

Processed 7.91 MB in 10.841s (96.31 MBps)

root@zcu106vcu_base:~# mkdir video_gray_vcu_all
root@zcu106vcu_base:~# cp xclbin.run_summary video_gray_vcu_all && cp timeline_trace.csv video_gray_vcu_all && cp profile_summary.csv video_gray_vcu_all && cp video_gray_vcu_all.mp4 video_gray_vcu_all
root@zcu106vcu_base:~#

2.4.6 结果分析

由于使用gstreamer的方法无法完成gray或rgba到H264 encoder的格式匹配。所以中间添加了颜色转换的操作(OpenCV的方法)，速度与前一个实验不具备可比性。未知异常，只处理了131帧，少了1帧。
处理时间为10.67秒
A53 CPU的处理速度：132/10.67 = 12.28 FPS
与目标30FPS还差了很多，后续还需要进行整体优化。

2.4.7 处理时间分析

在测试时使用性能分析工具：Vitis Analyzer
在运行程序的当前目录添加xrt.ini
默认打开性能分析工具

[Debug]                                                                         
profile=true                                                                    
data_transfer_trace=fine                                                        
stall_trace=all                                                                 
timeline_trace=true                                                             
root@zcu106vcu_base:~#

我们只接分析最终10.67秒的这次处理


可以看到
convolve_fpga的运行时比较不稳定，平均34ms，最大131ms，总共消耗4571ms。其中有5次运行超过100ms。
grayscale_fpga类似，平均16ms，最大40ms，总计消耗了2098ms。
最后一张图，可以看到虽然convolve_fpga和grayscale_fpga可以被队列化运行，但是没有合codec进行流水线。可以
Memor读消耗317ms，写消耗1105ms

优化考虑：

提高两个kernel的吞吐率，例化多个CU
流水线操作

3 总结

使用Vitis和自定义的ZCU106 XRT平台完成了Vitis-Tutorials中的Convolution Example功能测试。并使用VCU加速了编解码速度。

Vitis HLS 学习笔记--hls::stream（理解串流：基础） hi94 Vitis HLS 学习笔记 c++fpga开发 HLS
目录1.介绍2.示例2.1代码解析2.2定义串流2.3串流的综合报告3.总结1.介绍在VitisHLS中，hls::stream是一个用于在C/C++中进行高级合成的关键数据结构。它类似于C++标准库中的std::stream，但是专门设计用于硬件描述语言（如Verilog或VHDL）中的数据流。hls::stream提供了一种方便的方法来处理数据流，使得在设计硬件加速器时更加灵活和可控。hls:
vitis dpu kernel编译和docker环境搭建寒听雪落 linux
一，Vitis-AI简介1，Vitis-AI概述Vitis-AI在边缘计算设备的AI全栈部署框架中扮演了编译器端与后端的角色，接收前端DNN(DeepNeuralNetwork)框架训练后的网络参数IR(IntermediateRepresentation)，并将其优化后编译并传递给后端。后端DNNDK(DeepNeuralNetworkDevelopmentKit)为Edge终端提供了驱动和AP
ZYNQ笔记（二十）：Clocking Wizard 动态配置 W以至千里 ZYNQ 笔记 fpga开发
版本：Vivado2020.2（Vitis）任务：ZYNQPS端通过AXI4Lite接口配置ClockingWizardIP核输出时钟频率目录一、介绍二、寄存器定义三、配置四、PS端代码一、介绍Xilinx的ClockWizardIP核用于在FPGA中生成和管理时钟信号。它支持动态重配置（DynamicReconfiguration），允许在运行时通过AXI4-Lite接口或DRP接口（这两个接口
精品方案 | GCKontrol&TestManager在电车VCU上下电系统中的应用世冠科技软件工程 matlab
概述电车的整车控制单元（VCU）作为车辆的核心决策中枢,通过实时解析驾驶意图，结合车辆动态工况、电池状态及电机运行参数，动态分配动力输出，确保整车高效、安全运行。其中上下电流程作为VCU的核心功能，直接决定了车辆启动、行驶、充电及紧急断电全场景的安全性与响应效率。随着新能源汽车向高集成化、智能化方向加速发展，VCU需同时满足高实时性控制（毫秒级响应）、功能安全（ISO26262ASIL-D）以及多
BMS架构全解析空间机器人架构
BMS（电池管理系统）是新能源汽车中最核心的电子控制单元之一，它负责电池状态监测、充放电管理、温度控制、安全防护，并与整车控制系统（VCU）和动力系统（电机及逆变器）进行交互。下面，我们结合这张架构图，深入解析BMS的各个模块及其具体作用。BMS架构全解析BMS的架构主要分为电池管理系统、电源监控单元、充电管理、需求控制、安全控制、外部交互六大部分，每个部分都有专门的功能模块，协同工作。1.动力系
新能源汽车CAN通信深度解析：MCU、VCU、ECU协同工作原理 Dr.Zeus 新能源汽车汽车网络
1.什么是CAN通信？CAN（ControllerAreaNetwork，控制器局域网）是一种广泛应用于汽车电子系统的串行通信协议，由德国Bosch公司在1980年代开发，主要用于实现车内电子控制单元（ECU）之间的高效数据传输。CAN总线是新能源汽车电子架构的"神经系统"，连接着MCU（电机控制器）、VCU（整车控制器）、ECU（电子控制单元）等关键部件，实现实时数据交互和协同控制。CAN通信的
深入解析汽车VCU：新能源汽车的“大脑” 智源笔记汽车 VCU ECU
在新能源汽车的电子电气架构中，VCU（VehicleControlUnit）扮演着至关重要的角色。作为整车控制器，VCU是车辆电子控制系统的核心，负责协调管理车辆的动力系统、电池系统、制动系统等多个关键部件，确保车辆安全、高效运行。本文将深入探讨VCU的功能、组成、工作原理及其在新能源汽车发展中的重要性。一、VCU的基本功能与作用VCU在新能源汽车中充当“大脑”的角色，其基本功能包括：采集驾驶操作
全版本Vivado与Vitis安装终极指南：从零到精通的系统化实践芯作者 D1：ZYNQ设计 fpga开发
PGA开发环境的基石构建在数字逻辑设计的星辰大海中，Vivado与Vitas如同双星系统，承载着FPGA开发的全流程使命。本文突破传统教程框架，通过四维安装体系、六阶性能调优与八大创新技巧，打造适用于Windows/Linux双平台、2014-2023全版本的通用解决方案。文内含自研自动化脚本与军用级验证方案，助您构建坚如磐石的开发环境。一、环境准备：构建数字世界的基石1.1硬件需求金字塔基础层：
AUTOSAR从入门到精通-汽车虚拟控制器（vECU）格图素书汽车
目录几个高频面试题目AUTOSAR和微控制器虚拟化技术-如何整合多个ECU提高硬件利用率ECU、VCU、MCU和HCU的功能及其异同点1、ECU1.ECU的主要功能2.ECU的组成2、VCU3、MCU4、HCU算法原理什么是虚拟ECU验证？为什么需要虚拟控制器？虚拟化的价值关于MMU的争议虚拟ECU分类1.新思科技Silver2.ETAS3.迪捷SkyEye4.西门子Pave3605.Vector
Vitis: 使用自定义IP时 Makefile错误导致编译报错 W以至千里 ZYNQ 笔记
参考文章:【小梅哥FPGA】Vitis开发中自定义IP的Makefile路径问题解决方案VitisIDE自定义IPMakefile错误（arm-xilinx-eabi-gcc.exe:error:*.c:Invalidargument）解决方法Vitis使用自定义IP时:Makefile文件里的语句是需要修改的，如果不修改，当包含该IP的硬件（xsa）文件导出到vitis后，对vitis工程进行编
解决 Vitis HLS 无法找到源文件的错误 kanhao100 HLS fpga开发 c++
解决VitisHLS无法找到源文件的错误错误分析根据您提供的日志，VitisHLS在执行时遇到了以下关键错误：WARNING:[HLS200-40]Cannotfinddesignfile'resnet18_0325.cpp'WARNING:[HLS200-40]Cannotfindsourcefileresnet18_0325.cpp;skippingit.ERROR:[HLS200-70]Ca
Vitis 2024.1 无法正常编译custom ip的bug（因为Makefile里的wildcard） Αλήθεια bug fpga fpga开发 arm
现象：如果在vivado中，添加了自己的customIP，比如AXI4IP，那么在Vitis（2024.1）编译导出的原本的.xsa的时候，会构建build失败。报错代码是："Compilingblank_test_ip..."microblaze-xilinx-elf-gcc.exe:warning:(ildcard:linkerinputfileunusedbecauselinkingnotd
基于NXP+FPGA轨道交通3U机箱结构远程输入/输出模块（RIOM）深圳信迈主板定制专家轨道交通 NXP+FPGA fpga开发人工智能大数据边缘计算运维
基于NXP+FPGA轨道交通6U机箱结构远程输入/输出模块（RIOM）RIOM使得数据通过就近的I/O源输入和输出。也可以直接将I/O源连接到列车计算机（如VCU），可以减少电缆用量从而节约成本。关键特性支持模拟和数字输入/输出。可配置的模块包括DI、DIO、MDO、RDO、AIO、PTI等。接口选项MVBRIOM设备支持MVB/CAN/串行链路三种接口；TRDPRIOM设备知此恨TRDP/CAN
AUTOSAR汽车电子嵌入式编程精讲300篇-电池管理系统中 CAN 通信模块的设计与应用格图素书汽车
目录前言CAN总线发展现状2电池管理系统通信模块的设计2.1BMS网络的总体布局与拓扑结构2.1.1BMS网络的总体布局2.1.1.1主控模块2.2.1.2从控模块2.2.1.3功能模块2.1.2BMS网络的拓扑结构2.2BMS与VCU通信协议的具体制定2.2.1应用层协议制定原则2.2.2系统相关报文的分组定义本文篇幅较长，分为上中下三篇来讲，文章索引详见电池管理系统中CAN通信模块的设计与应用
Zynq UltraScale+ MPSoC 在linux系统运行R5 裸机程序 remoteproc - R5 愧莫佳话 linux arm
参考文章：ultrascale学习笔记之remoteproc启动R5ZYNQUltraScale+MPSoCLinux+ThreadXAMP玩法ZynqUltraScale+MPSoC包含Cortex™-A53处理器和Cortex™-R5实时处理单元。移植完Linux系统，在系统上同时运行A53和R5应用程序，重点是修改R5程序的起始地址。vitis创建A53应用程序可以参考之前的文章R5程序可以
工程师必读一次性讲明白系列（十四）XCU、BMS、BCM 、VCU 、MCU 空间机器人单片机嵌入式硬件
工程师必读一次性讲明白系列（十四）:XCU（多域控制器）、BMS、BCM（车身控制器）、VCU（整车控制器）、MCU（电机电控）今天我们要深入浅出地讨论一些电动汽车里不可或缺的控制系统，分别是XCU（多域控制器）、BMS（电池管理系统）、BCM（车身控制器）、VCU（整车控制器）和MCU（电机电控）。这些系统像“汽车的大脑和神经”，一起保证着车辆的高效、安全和舒适。我们将用简单又有趣的方式讲解原理
《基于FPGA的Cortex-M3软核基本SOC设计及外设开发详解》 HWxuYnO fpga开发程序人生
基于FPGA的Cortex-M3软核基本SOC设计实现基于FPGA的Cortex-M3软核基本SOC，系统外设包括GPIO和UART串口。开发基于vivado2019.2和vitis，理论上可适用于任何版本的vivado，并且附带本人编写的详细开发文档，能够快速完成工程的移植。在该工程基础上可进一步开发更多的功能。ID:42100675319624107小小读者ok基于FPGA的Cortex-M3
如何快速入门VCU应用层软件开发？（34篇实例讲解+软件开发测试方法+工具使用）汽车电控研习室技术经验分享经验分享 matlab 汽车算法测试工具
最近，用一个多月的时间总结了VCU应用层软件开发的基本流程，架构，关键模块的控制策略及Simulink建模方法、测试方法及相关工具的使用。如何快速入门VCU应用软件开发层软件开发，通过本篇文章可以给你答案。文章标题为超链接，可直接点击进入文章阅读。目录一、VCU应用层软件开发流程及架构二、VCU应用层软件开发模块1、输入信号处理2、控制策略模块3、输出信号处理4、标定量设置5、代码生成三、VCU应
【AUTOSAR】VCU开发实际项目讲解（二）----VCU软件与结构描述大道生单片机嵌入式硬件 AUTOSAR 26262 VCU 汽车
VCU软件描述VCU软件架构主要分为底层软件驱动和应用层控制策略，其中应用层控制策略通过基于模型的开发，自动生成代码并可与底层驱动软件实现无缝连接。VCU软件通过BOOTLOADER和CAN总线进行更新刷写。标定及诊断支持CCP/XCP标定协议支持UDS诊断协议及SAEJ1939诊断协议故障存储：128KIIC外扩EEPROM提供程序刷新Bootloader软件工具基于CAN总线的控制器刷新工具支
整车控制器（VCU，vehicle Controller Unit）勇往直前的进击 C++硬件
整车控制器（VCU，vehicleControllerUnit），即动力总成控制器，是整个汽车的核心控制部件，它采集加速踏板信号、制动踏板信号及其他部件信号，并做出相应判断后，控制下层的各部件控制器的动作，驱动汽车正常行驶。作为汽车的指挥管理中心，动力总成控制器主要功能包括：驱动力矩控制、制动能量的优化控制、整车的能量管理、CAN网络的维护和管理、故障的诊断和处理、车辆状态监视等，它起着控制车辆运
OpenXR Monado创建跨进程通信通道 ipc_connect 薛文旺图形学图形渲染 xr
OpenXRMonado创建跨进程通信通道ipc_connect@monado/src/xrt/targets/openxr/target.cxrt_instance_create@monado/src/xrt/ipc/client/ipc_client_instance.cipc_instance_create(ii,out_xinst);ipc_connectipc_c->ica=ipc_cl
microblaze使用 HandsomeDr 单片机嵌入式硬件 linux
前阵子LD要求，做一个项目的microblaze部分。特意写个记录一下调试过程，记录过程中遇到的坑：1.问题1：用xil_printf替代printf打印裸机vitis调试的时候，发现串口打印不正常，后面定位到是这个打印函数的问题。2.问题2：microblaze导出始终有问题，导出的uartlite的打印乱码同事帮忙定位到是开发板的时钟选择错误3.microblaze导出AXIGPIO点灯功能B
Vitis/Vivado HLS 流水线中的存储依赖——解决方法之二优质蛋白 - 芯片打工人高层次综合HLS fpga开发经验分享 fpga 嵌入式硬件
和上一篇内容Vitis/VivadoHLS流水线中的存储依赖——解决方法之一中一样，考虑以下函数模块，voidExampleModule(hls::streamstrm_in,hls::streamstrm_out){#pragmaHLSINTERFACEmode=ap_ctrl_noneport=returnt_datamem[2*N];#pragmaHLSBIND_STORAGEvariabl
【Vitis】Vitis HLS2023不支持的功能特性神仙约架 xilinx vitis fpga开发 xilinx vitis hls
VitisHLS简介Vitis™HLS是一种高层次综合工具，支持将C、C++和OpenCL™函数硬连线到器件逻辑互连结构和RAM/DSP块上。VitisHLS可在Vitis应用加速开发流程中实现硬件内核，并使用C/C++语言代码在Vivado®DesignSuite中为赛灵思器件设计开发RTLIP。【Vitis】HLS高层次综合的优势【Vitis】基于C++函数开发组件的步骤【Vitis】Viti
【Vitis】Vitis HLS简介神仙约架 vitis xilinx fpga开发 vitis HSL xilinx
VitisHLS简介Vitis™HLS是一种高层次综合工具，支持将C、C++和OpenCL™函数硬连线到器件逻辑互连结构和RAM/DSP块上。VitisHLS可在Vitis应用加速开发流程中实现硬件内核，并使用C/C++语言代码在Vivado®DesignSuite中为赛灵思器件设计开发RTLIP。【Vitis】VitisHLS简介【Vitis】HLS高层次综合的优势【Vitis】基于C++函数开
ZYNQ7020最小系统搭建PS端配置你觉得很酷吗？ FPGA技术开发语言 fpga开发
1.创建设计2.DDR配置（根据自己板子的实际情况进行选择）3.串口配置4.如果不包含PL端则取消勾选5.自动引出接口6.验证设计7.输出设计8.生成顶层HDL9.导出硬件10.打开Vitis11.设置字体12.编译13.打开串口调试助手14.烧录程序15.结果
Vitis AI 集成人工智能
更多TVM中文文档可访问→ApacheTVM是一个端到端的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。IApacheTVM中文站VitisAI是用在Xilinx平台（包括边缘设备和Alveo卡）上进行硬件加速AI推理的Xilinx开发堆栈。它由优化的IP、工具、库、模型和示例设计组成。在设计时兼顾高效率和易用性，充分发挥了XilinxFPGA和ACAP上AI加速的潜力。TVM中当
【Vitis/Vivado】在一台PC上同时调试多块FPGA开发板的方法 wjh776a68 #Xilinx入门 vitis vivado 多板调试 FPGA 多板
参考文献https://support.xilinx.com/s/article/75316?language=en_US问题描述需要对多个开发板之间的数据交互进行调试，而手头只有一台PC（和拓展坞），下文将介绍如何利用仅有的PC连接多个板卡进行单步调试。步骤连接多块开发板到电脑，启动开发板，如果接口不够可以用拓展坞或者只连接JTAG接口，在系统菜单里找到XilinxDesignTools，从中找
Vitis AI 集成 HyperAI超神经 TVM 人工智能 TVM
更多TVM中文文档可访问→ApacheTVM是一个端到端的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。IApacheTVM中文站**VitisAI**是用在Xilinx平台（包括边缘设备和Alveo卡）上进行硬件加速AI推理的Xilinx开发堆栈。它由优化的IP、工具、库、模型和示例设计组成。在设计时兼顾高效率和易用性，充分发挥了XilinxFPGA和ACAP上AI加速的潜力。T
使用HLS FFT报错： undefined reference to‘xilinx_ip_xfft_v9_1_*‘问题解决方法凳子花❀ Verilog 数字IC设计 HLS HLS fpga开发
最近需要用到HLS的FFT库，写了一个简单代码后编译报错：../Vitis_HLS/hls_fft.h:670:undefinedreferenceto'xilinx_ip_xfft_v9_1_create_state'../Vitis_HLS/hls_fft.h:771:undefinedreferenceto'xilinx_ip_xfft_v9_1_bitacc_simulate'../Vit
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla

【XRT Vitis-Tutorials】视频处理加速（Kernel+VCU）

1 前言

2 创建Vitis工程

2.1 CPU Only

2.1.1 新建工程

2.1.2 添加源码

2.1.3 代码分析

2.1.4 固件编译

2.1.5 测试验证

2.1.6 结果分析

2.2 Convolution加速

2.2.1 新建工程

2.2.2 添加源码

2.2.3 代码分析

2.2.4 固件编译

2.2.5 测试验证

2.2.6 结果分析

2.3 GrayScale加速

2.3.1 新建工程

2.3.2 添加源码

2.3.3 代码分析

2.3.4 固件编译

2.3.5 测试验证

2.3.6 结果分析

2.4 Codec加速

2.4.1 新建工程

2.4.2 添加源码

2.4.3 代码分析

2.4.4 固件编译

2.4.5 测试验证

纯CPU运行

不使能VCU

打开VCU Encoder and Decoder

2.4.6 结果分析

2.4.7 处理时间分析

3 总结

你可能感兴趣的:(XRT,VCU,Vitis)