祥瑞Coding

2018.5-2019.1基于FPGA平台的目标检测网络实现

2018.5 - 2019.1 基于FPGA平台的目标检测网络实现，将目标检测模型实现为c++代码，成功通过HLS工具部署于FPGA平台上，实现公交摄像头画面中人头的检测。

一、项目背景

1.1 公司背景

1.2 应用背景

1.3 技术路线

二、python端

2.1 MTCNN与训练过程

2.2 mAP的测试

2.3 网络结构的更改

2.4 输出python训练的权重到c代码端

python之中的顺序

c代码之中的顺序

三、c代码端

3.1 文件描述

程序文件

权重文件

更改结构顺序

3.2 卷积的更改

初始的依赖openBLAS的卷积函数

重新运用定义编写卷积代码

加入bias和ReLU

存储顺序

四、硬件端

4.1 卷积IPcore

存储

运算

接口

4.2 IPcore的验证

4.3 IPcore报告

时间资源

空间资源

4.4 ARM端工作

交叉编译工作

调用IPcore工作

一、项目背景

1.1 公司背景

智能交通上市公司，06年成立，2014年上市。车联网，物联网，智能公交，3G/4G监控，北斗/GPS监控等。

1.2 应用背景

公交车的车载终端有连接公交车的摄像头，希望根据摄像头画面估计出上车人数和下车人数。所以需要有一个目标检测网络先检测出上车下车的人头数。

因为FPGA平台价格较低，例如项目所用的zyqn系列FPGA，开发板2000元左右，单独FPGA板成本大概在500元，（开发板与FPGA板不一样，因为开发板模块更多，例如光电模块，通信模块，接口模块等等。FPGA板仅仅需要一个用于运算的FPGA板子，项目需要还要带一个单片机）。

项目目的就是希望把目标检测网络实现到FPGA上，从公交摄像头画面之中，把人头检测出来。

1.3 技术路线

项目分为python端，c代码端，硬件端。

python端用于确定相应的网络模型结构，训练模型。从而根据相应的权重进行保存。

c++端用于实现神经网络的推断，也就是只有前馈的预测运算。根据相应的python端的权重，和输入图片，预测得出相应的bounding box。一是因为c++代码执行效率高，并且省去了训练的过程，只有前馈运算过程。二是实现为c++代码可以方便于后面的HLS部署于FPGA上。

硬件端用于部署相应的网络结构。分为ARM端和FPGA端，ARM端就是arm架构，可以用c++代码直接交叉编译即可，FPGA端为FPGA架构，需要将相应的程序通过HLS实现为IPcore，烧写到FPGA上，然后用ARM控制进行运算。

二、python端

端用于确定相应的网络模型结构，训练模型。从而根据相应的权重进行保存。早期使用YOLO，后因为YOLO运算量较大，权重文件大，并且所用FPGA板子为xilinx MIZ 7z020，很低端，片上BRAM和DDR都不够用。因此换用内存较小的MTCNN。

数据集为根据相应的公交画面标定和训练的。YOLO mAP为89，MTCNN降低30个点

2.1 MTCNN与训练过程

https://github.com/wangbm/MTCNN-Tensorflow，Multi task级联的CNN

MTCNN是三个级联的网络，Pnet用于生成备选框，resize为不同的大小，然后根据响应在图像回归出12×12大小的框。

Rnet用于对备选框初次筛选，Onet用于确定最终输出的备选框。

所以训练过程需要训练三个网络。

训练流程见上面连接的内容。

2.2 mAP的测试

mAP为目标检测领域的基础指标。

首先标签相同交并比IoU>0.5表示网络检测正确。

然后画出相应的查全率与查准率的曲线，积分得到的蓝色区域即为mAP。

各类的平均AP即mAP

测试mAP需要将程序做一定的修改，将所有图像的预测标签与groundTruth放入文件夹之中。然后测试。

这一系列过程被封装好，封装到test_all.py之中。

2.3 网络结构的更改

在原始结构的基础上，

重新制作公交人头数据集，重新训练以在公交人头数据集上运行
为了增加硬件平台的功能（最好确定为定长度的），将卷积固定为3x3,（为什么要固定卷积尺寸，因为硬件资源有限，所以必须固定结构的卷积能更少的占用硬件资源，从而实现重复调用）
去掉pooling的过程，运用stride为2的卷积来替代以增加并行性。
然后将PReLU改为ReLU，这样不用存储斜率。relu种类： https://blog.csdn.net/ScorpC/article/details/88186920
增加一定量的通道数量，以增加mAP。为减少运算，可以将Pnet与Rnet的阈值设高
在文件mtcnn.py之中
更改后的网络结构表 https://blog.csdn.net/weixin_36474809/article/details/85990687

2.4 输出python训练的权重到c代码端

python权重与c权重顺序很不一样。python之中权重为tensorflow的四维张量，c代码之中为线性存储的。需要算出偏移量也就是映射。通过python端将权重写出，写为二进制文件，就是.bin文件，c++端读取此.bin文件作为权重运算。

python之中的顺序

c代码之中的顺序

因为是线性存储，所以需要一系列偏移地址找到权重位置：

三、c代码端

3.1 文件描述

程序文件

mtcnn.cpp .hpp : Network structure definition of MTCNN 网络结构的定义
network.cpp hpp : Basic functions such as conv , relu , padding 基本的函数实现，比如卷积，reLU，padding
pbox.cpp .hpp : definition of basic data format. 基本的数据结构定义。例如pBox结构体，里面存了宽，高，通道数和数据指针指向数据。

权重文件

Pnet.bin , Rnet.bin , Onet.bin total 3.0 MB 三个权重文件3MB，为了减少FPGA数据流量
Generated by python 通过前面的python端训练产生。
Read by readData function. 通过c文件之中的readData函数读取。之前c代码之中权重文件为.txt格式，我们改为 .bin格式，数据更紧密。
readData function difinied in network.cpp, function called in mtcnn.cpp

更改结构顺序

c代码的网络结构需要与python代码的结构一致。每次更改网络结构之后，需要做以下的修改。

Changing python code network structure。更改python代码的结构
Rerun python training code 重新训练python端的代码
Generate weight file. 输出权重文件
In mtcnn.hpp , change the structure of class Pnet(Rnet,Onet) private definition. 在mtcnn.hpp程序之中更改类Pnet(Rnet,Onet)的private定义
In mtcnn.cpp , change class Pnet(Rnet,Onet) construct function and destruct function. 在mtcnn.cpp更改相应的类的构造函数和析构函数
Change parameters in dataNumber, pointTeam, readData for weight file read.更改与权重读取相关的三个函数及参量：dataNumber, pointTeam, readData。
Change Init function for each layer buffer malloc.更改实现相应的层的init函数，init函数用于开辟内存空间。
Change run function to run each layer. 更改每层的运行函数。

3.2 卷积的更改

卷积的更改较为重要，因为部署于硬件端的时候，是ARM控制FPGA运算。ARM端较容易移植，通过c++代码交叉编译即可。但是FPGA端需要通过HLS工具进行移植，是异构运算。因此此部分就是需要移除相应的依赖库。

初始的依赖openBLAS的卷积函数

openBLAS为线性代数实现的函数。旧的卷积实现为矩阵乘法，但是移植入FPGA的卷积不能用此结构实现。必须实现为底层的c++代码。

卷积的运用滑窗函数实现为一个二维矩阵，然后与权重排列成的二维矩阵实现矩阵乘。这也是大多数卷积的实现方式。但是这种方法无法实现于FPGA之上。并且每次进行取框函数会加大运算量。

Convolution in 2D matrix multiplication format:
// input Weight matrix  *  input feature matrix(Trans) = output feature matrix
// height (outChannels)    height (3D_KernelSize)        height (outChannels)
// width  (3D_KernelSize)  width  (outFeatureSize)       width  (outFeatureSize)

重新运用定义编写卷积代码

我们需要从卷积的定义出发，编写卷积函数。

Without feature_2_matrix process: 
//  outpBox [out_ChannelNum][out_height][out_width] 
//  +=weightIn[out_ChannelNum][in_ChannelNum][kernelWidth][kernelHeight] 
//  *pboxIn[in_ChannelNum][width][height]

伪代码如上，这样，既不用滑窗函数，而且生成的output也可以被下层当作feature直接运用。

定义出发的卷积方便zynqNet改为FPGA内并行的结构。实现加速。

加入bias和ReLU

卷积后的过程并入卷积函数利用并行化，尽可能多的将任务给FPGA实现。

存储顺序

四、硬件端

硬件端是最复杂的。首先卷积的IPcore需要通过HLS来实现。为什么通过HLS来实现？一是因为HLS可以直接将c++代码进行HLS，从而更好地保证逻辑特性，二是缩短实现周期，用verilog这种底层语言写出来要更久时间。

4.1 卷积IPcore

在此之前，我们需要了解FPGA的存储结构。

存储

四种存储方式，主要是下面几种。

LUT，翻转寄存器，数据调用最快，直接参与运算。
BRAM，片上RAM，调用数据需要一个时钟周期。
DDR片上扩存存储，调用周期较长。因此采用的原则是尽量从BRAM上调取数据。少从DDR上搬运。但是权重文件过多，不得不从DDR上调取数据，需要用BRAM作为buffer，并行的从DDR调取数据到BRAM上。
移位寄存器。用于实现数据流操作。
还有其他的部分，可以在HLS工具里面查找到，例如LUT RAM，DSP RAM，具体可以通过HLS实现为不同的部分。

根据此存储结构，尽量将时钟调用周期短的和数据读取进行并行化。注意，大量权重文件存储于DDR上（BRAM存不下，不然全都存在BRAM上了），然后通过DDR与BRAM之间作为缓冲，然后BRAM之间并行实现并行的运算。

运算

运算结构：

LUT，既是运算单元也是存储单元。
FF，flip flop，翻转寄存器，可以参与运算。
DSP48 ，运行浮点运算较快

运算地址时候，运算单元与相应的BRAM的分配要并行化。比如地址运算需要DSP48，及时根据HLS生成的报告加入优化指令并且增加并行性。

接口

三种类型的接口，卷积函数的FPGA实现（四）函数接口的HLS

AXI-4，地址被实现为指针，较快，例如IPcore从DDR读取数据就需要用到此结构。
AXI-lite，接口被实现为register，适合小数据量传输。例如函数参数的传递。
AXI-strem，数据流，不需要地址。https://blog.csdn.net/weixin_36474809/article/details/81009769

卷积IPcore的实现参考zynqNet的结构，在DDR上搬运数据，传入BRAM上，然后通过并行实现加速。

vivado HLS硬件化指令（一）HLS针对循环的硬件优化

vivado HLS硬件化指令（二）HLS针对数组的硬件优化

vivado HLS硬件化指令（三）HLS增大运算吞吐量的硬件优化

4.2 IPcore的验证

关于IPcore的实现有很多内容，可以参考之前的博客。首先需要嵌入MTCNN之中验证，逻辑通过，再用testBench进行验证。

•Validated in MTCNN code 嵌入入MTCNN代码之中验证
•Validated in HLS test bench (C-simulation) 嵌入HLS的test Bench之中验证。也就是实现c仿真。
•Validated in synthesis and generate report 通过synthesisi和生成相应的报告
•Export RTL 输出RTL代码

•C-RTL co-simulation C与RTL协同仿真。

4.3 IPcore报告

https://blog.csdn.net/weixin_36474809/article/details/85271940

时间资源

zynqNet的时钟周期如下，基本与卷积IPcore为同一个数量级。

从MACC的次数考虑

zynqNet的MACC次数固定为 : 152,731,648，整个网络运行时间为2s

MTCNN:

从43,543,288 到85,176,568

按照此时间预测，MTCNN的时间为：

From 0.57sec – 1.12sec

空间资源

即使占用的资源比zynqNet少很多，但是MIZ7020平台上资源超出预期。

在7035平台上资源够用。

4.4 ARM端工作

ARM端的任务为

写数据到DDR上
调用FPGA端进行运算
运行神经网络

刚开始的MTCNN代码分开的开辟每层的卷积，对于调用IPcore来讲非常耗时。

交叉编译工作

虚拟机交叉编译openCV详细步骤及bug解决详解

虚拟机上安装openCV

zynq7020的ARM单片机编译与运行程序MTCNN

所以需要更改为在DDR一次性的开辟所有的内存反复调用。
首先交叉编译Open CV，其次交叉编译MTCNN程序，然后可以在FPGA的片上ARM运行
注意内存需要一次性开辟，不要像原代码那样，开辟了一系列小内存空间。影响IPcore获得偏移地址。甚至可以从权重文件中一边读取，一边写入DDR，因为ARM的RAM本来就很小，很容易堆栈溢出。

调用IPcore工作

然后实现IPcore，可以实现卷积IPcore的单次调用。
再用MTCNN程序反复调用卷积IPcore实现相应的卷积。

Ceph集群2025（Squid版）导出高可用NFS集群(上集) 野猪佩挤存储 system ceph java 服务器
#创建一个CephFS文件系统cephfsvolumecreatecephfs02#创建子卷cephfssubvolumegroupcreatecephfs02myfsg2#查看子卷cephfssubvolumegrouplscephfs02[{"name":"myfsg2"}]创建NFSGanesha集群#例子$cephnfsclustercreate[][--ingress][--virtua
SSH监控野猪佩挤 system Shell ssh 运维
创建/etc/ssh/sshrc文件写入以命令echo"=====系统状态====="uptimefree-h每次登录会显示如果在sshrc文件加入以下脚本每次登录就是执行这个脚本#cat/etc/ssh/sshrcecho"=====系统状态====="uptimefree-h/usr/local/bin/monit.sh以下脚本内容#!/bin/bash#获取登录信息USER_LOGIN="$
ngx_http_add_address 若云止水 nginx
staticngx_int_tngx_http_add_address(ngx_conf_t*cf,ngx_http_core_srv_conf_t*cscf,ngx_http_conf_port_t*port,ngx_http_listen_opt_t*lsopt){ngx_http_conf_addr_t*addr;if(port->addrs.elts==NULL){if(ngx_array
SpringbootActuator未授权访问漏洞 web_15534274656 面试学习路线阿里巴巴 java
漏洞介绍Actuator是SpringBoot提供的用来对应用系统进行自省和监控的功能模块，借助于Actuator开发者可以很方便地对应用系统某些监控指标进行查看、统计等。然而，其默认配置会出现接口未授权访问，导致部分接口会泄露网站数据库连接信息等配置信息，使用Jolokia库特性甚至可以远程执行任意代码，获取服务器权限。1、漏洞危害1、信息泄露：未授权的访问者可以通过Actuator端点获取敏感
MCP可能会引入新的数据传输方式：[RFC] 使用新的“可流式传输的 HTTP”传输方式取代 HTTP+SSE shadowcz007 http 网络协议网络
用简单易懂的方式讲解GitHub上modelcontextprotocol/specification仓库中pullrequest#206的内容。想象我们是在聊一个“快递系统”的升级！---这个PullRequest是啥？这个pullrequest（简称PR）就像是给一个软件规则（ModelContextProtocol）提了个改进建议。它的目标是升级“快递系统”（传输方式），让信息在电脑和服务器
sealos自动部署k8s集群 SilentCodeY linux 运维服务器云原生 kubernetes 容器
官网：安装K8s集群|Sealos:专为云原生开发打造的以K8s为内核的云操作系统1、sealos工具下载二进制自动下载VERSION=`curl-shttps://api.github.com/repos/labring/sealos/releases/latest|grep-oE'"tag_name":"[^"]+"'|head-n1|cut-d'"'-f4`curl-sfLhttps://m
Axios源码深度剖析 - XHR篇 IT博客技术分享 ajax node.js javascript
Axios源码深度剖析-XHR篇#Axios源码深度剖析-XHR篇[axios](https://github.com/axios/axios)是一个基于Promise的http请求库，可以用在浏览器和node.js中，目前在github上有42K的star数##分析axios-目录-[axios项目目录结构](#axios项目目录结构)-[名词解释](#名词解释)-[axios内部的运作流程图]
CI/CD(三) 安装nfs并指定k8s默认storageClass qq_41369135 kubernetes ci/cd docker nfs storageClass
一、NFS服务端安装（主节点10.60.0.20）1.安装NFS服务端sudoaptupdatesudoaptinstall-ynfs-kernel-server2.创建共享目录并配置权限sudomkdir-p/data/k8ssudochownnobody:nogroup/data/k8s#允许匿名访问sudochmod777/data/k8s3.配置NFS导出规则编辑/etc/exports文
uniapp刷新本页源码网 uni-app
网上那些都是放屁，浪费时间，都给我用这个！//刷新本页window.location.reload();
使用Yeager.ai轻松构建LangChain工具和代理 qahaj 人工智能 langchain python
技术背景介绍在现代AI开发框架中，如何快速构建、测试和部署AI解决方案是一个重要的课题。Yeager.ai为此提供了一个完整的生态系统，旨在简化AI智能体和工具的创建过程。它的核心组件yAgents是一个无代码的LangChain代理构建器，能够让用户轻松地集成各种语言模型和资源，非常适合开发者、研究人员和AI爱好者在不同应用场景中使用。核心原理解析Yeager.ai利用LangChain框架，通
k8s--集群内的pod调用集群外的服务 IT艺术家-rookie k8s与docker容器技术 kubernetes 容器云原生
关于如何让同一个局域网内的Kubernetes服务的Pod访问同一局域网中的电脑上的服务。可能的解决方案包括使用ClusterIP、NodePort、HeadlessService、HostNetwork、ExternalIPs，或者直接使用Pod网络。每种方法都有不同的适用场景，需要逐一分析。例如，ClusterIP是默认的，只能在集群内部访问，所以可能需要其他方式。NodePort会在每个节点
Angular与Laravel的CSRF问题探讨与解决 t0_54manong 编程问题解决手册 angular.js laravel csrf 个人开发
在现代Web开发中，安全性是一个不容忽视的关键问题。跨站请求伪造（CSRF）攻击是常见的安全威胁之一，幸运的是，Laravel框架已经为我们提供了强大的CSRF保护机制。然而，当我们将Angular前端与Laravel后端集成时，可能会遇到一些CSRF相关的挑战。今天我们将通过一个具体的案例来探讨如何解决Angular与Laravel之间的CSRF问题。背景介绍假设我们有一个使用Angular开发
学习Video.js 前端熊猫 Video Player 学习
查阅官方文档，学习video.js相关属性、回调与方法：播放器选项设置①标准的video标签属性②data-setup属性传递JSON③创建播放器实例以第二个参数配置videojs('my-player',{controls:true,autoplay:false,preload:'auto'});//修改选项varplayer=videojs('my-player');player.option
神经网络中层与层之间的关联 iisugar 神经网络深度学习计算机视觉
目录1.层与层之间的核心关联：数据流动与参数传递1.1数据流动（ForwardPropagation）1.2参数传递（BackwardPropagation）2.常见层与层之间的关联模式2.1典型全连接网络（如手写数字分类）2.2卷积神经网络（CNN，如图像分类）2.3循环神经网络（RNN/LSTM，如文本生成）2.4Transformer（如机器翻译）3.层间关联的核心原则3.1数据传递的“管道
第二十一篇：伦理/道德Ethics flying_1314 NLP ethics 伦理/道德隐私偏见双重用途
目录什么是伦理/道德？我们为什么要关心？为什么道德很难？学习成果大纲反对NLP道德检查的论据我们应该审查科学吗？H5N1透明度不是更好吗？AIvs.Cybersecurity核心NLP伦理概念偏见词嵌入中的偏差双重用途OpenAIGPT-2隐私GDPRAOL搜索数据泄露小组讨论提示自动刑期预测自动简历处理语言社区分类打包带走~什么是伦理/道德？我们应该如何生活——苏格拉底•正确的做法是什么？•为什
【STM32】智能避障红外小车 Alioooooooon 嵌入式 stm32 单片机嵌入式硬件
文章目录直流电机`motor.c/motor.h`红外对管红外循迹利用脉冲宽度调制技术（PWM）控制电机转速避障`red.c/red.h`编译环境：keil5SourceInsightSTM32F103X原理图：直流电机直流电机的原理：通电就会转，反向通电就会反转两极的电势差决定转速电机驱动模块以及接线参考图示代码实现：motor.c/motor.h#ifndef__MOTOR_H__#defin
SAP-ABAP：SAP生产业务（PP模块）全流程深度解析爱喝水的鱼丶 VIP详情查看专栏 SAP ABAP 开发运维运维系统架构
SAP生产业务（PP模块）全流程深度解析一、生产主数据架构体系1.主数据矩阵物料主数据工艺路线工作中心生产版本MRP运行2.核心主数据表数据对象表结构关键字段事务码物料主数据MARAMATNR,MTART,DISMMMM01工艺路线PLKO/PLPOPLNNR(路由号),VORNR(工序)CA01工作中心CRHD/CRTXARBPL(工作中心),KAPAR(能力)CR01BOMMAST/STPOS
css filter属性详解 pengfeixc CSS css css3 web development
cssfilter属性详解文章中codepen例子，无法实时预览，可以在这里获得更好阅读体验。最近琢磨着把网站主题色更改一下，看到了一篇文章DarkModeinOneLineofCode，作者讲述了如何用一句代码将网站主题色更改成相反色，这样网站就可以拥有有白天模式和黑夜模式了。html{filter:invert(1);}使用上面的代码，可以很方便的将页面颜色反转，达到黑夜模式的效果。但是我并不
深夜惊魂：当监控告警“撒谎”时，SRE 如何逆风翻盘？ YAMLMaster kubernetes 运维开发 devops 容器云原生
Yorkshire,England引言我们这一篇也是含金量十足，如果面试官让你说个你处理过的比较有意思的案例，可以跟他讲讲，让他也见见世面。好吧，我们直接开始，最后有相关的群，有兴趣可以加入。开始一、故障场景深度还原时间：2025年1月3日02:00（GMT+8）环境：•数据库集群：MySQL8.0.35，通过KubeBlocks部署（3节点，跨AZ）•监控架构：•Prometheus-Opera
Pytorch深度学习教程_9_nn模块构建神经网络 tRNA做科研深度学习保姆教程深度学习 pytorch 神经网络
欢迎来到《深度学习保姆教程》系列的第九篇！在前面的几篇中，我们已经介绍了Python、numpy及pytorch的基本使用，进行了梯度及神经网络的实践并学习了激活函数和激活函数，在上一个教程中我们学习了优化算法。今天，我们将开始使用pytorch构建我们自己的神经网络。欢迎订阅专栏进行系统学习：深度学习保姆教程_tRNA做科研的博客-CSDN博客目录1.理解nn模块：(1)使用nn.Sequent
【MyBatisPlus】MyBatisPlus介绍与使用 web_15534274656 面试学习路线阿里巴巴 java
【MyBatisPlus】MyBatisPlus介绍与使用文章目录【MyBatisPlus】MyBatisPlus介绍与使用1、什么MyBatisPlus2、MyBatisPlus的CRUD操作3、MyBatisPlus分页使用1、什么MyBatisPlusMyBatisPlus（简称MP）是基于MyBatis框架基础上开发的增强型工具，旨在简化开发、提高效率官网：https://baomidou
k8s运维设置Pod实现JVM内存根据容器内存动态调整风行無痕 K8S kubernetes jvm 容器
一、实现方式推荐方案：利用JVM容器感知特性，按比例动态分配。适用场景‌：动态根据Pod内存限制自动分配堆内存，无需硬编码参数Java要求：Java8u191+或Java11+Java8u191+或Java11+支持通过-XX:InitialRAMPercentage替代-Xms，根据容器内存限制自动计算堆内存。在容器环境变量中配置-XX:MaxRAMPercentage=75.0，使JVM根据容
【机器学习】算法分类 CH3_CH2_CHO 什么？！是机器学习！！机器学习算法有监督学习无监督学习半监督学习强化学习
1、有监督学习1.1定义使用带标签的数据训练模型。有监督学习是机器学习中最常见的一种类型，它利用已知的输入特征和对应的输出标签来训练模型，使模型能够学习到特征与标签之间的映射关系。在训练过程中，模型会不断地调整自身的参数，以最小化预测值与真实标签之间的误差，从而提高预测的准确性。1.2回归问题1.2.1目标预测连续值。回归问题的目标是预测一个连续的数值结果，模型的输出是一个实数值。1.2.2解释回
Linux------Redis(软件安装，Linux下和Windows下)，NoSQL（简单了解） .墨迹. Linux redis 大数据 java
文章目录NoSql1.历史1.单机MySql2.Memcached(缓存)+MySql+垂直拆分(读写分离)3.分库分表+水平拆分+MySql集群4.如今最近的年代5.为什么要使用NoSQL2.什么是NoSQL1.NOSQL2.特点3.3v+3高3.NoSQL的四大分类1.kv键值对：2.文档型数据库（bson和json一样）：3.列存储数据库：4.图关系型数据库Redis1.初始redis1.简
Java并发实战——CountDownLatch优化商品详情页数据加载 1加1等于 Java并发 java 开发语言多线程
本文将结合电商场景比如优化商品详情页数据加载，深入探讨CountDownLatch的工作原理及实际应用。本文目录1.简介2.商品详情页数据加载优化实战3.CountDownLatch的优势4.其他应用场景5.使用误区1.简介CountDownLatch是Java并发包java.util.concurrent中的一个同步工具类。允许一个或多个线程等待，直到其他一组线程完成一系列操作。CountDow
SpringBoot + Facade Pattern : 通过统一接口简化多模块业务 Java布道者 spring boot 外观模式后端
概述外观设计模式（FacadePattern）是一种常见的结构型设计模式，它的主要目的是简化复杂系统的使用。可以把它想象成一个“控制面板”或者“遥控器”，通过这个控制面板，用户可以轻松操作一个复杂的系统，而不需要关心系统内部是如何运作的。举个生活中的例子，想象一下，你家有一台多功能的家电，比如一台智能电视，它不仅能看电视，还能上网、播放视频、控制智能家居等等。对于电视的操作，你有遥控器，可以通过一
P2P通信：WebRTC的原理与实现幻想彩虹中的绚丽光华 p2p webrtc 网络协议 WebRTC
WebRTC（WebReal-TimeCommunication）是一种用于在Web浏览器之间进行实时通信的开放标准。它提供了一种直接的点对点（P2P）通信方式，使得浏览器之间可以实时传输音频、视频和数据。本文将详细介绍WebRTC的原理和实现，并提供相应的源代码示例。WebRTC的原理：WebRTC利用了多种技术，包括实时传输协议（RTP）、会话发起协议（SDP）、媒体传输控制协议（RTCP）和
删除 mkcert 根证书堕落年代杂论网络
1.删除mkcert根证书（关键步骤）Windows系统打开证书管理器：•按Win+R，输入certmgr.msc，回车。定位根证书：•左侧导航栏依次展开受信任的根证书颁发机构→证书。•在右侧列表中找到mkcert@或mkcertdevelopmentCA。删除证书：•右键证书→删除→确认操作。macOS系统打开钥匙串访问：•通过Spotlight搜索或进入应用程序/实用工具。定位根证书：•左侧选
Ruoyi报‘com.ruoyi.system.api.RemoteLogService‘ that could not be found. 堕落年代 SpringCloud Springboot spring cloud spring boot
解释这个因为在引包的时候有些包的配置没有导入进去，想要解决这个问题最简单的方式就是注释掉这个的包的导入。解决方法报错***************************APPLICATIONFAILEDTOSTART***************************Description:FieldremoteLogServiceincom.ruoyi.common.log.service.
stlink is not in the dfu mode，please restart it litvm bug解决经验分享
问题：Keil中使用stlink烧录代码时，提示需要更新驱动，点击更新后，提示：“STLINKisnotintheDFUmodeplesserestartit”，重新拔插之后，还是同样的问题解决方法：stlink已经连接了STM32F103（VCC，GND，SWCLK，SWDIO四个引脚），在连接状态下，插入电脑进行更新是不行的，也就是所谓的notinthedfumode。只需要把stlink与S
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后

2018.5-2019.1基于FPGA平台的目标检测网络实现

一、项目背景

1.1 公司背景

1.2 应用背景

1.3 技术路线

二、python端

2.1 MTCNN与训练过程

2.2 mAP的测试

2.3 网络结构的更改

2.4 输出python训练的权重到c代码端

python之中的顺序

c代码之中的顺序

三、c代码端

3.1 文件描述

程序文件

权重文件

更改结构顺序

3.2 卷积的更改

初始的依赖openBLAS的卷积函数

重新运用定义编写卷积代码

加入bias和ReLU

存储顺序

四、硬件端

4.1 卷积IPcore

存储

运算

接口

4.2 IPcore的验证

4.3 IPcore报告

时间资源

空间资源

4.4 ARM端工作

交叉编译工作

调用IPcore工作

你可能感兴趣的:(机器学习,c/c++,目标检测,FPGA)