人工智能和FPGA AI技术

语义分割enet模型在ultra96开发板上的实现

CSDN不能直接上传DOC文档，没时间整理插图，请大家见谅！

目录
一、硬件和软件环境 2
1.1 主开发板Ultra96v2 2
1.2 独立硬件系统连接图 3
1.3 安装脚本cityscapesscripts 4
1.4 生成金标TrainIdLabelImgs文件 4
二、改变训练浮点模型 5
2.1 计算机侧项目目录 5
2.2 训练模型层改动 6
2.3 训练模型训练参数 7
2.3.1 训练输入目录 7
2.3.2 输入命令和参数 8
2.4 各种语义分割模型比较 9
三、Vitis-AI量化 11
3.1 量化浮点图像模型改动 11
3.2 量化浮点图像模型参数 13
3.3 量化浮点视频模型改动 14
3.4 量化命令与输入参数 14
3.5 部署模型输入层 15
四、测试用浮点模型 16
4.1增加输入层DeephiResize 16
4.2 训练和测试输入层ImageSegData 16
4.3 模型评估与测试 17
4.3.1 评估脚本命令 17
4.3.2 浮点评估命令 18
4.3.3 量化评估命令 18
4.3.4 mIOU指标评估 18
4.3.5 图形命令与显示 18
五、制作DPU 20
5.1 DPU IP 2304 20
5.2 DPU CLK 300M 20
六、编译 20
6.1 编译程序 20
6.1.1 判断cf还是tf模型 21
6.1.2 hwh生成dcf文件 21
6.1.3 编译命令 21
6.2 图像处理elf文件 22
6.3 视频处理elf文件 24
七、Ultra96板开发 25
7.1 项目文件夹 25
7.2 Makefile文件 25
7.3 源程序介绍 26
7.4 制作链接库 28
7.5 加载overlay程序 28
7.6 并行编译 29
7.7 多线程 29
7.8 单线程 30
7.9 图像和视频演示 31

一、硬件和软件环境
1.1 主开发板Ultra96v2
Ultra96采用了Zynq® UltraScale+ MPSoC 器件，跟银行卡一样大的板卡放下了Xilinx最先进的MPSoC，其搭载的xczu3eg提供了大约7020两倍的逻辑资源。

1.2 独立硬件系统连接图

1.3 安装脚本cityscapesscripts
#Installation cityscapesscripts
Install cityscapesscripts with pip

python -m pip install cityscapesscripts

Graphical tools (viewer and label tool) are based on Qt5 and can be installed via
python -m pip install cityscapesscripts[gui]

1.4 生成金标TrainIdLabelImgs文件
john@john-wang:~/Vitis-AI_1.2/Segment/workspace/cityscapesScripts/cityscapesscripts/preparation$ vim ~/.bashrc
export CITYSCAPES_DATASET=/home/john/Vitis-AI_1.2/Segment/Cityscapes

/workspace/Segment/Cityscapes/leftImg8bit/train/aachen/aachen_000000_000019_leftImg8bit.png /workspace/Segment/Cityscapes/gtFine/train/aachen/aachen_000000_000019_gtFine_labelTrainIds.png

二、改变训练浮点模型
2.1 计算机侧项目目录

2.2 训练模型层改动
**Replacing the un-pooling layer with deconvolution layer in the decoder module

layer {
  name: "UpsamplingBilinear2d_1"
  type: "Deconvolution"
  bottom: "BatchNorm_72"
  top: "UpsamplingBilinear2d_1"
  param {
    lr_mult: 0.0
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 64
    bias_term: false
    pad: 1
    kernel_size: 4
    group: 64
    stride: 2
    weight_filler {
      type: "bilinear"
    }
  }
}

Replacing all PReLU with ReLU
Removing spatial dropout layers
Replace Batchnorm layers with a merged Batchnorm + Scale layer

layer {
  name: "BatchNorm_85"
  type: "BatchNorm"
  bottom: "ConvNd_87"
  top: "BatchNorm_85"
  param {
    lr_mult: 1
    decay_mult: 0
  }
  param {
    lr_mult: 1
    decay_mult: 0
  }
  param {
    lr_mult: 0
    decay_mult: 0
  }
  param {
    lr_mult: 0
    decay_mult: 0
  }
  batch_norm_param {
    use_global_stats: false
    eps: 1e-05
    scale_filler {
      type: "constant"
      value: 1
    }
    bias_filler {
      type: "constant"
      value: 0
    }
  }
}

Position Batchnorm layers in parallel with ReLU
In UNet-full/Unet-lite models Batchnorm/scale layer combinations were inserted before relu layers (after d0c, d1c, d2c, and d3c) as the DPU doesn’t support the data flow from Convolution to both the Concat and relu simultaneously**

2.3 训练模型训练参数
2.3.1 训练输入目录
img_seg.txt的真实位置
/home/john/Vitis-AI_1.2/Segment/Cityscapes/img_seg.txt

根据你的计算机内存调整batch_size大小和img_seg.txt的真实位置调整prototxt

2.3.2 输入命令和参数
2.3.2.1 进入GPU镜像
双系统的Ubuntu命令行输入：
john@john-wang:~/Vitis-AI_1.2$ ./docker_run.sh xilinx:gpunetscope

2.3.2.2 训练解码模型和batch_size参数
(vitis-ai-caffe)john@john-wang:/workspace/Segment/model/enet$ caffe train -solver solver_encoder.prototxt 2>&1 | tee encoder_models/train_encoder_log.txt

train_val_encoder.prototxt文件中batch_size决定于计算机内存大小，我的计算机是16G，只能取4，而 solver_encoder.prototxt的iter_size并不受限。
2.3.2.3 迁移训练全模型和batch_size参数
caffe train -solver solver.prototxt -weights final_models/pretrained.caffemodel 2>&1 | tee caffe-fine-tune-full.log

train_val.prototxt文件中batch_size决定于计算机内存大小，不同于解码模型，只能取2，而 solver.prototxt的iter_size并不受限。
2.4 各种语义分割模型比较
caffe train –solver solver.prototxt –weights final_models/pretrained.caffemodel 2>&1 | tee caffe-fine-tune-full.log

训练时计算机截图：

下图是各语义分割模型训练时的指标：

• ENet -> 6K 迭代模型
• ESPNet -> 18K 迭代模型
• FPN -> 10K 迭代模型
• Unet-Lite -> 13K 迭代模型
• Unet-Full -> 16K 迭代模型

鉴于以上分析结果，我们选用mIOU与迭代时间指标都不错的ENet模型。
三、Vitis-AI量化
3.1 量化浮点图像模型改动

train_val.prototxt 与 VAI float.prototxt 输入层对比

The input layer has changed from “ImageSegData” type to “ImageData”

原训练模型train_val.prototxt开始部分

layer {
  name: "data"
  type: "ImageSegData"
  top: "data"
  top: "label"
  transform_param {
    mean_value: 73
    mean_value: 82
    mean_value: 72
    scale: 0.022
    crop_size: 512
  }
  image_data_param {
    source: "/workspace/Segment/Cityscapes/img_seg.txt"
    #batch_size: 7
    batch_size: 3
    #root_folder: "/data2/datasets/Cityscapes/"
    shuffle: true
    mirror: false
  }
 include {
   phase: TRAIN
  }
}

量化用浮点模型float.prototxt开始部分

name: "enet"
layer {
  name: "data"
  type: "ImageData"
  top: "data"
  top: "label"
    include {
    phase:TRAIN
  }
  image_data_param {
    source: "/workspace/Segment/VAI/data/cityscapes/calibration.txt"                    **#文件中没有目录**
    root_folder:"/workspace/Segment/VAI/data/cityscapes/calibration_images/"    **＃指定目录**
    batch_size: 1         **＃改为1**
    new_height: 512       **＃指出图像分辨率**
    new_width: 1024
    shuffle: true
  }
  transform_param {
    mean_value: 73
    mean_value: 82
    mean_value: 72
    scale: 0.022
    resize_param {         **＃代替crop_size: 512**
      prob: 1.0
      resize_mode: WARP
      height: 512          **＃can change to 512x256 input size for video**
      width: 1024
    }
  }
}

原训练模型train_val.prototxt开始部分

layer {
  name: "loss"
  type: "SoftmaxWithLoss"        **#change to Softmax in VAI**
  bottom: "ConvNd_91"
  bottom: "label"
  top: "loss"
  loss_param {
    ignore_label: 255
  }
#  include {
#   phase: TRAIN
#  }
}
#===========accurcay=====
layer {
  name: "acc"                       **#delete acc layer in VAI**
  type: "Accuracy"
  bottom: "ConvNd_91"
  bottom: "label"
  top: "acc"
  top: "per_acc"
  accuracy_param {
  ignore_label: 255
  }
#  include {
#   phase: TRAIN
#  }
}

VAI float.prototxt

layer {
  name: "score"
  type: "Softmax"                  **#change to Softmax in VAI**        
  bottom: "ConvNd_91"
  top: "score"
}

3.2 量化浮点图像模型参数
train_val.prototxt

3.3 量化浮点视频模型改动
量化输入video模型文件float.prototxt

name: “enet”
layer {
name: “data”
type: “ImageData”
top: “data”
top: “label”
include {
phase:TRAIN
}
image_data_param {
source: “/workspace/Segment/VAI/data/cityscapes/calibration.txt”
root_folder:"/workspace/Segment/VAI/data/cityscapes/calibration_images/"
batch_size: 1
new_height: 256
new_width: 512
shuffle: true
}
transform_param {
mean_value: 73
mean_value: 82
mean_value: 72
scale: 0.022

resize_param {
  prob: 1.0
  resize_mode: WARP
  height: 256
  width: 512
}

}
}
3.4 量化命令与输入参数
(vitis-ai-caffe) john@john-wang:/workspace/Segment/VAI/enet$ ./quantize_and_compile.sh
vai_q_caffe quantize
-model $(pwd)/float.prototxt
-weights $(pwd)/float.caffemodel
-gpu $GPUID
-calib_iter 1000
-output_dir ${model_dir} 2>&1 | tee ${model_dir}/quantize.txt

量化开始：

量化结束：

3.5 部署模型输入层
量化后输入层：

四、测试用浮点模型
4.1增加输入层DeephiResize
测试用浮点模型float_test.prototxt

"DeephiResize"是在测试中增加的一层，采用原来的float.prototxt能成功，但IOU下降一点。

** 增加DeephiResize 层**

# Resize to expected resolution
layer {
  name: "resize_down"
  type: "DeephiResize"
  bottom: "data"
  top: "data"
  include {
    phase: TEST
  }
  deephi_resize_param {
#    new_height: 256
#    new_width: 512
    new_height: 512
    new_width: 1024
#    new_height: 1024
#    new_width: 2048
    resize_type: 0
  }
}

4.2 训练和测试输入层ImageSegData
An additional input layer “ImageSegData” has been added which has a path to the val_img_seg_nomap.txt file. 只要用到标的，就必须用ImageSegData

如果反过来，在量化中采用ImageSegData层，则会出错。

从下面浮点与定点的带DEEPHI层与不带的对比，可以看到采用DEEPHI层要高2％

带DEEPHI层浮点模型IOU

带DEEPHI层部署模型IOU，但如果用这个模型编译会出错

不带DEEPHI层浮点模型IOU

不带DEEPHI层部署模型IOU

4.3 模型评估与测试
4.3.1 评估脚本命令
Docker xilinx:gpunetscope镜像中输入
(vitis-ai-caffe) john@john-wang:/workspace/Segment/VAI/enet$./test_float_and_quantized.sh
4.3.2 浮点评估命令
vai_q_caffe test -model float_test.prototxt -weights float.caffemodel -test_iter 500 -gpu $GPUID 2>&1 | tee test_results/float_model_test.txt

4.3.3 量化评估命令
vai_q_caffe quantize
-model ${model_dir}/float_test.prototxt
-weights ${model_dir}/float.caffemodel
-gpu $GPUID
-calib_iter 1000
-test_iter 500
-auto_test
-output_dir ${output_dir} 2>&1 | tee test_results/quantized_model_test.txt

4.3.4 mIOU指标评估

4.3.5 图形命令与显示
4.3.5.1 图形处理命令
./test_enet.sh

python test_enet.py
–model …/…/model/enet/deploy.prototxt
–weights …/…/model/enet/final_models/pretrained.caffemodel
–input …/munich_000000_000019_leftImg8bit.png
–out_dir ./
4.3.5.2 显示程序与效果
官方的镜像文件图形不能显示图片，调用Python的标准图像库里show()函数，而它调用了xv，但xv在后面的ubuntu版本中xv都不装了。
解决办法：先装一个ImageMagic，就相当于把xv的入口换成了ImageMagic的display：

(vitis-ai-caffe) john@john-wang:/workspace/segment/scripts/test_scripts$ sudo apt-get update
(vitis-ai-caffe) john@john-wang:/workspace/segment/scripts/test_scripts$ sudo apt-get install imagemagick

注意对这个镜像进行commit生成新的镜像文件。

以下是在计算机侧展示的图像：

处理前后图像

五、DPU选型与制作
5.1 DPU 2304制作
5.1.1 Vitis-AI输入文件
DPU2304比DPU1600算力更强，ultra96也能接受，可以在300M DPU时钟工作,时钟更高则由于电源设计缺陷而呈现不稳定。

Prj_config文件

Ultra96.json文件

5.1.2 DPU制作脚本

5.2 Vivado原理图

5.3 DPU 2304性能

六、Kernel编译
6.1 编译程序
john@john-virtual-machine:/workspace$ ./compile.sh

6.1.1 判断cf还是tf模型
if [ $FRAMEWORK = ‘cf’ ]; then
conda activate vitis-ai-caffe
elif [ $FRAMEWORK = ‘tf’ ]; then
conda activate vitis-ai-tensorflow
else
echo “Error: currently only caffe and tensorflow are supported.”
exit 1
fi
6.1.2 hwh生成dcf文件
if [ $KaTeX parse error: Undefined control sequence: \ at position 109: …f Ultra96.json \̲ ̲ /opt/vitis_ai…$ {BOARD}/*.dcf
sudo cp *.dcf /opt/vitis_ai/compiler/arch/dpuv2/ ${BOARD}/$ {BOARD}.dcf
fi
6.1.3 编译命令
if [ $FRAMEWORK = ‘cf’ ]; then
vai_c_caffe
–prototxt ${MODEL_UNZIP}/quantized/deploy.prototxt
–caffemodel $KaTeX parse error: Undefined control sequence: \ at position 43: …loy.caffemodel \̲ ̲ --arch /opt/v…$ {BOARD}/${BOARD}.json
–output_dir ./model
–net_name ${MODEL}
elif [ $FRAMEWORK = ‘tf’ ]; then
echo “FRAMEWORK tensorflow”
vai_c_tensorflow
–frozen_pb $KaTeX parse error: Undefined control sequence: \ at position 41: …eploy_model.pb \̲ ̲ --arch /opt/v…$ {BOARD}/ $KaTeX parse error: Undefined control sequence: \ at position 14: {BOARD}.json \̲ ̲ --output_dir …$ {MODEL}
6.2 图像处理elf文件
分辨率为512 x 1024

6.3 视频处理elf文件
分辨率为256 x 512

七、Ultra96板开发
7.1 项目文件夹

7.2 Makefile文件

PROJECT = seg
OBJ := main.o
CXX := g++
CC := gcc

linking libraries of OpenCV

LDFLAGS = $(shell pkg-config --libs opencv)

linking libraries of DNNDK

LDFLAGS += -ln2cube -lpthread -lhineon
CUR_DIR = $(shell pwd)
SRC = $(CUR_DIR)/src
BUILD = $(CUR_DIR)/build
MODEL = $(CUR_DIR)/model
VPATH = $(SRC)
MODEL = $(CUR_DIR)/model/dpu_segmentation_0.elf
ARCH = $(s h e l l u n a m e - m ∣ s e d - e s / a r m . * / a r m v 71 / - e s / a a r c h 64 . * / a a r c h 64 /) C F L A G S : = - O 2 - W a l l - W p o i n t e r - a r i t h - s t d = c + + 11 - f f a s t - m a t h - I . . / c o m m o n / i f e q ($ (ARCH),armv71)
CFLAGS += -mcpu=cortex-a9 -mfloat-abi=hard -mfpu=neon -I…/common/
endif
ifeq ($(ARCH),aarch64)
CFLAGS += -mcpu=cortex-a53 -I…/common/
endif
all: $(BUILD) $(PROJECT)
$(PROJECT): $(OBJ)
$(CXX) $(CFLAGS) $(addprefix $(BUILD)/, $^) $(MODEL) -o $@ $(LDFLAGS)
%.o : %.cc
$(CXX) -c $(CFLAGS) $< -o $(B U I L D) /$ @
%.o : %.cpp
$(CXX) -c $(CFLAGS) $< -o $(B U I L D) /$ @
clean:
$(RM) -r $(BUILD)
$(RM) $(PROJECT)
$(BUILD) :
-mkdir -p $@
7.3 源程序介绍
源程序分为图像、视频和摄像头三个主程序。

enet_cap、enet_image、enet_videosingle、enet_videomulti四个文件夹分别负责实时实景、图像处理、单线程视频处理和多线程视频处理。

模型名称和节点：
#define KERNEL_CONV “segmentation_0”
#define CONV_INPUT_NODE “ConvNd_1”
#define MAXPOOL_INPUT_NODE “MaxPool2d_1”
#define CONV_OUTPUT_NODE “ConvNd_91”

19种对象的色彩
uint8_t colorB[] = {128, 232, 70, 156, 153, 153, 30, 0, 35, 152,
180, 60, 0, 142, 70, 100, 100, 230, 32};
uint8_t colorG[] = {64, 35, 70, 102, 153, 153, 170, 220, 142, 251,
130, 20, 0, 0, 0, 60, 80, 0, 11};
uint8_t colorR[] = {128, 244, 70, 102, 190, 153, 250, 220, 107, 152,
70, 220, 255, 0, 0, 0, 0, 0, 119};

图像预处理子程序
int dpuSetInputImageWithScale(DPUTask task, const char nodeName, const cv::Mat &image, float *mean, float scale, int idx)

读取指定目录图像文件名
void ListImages(string const &path, vector &images)

读入图像文件并调用DPU处理子程序
void Read(DPUTask *task, int argc)

DPU处理子程序
void runSegmentation(DPUTask *task, string filename, Mat img, int argc)

根据输入命令行，调用不同的图像均值初始化值
float mean[3];
if (argc == 1) {
mean[0]=73.0;mean[1]=82.0;mean[2]=72.0;
} else {
mean[0]=104.0;mean[1]=84.0;mean[2]=86.0;}

按照原图与DPU输出图一定比例混合输出
for (int i = 0; i < segMat.rows * segMat.cols * 3; i++) {
segMat.data[i] = img.data[i] * 0.2 + segMat.data[i] * 0.8;}
cv::imshow( “Display”, segMat );

根据输入命令行参数，选择不同的输入图像文件夹
if (argc == 2) {
lindau_images = path + argv[1] + “/”;
cout << " directory : " << lindau_images << endl;
} else {
cout << " directory : " << lindau_images << endl;
}

每幅图像停留300ms,期间若按下ESC,程序暂停，按回车，程序继续运行
if(waitKey(300)==27) while(getchar() != ‘\n’);//getchar();

调整视频窗口
cv::namedWindow(“Segmentation Display”, cv::WINDOW_NORMAL);
cv::resizeWindow(“Segmentation Display”, cv::Size(1024,512));
7.4 制作链接库

#!/bin/bash
set -e
model=segmentation
overlays=overlays_300M2304
cd $KaTeX parse error: Expected 'EOF', got '#' at position 12: {overlays} #̲pwd aarch64-lin\dots$ {model}_0.elf -o libdpumodel $KaTeX parse error: Expected group after '_' at position 57: \dotsPIC -shared dpu_̲$ {model}_0.elf -o libdpumodel{ $KaTeX parse error: Expected 'EOF', got '}' at position 6: model}̲.so" cp libdpum\dots$ {model}.so /usr/lib/
ls -l /usr/lib/libdpu*.so
cd …
pwd
cp ./${overlays}/* /usr/local/lib/python3.6/dist-packages/pynq_dpu/overlays/
python3 overlay.py
7.5 加载overlay程序

import os
from pynq_dpu import DpuOverlay
overlay = DpuOverlay(“dpu.bit”)
os.system(“dexplorer -w”)
7.6 并行编译
尝试用make -j4并行编译, 提高编译速度

7.7 多线程
Ultra96v2 三线程 read segmentation display,的确能提高一点处理速度，但由于Ultra96的电源本身的缺陷，极不稳定，放弃。

多线程死掉

7.8 单线程
Ultra96v2 单线程 read segmentation display

7.9 图像和视频演示
这张是我们用自己的图片进行调试中的截图

以下效果图是在计算机侧展示的图像：

ultra96效果图一：

ultra96效果图二：

ultra96效果图三：

以下是调试过程记录：

https://github.com/Xilinx/Vitis-AI-Tutorials/tree/ML-Caffe-Segmentation-Tutorial

Installation cityscapesscripts

Install cityscapesscripts with pip

python -m pip install cityscapesscripts

Graphical tools (viewer and label tool) are based on Qt5 and can be installed via

python -m pip install cityscapesscripts[gui]

生成TrainIdLabelImgs图形文件

john@john-wang:~/Vitis-AI_1.2/Segment/workspace/cityscapesScripts/cityscapesscripts/preparation$ vim ~/.bashrc
export CITYSCAPES_DATASET=/home/john/Vitis-AI_1.2/Segment/Cityscapes

john@john-wang:~/Vitis-AI_1.2/Segment/workspace/cityscapesScripts/cityscapesscripts/preparation$ python createTrainIdLabelImgs.py
/home/john/Vitis-AI_1.2/Segment/workspace/cityscapesScripts/cityscapesscripts/preparation/…/…/gtFine///_gt_polygons.json

/workspace/Segment/Cityscapes/leftImg8bit/train/aachen/aachen_000000_000019_leftImg8bit.png /workspace/Segment/Cityscapes/gtFine/train/aachen/aachen_000000_000019_gtFine_labelTrainIds.png

模型的改变

https://github.com/Xilinx/Vitis-AI-Tutorials/tree/ML-Caffe-Segmentation-Tutorial

Note that these models may differ somewhat from the original models as they have been modified for end use in the DPU IP. Some of the types of modifications that were made to these models include:

Replacing the un-pooling layer with deconvolution layer in the decoder module

This essentially removes the decoder stage that is present in the (d) ESPNet model, and in place of that decoder stage, a single deconvolution layer is added to resize up 8x back to the original input size which matches the annotation size.

layer {
  name: "UpsamplingBilinear2d_1"
  type: "Deconvolution"
  bottom: "BatchNorm_72"
  top: "UpsamplingBilinear2d_1"
  param {
    lr_mult: 0.0
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 64
    bias_term: false
    pad: 1
    kernel_size: 4
    group: 64
    stride: 2
    weight_filler {
      type: "bilinear"
    }
  }
}

Replacing all PReLU with ReLU
Removing spatial dropout layers
Replace Batchnorm layers with a merged Batchnorm + Scale layer

layer {
  name: "BatchNorm_85"
  type: "BatchNorm"
  bottom: "ConvNd_87"
  top: "BatchNorm_85"
  param {
    lr_mult: 1
    decay_mult: 0
  }
  param {
    lr_mult: 1
    decay_mult: 0
  }
  param {
    lr_mult: 0
    decay_mult: 0
  }
  param {
    lr_mult: 0
    decay_mult: 0
  }
  batch_norm_param {
    use_global_stats: false
    eps: 1e-05
    scale_filler {
      type: "constant"
      value: 1
    }
    bias_filler {
      type: "constant"
      value: 0
    }
  }
}

Position Batchnorm layers in parallel with ReLU

In UNet-full/Unet-lite models Batchnorm/scale layer combinations were inserted before relu layers (after d0c, d1c, d2c, and d3c) as the DPU doesn’t support the data flow from Convolution to both the Concat and relu simultaneously**

The ESPNet model will not compile properly due to the enablement of the channel augmentation setting in the DPU for those boards
you will need to create your own board image without channel augmentation in the DPU settings

“float.prototxt” that is included as an example in the VAI subfolders (i.e. ENet, ESPNet, etc.).
The “float.prototxt” files should be mostly identical to your “train_val.prototxt” except for the following:

train_val.prototxt 与 VAI float.prototxt 输入层对比

＃train_val.prototxt

The input layer has changed from "ImageSegData" type to "ImageData"
layer {
  name: "data"
  type: "ImageSegData"
  top: "data"
  top: "label"
  transform_param {
    mean_value: 73
    mean_value: 82
    mean_value: 72
    scale: 0.022
    crop_size: 512
  }
  image_data_param {
    source: "/workspace/Segment/Cityscapes/img_seg.txt"
    #batch_size: 7
    batch_size: 3
    #root_folder: "/data2/datasets/Cityscapes/"
    shuffle: true
    mirror: false
  }
 include {
   phase: TRAIN
  }
}

＃ VAI float.prototxt

name: "enet"
layer {
  name: "data"
  type: "ImageData"
  top: "data"
  top: "label"
    include {
    phase:TRAIN
  }
  image_data_param {
    source: "/workspace/Segment/VAI/data/cityscapes/calibration.txt"                    **#文件中没有目录**
    root_folder:"/workspace/Segment/VAI/data/cityscapes/calibration_images/"    **＃指定目录**
    batch_size: 1         **＃改为1**
    new_height: 512    **＃指出图像分辨率**
    new_width: 1024
    shuffle: true
  }
  transform_param {
    mean_value: 73
    mean_value: 82
    mean_value: 72
    scale: 0.022
    resize_param {       **＃代替crop_size: 512**
      prob: 1.0
      resize_mode: WARP
      height: 512          **＃can change to 512x256 input size for video**
      width: 1024
    }
  }
}

train_val.prototxt

layer {
  name: "loss"
  type: "SoftmaxWithLoss"        **#change to Softmax in VAI**
  bottom: "ConvNd_91"
  bottom: "label"
  top: "loss"
  loss_param {
    ignore_label: 255
  }
#  include {
#   phase: TRAIN
#  }
}
#===========accurcay=====
layer {
  name: "acc"                       **#delete acc layer in VAI**
  type: "Accuracy"
  bottom: "ConvNd_91"
  bottom: "label"
  top: "acc"
  top: "per_acc"
  accuracy_param {
  ignore_label: 255
  }
#  include {
#   phase: TRAIN
#  }
}

VAI float.prototxt

layer {
  name: "score"
  type: "Softmax"                  **#change to Softmax in VAI**        
  bottom: "ConvNd_91"
  top: "score"
}

测试浮点模型float_test.prototxt

"DeephiResize"是在测试中增加的一层，尝试下不增加，采用原来的float.prototxt能成功，但IOU下降一点。

float_test.prototxt 增加DeephiResize 层

# Resize to expected resolution
layer {
  name: "resize_down"
  type: "DeephiResize"
  bottom: "data"
  top: "data"
  include {
    phase: TEST
  }
  deephi_resize_param {
#    new_height: 256
#    new_width: 512
    new_height: 512
    new_width: 1024
#    new_height: 1024
#    new_width: 2048
    resize_type: 0
  }
}

An additional input layer “ImageSegData” has been added which has a path to the val_img_seg_nomap.txt file. 只要用到标的，就必须用ImageSegData

量化过程中用ImageSegData，则报错

if type is ImageSegData, then error

量化过程中若文件包含ImageSegData in quantize.sh , 则因寻找标的图像文件而失败

如果将ImageSegData change to ImageData，则成功

编译过程用name: resize_down, type: DeephiResize, 则报错。

因无法识别该层。

从下面浮点与定点的带DEEPHI与不带的对比，可以看到采用DEEPHI层要高2％，但由于移植到板上并无该层，有意用该层是否有美化效果之意，有待观察

A new layer called “SegmentPixelIOU” within the vai_q_caffe tool. The val_img_seg_nomap.txt file actually points to the gtFIne_labelIds rather than gtFine_labelTrainIds. This is because the SegmentPixelIOU layer has been coded to automatically relabel the classes.

程序个性调整

img_seg.txt的真实位置
/home/john/Vitis-AI_1.2/Segment/Cityscapes/img_seg.txt

根据你的计算机内存调整batch_size大小和img_seg.txt的真实位置调整prototxt

For ESPNet or ENet:
(vitis-ai-caffe) john@john-wang:/workspace/Segment/model/enet$ cd Segment/model/enet
从头训练：
(vitis-ai-caffe) john@john-wang:/workspace/Segment/model/enet$
caffe train -solver solver_encoder.prototxt 2>&1 | tee encoder_models/train_encoder_log.txt
迁移训练：
(vitis-ai-tensorflow) john@john-wang:/workspace/Segment/model/enet$
caffe train -solver solver.prototxt -weights encoder_models/pretrained_encoder.caffemodel 2>&1 | tee final_models/train_log.txt
从头训练：
For FPN, Unet-Full, or Unet-Lite:
(vitis-ai-caffe) john@john-wang:/workspace/Segment/model/FPN$ caffe train -solver solver.prototxt 2>&1 | tee final_models/train_log.txt
迁移训练：
john@john-wang:/workspace/Segment/model/enet$
caffe train -solver solver.prototxt -weights final_models/pretrained.caffemodel 2>&1 | tee caffe-fine-tune-full.log

python test_enet.py --model …/…/model/enet/deploy.prototxt --weights …/…/model/enet/final_models/pretrained.caffemodel --input …/…/Cityscapes/leftImg8bit/val/frankfurt/frankfurt_000000_000576_leftImg8bit.png --out_dir ./

./build/tools/caffe time -model …/workspace/model/enet/deploy.prototxt -gpu 0 -iterations 100

Python评估
(vitis-ai-caffe) john@john-wang:/workspace/Segment/scripts/eval$ python cls34_to_cls19.py
(vitis-ai-caffe) john@john-wang:/workspace/Segment/scripts/eval$ ./forward_inference_enet.sh
(vitis-ai-caffe) john@john-wang:/workspace/Segment/scripts/eval$ ./eval_segmentation.sh

(vitis-ai-caffe) john@john-wang:/workspace/Segment/VAI/enet$ ./quantize_and_compile.sh*
quantizing network: /workspace/Segment/VAI/enet/float.prototxt
内存仅为8G时：
WARNING: Logging before InitGoogleLogging() is written to STDERR
F0925 02:21:10.564823 75 gpu_memory.cpp:191] Check failed: error == cudaSuccess (2 vs. 0) out of memory

内存为16G，可以正常运行

Calibration 1000张图片，时间大概十分钟

官方指导模型与权重对应文件

以下用于测试的两个模型与权重文件一一对应：

–model …/…/model/enet/deploy.prototxt
–weights …/…/model/enet/final_models/pretrained.caffemodel \

以下VAI文件夹的两个模型与权重文件一一对应：

成功生成elf文件

vitis ai 无法用cv2显示
cv2.error: OpenCV(3.4.2) /tmp/build/80754af9/opencv-suite_1535558553474/work/modules/highgui/src/window.cpp:632: error: (-2:Unspecified error) The function is not implemented. Rebuild the library with Windows, GTK+ 2.x or Carbon support. If you are on Ubuntu or Debian, install libgtk2.0-dev and pkg-config, then re-run cmake or configure script in function ‘cvShowImage’

import os

os.getcwd()
‘/workspace/Segment’

pa="./scripts/test_scripts/frankfurt_000000_000576_leftImg8bit.png"
im=cv2.imread(pa)
type(im)

cv2.imshow(“im”,im)

(vitis-ai-caffe) john@john-wang:/workspace$ conda remove opencv
https://repo.anaconda.com/pkgs/main/linux-64

调用Python的标准图像库里show()函数，有可能无法显示图片。因为它调用了xv，但xv在后面的ubuntu版本中xv都不装了。
解决办法：先装一个ImageMagic，就相当于把xv的入口换成了ImageMagic的display：

sudo apt-get update
sudo apt-get install imagemagick
(vitis-ai-caffe) john@john-wang:/workspace/segment/scripts/test_scripts$ sudo apt-get update
(vitis-ai-caffe) john@john-wang:/workspace/segment/scripts/test_scripts$ sudo apt-get install imagemagick

xhost + 是使所有用户都能访问Xserver.

Unpooling

Unpooling是在CNN中常用的来表示max pooling的逆操作。这是从2013年纽约大学Matthew D. Zeiler和Rob Fergus发表的《Visualizing and Understanding Convolutional Networks》中产生的idea：

鉴于max pooling不可逆，因此使用近似的方式来反转得到max pooling操作之前的原始情况
简单来说，记住做max pooling的时候的最大item的位置，比如一个3x3的矩阵，max pooling的size为2x2，stride为1，反卷积记住其位置，其余位置至为0就行：

(171条消息) CNN概念之上采样，反卷积，Unpooling概念解释_g11d111的博客-CSDN博客 https://blog.csdn.net/g11d111/article/details/82350563

转置卷积（反卷积）

之所以叫转置矩阵，是因为下采样卷积核矩阵kernel逆运算上采样卷积必须旋转180，输入正常补零或间隔补零。

转置卷积
一般的卷积操作（我们这里只考虑最简单的无padding, stride=1的情况），都将输入的数据越卷越小。根据卷积核大小的不同，和步长的不同，输出的尺寸变化也很大。但是有的时候我们需要输入一个小的特征，输出更大尺寸的特征该怎么办呢？比如图像语义分割中往往要求最终输出的特征尺寸和原始输入尺寸相同，但在网络卷积核池化的过程中特征图的尺寸却逐渐变小。在这里转置卷积便能派上了用场。在数学上，转置卷积的操作也非常简单，把正常卷积的操作反过来即可。
对应上面公式，我们有转置卷积的公式：

如下所示：

这样我们就将一个转置卷积操作转换为对应的直接卷积。如下图所示：

总结一下将转置卷积转换为直接卷积的步骤：（这里只考虑stride=1，padding=0的情况）
设卷积核大小为k*k，输入为方形矩阵

对输入进行四边补零，单边补零的数量为k-1
将卷积核旋转180°，在新的输入上进行直接卷积

验证实验代码：

首先调用TensorFlow的conv_transpose函数来进行转置卷积

import tensorflow as tf

x = tf.reshape(tf.constant([[1,2],
                            [4,5]],dtype=tf.float32), [1, 2, 2, 1])
kernel = tf.reshape(tf.constant([[1,2,3],
                                 [4,5,6],
                                 [7,8,9]],dtype=tf.float32), [3, 3, 1, 1])
transpose_conv = tf.nn.conv2d_transpose(x, kernel, output_shape=[1, 4, 4, 1], strides=[1,1,1,1], padding='VALID')
sess = tf.Session()
print(sess.run(x))
print(sess.run(kernel))
print(sess.run(transpose_conv))

输出结果如下：

tf转置卷积
input: 1 2
4 5
kernel: 1 2 3
4 5 6
7 8 9
output: 1 4 7 6
8 26 38 27
23 62 74 48
28 67 76 45
接下来按照上面的方式，将转置卷积转换为一个等效的直接卷积

#转换为等效普通卷积

x2 = tf.reshape(tf.constant([[0, 0, 0, 0, 0, 0],
                             [0, 0, 0, 0, 0, 0],
                             [0, 0, 1, 2, 0, 0],
                             [0, 0, 4, 5, 0, 0],
                             [0, 0, 0, 0, 0, 0],
                             [0, 0, 0, 0, 0, 0]],dtype=tf.float32), [1, 6, 6, 1])
kernel2  = tf.reshape(tf.constant([[9,8,7],
                                   [6,5,4],
                                   [3,2,1]],dtype=tf.float32), [3, 3, 1, 1])
conv = tf.nn.conv2d(x2,kernel2,strides=[1,1,1,1],padding='VALID')

print(sess.run(x2))
print(sess.run(kernel2))
print(sess.run(conv))

输出结果和转置卷积相同

等效直接卷积
input: 0 0 0 0 0 0
补零 0 0 0 0 0 0
0 0 1 2 0 0
0 0 4 5 0 0
0 0 0 0 0 0
0 0 0 0 0 0

kernel: 9 8 7
旋转180度 6 5 4
3 2 1
output: 1 4 7 6
输出不变 8 26 38 27
23 62 74 48
28 67 76 45
实验结果和我们的预测一致。

总结
通过这一篇文章，仔细的梳理的了转置卷积由来以及其等效的直接卷积形式。希望以后在使用转置卷积的过程中可以做到心中有数，有画面。有关其他不同参数的转置卷积还有很多，比如当stride不为1时怎么办，padding不为0时怎么办。关于这些细节的讨论建议可以去参看参考文献：https://arxiv.org/pdf/1603.07285.pdf 。这里作者做了更加详尽的讨论，这里就不赘述了。

参考

(171条消息) 抽丝剥茧，带你理解转置卷积（反卷积）_史丹利复合田的博客-CSDN博客 https://blog.csdn.net/tsyccnh/article/details/87357447

set() 函数创建一个无序不重复元素集

np.array.diag, sum(0), sum(1)的研究

>>> import numpy as np
>>> b=np.arange(9)
>>> b=b.reshape(3,3)
>>> b
array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])
>>> np.diag(b)
array([0, 4, 8])
>>> b.sum(1)
array([ 3, 12, 21])
>>> b.sum(0)
array([ 9, 12, 15])
>>> 3+12+21
36
>>> 9+12+15
36

ious[np.isnan(ious)] ious[True]时置0 研究

def per_class_iu(hist):
    print(np.diag(hist))
    ious = np.diag(hist) / (hist.sum(1) + hist.sum(0) - np.diag(hist))
    print(ious)
    ious[np.isnan(ious)] = 0
    ious[True]=0
    print(ious)
    return ious

np.unique(gt) 该函数是去除数组中的重复数字，并进行排序之后输出
gt_id_set.update(np.unique(gt).tolist())

max_element类型是指针，指向值最大的那个元素；max_element指向值最小的那个元素。

测试如下：

#include
#include
using namespace std;
int main()
{
int a[] = { 42, 13, 12, 68, 25, 6, 5, 32 };
int len = sizeof(a) / sizeof(int);
auto s1 = max_element(a, a + len);
auto s2 = min_element(a, a + len);
cout << s1 << endl; //指向值最大的元素的地址
cout << s2 << endl; //指向值最小的元素的地址
cout << *s1 << endl; //值最大的元素
cout << *s2 << endl; //值最小的元素
cout << s1 - a << endl; //值最大的元素的索引
cout << s2 - a << endl; //值最小的元素的索引

return 0;

}

你可能感兴趣的:(FPGA,AI,Xilinx)

guava loadingCache代码示例 IM 胡鹏飞 Java 工具类介绍
publicclassTest2{publicstaticvoidmain(String[]args)throwsException{LoadingCachecache=CacheBuilder.newBuilder()//设置并发级别为8，并发级别是指可以同时写缓存的线程数.concurrencyLevel(8)//设置缓存容器的初始容量为10.initialCapacity(10)//设置缓存
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
【LeetCode 热题 100】24. 两两交换链表中的节点——（解法一）迭代+哨兵 xumistore LeetCode leetcode 链表算法 java
Problem:24.两两交换链表中的节点题目：给你一个链表，两两交换其中相邻的节点，并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题（即，只能进行节点交换）。文章目录整体思路完整代码时空复杂度时间复杂度：O(N)空间复杂度：O(1)整体思路这段代码旨在解决一个经典的链表操作问题：两两交换链表中的节点(SwapNodesinPairs)。问题要求将链表中每两个相邻的节点进行交换
基于定制开发开源AI智能名片S2B2C商城小程序的社群游戏定制策略研究说私域人工智能小程序游戏
摘要：本文聚焦社群游戏定制领域，深入探讨以社群文化和用户偏好为导向的定制策略。通过分析互动游戏活动、社群文化塑造等关键要素，结合定制开发开源AI智能名片S2B2C商城小程序的技术特性，提出针对性游戏定制方案。研究旨在提升社群用户参与度与游戏体验，为社群游戏发展提供理论支持与实践指导。关键词：社群游戏定制；定制开发开源AI智能名片S2B2C商城小程序；社群文化；用户偏好一、引言在数字化社交蓬勃发展的
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
Android ViewBinding 使用与封装教程积跬步DEV Android 开发实战大全 android
AndroidViewBinding使用与封装教程：一、ViewBinding是什么？核心功能：为每个XML布局文件自动生成一个绑定类（如ActivityMainBinding），直接暴露所有带ID的视图引用。优点：避免繁琐的findViewById()，类型安全且编译时检查。对比DataBinding：ViewBinding仅处理视图引用，无数据绑定功能。DataBinding支持双向数据绑定，
Java大厂面试实录：谢飞机的电商场景技术问答（Spring Cloud、MyBatis、Redis、Kafka、AI等）
Java大厂面试实录：谢飞机的电商场景技术问答（SpringCloud、MyBatis、Redis、Kafka、AI等）本文模拟知名互联网大厂Java后端岗位面试流程，以电商业务为主线，由严肃面试官与“水货”程序员谢飞机展开有趣的对话，涵盖SpringCloud、MyBatis、Redis、Kafka、SpringSecurity、AI等热门技术栈，并附详细解析，助力求职者备战大厂面试。故事设定谢
【超硬核】JVM源码解读：Java方法main在虚拟机上解释执行 HeapDump性能社区 java 开发语言后端 jvm
本文由HeapDump性能社区首席讲师鸠摩（马智）授权整理发布第1篇-关于Java虚拟机HotSpot，开篇说的简单点开讲Java运行时，这一篇讲一些简单的内容。我们写的主类中的main()方法是如何被Java虚拟机调用到的？在Java类中的一些方法会被由C/C++编写的HotSpot虚拟机的C/C++函数调用，不过由于Java方法与C/C++函数的调用约定不同，所以并不能直接调用，需要JavaC
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
基于开源AI智能名片链动2+1模式与S2B2C商城小程序的渠道选择策略研究说私域人工智能小程序
摘要：在数字化商业环境下，品牌与产品的渠道选择对其市场推广和运营成功至关重要。本文聚焦于如何依据自身品牌和产品特性，结合开源AI智能名片链动2+1模式与S2B2C商城小程序，运用科学的渠道选择方法，慎重挑选1-2个适宜平台，集中资源发力并取得成绩后再拓展其他渠道。通过理论分析与案例研究，探讨该策略的有效性和可行性，为企业渠道布局提供参考。关键词：渠道选择；开源AI智能名片；链动2+1模式；S2B2
深入解析 TCP 连接状态与进程挂起、恢复与关闭誰能久伴不乏 tcp/ip 网络服务器
文章目录深入解析TCP连接状态与进程挂起、恢复与关闭一、TCP连接的各种状态1.**`LISTEN`**（监听）2.**`SYN_SENT`**（SYN已发送）3.**`SYN_RECEIVED`**（SYN已接收）4.**`ESTABLISHED`**（已建立）5.**`FIN_WAIT_1`**（关闭等待1）6.**`FIN_WAIT_2`**（关闭等待2）7.**`CLOSE_WAIT`**
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（Spring Boot、MyBatis、Kafka、Redis、AI等）来旺 Java场景面试宝典 Java Spring Boot MyBatis Kafka Redis 微服务 AI
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（SpringBoot、MyBatis、Kafka、Redis、AI等）互联网大厂技术面试不仅考察技术深度，更注重业务场景与系统设计能力。本篇以严肃面试官与“水货”程序员谢飞机的对话，带你体验音视频业务场景下的Java面试全过程，涵盖主流技术栈，并附详细答案解析，助你面试无忧。故事场景设定谢飞机是一名有趣但技术基础略显薄弱的程序员，这次应
配音助手：自媒体神器，内置海量音色的语音，支持多主播配音阿幸软件杂货间媒体
软件介绍内置文字转语音，提供多个主播音色，男声、女声、小孩、方言。支持的场景也是比较多，比如：广告促销、有声读物、广播配音、影视配音、Ai配音等。这个软件是免费的，只不过需要通过手机号码登录就可以使用全部功能了。软件下载夸克下载
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
kube-scheduler 抢占机制分享放大价值 kubernetes源码分析 kubernetes kube-scheduler 抢占
当pod调度失败后，会在PostFilter扩展点执行抢占流程，下面分析相关的代码实现抢占接口//PodNominatorabstractsoperationstomaintainnominatedPods.typePodNominatorinterface{//将pod加入抢占成功的node中AddNominatedPod(pod*PodInfo,nodeNamestring)//将pod从no
Java特性之设计模式【责任链模式】 Naijia_OvO Java特性 java 设计模式责任链模式
一、责任链模式概述顾名思义，责任链模式（ChainofResponsibilityPattern）为请求创建了一个接收者对象的链。这种模式给予请求的类型，对请求的发送者和接收者进行解耦。这种类型的设计模式属于行为型模式在这种模式中，通常每个接收者都包含对另一个接收者的引用。如果一个对象不能处理该请求，那么它会把相同的请求传给下一个接收者，依此类推主要解决：职责链上的处理者负责处理请求，客户只需要将
ThinkSound V2版 - 一键给无声视频配音，为AI视频生成匹配音效支持50系显卡一键整合包下载昨日之日2006 ai语音音视频人工智能
ThinkSound是阿里通义实验室开源的首个音频生成模型，它能够让AI像专业“音效师”一样，根据视频内容生成高度逼真、与视觉内容完美契合的音频。ThinkSound可直接应用于影视后期制作，为AI生成的视频自动匹配精准的环境噪音与爆炸声效；服务于游戏开发领域，实时生成雨势变化等动态场景的自适应音效；同时可以无障碍视频生产，为视障用户同步生成画面描述与环境音效。今天分享的ThinkSoundV2版
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
“Datawhale AI夏令营”基于带货视频评论的用户洞察挑战赛 fzyz123 Datawhale AI夏令营人工智能 Datawhale 大模型技术 NLP 深度学习 AI夏令营
前言：本次是DatawhaleAI夏令营2025年第一期的内容，赛事是：基于带货视频评论的用户洞察挑战赛（科大讯飞AI大赛）一、赛事背景在直播电商爆发式增长浪潮中，短视频平台积累的海量带货视频及用户评论数据蕴含巨大商业价值。这些数据不仅是消费者体验的直接反馈，更是驱动品牌决策的关键资产。用户洞察的核心在于视频内容与评论数据的联合挖掘：通过智能识别推广商品分析评论中的情感表达与观点聚合精准捕捉消费者
无面试无offer? 你需要AI 求职co-pilot的帮助!
大家好啊，我写的开源免费求职AIco-pilot工具发布了v3.0.0，欢迎大家参与、使用!https://github.com/weicanie/prisma-ai一、项目介绍开源免费的求职co-pilot，自动化简历准备至offer到手的整个流程。优化您的项目、定制您的简历、为您匹配工作，并帮助您做好面试准备。二、核心价值prisma-ai旨在解决求职者在准备简历和寻找工作时最头疼的3个问题:
[特殊字符] 实时数据洪流突围战：Flink+Paimon实现毫秒级分析的架构革命（附压测报告）——日均百亿级数据处理成本降低60%的工业级方案 Lucas55555555 flink 大数据
引言：流批一体的时代拐点据阿里云2025白皮书显示，实时数据处理需求年增速达240%，但传统Lambda架构资源消耗占比超运维成本的70%。某电商平台借助Flink+Paimon重构实时数仓后，端到端延迟从分钟级压缩至800ms，计算资源节省5.6万核/月。技术红利窗口期：2025年ApachePaimon1.0正式发布，支持秒级快照与湖仓一体，成为替代Iceberg的新范式一、痛点深挖：实时数仓
AIGC工具与软件开发流程的深度集成方案 Irene-HQ 软件开发测试 AIGC 测试工具 github AIGC 程序人生面试
一、代码开发环节集成路径‌环境配置标准化‌安装AIGC工具包并配置环境变量（如设置AIGC_TOOL_PATH），确保团队开发环境一致‌。在IDE插件市场安装Copilot等工具，实现编码时实时建议调用‌。‌人机协作新模式‌‌需求解析‌：上传PRD文档，AI自动提取业务规则生成类结构（如支付模块的PaymentService雏形）‌。‌代码补全‌：输入注释//JWT验证中间件，生成OAuth2.0
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（Advanced RAG[1]）基于历史对话重新生成Query？ 985小水博一枚呀 AI大模型学习路线人工智能学习 langchain RAG
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Query？【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Query？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Q
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（Advanced RAG[1]）其他Query优化相关策略？ 985小水博一枚呀 AI大模型学习路线人工智能学习 langchain
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？一
Topview Avatar 2深度实测：AI数字人带货的新高度，还是又一个营销噱头？神码小Z AI工具人工智能
在AI数字人赛道越来越卷的今天，各家产品都在宣传自己的"独门秘技"。最近，TopviewAI推出的Avatar2引起了我的注意——号称突破了产品尺寸限制，实现了"万物皆可带"。作为一个经常需要制作营销视频的内容创作者，我决定亲自上手测试一番，看看这款工具是否真的像宣传的那样强大。TopviewAvatar2是什么？革命性升级还是渐进式改良？TopviewAvatar2是TopviewAI推出的第二
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n