小火车、摆动的旋律

Few-shot Object Detection via Feature Reweighting论文学习以及复现

复现Few-shot Object Detection via Feature Reweighting论文代码

写在前面
本电脑配置
环境配置
- Prepare dataset
- Base Training
- - Train The Model
  - Evaluate the Model

写在前面

最近在看Few-shot Object Detection的开篇之作，看完论文后，打算先开始复现论文代码，跑跑看。
论文: link.
代码: link.
看完一遍论文后感觉似懂非懂，只了解了大概的框架，做了一些注释，后面需要再仔细看几遍。
以下记录我配置环境的过程以及其中遇到的问题:（这篇文章记录了我配置环境的过程，感觉比较啰嗦，我整理一个配置环境的简洁版本以及如何跑自己的数据集，见：Few-shot Object Detection via Feature Reweighting跑自己的数据集.）

本电脑配置

ubantu20.04，使用专业版pycharm（2021.3.1）软件（也可以在终端操作）配置

环境配置

作者的代码是基于 https://github.com/marvis/pytorch-yolo2 并使用 Python 2.7 和 PyTorch 0.3.1 开发的。一开始看到python2.7有点蒙，现在好像python3使用比较多？一开始走了一段弯路，我配置环境经常使用Anaconda（Anaconda则是一个打包的集合，里面预装好了conda、某个版本的python、众多packages、科学计算工具等等，所以也称为Python的一种发行版。）配置，用来比较方便，查阅资料可知（link），Anacona2.xxx对应python2.7.xxx版本，Anaconda3.xxx对应python3.xxx，于是我尝试同时安装两个版本的Anaconda的，找到一篇博客（基于Windows下）把Anaconda2安装在Anaconda3的安装路径下（link），着在ubantu上试一试，结果从官网下载Anaconda2太慢了，我打开pycharm看了一会发现好像可以选择python2.7的解释器？！？！，创建基于python2.7的解释器（自动创建了虚拟环境）后，继续下一步。

从代码链接下载代码后，查看requirements.txt文件

# -*- coding: utf-8 -*-
https://download.pytorch.org/whl/cpu/torch-0.3.1-cp27-cp27mu-linux_x86_64.whl ; sys_platform == "linux2"
torchvision == 0.2.2
future
easydict
numpy
opencv-python == 3.4.2

发现有个sys_platform == “linux2”，我查了下表示是表示操作系统，链接，大概的意思就是以前的版本区分linux2和linux3，后来改版后不区分了，变为linux，我查看了下我的（pycharm控制台输入sys.paltform）一开始是linux，然后我安装torch-0.3.1-cp27-cp27mu-linux_x86_64.whl 这个的时候显示平台不支持，没办法只能查资料看怎么解决，尝试能不能改为linux2，搜了好久都没有找到相关的资料，就先搁置了。
第二天，我发现又可以了，直接执行pip install -r requirements.txt比较顺利，只是该了一个地方:显示requirements.txt中opencv版本不匹配，没有3.4.2，只有3.4.2.16/17，我修改equirements.txt中opencv版本为3.4.2.16后，再执行pip install -r requirements.txt，没有报错，基本成功了，我输入sys.platform，发现变为linux2了（比较疑惑…，算了接着弄后面吧）。总的来说，我整理了下思路步骤:
（1）在pycharm中先创建基于python2.7的解释器（虚拟环境）
（2）执行requirements.txt
（3）如果遇到opencv版本不匹配的问题，如它报错显示只有3.4.2.16/17之类的，那就想修改requirements.txt的opencv版本为3.4.2.16/17，再执行requirements.txt

#执行Readme
接下来按照Readme的步骤执行：

Prepare dataset

执行

wget https://pjreddie.com/media/files/VOCtrainval_11-May-2012.tar
wget https://pjreddie.com/media/files/VOCtrainval_06-Nov-2007.tar
wget https://pjreddie.com/media/files/VOCtest_06-Nov-2007.tar

我下载后，执行解压命令时，解压失败，然后我手动解压，接着执行

wget http://pjreddie.com/media/files/voc_label.py
python voc_label.py

执行python voc_label.py 显示文件找不到，然后我查看后，发现有个文件夹（2012的那个）里的数据与2007的文件夹相比少了一些数据，我觉得可能是下载的时候的出现了问题，我把所有的数据集删除后，重新下载，这时出现了问题，
下载到99%报错了，显示“错误 (核心已转储)”

找了好多资料后，才解决这个问题，解决方法：链接: link.按照这篇博客所说的方法修改后，就可以下载数据集了。有时候每下载一次就要用这个方法修改一次，但还有时候修改了没有用！！！，直接暴力复制链接在浏览器下载。

切记：
要按照作者的解压语句解压，不建议手动解压。我和同学讨论语句解压和手动解压这个问题，发现了一个神奇的现象：运行解压语句，会把相同名称的文家夹合并起来，最后合成一个名为VOCdevkit的大文件夹（好神奇！！！），手动解压的话，会得到三个相应的文件夹，里面也包含着一些文件夹。语句解压相当于帮你把三个压缩包里的内容（相同名字的文件夹）合并了，以便后面使用。手动解压也行，在执行代码的时候修改路径准确对应就行，方便点的话
解压语句如下：

tar xf VOCtrainval_11-May-2012.tar
tar xf VOCtrainval_06-Nov-2007.tar
tar xf VOCtest_06-Nov-2007.tar

下载完成，解压完成，然后把所有文件放在一个名为voc的文件夹下面（方便后面操作），如下图：

（上图中，voc文件夹中多了几个文件，那是执行后面的步骤产生的，看了后面的代码发现，这里把文件都放在voc以便于后面的操作）

下一步Generate few-shot image list To use our few-shot datasets，进入工程所在的目录，执行

python scripts/convert_fewlist.py

直接执行会报错，先分析一下scripts/convert_fewlist.py 的作用，这个文件的目的主要是修改路径，生成小样本图片的列表，文件中具有批量修改小样本图片的列表的操作。
在这里要完成修改路径，才能执行这个py文件：
修改路径：

// 第8行
parser.add_argument('--droot', type=str, default='/home/wtz/me/fewshot/voc'

修改default后面的内容，定位到voc文件夹。

Base Training

下一步修改 Pascal 数据的 Cfg 更改 data/metayolo.data 文件

metayolo=1
metain_type=2
data=voc
neg = 1
rand = 0
novel = data/voc_novels.txt             // file contains novel splits
novelid = 0                             // which split to use
scale = 1
meta = data/voc_traindict_full.txt
train = $DATA_ROOT/voc_train.txt
valid = $DATA_ROOT/2007_test.txt
backup = backup/metayolo
gpus=1,2,3,4

复制过去记得把
// file contains novel splits
// which split to use
删除，这个只是解释前面的参数的，如果不删除后面运行会报错，issues上也有人题了这个问题: link。

Train The Model

python train_meta.py cfg/metayolo.data cfg/darknet_dynamic.cfg cfg/reweighting_net.cfg darknet19_448.conv.23

执行训练的时候报错了
错误1：No such file or directory: 'backup/metayolo_novel0_neg1
显示找不到这个文件，检查之后发现确实没有这个文件夹，issues有人讨论了这个问题link.，我看了之后他们所说的解决方法就是：在工程下面创建一个名为backup的空文件夹。
按照这个方法创建文件夹后，运行后没有报这个错误，但是新的错误又出现了：

根据报错查看后，发现缺少一个文件voc_metadict1_full，isuues上有人提出这个问题链接: link.但是没有解决方案，查询很多资料都没有找到相关的信息，然后去请教了学长，学长说可能是超参数配置文件、数据集索引文件、加权文家等，要先读懂代码才能把这个文件做出来。
所以开始仔细读代码喽～～～
…
…
…
额，感觉好多函数都需要查资料…
…
这几天看代码，感觉很慢，代码比较多读起来有点难，感觉效率不是很高。
…
我仔细看了下错误，发现好像并不是因为缺少这个voc_metadict1_full.txt，查看了运行Train_meta.py所调用的metatune.data、darknet_dynamic.cfg 、reweighting_net.cfg配置文件，发现文件路径以及文件中的路径没改，怪不得报错了，主要修改metatune.data文件，darknet_dynamic.cfg 、reweighting_net.cfg为网络的一些参数，不用改。

修改metatune.data文件：
修改1:
a.修改voc_train.txt文件的位置索引

train = /home/wtz/me/fewshot/voc_train.txt

b.voc_train.txt文件是数据集的位置索引，也需要改，改为自己的数据集所在的位置，修改文件中的索引路径的py文件如：

# coding:UTF-8
import argparse
import random
import os
import numpy as np
from os import path

parser = argparse.ArgumentParser()
parser.add_argument('--droot', type=str, default='/home/wtz/me/fewshot/voc')
# parser.add_argument('--droot', type=str, default='/home/bykang/voc')
args = parser.parse_args()

args.droot = args.droot.rstrip('/')
tgt_folder = path.join(args.droot, 'voclist')
src_folder = '/home/wtz/me/fewshot/1'

print('===> Converting few-shot name lists.. ')
for name_list in sorted(os.listdir(src_folder)):
    print('  | On ' + name_list)
    # Read from src
    with open(path.join(src_folder, name_list), 'r') as f:
        names = f.readlines()

    # Replace data root
    names = [name.replace('/home/bykang/voc', args.droot)
             for name in names]

    with open(path.join(args.droot, 'voclist', name_list), 'w') as f:
        f.writelines(names)

这是我根据作者的代码改的，src_folder 为修改前的文件所在的位置，tgt_folder 为修改后的文件所在的位置。

修改2：
a.修改voc_traindict_bbox_5shot.txt文件的位置索引

meta = data/voc_traindict_bbox_5shot.txt

b.修改voc_traindict_bbox_5shot.txt中的位置索引，修改索引的py文件见修改1。

修改3：
a.修改2007_test.txt文件的位置索引

valid = /home/wtz/me/fewshot/voc/2007_test.txt

b.修改voc_traindict_bbox_5shot.txt中的位置索引，修改索引的py文件见修改1。

以上就是把对应的文件、数据集的位置修改正确。
修改完后，再运行

python train_meta.py cfg/metayolo.data cfg/darknet_dynamic.cfg cfg/reweighting_net.cfg darknet19_448.conv.23

又报错了，如下：

显示raise AssertionError(“Torch not compiled with CUDA enabled”)
AssertionError: Torch not compiled with CUDA enabled
Torch编译的时候没有可用的CUDA？

… … … … … … … … … … … … … … … … … … … . … . . . … … . … … . . . .

经过很长时间的尝试，一直在弄cuda的问题，总结如下：
（1）只安装了cuda而没有安装pytorch框架，cuda是用不了的，安装cuda以及对应的pytorch框架，建议去官网选择安装，pytorch.

需要更早版本的在上面点击Previous Pytorch Versions选择，如conda install pytorch1.2.0 torchvision0.4.0 cudatoolkit=9.2 -c pytorch（为cuda9.2和pytorch1.2版本）

自己单独下载的话，要注意cuda和pytorch的对应！
验证cuda是否能用
a.没有在虚拟环境里安装的cuda（即没有进入虚拟环境，直接在终端里按装的cuda)，验证方法如下：
哦
返回True表示cuda可以用，返回False表示cuda不能用。
b.如果是在虚拟环境中安装的cuda，我们进入虚拟环境，进行测试，如果有pycharm的话，直接在控制台运行语句测试：

返回True表示cuda可以用，返回False表示cuda不能用。
（2）在虚拟环境里和不在虚拟环境安装的cuda是不通用的，所以配环境的时候直接在虚拟环境里安装cuda…等。
在虚拟环境里安装了cuda9.2+pytorch1.4

 pip install torch==1.4.0+cu92 torchvision==0.5.0+cu92 -f https://download.pytorch.org/whl/torch_stable.html

解决了raise AssertionError(“Torch not compiled with CUDA enabled”)
AssertionError: Torch not compiled with CUDA enabled的问题（这里的版本我是作了个尝试，报着试试的心态安装的，其他版本可能也行，但是有些版本如cuda11.1+pytorch1.8.1就不可以，可能和所创建的虚拟环境，使用的python版本有关吧）

再运行语句

python train_meta.py cfg/metayolo.data cfg/darknet_dynamic.cfg cfg/reweighting_net.cfg darknet19_448.conv.23

报错如下：

Traceback (most recent call last):
  File "train_meta.py", line 88, in <module>
    model.load_weights(weightfile)
  File "/home/wtz/me/fewshot/Fewshot_Detection-master/darknet_meta.py", line 378, in load_weights
    start = load_conv_bn(buf, start, model[0], model[1])
  File "/home/wtz/me/fewshot/Fewshot_Detection-master/cfg.py", line 455, in load_conv_bn
    conv_model.weight.data.copy_(torch.from_numpy(buf[start:start+num_w])); start = start + num_w 
RuntimeError: The size of tensor a (3) must match the size of tensor b (864) at non-singleton dimension 3

RuntimeError：张量 a (3) 的大小必须与非单维 3 的张量 b (864) 的大小相匹配？？？
维度不同，可能需要转换维度对应起来，issue上有人提了类似的问题链接: link.
解决方法：
修改cfg.py455行：

    # conv_model.weight.data.copy_(torch.from_numpy(buf[start:start+num_w])); start = start + num_w
    conv_model.weight.data.copy_(torch.from_numpy(buf[start:start + num_w]).reshape_as(conv_model.weight.data));start = start + num_w
    return

加了个reshape_as(conv_model.weight.data))转换维度
再运行语句

python train_meta.py cfg/metayolo.data cfg/darknet_dynamic.cfg cfg/reweighting_net.cfg darknet19_448.conv.23

报错如下：
显示RuntimeError: cuda runtime error (38) : no CUDA-capable device is detected at /pytorch/aten/src/THC/THCGeneral.cpp:50，查了一些解决方法: link.查看显卡编号为0：
修改配置文件metatune.data、metayolo.data 中的 gpu = 0。
再运行语句

python train_meta.py cfg/metayolo.data cfg/darknet_dynamic.cfg cfg/reweighting_net.cfg darknet19_448.conv.23

报错如下：
显示RuntimeError: CUDA out of memory. Tried to allocate 1.32 GiB (GPU 0; 3.81 GiB total capacity; 2.13 GiB already allocated; 364.25 MiB free; 2.25 GiB reserved in total by PyTorch)

然后我减少数据集的数量，3张数据集训练、2张数据集训练，出现了新的问题：调试检查后发现维度不对应，需要修改维度，issue上也有人提出并说了解决方案link.：

// 修改295～298行 为:
pred_boxes[0] = x.data.view(nB*nA*nH*nW) + grid_x
pred_boxes[1] = y.data.view(nB*nA*nH*nW) + grid_y
pred_boxes[2] = torch.exp(w.data).view(nB*nA*nH*nW) * anchor_w
pred_boxes[3] = torch.exp(h.data).view(nB*nA*nH*nW) * anchor_h

继续运行，出现问题：issue上有人提出并说了解决方案link.：

// 修改 conf_mask[b][cur_ious>sil_thresh] = 0 为：
conf_mask[b][torch.reshape(cur_ious, (nA, nH, nW)) > sil_thresh] = 0

继续运行，出现问题：
问题分析及解决link.
#将原语句：

train_loss+=loss.data[0]

#修改为：

train_loss+=loss.item()

继续运行，出现问题：
这个问题查了很多资料，发现都没有解决，issue上也没人讨论这个问题，经过我一步一步调试，发现是维度不匹配的问题，修改如下：

// cls_mask 改为 cls_mask.view（-1） 维度就匹配了
tcls = Variable(tcls.view(-1)[cls_mask.view(-1)].long().cuda())

接着运行，出现问题：
RuntimeError: shape ‘[30, 5, 6, 13, 13]’ is invalid for input of size 5070
这个问题我调试后发现它是有概率出现的，我在调试的时候，他没有报错，然后运行就报错了，而且是偶尔出现的？！？！？！我觉得应该问题不大，也有可能是数据集太少了的原因吧。
我刚开运行的时候，发现跑了4个epoch后就报这个错误了，能跑4个epoch环境应该没啥的问题了吧，我决定仔细读代码，学习、了解整个网络。感觉对网路还不是太熟，有时候调参数不太方便。
…
昨天调试了一下午，大概了解了整个代码的训练过程，训练的时候会用到voc_traindict_full.txt里对应类别的图片，我看了下，每个类别
都有好多图片，数据量很大，这可能是导致Cuda内存不足的的一个原因吧。我把每个类的图片减少到4张左右，发现还是训练不了，Cuda内存还是不足。我尝试删除类别进行训练。如果要改变类别数，需要修改的地方有点多，主要在训练所用的配置文件涉及类别的文件以及cfg.py文件中voc_classes，后面换数据集的时候再仔细记录吧。比较难受的是，我改完类别之后，运行报错了：浮点数例外 (核心已转储)，网上资料特别少，不知道怎么解决，后来又把类别改回去了，继续运行，依然只能训练集张图片，修改darknet_dynamic.cfg中的max_batches后，发现训练的时候的epoch减少了，并且可以运行17个epoch了，max_batches的值与epoch数目的计算有关，在train_meta.py可以找相应的语句。运行完之后，又不能运行了！！！Cuda内存又不足了！！！后来听同学说，把配置文件中的momentum=0改为0之后就可以运行了，我试了下，果然可以，momentum=0好像是梯度更新的时候用的，我觉得改为0后，网络在训练的时候就会变的“小”一点，所以就可以运行了。先这样吧，先训练一个全重，进行下一步！

Evaluate the Model

训练后得到权重000010.weights，路径为backup/metayolo_novel0_neg1/000010.weights，然后运行：

// Remember to change the corresponding path of 000010.weights
python valid_ensemble.py cfg/metayolo.data cfg/darknet_dynamic.cfg cfg/reweighting_net.cfg backup/metayolo_novel0_neg1/000010.weights

报错如下：

issue上没人讨论，进行调试检查，问题出现在cfg.py的文件419行：

conv_model.weight.data.copy_(torch.from_numpy(buf[start:start+num_w]).view(conv_model.weight.data.shape));

conv_model.weight.data的维度为[30,1024,1,1]，torch.from_numpy(buf[start:start+num_w]的维度为[32700,]，需要把维度转换为[30,1024,1,1]，链接: link.（解决方法来自这篇文章）：

conv_model.weight.data.copy_(torch.from_numpy(buf[start:start+num_w]).view(conv_model.weight.data.shape));

关于warning的修改，尽量别改，我在后面测试的发现报错了，一直解决不了问题，后面直接换了测试的py，没有改过warning的，就没有问题了…/

作者默认使用的是 5shot.txt，我报Cuda内存不足了，尝试改用1shot.txt.结果还是不行，Cuda 内存空间不足，就先这样吧，等熟悉下代码换数据集后在运行看看，后面估价得到服务器上跑了。
后面的Few-shot Tuning部分，也是用train_meta.py文件，和前面的配置文件有点不同，我尝试运行后一也是cuda内存不足的问题，我觉得应该环境应该没多大问题了。下一步打算换数据集试试。

【4.24更新】
已经更换了数据集，实现从同一个类，不同场景的迁移（1对1），作者是15base类迁移到 5novel类，目前还没完成弄完，等全部训练、测试完等再来更新吧，上面我是基于pycharm配python2.7的，其实可以直接创建 conda create -n name python=2.7。
【7.09】
最近又跑了一遍作者的数据集并做了测试，解决了一直困扰我好久好久的问题（测试的时候老是爆cuda，自己一直没意识到测试时其实不需要进行梯度更新，报错的语句前加 with torch.no grad 就可以了（记得训练的时候注释了，测试的时候再使用），我看issue上没人提这个问题，真的是毫无头绪，直到前几天才搜到这个问题的解决方法。测试完发现，对应的新类的AP和论文中的差不多，但是基类的AP却降得很厉害，Mean AP比论文低0.2左右！！！

（未完，后面接着更新…）

PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
【目标检测】机场内部目标检测数据集4106张YOLO+VOC格式
数据集格式：VOC格式+YOLO格式压缩包内含：3个文件夹，分别存储图片、xml、txt文件JPEGImages文件夹中jpg图片总计：4106Annotations文件夹中xml文件总计：4106labels文件夹中txt文件总计：4106标签种类数：7标签名称:["Ground_vehicles","Horizontal_sign","Runaway_limit","Taxiway","Ver
传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
目标检测中的NMS算法详解
好的，我们来详细解释一下目标检测中非极大值抑制（Non-MaximumSuppression,NMS）的相关概念和计算过程。1.为什么需要NMS？问题：目标检测模型（如FasterR-CNN,YOLO,SSD等）在推理时，对于同一个目标物体，通常会预测出多个重叠的、不同置信度（confidencescore）的候选边界框（BoundingBoxes）。直接输出所有这些框会导致：结果冗余：同一个物体
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
解决 Python 包安装失败问题：以 accelerate 为例
在使用Python开发项目时，我们经常会遇到依赖包安装失败的问题。今天，我们就以accelerate包为例，详细探讨一下可能的原因以及解决方法。通过这篇文章，你将了解到Python包安装失败的常见原因、如何切换镜像源、如何手动安装包，以及一些实用的注意事项。一、问题背景在开发一个深度学习项目时，我需要安装accelerate包来优化模型的训练过程。然而，当我运行以下命令时：bash复制pipins
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
如何使用Python实现交通工具识别
如何使用Python实现交通工具识别文章目录技术架构功能流程识别逻辑用户界面增强特性依赖项主要类别内容展示该系统是一个基于深度学习的交通工具识别工具，具备以下核心功能与特点：技术架构使用预训练的ResNet50卷积神经网络模型（来自ImageNet数据集）集成图像增强预处理技术（随机裁剪、旋转、翻转等）采用多数投票机制提升预测稳定性基于置信度评分的结果筛选策略功能流程用户通过GUI界面选择待识别图
YOLOv11 技术详解：架构优化与性能提升代码老y YOLO 架构目标跟踪
YOLOv11是目标检测领域中一个备受瞩目的新版本，它在保持实时性的同时，显著提升了检测的准确性和效率。本文将深入探讨YOLOv11的架构改进、性能优化以及它在不同应用场景中的表现。一、架构改进（一）C3K2块YOLOv11引入了C3K2块，这是对之前版本中CSP（CrossStagePartial）块的增强。C3K2块使用不同的核大小（例如3x3或5x5）和通道分离策略来优化更复杂特征的提取。这
YOLO11 目标检测从安装到实战
前言YOLO（YouOnlyLookOnce）系列是目标检测领域的经典算法，凭借速度快、精度高的特点被广泛应用。最新的YOLO11在模型结构和性能上进一步优化，本文将从环境搭建到实战应用，详细讲解YOLO11的使用方法，适合新手快速上手。一、环境准备1.系统要求操作系统：Windows10/11、Ubuntu20.04+、欧拉系统等硬件：CPU可运行，GPU（NVIDIA）可加速（推荐，需支持CU
Python OpenCV教程从入门到精通的全面指南【文末送书】一键难忘 python opencv 开发语言
文章目录PythonOpenCV从入门到精通1.安装OpenCV2.基本操作2.1读取和显示图像2.2图像基本操作3.图像处理3.1图像转换3.2图像阈值处理3.3图像平滑4.边缘检测和轮廓4.1Canny边缘检测4.2轮廓检测5.高级操作5.1特征检测5.2目标跟踪5.3深度学习与OpenCVPythonOpenCV从入门到精通【文末送书】PythonOpenCV从入门到精通OpenCV(Ope
OpenCV入门到精通：AI视觉处理的完整指南 AI云原生与云计算技术学院人工智能 opencv 计算机视觉 ai
OpenCV入门到精通：AI视觉处理的完整指南关键词：OpenCV、计算机视觉、图像预处理、目标检测、AI视觉应用摘要：本文是一份面向AI视觉爱好者的OpenCV完整学习指南。从OpenCV的核心概念讲起，结合生活案例、代码示例和项目实战，逐步拆解图像读取/显示、灰度化、边缘检测、目标检测等关键技术。无论你是想入门计算机视觉的新手，还是希望用OpenCV解决实际问题的开发者，都能通过本文掌握从理论
第八周 tensorflow实现猫狗识别降花绘 365天深度学习 tensorflow系列 tensorflow 深度学习人工智能
本文为365天深度学习训练营内部限免文章（版权归K同学啊所有）**参考文章地址：[TensorFlow入门实战｜365天深度学习训练营-第8周：猫狗识别（训练营内部成员可读）]**作者：K同学啊文章目录一、本周学习内容:1、自己搭建VGG16网络2、了解model.train_on_batch（）3、了解tqdm，并使用tqdm实现可视化进度条二、前言三、电脑环境四、前期准备1、导入相关依赖项2、
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路一、医疗领域：AI驱动的精准诊疗与效率提升1.医学影像诊断AI算法通过深度学习技术，已实现对X光、CT、MRI等影像的快速分析，辅助医生检测癌症、骨折等疾病。例如，GoogleDeepMind的AI系统在乳腺癌筛查中，误检率比人类专家低9.4%；中国的推想医疗AI系统可在20秒内完成肺部CT扫描分析，为急诊救治争取黄金时间。2.药物研发传统药
目前主流图像分类模型的详细对比分析 @comefly 闲聊 linux 运维服务器
以下是目前主流图像分类模型的详细对比分析，结合性能、架构特点及应用场景进行整理：一、主流模型架构分类与定量对比模型名称架构类型核心特点ImageNetTop-1准确率参数量（百万）计算效率典型应用场景ResNetCNN残差连接解决梯度消失，支持超深网络（如ResNet-152）76.1%25.6中等通用分类、目标检测ViTTransformer将图像分割为patches，用标准Transforme
专题：2025云计算与AI技术研究趋势报告|附200+份报告PDF、原数据表汇总下载
原文链接：https://tecdat.cn/?p=42935关键词：2025,云计算，AI技术，市场趋势，深度学习，公有云，研究报告云计算和AI技术正以肉眼可见的速度重塑商业世界。过去十年，全球云服务收入激增8倍，中国云计算市场规模突破6000亿元，而深度学习算法的应用量更是暴涨400倍。这些数字背后，是企业从“自建机房”到“云原生开发”的转型，是AI从“实验室”走向“产业级应用”的跨越。本报告
【深度学习解惑】在实践中如何发现和修正RNN训练过程中的数值不稳定？云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习 rnn 人工智能 tensorflow pytorch 神经网络机器学习
在实践中发现和修正RNN训练过程中的数值不稳定目录引言与背景介绍原理解释代码说明与实现应用场景与案例分析实验设计与结果分析性能分析与技术对比常见问题与解决方案创新性与差异性说明局限性与挑战未来建议和进一步研究扩展阅读与资源推荐图示与交互性内容语言风格与通俗化表达互动交流1.引言与背景介绍循环神经网络(RNN)在处理序列数据时表现出色，但训练过程中常面临梯度消失和梯度爆炸问题，导致数值不稳定。当网络
【深度学习实战】当前三个最佳图像分类模型的代码详解云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习人工智能分类模型机器学习 Transformer EfficientNet ConvNeXt
下面给出三个在当前图像分类任务中精度表现突出的模型示例，分别基于SwinTransformer、EfficientNet与ConvNeXt。每个模型均包含：训练代码（使用PyTorch）从预训练权重开始微调（也可注释掉预训练选项，从头训练）数据集目录结构：└──dataset_root├──buy#第一类图像└──nobuy#第二类图像随机拆分：80%训练，20%验证每个Epoch输出一次loss
第35周—————糖尿病预测模型优化探索
目录目录前言1.检查GPU2.查看数据编辑3.划分数据集4.创建模型与编译训练5.编译及训练模型6.结果可视化7.总结前言本文为365天深度学习训练营中的学习记录博客原作者：K同学啊1.检查GPUimporttorch.nnasnnimporttorch.nn.functionalasFimporttorchvision,torch#设置硬件设备，如果有GPU则使用，没有则使用cpudevice=
目标检测之数据增强
数据翻转，需要把bbox相应的坐标值也进行交换代码：importrandomfromtorchvision.transformsimportfunctionalasFclassCompose(object):"""组合多个transform函数"""def__init__(self,transforms):self.transforms=transformsdef__call__(self,ima
深度学习预备知识 AmazingMQ 深度学习人工智能
1.Tensor张量定义：张量（tensor）表示一个由数值组成的数组，这个数组可能有多个维度（轴）。具有一个轴的张量对应数学上的向量，具有两个轴的张量对应数学上的矩阵，具有两个以上轴的张量目前没有特定的数学名称。importtorch#arange创建一个行向量x，这个行向量包含以0开始的前12个整数。x=torch.arange(12)print("x=",x)#x=tensor([0,1,2
模型实战（21）之 C++ - tensorRT部署yolov8-det 目标检测明月醉窗台 #深度学习实战例程人工智能 c++YOLO 目标检测计算机视觉人工智能
C++-tensorRT部署yolov8-det目标检测python环境下如何直接调用推理模型转换并导出：pt->onnx->.engineC++tensorrt部署检测模型不写废话了，直接上具体实现过程+all代码1.Python环境下推理直接命令行推理，巨简单yolodetectpredictmodel=yolov8n.ptsource='https
根茎式装配体（RA）作为下一代协同智能范式的理论、架构与应用由数入道人工智能思维框架软件工程智能体
一、引言——范式危机与新大陆的召唤1.1表征主义的黄昏：当前AI协同范式的认知天花板自艾伦·图灵在《计算机器与智能》中播下思想的种子以来，人工智能的漫长征途始终被一个强大而内隐的哲学范式所笼罩——我们称之为“表征主义”（Representationism）。这一范式，无论其外在形态如何演变，从早期的符号逻辑、专家系统，到如今风靡全球的深度学习神经网络，其核心信念从未动摇：智能的核心，在于构建一个关
强大的销售团队背后竟然是大数据分析的身影蓝儿唯美数据分析
Mark Roberge是HubSpot的首席财务官，在招聘销售职位时使用了大量数据分析。但是科技并没有挤走直觉。大家都知道数理学家实际上已经渗透到了各行各业。这些热衷数据的人们通过处理数据理解商业流程的各个方面，以重组弱点，增强优势。 Mark Roberge是美国HubSpot公司的首席财务官，HubSpot公司在构架集客营销现象方面出过一份力——因此他也是一位数理学家。他使用数据分析
Haproxy+Keepalived高可用双机单活 bylijinnan 负载均衡 keepalived haproxy 高可用
我们的应用MyApp不支持集群，但要求双机单活（两台机器：master和slave）： 1.正常情况下，只有master启动MyApp并提供服务 2.当master发生故障时，slave自动启动本机的MyApp，同时虚拟IP漂移至slave，保持对外提供服务的IP和端口不变 F5据说也能满足上面的需求，但F5的通常用法都是双机双活，单活的话还没研究过服务器资源 10.7
eclipse编辑器中文乱码问题解决 0624chenhong eclipse乱码
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题，Eclipse提供了灵活的设置文件编码格式的选项，我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式：Workspace、Project、Content Type、File 本文以Eclipse 3.3（英文）为例加以说明： 1. 设置Workspace的编码格式： Windows-&g
基础篇--resources资源不懂事的小屁孩 android
最近一直在做java开发，偶尔敲点android代码，突然发现有些基础给忘记了，今天用半天时间温顾一下resources的资源。 String.xml 字符串资源涉及国际化问题 http://www.2cto.com/kf/201302/190394.html string-array
接上篇补上window平台自动上传证书文件的批处理问卷酷的飞上天空 window
@echo off : host=服务器证书域名或ip，需要和部署时服务器的域名或ip一致 ou=公司名称, o=公司名称 set host=localhost set ou=localhost set o=localhost set password=123456 set validity=3650 set salias=s
企业物联网大潮涌动：如何做好准备？蓝儿唯美企业
物联网的可能性也许是无限的。要找出架构师可以做好准备的领域然后利用日益连接的世界。尽管物联网（IoT）还很新，企业架构师现在也应该为一个连接更加紧密的未来做好计划，而不是跟上闸门被打开后的集成挑战。“问题不在于物联网正在进入哪些领域，而是哪些地方物联网没有在企业推进，” Gartner研究总监Mike Walker说。 Gartner预测到2020年物联网设备安装量将达260亿，这些设备在全
spring学习——数据库（mybatis持久化框架配置） a-john mybatis
Spring提供了一组数据访问框架，集成了多种数据访问技术。无论是JDBC，iBATIS(mybatis)还是Hibernate，Spring都能够帮助消除持久化代码中单调枯燥的数据访问逻辑。可以依赖Spring来处理底层的数据访问。 mybatis是一种Spring持久化框架，要使用mybatis，就要做好相应的配置： 1，配置数据源。有很多数据源可以选择，如：DBCP，JDBC，aliba
Java静态代理、动态代理实例 aijuans Java静态代理
采用Java代理模式，代理类通过调用委托类对象的方法，来提供特定的服务。委托类需要实现一个业务接口，代理类返回委托类的实例接口对象。按照代理类的创建时期，可以分为：静态代理和动态代理。所谓静态代理：　指程序员创建好代理类，编译时直接生成代理类的字节码文件。所谓动态代理：　在程序运行时，通过反射机制动态生成代理类。一、静态代理类实例： 1、Serivce.ja
Struts1与Struts2的12点区别 asia007 Struts1与Struts2
1) 在Action实现类方面的对比：Struts 1要求Action类继承一个抽象基类；Struts 1的一个具体问题是使用抽象类编程而不是接口。Struts 2 Action类可以实现一个Action接口，也可以实现其他接口，使可选和定制的服务成为可能。Struts 2提供一个ActionSupport基类去实现常用的接口。即使Action接口不是必须实现的，只有一个包含execute方法的P
初学者要多看看帮助文档不要用js来写Jquery的代码百合不是茶 jquery js
解析json数据的时候需要将解析的数据写到文本框中, 出现了用js来写Jquery代码的问题; 1, JQuery的赋值有问题代码如下: data.username 表示的是: 网易 $("#use
经理怎么和员工搞好关系和信任 bijian1013 团队项目管理管理
产品经理应该有坚实的专业基础，这里的基础包括产品方向和产品策略的把握，包括设计，也包括对技术的理解和见识，对运营和市场的敏感，以及良好的沟通和协作能力。换言之，既然是产品经理，整个产品的方方面面都应该能摸得出门道。这也不懂那也不懂，如何让人信服？如何让自己懂？就是不断学习，不仅仅从书本中，更从平时和各种角色的沟通
如何为rich:tree不同类型节点设置右键菜单 sunjing contextMenu tree Richfaces
组合使用target和targetSelector就可以啦，如下： <rich:tree id="ruleTree" value="#{treeAction.ruleTree}" var="node" nodeType="#{node.type}" selectionChangeListener=&qu
【Redis二】Redis2.8.17搭建主从复制环境 bit1129 redis
开始使用Redis2.8.17 Redis第一篇在Redis2.4.5上搭建主从复制环境，对它的主从复制的工作机制，真正的惊呆了。不知道Redis2.8.17的主从复制机制是怎样的，Redis到了2.4.5这个版本，主从复制还做成那样，Impossible is nothing! 本篇把主从复制环境再搭一遍看看效果，这次在Unbuntu上用官方支持的版本。 Ubuntu上安装Red
JSONObject转换JSON--将Date转换为指定格式白糖_ JSONObject
项目中，经常会用JSONObject插件将JavaBean或List<JavaBean>转换为JSON格式的字符串，而JavaBean的属性有时候会有java.util.Date这个类型的时间对象，这时JSONObject默认会将Date属性转换成这样的格式： {"nanos":0,"time":-27076233600000,
JavaScript语言精粹读书笔记 braveCS JavaScript
【经典用法】： //①定义新方法 Function .prototype.method=function(name, func){ this.prototype[name]=func; return this; } //②给Object增加一个create方法，这个方法创建一个使用原对
编程之美-找符合条件的整数用字符串来表示大整数避免溢出 bylijinnan 编程之美
import java.util.LinkedList; public class FindInteger { /** * 编程之美找符合条件的整数用字符串来表示大整数避免溢出 * 题目：任意给定一个正整数N，求一个最小的正整数M(M>1)，使得N*M的十进制表示形式里只含有1和0 * * 假设当前正在搜索由0，1组成的K位十进制数
读书笔记 chengxuyuancsdn 读书笔记
1、Struts访问资源 2、把静态参数传递给一个动作 3、<result>type属性 4、s:iterator、s:if c:forEach 5、StringBuilder和StringBuffer 6、spring配置拦截器 1、访问资源 (1)通过ServletActionContext对象和实现ServletContextAware,ServletReque
[通讯与电力]光网城市建设的一些问题 comsci 问题
信号防护的问题,前面已经说过了,这里要说光网交换机与市电保障的关系我们过去用的ADSL线路,因为是电话线,在小区和街道电力中断的情况下,只要在家里用笔记本电脑+蓄电池,连接ADSL,同样可以上网........
oracle 空间RESUMABLE daizj oracle 空间不足 RESUMABLE 错误挂起
空间RESUMABLE操作转 Oracle从9i开始引入这个功能，当出现空间不足等相关的错误时，Oracle可以不是马上返回错误信息，并回滚当前的操作，而是将操作挂起，直到挂起时间超过RESUMABLE TIMEOUT，或者空间不足的错误被解决。这一篇简单介绍空间RESUMABLE的例子。第一次碰到这个特性是在一次安装9i数据库的过程中，在利用D
重构第一次写的线程池 dieslrae 线程池 python
最近没有什么学习欲望,修改之前的线程池的计划一直搁置,这几天比较闲,还是做了一次重构,由之前的2个类拆分为现在的4个类. 1、首先是工作线程类:TaskThread,此类为一个工作线程,用于完成一个工作任务,提供等待(wait),继续(proceed),绑定任务(bindTask)等方法 #!/usr/bin/env python # -*- coding:utf8 -*-
C语言学习六指针 dcj3sjt126com c
初识指针，简单示例程序： /* 指针就是地址，地址就是指针地址就是内存单元的编号指针变量是存放地址的变量指针和指针变量是两个不同的概念但是要注意：通常我们叙述时会把指针变量简称为指针，实际它们含义并不一样 */ # include <stdio.h> int main(void) { int * p; // p是变量的名字， int *
yii2 beforeSave afterSave beforeDelete dcj3sjt126com delete
public function afterSave($insert, $changedAttributes) { parent::afterSave($insert, $changedAttributes); if($insert) { //这里是新增数据 } else { //这里是更新数据 } }
timertask shuizhaosi888 timertask
java.util.Timer timer = new java.util.Timer(true); // true 说明这个timer以daemon方式运行（优先级低， // 程序结束timer也自动结束），注意，javax.swing // 包中也有一个Timer类，如果import中用到swing包， // 要注意名字的冲突。 TimerTask task = new
Spring Security（13）——session管理 234390216 session Spring Security 攻击保护超时
session管理目录 1.1 检测session超时 1.2 concurrency-control 1.3 session 固定攻击保护
公司项目NODEJS实践0.3[ mongo / session ...] 逐行分析JS源代码 mongodb session nodejs
http://www.upopen.cn 一、前言书接上回，我们搭建了WEB服务端路由、模板等功能，完成了register 通过ajax与后端的通信，今天主要完成数据与mongodb的存取，实现注册 / 登录 /
pojo.vo.po.domain区别 LiaoJuncai java VO POJO javabean domain
　　POJO = "Plain Old Java Object"，是MartinFowler等发明的一个术语，用来表示普通的Java对象，不是JavaBean, EntityBean 或者 SessionBean。POJO不但当任何特殊的角色，也不实现任何特殊的Java框架的接口如，EJB， JDBC等等。　　　　即POJO是一个简单的普通的Java对象，它包含业务逻辑
Windows Error Code OhMyCC windows
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足, 无法处理此命令. 9 存储控制块地址无效. 10 环境错误. 11 试图加载格式错误的程序. 12 访问码无效. 13 数据无效. 14 存储器不足, 无法完成此操作. 15 系
在storm集群环境下发布Topology roadrunners 集群 storm topology spout bolt
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中，通过storm的管理命令来发布和管理集群中的topology。 1、打包打包插件是使用maven提供的maven-shade-plugin，详细见maven-shade-plugin。 <plugin> <groupId>org.apache.maven.
为什么不允许代码里出现“魔数” tomcat_oracle java
　　在一个新项目中，我最先做的事情之一，就是建立使用诸如Checkstyle和Findbugs之类工具的准则。目的是制定一些代码规范，以及避免通过静态代码分析就能够检测到的bug。　　迟早会有人给出案例说这样太离谱了。其中的一个案例是Checkstyle的魔数检查。它会对任何没有定义常量就使用的数字字面量给出警告，除了-1、0、1和2。　　很多开发者在这个检查方面都有问题，这可以从结果
zoj 3511 Cake Robbery(线段树) 阿尔萨斯线段树
题目链接：zoj 3511 Cake Robbery 题目大意：就是有一个N边形的蛋糕，切M刀，从中挑选一块边数最多的，保证没有两条边重叠。解题思路：有多少个顶点即为有多少条边，所以直接按照切刀切掉点的个数排序，然后用线段树维护剩下的还有哪些点。 #include <cstdio> #include <cstring> #include <vector&