一只小白鸟

pytorch实战（三）——基于CNN三种经典网络（VGG19 Resnet50 Inception）的煤矸识别

之前参考博客 PyTorch 入门实战（五）——2013kaggle比赛猫狗大战的实现（可能需要收费浏览，当时被我买下收藏了，如有需要可留言）跑了一下基于三种CNN经典网络模型的猫狗识别程序，这篇博客的步骤写的很详细，不过我不是像博客里讲的在官网中下的数据猫狗train test数据集，而是直接在 百度网盘中下载用的。

因为这次的煤矸识别程序是在之前的猫狗识别程序上直接改的，所以猫狗识别的程序没有完整的了，因为数据集已经被改为煤、矸石的数据集了，下面讲详细介绍我实战煤矸识别的整个流程。

1.CNN经典网络模型简介

我这次采用的是经典网络模型中的VGG19 Resnet50 Inception三种，可以直接通过程序在网上下载预训练模型，也就是网络结构中的参数都是被训练好的，只需下载下来就行。

下载网络模型代码如下：

import torch.nn as nn
import torchvision.models as models
class feature_net(nn.Module):
    def __init__(self, model, dim, n_classes):
        super(feature_net, self).__init__()

        # if model == 'vgg':
        #     vgg = models.vgg19(pretrained=True)
        #     self.feature = nn.Sequential(*list(vgg.children())[:-1])
        #     self.feature.add_module('global average', nn.AvgPool2d(3))

        #选择resnet50网络模型
        if model == 'resnet50':
            resnet = models.resnet50(pretrained=True)
            self.feature = nn.Sequential(*list(resnet.children())[:-1])

        # # 选择inceptionv3网络模型
        #     if model == 'inceptionv3':
        #         inception = models.inception_v3(pretrained=True)
        #         self.feature = nn.Sequential(*list(inception.children())[:-1])
        #         self.feature._modules.pop('13')
        #         self.feature.add_module('global average', nn.AvgPool2d(18))


        self.classifier = nn.Sequential(
            nn.Linear(dim, 4096),
            nn.ReLU(True),
            nn.Dropout(0.5),
            nn.Linear(4096, 4096),
            nn.ReLU(True),
            nn.Dropout(0.5),
            nn.Linear(4096, n_classes)
        )

    def forward(self, x):
        x = self.feature(x)
        x = x.view(x.size(0), -1)
        x = self.classifier(x)
        return x
# model = feature_net('vgg19',10,2)
model = feature_net('resnet50',10,2)  #model='resnet50',dim=10，n_classes=2
# model = feature_net('inceptionv3',10,2)  #model='resnet50',dim=10，n_classes=2
#print(model)

上述代码放置在一个新的py文件（network.py）下

2.基于openCV的图片批量增强

因为之前在学校获取的煤、矸石的图片是有限的，所以需要一个图片数据集的扩充。之前利用opencv做过单张图片的增强处理，所以这次还是用opencv进行批量（整个文件夹）增强。
步骤如下：

代码如下：

import os.path
import glob
import cv2
def convertjpg(jpgfile, outdir, width=320, height=256):
    src1 = cv2.imread(jpgfile, cv2.IMREAD_ANYCOLOR)
    src2 = cv2.imread(jpgfile, cv2.IMREAD_ANYCOLOR)
    # rows, cols, channel = src.shape[:3]
    try:
          #1.裁剪320*256
        dst = cv2.resize(src, (width, height), interpolation=cv2.INTER_CUBIC)
        #   #2.围绕中心旋转180°
        # M = cv2.getRotationMatrix2D((cols / 2, rows / 2), 180, 1)
        # dst = cv2.warpAffine(src, M, (cols, rows))
        #   #3.围绕中心旋转90°
        # M = cv2.getRotationMatrix2D((cols / 2, rows / 2), 90, 1)
        # dst = cv2.warpAffine(src, M, (cols, rows))
        #   #4.绕x轴翻转
        # dst = cv2.flip(src, 0)
        #   #5.调整对比度
        # dst = cv2.addWeighted(src1, 0.5, src2, 0.2, 1)
        #   #6.裁剪图片
        # dst = scr1[50:200, 100:220]
            #7.平移
        M = np.float32([[1, 0, 200], [0, 1, 200]])
        dst = cv2.warpAffine(src1, M, (src1.shape[1], src1.shape[0]))
          ##保存图片
        cv2.imwrite(os.path.join(outdir, os.path.basename(jpgfile)), dst) #os.path.basename(jpgfile)返回jpgfile的文件名
    except Exception as e:
        print(e)


for jpgfile in glob.glob(r'D:\图像\gangue-cai4\*.jpg'):  ##获取指定目录下的所有图片
    convertjpg(jpgfile, r'D:\图像\gangue-ping')

增强后的部分文件夹：此次使用了程序注释中的7种增强方法，另外还有是先裁剪后旋转，或者先裁剪后平移等混合方法增强。

增强后选取煤、矸石各1000张煤的图片放到coal-test gangue-test两个文件夹下。等待下一步命名处理

3.数据集有规律命名

因为这是自己的数据集，所以命名比较乱，因此要命名成像猫狗数据集一样的方式。
猫狗命名方式如下：

自己的煤矸数据集命名如下：coal/gangue.+有序数字.+jpg

命名程序代码为：

import os
path_name = r'D:\dogs_vs_cats1\train2\coal'
 #path_name :表示你需要批量改的文件夹
i = 0  #起始编号
for item in os.listdir(path_name):  # 进入到文件夹内，对每个文件进行循环遍历
    os.rename(os.path.join(path_name, item),
              os.path.join(path_name, ('coal.'+ str(i) + '.jpg')))  # os.path.join(path_name,item)表示找到每个文件的绝对路径并进行拼接操作
    i += 1

4.数据集预处理

上面已经完成了图片的增强，得到了命名好的煤、矸石共2000张图片，下面要对这2000张图片进行预处理。

4.1 建立datanet等文件夹

在硬盘中建立一个项目（coal-gangue），然后在项目下建立一个名称为datanet的空文件夹，接着把刚命名好的2000（coal.0.jpg-coal.999.jpg）张图片复制到此文件夹下。最后在datanet同等文件夹下创建train、val两个空文件夹，用来存放训练、测试集。然后在这两个文件夹里分别再创建两个空文件夹：coal、gangue。如下图所示：

4.2划分训练、测试集

下面将通过运行程序把2000张图片按照90%、10%随机划分为训练样本、测试样本。

800张煤的训练样本被放在了/D:coal-gangue>train>coal文件下; 同样，800张矸石的训练样本被放在了/D:coal-gangue>train>gangue文件下。
200张煤的测试样本被放在了/D:coal-gangue>val>coal文件下。200张矸石的测试样本被放在了/D:coal-gangue>val>gangue文件下。

def redistribution():
    data_file = os.listdir('D:/dogs_vs_cats1/dataset1') #os.listdir():返回指定目录下的所有文件名：即图片名。
    #将图片名为和cats的图片分别取出来，存为两个list
    coals_file = list(filter(lambda x: x[:4] == 'coal', data_file))
    gangues_file = list(filter(lambda x: x[:6] == 'gangue', data_file))
    print(len(coals_file))  #刚开始是5000，移动完后变为0
    print(len(gangues_file))


    data_root = 'D:/dogs_vs_cats1/'
    train_root = 'D:/dogs_vs_cats1/train2'
    val_root = 'D:/dogs_vs_cats1/val2'
    for i in range(len(gangues_file)):
        image_path = data_root + 'dataset1/' + gangues_file[i]
        if i < len(gangues_file)  * 0.9:
            new_path = train_root + '/gangue/' + gangues_file[i]
        else:
            new_path = val_root + '/gangue/' + gangues_file[i]
        shutil.move(image_path, new_path)  #把90%的s图片从'Dataset/'移动到'D:/dogs_vs_cats1/train//'

    for i in range(len(coals_file)):
        image_path = data_root + 'dataset1/' +coals_file[i]
        if i < len(coals_file) * 0.9:
            new_path = train_root + '/coal/' +coals_file[i]
        else:
            new_path = val_root + '/coal/' +coals_file[i]
        shutil.move(image_path, new_path)  #把10%的s图片从'Dataset/'移动到'D:/dogs_vs_cats1/val/cats    /'


if __name__ == '__main__':
    redistribution()

5.整个程序代码


from PIL import ImageFile
ImageFile.LOAD_TRUNCATED_IMAGES = True
import os   #用来打开文件夹
import shutil  #用来移动图片的库

def redistribution():
   data_file = os.listdir('D:/dogs_vs_cats1/dataset1') #os.listdir():返回指定目录下的所有文件名：即图片名。
   #将图片名为和cats的图片分别取出来，存为两个list
   coals_file = list(filter(lambda x: x[:4] == 'coal', data_file))
   gangues_file = list(filter(lambda x: x[:6] == 'gangue', data_file))
   print(len(coals_file))  #刚开始是5000，移动完后变为0
   print(len(gangues_file))


   data_root = 'D:/dogs_vs_cats1/'
   train_root = 'D:/dogs_vs_cats1/train2'
   val_root = 'D:/dogs_vs_cats1/val2'
   for i in range(len(gangues_file)):
       image_path = data_root + 'dataset1/' + gangues_file[i]
       if i < len(gangues_file)  * 0.9:
           new_path = train_root + '/gangue/' + gangues_file[i]
       else:
           new_path = val_root + '/gangue/' + gangues_file[i]
       shutil.move(image_path, new_path)  #把90%的s图片从'Dataset/'移动到'D:/dogs_vs_cats1/train//'

   for i in range(len(coals_file)):
       image_path = data_root + 'dataset1/' +coals_file[i]
       if i < len(coals_file) * 0.9:
           new_path = train_root + '/coal/' +coals_file[i]
       else:
           new_path = val_root + '/coal/' +coals_file[i]
       shutil.move(image_path, new_path)  #把10%的s图片从'Dataset/'移动到'D:/dogs_vs_cats1/val/cats    /'


if __name__ == '__main__':
   redistribution()


   ##3.训练
import torch
from torch.autograd import Variable
import torchvision
from torchvision import datasets, transforms
import matplotlib.pyplot as plt
import os
import time
import argparse #
from tensorboardX import SummaryWriter
from network import feature_net

# 参数设置
total_epoch =10
parser = argparse.ArgumentParser(description='cifar10')
parser.add_argument('--dataset1_dir', default='D:\dogs_vs_cats1')
parser.add_argument('--checkpoint_dir', default='./checkpoint')
parser.add_argument('--record_dir', default='./record')
parser.add_argument('--log_dir', default='./log')
# parser.add_argument('--model', default='vgg', help='model for training')
parser.add_argument('--model', default='resnet50', help='model for training')
#parser.add_argument('--model', default='inceptionv3', help='model for training')
parser.add_argument('--outf', default='./model', help='folder to output images and model checkpoints')  # 输出结果保存路径
parser.add_argument('--pre_model', default=False, help='use pre-model')  # 恢复训练时的模型路径
args = parser.parse_args()
# print('args:',args) #(CenterCropSize=224, batch_size=4, checkpoint_dir='./checkpoint', dataset_dir='D:\\dogs_vs_cats1',
# log_dir='./log', model='vgg', outf='./model', pre_epoch=0, pre_model=False, record_dir='./record', total_epoch=1)

# 定义使用上述参数的模型
model = args.model
# 使用gpu
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")


# 图片导入
from torch.utils.data import DataLoader
from torchvision.datasets import ImageFolder  #ImageFolder:数据加载器

path = args.dataset1_dir #dataset_dir='D:\\dogs_vs_cats1'
#图片预处理
transform = transforms.Compose([transforms.CenterCrop(224), #图像裁剪成：224*224*3 CenterCropSize=224 从图片的中间区域进行裁剪
                               transforms.ToTensor(),  #将图片转换为Tensor,归一化至[0,1];convert a PIL image to tensor (H*W*C) in range [0,255] to a torch.Tensor(C*H*W) in the range [0,1]
                               transforms.Normalize((0.5,), (0.5,))])
#找到训练集、测试集的路径，并依次遍历图片
data_image = {x: ImageFolder(root=os.path.join(path, x),   #在指定的root路径下面寻找图片 /os.path.join：连接两个或更多的路径名组件
                                     transform=transform)
                                     for x in ["train2", "val2"]} #把"train2", "val2"添加到路径'D:\\dogs_vs_cats1'下
# 打印训练、验证集
print("train data set:", len(data_image["train2"]))
print("val data set:", len(data_image["val2"]))
# train_dataset = torchvision.datasets.ImageFolder(root='D:\dogs_vs_cats1\train2', transform=data_transform)
# train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=16, shuffle=True, num_workers=0)
#
# val_dataset = torchvision.datasets.ImageFolder(root='D:\dogs_vs_cats1\val2', transform=data_transform)
# val_loader = torch.utils.data.DataLoader(val_dataset, batch_size=16, shuffle=True, num_workers=0)
# print("train data set:", len(train_dataset))
# print("val data set:", len(val_dataset))

#装载图片
dataloader_image = {x: DataLoader(dataset=data_image[x],
                                   batch_size=16  , #batch_size=16:一次装载的图片个数，大小不能超过GPU的内存
                                   shuffle=True)
                                   for x in ["train2", "val2"]}

classes = data_image["train2"].classes  # 按文件夹名字分类  ['', 'cats']
classes_index = data_image["train2"].class_to_idx  # 文件夹类名所对应的label {'': 0, 'cats': 1}
print(classes)
print(classes_index)

#遍历16张训练图片和其对应的label
image_train2, label_train2 = next(iter(dataloader_image["train2"]))  #iter()函数获取这些可迭代对象的迭代器，使⽤next()函数来获取下⼀条数据
print([classes[i] for i in label_train2])  # 打印16张图像中对应的label_train，也就是图像的类型
#显示图片
mean = [0.5, 0.5, 0.5]
std = [0.5, 0.5, 0.5]
img = torchvision.utils.make_grid(image_train2)  # 把batch_size(16)张的图片拼成一个图片
# print(img.shape)#[3, 228, 906]#拼接后图像的形状
img = img.numpy().transpose((1, 2, 0))  # 本来是(0,1,2)，相当于把第一维变为第三维，其他两维前移
# print(img.shape) #(228,996,3)
img = img * std + mean  # (228, 906, 3)范围由(-1, 1)变成(0, 1)
plt.imshow(img)  # mshow能显示数据归一化到0到1的图像
plt.show()

# 分类器工厂
classifier_factory = {
   'vgg': 25088,
   'resnet50': 2048,
   'inceptionv3': 2048
}

# 构建网络
use_model = feature_net(model, dim=classifier_factory[args.model], n_classes=2)
for parma in use_model.feature.parameters():
   parma.requires_grad = False  #参数不需要计算梯度

for index, parma in enumerate(use_model.classifier.parameters()):
   print(index)
   if index == 6:
       parma.requires_grad = True ##参数需要计算梯度


use_model = use_model.to(device)

# 损失函数和优化器
loss = torch.nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(use_model.classifier.parameters()) #适应性动量估计法




if __name__ == '__main__':
   #没有就创建checkpoint文件夹
   if not os.path.exists(args.checkpoint_dir + '/' + args.model):
       os.makedirs(args.checkpoint_dir + '/' + args.model)
       print("Checkpoint directory has been created:", str(args.checkpoint_dir + '/' + args.model))
   else:
       print("Checkpoint directory is already existed:", str(args.checkpoint_dir + '/' + args.model))
   if not os.path.exists(args.outf + '/' + args.model):
       os.makedirs(args.outf + '/' + args.model)
       print("Model directory has been created:", str(args.outf + '/' + args.model))
   else:
       print("Model directory is already existed:", str(args.outf + '/' + args.model))


   # total_epoch =10
   writer = SummaryWriter(log_dir=args.log_dir + '/' + args.model)
   print("Start Training, {}...".format(model))
   record_path = args.record_dir
   acc_path = args.record_dir + '/' + args.model + '/acc.txt'
   log_path = args.record_dir + '/' + args.model + '/log.txt'
   if not os.path.exists(args.record_dir + '/' + args.model):
       os.makedirs(args.record_dir + '/' + args.model)
       print("acc.txt and log.txt will be recorded into:", str(args.record_dir + '/' + args.model))
   else:
       print("record directory is already existed:", str(args.record_dir + '/' + args.model))

   with open(acc_path, "w") as acc_f:
       with open(log_path, "w") as log_f:
           start_time = time.time()

           for epoch in range(0, total_epoch):
               print("epoch{}/{}:".format(epoch, total_epoch))
               # print("Train Epoch: {}".format(epoch))
               # print("-" * 10)
               # 开始训练
               use_model.train()
               # print(use_model)
               # 初始化
               sum_loss = 0.0
               accuracy = 0.0
               total = 0
               best_test_acc = 0
               for i, (image, label) in enumerate(dataloader_image["train2"]):  #i= 0 1.........
                   # print(i)
                   image, label = image.to(device), label.to(device)

                   label_prediction = use_model(image) #计算预测输出结果
                   _, prediction = torch.max(label_prediction.data, 1) #找出tensor中每一行中的最大值，以及其所在位置

                   # print(total)  #16 32 48 64 80 总共训练的图片数
                   current_loss = loss(label_prediction, label) #计算目前的损失
                   sum_loss += current_loss.item()  # 计算总损失
                   accuracy += torch.sum(prediction == label.data)
                   # accuracy += (label_prediction == label).sum()

                   total += label.size(0)
                   current_loss.backward() #误差反向传递
                   optimizer.step() #优化器参数更新
                   optimizer.zero_grad()


                   if total % 5 == 0:  #每训练5组16张的图片（即80张），输出一次训练结果
                       print("total {}, train loss:{:.4f}, train accuracy:{:.4f}".format(
                           total, sum_loss / total, 100 * accuracy / total))
                       # 写入日志
                       log_f.write("total {}, train loss:{:.4f}, train accuracy:{:.4f}".format(
                           total, sum_loss / total, 100 * accuracy / total))
                       log_f.write('\n')
                       log_f.flush()

               # 写入tensorboard
               writer.add_scalar('loss/train', sum_loss / (i + 1), epoch)
               writer.add_scalar('accuracy/train', 100. * accuracy / total, epoch)

               # 每一个epoch测试准确率
               print("Waiting for test...")
               # 在上下文环境中切断梯度计算，在此模式下，每一步的计算结果中requires_grad都是False，即使input设置为requires_grad=True
               with torch.no_grad():
                   accuracy = 0
                   total = 0
                   for image, label  in dataloader_image["val2"]:
                       use_model.eval()  # 告诉我们的网络，这个阶段是用来测试的，于是模型的参数在该阶段不进行更新。
                       image, label = Variable(image.to(device)), Variable(label.to(device))
                       label_prediction = use_model(image)
                       _, prediction = torch.max(label_prediction.data, 1)
                       total += label.size(0)
                       accuracy += torch.sum(prediction == label.data)

                   # 输出测试准确率
                   print('测试准确率为: %.3f%%' % (100 * accuracy / total))
                   acc = 100. * accuracy / total

                   # 写入tensorboard
                   writer.add_scalar('accuracy/test', acc, epoch)

                   # 将测试结果写入文件

                   model_path = args.outf + '/' + args.model + '/net_%3d.pth' % (epoch + 1)
                   torch.save(use_model.state_dict(), model_path)
                   print("Model has been saved in:", model_path)
                   acc_f.write("epoch = %03d, accuracy = %.3f%%" % (epoch + 1, acc))
                   acc_f.write('\n')
                   acc_f.flush()
           writer.close()
           end_time = time.time() - start_time
           print("training time is:{:.0f}m {:.0f}s".format(end_time // 60, end_time % 60))
           writer.close()

另外再加第1节中的network.py文件代码。

6.可视化结果

运行结果的截图暂时没有找到，电脑也快要没电了，，，后续会补充运行结果的可视化。

(by dxz 2020 06 02 17:21)

Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
RocketMQ 核心特性实战详解愤怒的代码 RocketMQ实战 rocketmq
RocketMQ核心特性实战详解本文基于RocketMQ4.x+rocketmq-spring-boot-starter2.3.1，从零搭建，逐步讲解RocketMQ11大核心特性，每一段代码都能直接跑。0.项目环境准备依赖引入在pom.xml文件添加：org.apache.rocketmqrocketmq-spring-boot-starter2.3.1配置文件application.ymlse
传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
Java设计模式实战：高频场景解析与避坑指南 mckim_ 笔记学习 java 设计模式
引言设计模式是软件开发的基石，但许多开发者面对23种模式时容易陷入“学完就忘”或“滥用模式”的困境。本文从工业级项目视角出发，精选10种高频设计模式，结合真实代码案例与主流框架应用，帮你建立模式思维，拒绝纸上谈兵。一、创建型模式：告别new的暴力美学1.工厂方法模式（FactoryMethod）核心痛点：对象创建逻辑散落各处，难以统一管理。场景案例：电商平台需要支持多种支付方式（支付宝、微信、银联
《Java前端开发全栈指南：从Servlet到现代框架实战》
前言在当今Web开发领域，Java依然是后端开发的主力语言，而随着前后端分离架构的普及，Java开发者也需要掌握前端技术栈。本文将全面介绍JavaWeb前端开发的核心技术，包括传统Servlet/JSP体系、现代前端框架集成方案，以及全栈开发的最佳实践。通过本文，您将了解如何构建现代化的JavaWeb应用前端界面。一、JavaWeb前端技术演进1.1传统技术栈Servlet：JavaWeb基础，处
Python 爬虫实战：视频平台播放量实时监控（含反爬对抗与数据趋势预测）西攻城狮北 python 爬虫音视频
一、引言在数字内容蓬勃发展的当下，视频平台的播放量数据已成为内容创作者、营销人员以及行业分析师手中极为关键的情报资源。它不仅能够实时反映内容的受欢迎程度，更能在竞争分析、营销策略制定以及内容优化等方面发挥不可估量的作用。然而，视频平台为了保护自身数据和用户隐私，往往会设置一系列反爬虫机制，对数据爬取行为进行限制。这就向我们发起了挑战：如何巧妙地突破这些限制，同时精准地捕捉并预测播放量的动态变化趋势
Vue3组件库实战: 打造高复用UI系统武昌库里写JAVA 面试题汇总与解析课程设计 spring boot vue.js layui 毕业设计
Vue3组件库实战:打造高复用UI系统介绍什么是Vue3组件库在前端开发中，UI组件库是非常重要的一部分。Vue3组件库是基于Vue.js3.x版本开发的一套可用于构建Web应用的UI组件集合，可以帮助开发者快速搭建页面并保证页面的一致性和美观性。目标关键词：Vue3组件库设计与构建设计原则组件库的设计需要遵循一定的原则，比如易用性、可维护性、扩展性等。在设计阶段需要考虑到不同场景的使用，并且保证
flutter redux状态管理 liao277218962 Flutter flutter state redux
Flutter状态管理系列文章目录Flutter状态管理(setState、InheritedWidget、Provider、Riverpod、BLoC/Cubit、GetX、MobX、Redux)setState()使用详解：原理及注意事项InheritedWidget组件使用及原理Flutter中Provider的使用、注意事项与原理解析（含代码实战）GetX用法详细解析以及注意事项Flutt
苦练Python第9天：if-else分支九剑 python后端前端人工智能
苦练Python第9天：if-else分支九剑前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众号：倔强青铜三。欢迎点赞、收藏、关注，一键三连！！！欢迎来到100天Python挑战第9天！今天我们不练循环，改磨“分支剑法”——ifelse三式：单分支、双分支、多分支，以及嵌套和三元运算符，全部实战演练，让
JVM与Spring Boot核心解析 AIHacksCash Java场景面试宝典 Java JVM Spring Boot
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
Spring WebFlux 响应式编程原理与实战指南
SpringWebFlux响应式编程原理与实战指南一、技术背景与应用场景随着微服务与高并发的迅速发展，传统的阻塞式编程模型在处理大量并发请求时容易导致线程资源耗尽、响应延迟增高。SpringWebFlux基于ReactiveStreams规范，通过非阻塞、背压机制，实现高吞吐、低延迟的Web服务。典型应用场景包括：实时数据推送：WebSocket或Server-SentEvents场景。高并发AP
2025年渗透测试面试题总结-2025年HW(护网面试) 43（题目+回答）独行soc 2025年护网面试职场和发展 linux 科技渗透测试安全护网
安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录2025年HW(护网面试)431.自我介绍与职业规划2.Webshell源码级检测方案3.2025年新型Web漏洞TOP54.渗透中的高价值攻击点5.智能Fuzz平台架构设计6.堆栈溢出攻防演进7.插桩技术实战应用8.二进制安全能力矩阵9.C语言内存管理精要10.Pyth
【运维实战】解决 K8s 节点无法拉取 pause:3.6 镜像导致 API Server 启动失败的问题 gs80140 各种问题运维 kubernetes 容器
目录【运维实战】解决K8s节点无法拉取pause:3.6镜像导致APIServer启动失败的问题问题分析✅解决方案：替代拉取方式导入pause镜像Step1.从私有仓库拉取pause镜像Step2.重新打tag为Kubernetes默认命名Step3.导出镜像为tar包Step4.拷贝镜像到目标节点Step5.在目标节点导入镜像到containerd的k8s.io命名空间Step6.验证镜像是否导
Python爬虫实战：利用最新技术爬取B站直播数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 html 百度
1.B站直播数据爬取概述B站(哔哩哔哩)是中国最大的年轻人文化社区和视频平台之一，其直播业务近年来发展迅速。爬取B站直播数据可以帮助我们分析直播市场趋势、热门主播排行、观众喜好等有价值的信息。常见的B站直播数据类型包括：直播间基本信息(标题、分类、主播信息)实时观看人数与弹幕数据礼物打赏数据直播历史记录分区热门直播数据本文将重点介绍如何获取直播间基本信息和分区热门直播数据。2.环境准备与工具选择2
基于Python的智能公示信息监控爬虫系统开发实战 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言音视频搜索引擎 scrapy
摘要本文详细介绍了如何使用Python构建一个高效的公示信息监控爬虫系统。系统采用最新技术栈，包括异步爬取、智能解析、反反爬策略等，能够自动监控各类政府网站、企业公示平台的更新信息。文章从系统设计到具体实现，提供了完整的代码示例和详细的技术解析，帮助读者掌握大规模公示信息采集的核心技术。关键词：Python爬虫、公示监控、信息采集、异步爬取、智能解析1.引言在数字化时代，各类公示信息（如政府采购、
基于Python的Google Scholar学术论文爬虫实战：最新技术与完整代码解析 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言学习 scrapy
摘要本文详细介绍如何使用Python构建一个高效的GoogleScholar爬虫系统，包括代理设置、反反爬策略、数据解析与存储等核心技术。文章涵盖最新Python爬虫技术栈（如Playwright、异步IO等），提供完整可运行的代码示例，并讨论学术爬虫的伦理与法律问题。通过本教程，读者将掌握从GoogleScholar批量获取学术论文信息的高级爬虫技术。关键词：Python爬虫、GoogleSch
不同行业的 AI 数据安全与合规实践：7 大核心要点全解析观熵人工智能 DeepSeek 私有化部署
不同行业的AI数据安全与合规实践：7大核心要点全解析关键词AI数据安全、行业合规、私有化部署、数据分类分级、国产大模型、隐私保护、DeepSeek部署摘要随着国产大模型在金融、医疗、政务、教育等关键领域的深入部署，AI系统对数据安全与行业合规提出了更高要求。本文结合DeepSeek私有化部署实战，系统梳理当前各行业主流的数据安全合规标准与落地策略，从数据分类分级、访问控制、审计追踪到敏感信息识别与
【Freertos实战】零基础制作基于stm32的物联网温湿度检测(教程非常简易)持续更新中......... 熬夜的猪仔 stm32 物联网嵌入式硬件
本次记录采用Freertos的第二个DIY作品，基于Onenet的物联网温湿度检测系统，此次代码依然是全部开源。通过网盘分享的文件：物联网温湿度检测.rar链接:https://pan.baidu.com/s/1uj9UURVtGE6ZB6OsL2W8lw?pwd=qm2e提取码:qm2e大家也可以看看我上个的开源项目【Freertos实战】零基础制作基于stm32智能小车(教程非常简易)实物演示
vllm本地部署bge-reranker-v2-m3模型API服务实战教程雷电法王大模型部署 linux python vscode language model
文章目录一、说明二、配置环境2.1安装虚拟环境2.2安装vllm2.3对应版本的pytorch安装2.4安装flash_attn2.5下载模型三、运行代码3.1启动服务3.2调用代码验证一、说明本文主要介绍vllm本地部署BAAI/bge-reranker-v2-m3模型API服务实战教程本文是在Ubuntu24.04+CUDA12.8+Python3.12环境下复现成功的二、配置环境2.1安装虚
Qualcomm Hexagon DSP 与 AI Engine 架构深度分析：从微架构原理到 Android 部署实战观熵国产 NPU ×Android 推理优化人工智能架构 android
QualcommHexagonDSP与AIEngine架构深度分析：从微架构原理到Android部署实战关键词QualcommHexagon、AIEngine、HTA、HVX、HMX、Snapdragon、DSP推理加速、AIC、QNNSDK、Tensor编排、AndroidNNAPI、异构调度摘要HexagonDSP架构是QualcommSnapdragonSoC平台中长期演进的异构计算核心之一
OpenWebUI系列之如何通过docker自动将其更新到OpenWebUI最新版本知识大胖 NVIDIA GPU和大语言模型开发教程 docker llm openwebui
实战需求OpenWebUI是一个可扩展、功能丰富且用户友好的自托管WebUI，旨在完全离线运行。它支持各种LLM运行器，包括Ollama和OpenAI兼容API。如何通过docker自动将其更新到OpenWebUI最新版本？系列文章《OpenWebUI系列之如何通过docker更新到OpenWebUI的最新版本》权重0，本地类、opewebui类《OpenWebUI系列之如何通过docker自动将
优化版三国主题MySQL建表与查询练习（细节增强）韩公子的Linux大集市五 MySQL运维DBA mysql 数据库
文章目录优化版三国主题MySQL建表与查询练习（细节增强）题目一：三国人物信息表（全面优化）建表语句（增强约束与注释）插入数据（含完整信息）查询练习（增强实用性）题目二：三国战役表（增强关系设计）建表语句（完整关系模型）插入数据（完整战役信息）查询练习（多表关联）综合实战演练1.人物能力值分析2.战役地图查询3.胜负因素分析设计亮点总结优化版三国主题MySQL建表与查询练习（细节增强）题目一：三国
为什么你的服务器总被攻击？运维老兵的深度分析
作为运维人员，最头疼的莫过于服务器在毫无征兆的情况下变得异常缓慢、服务中断，甚至数据泄露。事后查看日志，常常发现一些“莫名其妙”的攻击痕迹。为什么服务器会成为攻击者的目标？这些攻击又是如何悄无声息发生的？今天，我们就从实战角度分析几种常见且容易被忽视的攻击模式，并教你如何通过日志分析初步定位问题。一、服务器被攻击的常见“莫名其妙”原因“扫楼式”探测与弱口令爆破：现象：服务器CPU、内存无明显异常，
如何在Windows系统下使用Dockerfile构建Docker镜像：完整指南 996蹲坑 windows docker 容器
前言Docker作为当前最流行的容器化技术，已经成为开发、测试和运维的必备工具。本文将详细介绍在Windows系统下使用Dockerfile构建Docker镜像的完整流程，包括两种镜像构建方式的对比、Dockerfile核心指令详解、实战案例演示以及Windows系统下的特殊注意事项。一、Docker镜像构建的两种方式1.容器转为镜像（不推荐）这种方式适合临时保存容器状态，但不适合生产环境使用：#
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息