ctrl A_ctrl C_ctrl V

图像分类：AlexNet网络、五分类 flower 数据集、pytorch

文章目录

- 一、代码结构
- 二、数据集的处理
- - 2.1 数据集的下载和切分：split_data.py
  - 2.2 数据集的加载：dataset.py
  - 2.3 数据集图片可视化：imgs_vasual.py
- 三、AlexNet介绍及网络搭建：model.py
- - 3.1 AlexNet网络结构
  - 3.2 AlexNet网络的亮点
  - 3.3 网络搭建
- 四、训练及保存精度最高的网络参数：train.py
- 五、用数据集之外的图片进行测试：predict.py

代码来源：使用pytorch搭建AlexNet并训练花分类数据集

一、代码结构

二、数据集的处理

2.1 数据集的下载和切分：split_data.py

"""
视频教程：https://www.bilibili.com/video/BV1p7411T7Pc/?spm_id_from=333.788
flower数据集为5分类数据集，共有 {'daisy':0, 'dandelion':1, 'roses':2, 'sunflower':3, 'tulips':4} 5个分类。

该程序用于将数据集切分为训练集和验证集，使用步骤如下：
（1）在"split_data.py"的同级路径下创建新文件夹"flower_data"
（2）点击链接下载花分类数据集 http://download.tensorflow.org/example_images/flower_photos.tgz
（3）解压数据集到flower_data文件夹下
（4）执行"split_data.py"脚本自动将数据集划分为训练集train和验证集val

切分后的数据集结构：
├── split_data.py 
├── flower_data
       ├── flower_photos.tgz （下载的未解压的原始数据集）
       ├── flower_photos（解压的数据集文件夹，3670个样本）  
       ├── train（生成的训练集，3306个样本）  
       └── val（生成的验证集，364个样本） 
"""""


import os
from shutil import copy, rmtree
import random


def mk_file(file_path: str):
    if os.path.exists(file_path):
        # 如果文件夹存在，则先删除原文件夹在重新创建
        rmtree(file_path)
    os.makedirs(file_path)


def main():
    random.seed(0)

    # 将数据集中10%的数据划分到验证集中
    split_rate = 0.1

    # 指向你解压后的flower_photos文件夹
    cwd = os.getcwd()
    data_path = os.path.join(cwd, "flower_data/flower_photos/flower_photos")
    data_root=os.path.join(cwd, "flower_data")
    origin_flower_path = os.path.join(data_path, "")
    assert os.path.exists(origin_flower_path), "path '{}' does not exist.".format(origin_flower_path)

    flower_class = [cla for cla in os.listdir(origin_flower_path)
                    if os.path.isdir(os.path.join(origin_flower_path, cla))]

    # 建立保存训练集的文件夹
    train_root = os.path.join(data_root, "train")
    mk_file(train_root)
    for cla in flower_class:
        # 建立每个类别对应的文件夹
        mk_file(os.path.join(train_root, cla))

    # 建立保存验证集的文件夹
    val_root = os.path.join(data_root, "val")
    mk_file(val_root)
    for cla in flower_class:
        # 建立每个类别对应的文件夹
        mk_file(os.path.join(val_root, cla))

    for cla in flower_class:
        cla_path = os.path.join(origin_flower_path, cla)
        images = os.listdir(cla_path)
        num = len(images)
        # 随机采样验证集的索引
        eval_index = random.sample(images, k=int(num*split_rate))
        for index, image in enumerate(images):
            if image in eval_index:
                # 将分配至验证集中的文件复制到相应目录
                image_path = os.path.join(cla_path, image)
                new_path = os.path.join(val_root, cla)
                copy(image_path, new_path)
            else:
                # 将分配至训练集中的文件复制到相应目录
                image_path = os.path.join(cla_path, image)
                new_path = os.path.join(train_root, cla)
                copy(image_path, new_path)
            print("\r[{}] processing [{}/{}]".format(cla, index+1, num), end="")  # processing bar
        print()

    print("processing done!")


if __name__ == '__main__':
    main()

2.2 数据集的加载：dataset.py

import os
import json
import torch
from torchvision import transforms, datasets


def dataset(batch_size):
    train_path = "flower_data/train"
    val_path = "flower_data/val"
    assert os.path.exists(train_path), "{} path does not exist.".format(train_path)

    nw = min([os.cpu_count(), batch_size if batch_size > 1 else 0, 8])  # number of workers
    print('Using {} dataloader workers every process'.format(nw))

    """
    数据预处理，训练集做随机裁剪和随机翻转用来数据增强
    RandomResizedCrop(224) 表示先随机裁剪为不同的大小和宽高比，然后缩放为(224,224)大小
    RandomHorizontalFlip() 表示随机水平翻转（即左右翻转），默认概率为 0.5
    """

    data_transform = {
        "train": transforms.Compose([transforms.RandomResizedCrop(224),
                                     transforms.RandomHorizontalFlip(),
                                     transforms.ToTensor(),
                                     transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))]),
        "val": transforms.Compose([transforms.Resize((224, 224)),   # cannot 224, must (224, 224)
                                   transforms.ToTensor(),
                                   transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])}

    """
    torchvision.datasets.ImageFolder 适用于加载特定存储格式的数据集，具体使用可参考博客：
    https://blog.csdn.net/qq_39507748/article/details/105394808
    """

    train_dataset = datasets.ImageFolder(root=train_path,transform=data_transform["train"])
    train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=batch_size,
                                               shuffle=True, num_workers=nw)
    validate_dataset = datasets.ImageFolder(root=val_path, transform=data_transform["val"])
    valid_loader = torch.utils.data.DataLoader(validate_dataset, batch_size=batch_size,
                                               shuffle=True, num_workers=nw)
    train_num = len(train_dataset)
    val_num = len(validate_dataset)
    print(f"using {train_num} images for training, {val_num} images for valid.")

    flower_class_id = train_dataset.class_to_idx
    # 按照不同分类数据集的排列顺序获得 train_dataset中图片对应的分类,得到字典格式：
    # {'daisy': 0, 'dandelion': 1, 'roses': 2, 'sunflower': 3, 'tulips': 4}
    # 雏菊           蒲公英           玫瑰         向日葵           郁金香
    # class_to_idx属性是通过.ImageFolder() 方法加载数据集才有的，并不是所有dataset都有该属性

    cla_dict = dict((val, key) for key, val in flower_class_id.items())
    # 将 dict中的 key和 value互换：
    # {0: 'daisy', 1: 'dandelion', 2: 'roses', 3: 'sunflowers', 4: 'tulips'}

    json_str = json.dumps(cla_dict, indent=4)
    """
    json.dumps() 将 python对象转换成 json对象，生成一个字符串。
    indent=4 表示缩进4个空格，方便阅读。
    json_str的内容为：
        {
            "0": "daisy",
            "1": "dandelion",
            "2": "roses",
            "3": "sunflowers",
            "4": "tulips"
        }
    """

    # 将字符串写入json文件，便于predict时使用。python只能将字符串格式的数据写入文件。
    with open('class_indices.json', 'w') as json_file:
        json_file.write(json_str)

    return train_loader,valid_loader,val_num

2.3 数据集图片可视化：imgs_vasual.py

"""
图片可视化函数，用于imshow多张图片，并输出每张图片对应的label
"""""

import os
import torch
from torchvision import transforms, datasets, utils
import matplotlib.pyplot as plt
import numpy as np


def imgs_imshow(batch_size):
    # 产生数据集迭代器
    train_path = "flower_data/train"
    assert os.path.exists(train_path), "{} path does not exist.".format(train_path)
    tramsform=transforms.Compose([transforms.Resize((224, 224)),transforms.ToTensor(),
                                 transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])
    train_dataset = datasets.ImageFolder(root=train_path, transform=tramsform)
    train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=batch_size,
                                               shuffle=True, num_workers=0)
    # windows中只能设置 num_workers=0，即单个线程处理数据集。Linux系统中可以设置多个 num_workers

    data_iter = iter(train_loader)
    image, label = data_iter.next()    # 每次产生batch_size张图片

    # 产生图片和对应 label
    flower_list = train_dataset.class_to_idx
    cla_dict = dict((val, key) for key, val in flower_list.items())
    print('   '.join('%5s' % cla_dict[label[j].item()] for j in range(batch_size)))

    img = utils.make_grid(image)     # make_grid() 用于将多张图像拼成一张
    img = img / 2 + 0.5   # unnormalize
    npimg = img.numpy()
    plt.imshow(np.transpose(npimg, (1, 2, 0)))
    plt.show()


if __name__ == '__main__':
    imgs_imshow(batch_size=6)

三、AlexNet介绍及网络搭建：model.py

3.1 AlexNet网络结构

本程序中输入图片的尺寸是 224*224，输出为5分类而不是1000分类，其他数据均为图中的数据。

3.2 AlexNet网络的亮点

(1）首次利用GPU进行网络加速训练，作者用了两块GPU进行并行训练。

(2）使用了ReLU激活函数，而不是传统的Sigmoid激活函数以及Tanh激活函数。

(3) 使用了LRN局部响应归一化（Local Response Normalization）。本程序中没有用LRN，因为这个方法现在已经用的很少了。

(4）在全连接层的前两层中使用了Dropout随机失活神经元操作，以减少过拟合。

3.3 网络搭建

import torch.nn as nn

"""
本程序中没有使用LRN归一化，因为这个方法现在已经用的很少了。
"""

class AlexNet(nn.Module):
    def __init__(self,class_num=1000,init_weights=False):
        super(AlexNet,self).__init__()
        self.dropout=0.1

        # 提取图像特征
        self.features=nn.Sequential(
            nn.ZeroPad2d((2, 1, 2, 1)),
            # nn.ZeroPad2d 的填充顺序是左右上下

            nn.Conv2d(in_channels=3,out_channels=96,kernel_size=11,stride=4),
            # 图像数据通道存储顺序为 [N,C,H,W]，即[batch_size,channels,height,weight]
            # input[bsz，3, 224, 224]    output[bsz，96, 55, 55]
            # output_size=(W-K+P)/S+1,其中W*W是输入图像尺寸，K是kernel_size，P是padding的行/列数量，S是stride

            nn.ReLU(inplace=True),
            # inplace=True 表示对上一层的数据进行修改，用新数据覆盖旧数据，不存储旧数据，可以节省内存。默认值为 inplace=False
            # 激活函数不改变数据尺寸

            nn.MaxPool2d(kernel_size=3,stride=2),          # output[bsz, 96, 27, 27]
            # pooling层不改变channel，只改变H和W

            nn.Conv2d(96,256,kernel_size=5,padding=2),     # output[bsz, 256, 27, 27]
            # padding=2 表示四边都 padding 两行或两列 0 像素值

            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=3,stride=2),          # output[bsz, 256, 13, 13]
            nn.Conv2d(256,384,kernel_size=3,padding=1),    # output[bsz, 384,13,13]
            nn.ReLU(inplace=True),
            nn.Conv2d(384,256,kernel_size=3,padding=1),    # output[bsz, 256,13,13]
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=3,stride=2),          # output[bsz, 256,6,6]
        )

        # 分类器,在全连接层的前两层使用了 dropout
        self.classifier=nn.Sequential(
            nn.Dropout(p=self.dropout),
            nn.Linear(in_features=9216,out_features=4096),    # input[bsz，9216]    output[bsz，4096]
            nn.ReLU(inplace=True),
            nn.Dropout(p=self.dropout),
            nn.Linear(in_features=4096, out_features=4096),   # output[bsz，4096]
            nn.ReLU(inplace=True),
            nn.Linear(in_features=4096, out_features=class_num),   # output[bsz，class_num]
        )

        # 初始化权重参数
        if init_weights:
            self._initialize_weights()

    def forward(self,x):
        x=self.features(x)
        x=x.view(-1,256*6*6)
        x=self.classifier(x)
        return x

    def _initialize_weights(self):
        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                nn.init.kaiming_normal_(m.weight, mode='fan_out', nonlinearity='relu')
                if m.bias is not None:
                    nn.init.constant_(m.bias, 0)
            elif isinstance(m, nn.Linear):
                nn.init.normal_(m.weight, 0, 0.01)    # 用正态分布N(0,0.01)对weight初始化
                nn.init.constant_(m.bias, 0)          # 将bias初始化为0

    """
    _initialize_weights()方法的解释：
    self.modules():  Returns an iterator over all modules in the network，即遍历网络中的所有层，并返回一个迭代器。
    for m in self.modules()： 遍历网络中的每一层
    if isinstance(m, nn.Conv2d)： 判断m是否是 nn.Conv2d层
    其实并不需要用_initialize_weights()方法进行初始化，因为pytorch会默认以 nn.init.kaiming_normal_() 进行初始化。
    """

四、训练及保存精度最高的网络参数：train.py

import torch
import torch.nn as nn
import torch.optim as optim
from tqdm import tqdm

from model import AlexNet
from dataset import dataset


def train(batch_size, epochs, lr=0.001):
    device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
    print("using {} device.".format(device))

    train_loader, valid_loader, val_num = dataset(batch_size=batch_size)
    model = AlexNet(class_num=5, init_weights=True)
    model.to(device)
    loss_function = nn.CrossEntropyLoss()
    optimizer = optim.Adam(model.parameters(), lr=lr)
    # model.parameters()表示优化网络中所有的可训练参数

    save_path = './AlexNet.pth'
    best_acc = 0.0
    train_steps = len(train_loader)
    for epoch in range(epochs):
        # train
        model.train()    # 启用 dropout和 Batch Normalization
        running_loss = 0.0
        train_bar = tqdm(train_loader)     # 将 train_loader设置为进度条对象
        for step, (images, labels) in enumerate(train_bar):
            optimizer.zero_grad()
            outputs = model(images.to(device))
            loss = loss_function(outputs, labels.to(device))
            loss.backward()
            optimizer.step()
            running_loss += loss.item()
            train_bar.desc = f"train epoch [{epoch+1}/{epochs}]   loss= {loss:.3f}"

        # validate
        model.eval()    # 不启用 dropout和 Batch Normalization
        acc = 0.0    # accumulate accurate number / epoch
        with torch.no_grad():
            val_bar = tqdm(valid_loader)
            for val_data in val_bar:
                val_images, val_labels = val_data
                outputs = model(val_images.to(device))
                predict_y = torch.max(outputs, dim=1)[1]
                acc += torch.eq(predict_y, val_labels.to(device)).sum().item()
                # torch.eq() 用于对两个Tensor进行逐元素比较，若相同位置的两个元素相同，则返回1；否则返回0。

        val_accurate = acc / val_num
        print('[epoch %d]   train_loss= %.3f   val_accuracy= %.3f' %
              (epoch + 1, running_loss / train_steps, val_accurate))

        # 保存验证精度最高的模型
        if val_accurate > best_acc:
            best_acc = val_accurate
            torch.save(model.state_dict(), save_path)

    print('Finished Training')


if __name__ == '__main__':
    train(batch_size=16, epochs=10, lr=0.0002)

训练结果（没有跑完）：

五、用数据集之外的图片进行测试：predict.py

import os
import json
import torch
from PIL import Image
from torchvision import transforms
import matplotlib.pyplot as plt

from model import AlexNet


def predict():
    device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
    data_transform = transforms.Compose(
        [transforms.Resize((224, 224)),
         transforms.ToTensor(),
         transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])

    # load image
    img_path = "./tulip.png"      # 用数据集之外的图片进行测试
    assert os.path.exists(img_path), f"file: '{img_path}' dose not exist."
    img = Image.open(img_path)
    plt.imshow(img)               # 在扩维之前 imshow
    img = data_transform(img)     # [C, H, W]，图片只有三个维度，没有batch_size的维度
    img = torch.unsqueeze(img, dim=0)     # 扩维为 [N, C, H, W]

    # read class_indict
    json_path = './class_indices.json'
    assert os.path.exists(json_path), "file: '{}' dose not exist.".format(json_path)
    json_file = open(json_path, "r")
    class_indict = json.load(json_file)

    # load model weights
    model = AlexNet(class_num=5).to(device)
    weights_path = "./AlexNet.pth"
    assert os.path.exists(weights_path), f"file: '{weights_path}' dose not exist."
    model.load_state_dict(torch.load(weights_path))

    # predict class
    model.eval()
    with torch.no_grad():
        output = torch.squeeze(model(img.to(device))).cpu()
        # 维度压缩，去掉batch_size维度
        # output = tensor([-2.0011, -4.6823,  2.4246, -2.3200,  3.8126])

        predict = torch.softmax(output, dim=0)
        # predict = tensor([2.3797e-03, 1.6297e-04, 1.9888e-01, 1.7299e-03, 7.9685e-01])

        predict_cla = torch.argmax(predict).item()
        # 取出predict中最大值的索引（索引为tensor），并将索引转为数字
        # predict_cla = 4

    # imshow img and class
    img_class = class_indict[str(predict_cla)]
    img_preb=predict[predict_cla].item()
    print_res = f"class: {img_class}    prob: {img_preb:.3}"
    plt.title(print_res)    # 表头名称
    for i in range(len(predict)):
        print(f"class: {class_indict[str(i)]:12}   prob: {predict[i].item():.3}")
    plt.show()


if __name__ == '__main__':
    predict()

测试结果：

class: daisy          prob: 0.00238
class: dandelion      prob: 0.000163
class: roses          prob: 0.199
class: sunflowers     prob: 0.00173
class: tulips         prob: 0.797

测试图片及类别预测：

详解三种常用标准化：Batch Norm、Layer Norm和RMSNorm yyytucj batch 开发语言
在深度学习中，标准化技术是提升模型训练速度、稳定性和性能的重要手段。本文将详细介绍三种常用的标准化方法：BatchNormalization（批量标准化）、LayerNormalization（层标准化）和RMSNormalization（RMS标准化），并对其原理、实现和应用场景进行深入分析。一、BatchNormalization1.1BatchNormalization的原理BatchNor
卢京潮自动控制原理ppt_自动控制原理总结 weixin_39609166 卢京潮自动控制原理ppt
自控好难TAT参考资料：河海大学自动控制原理PPT使用软件：Word+幕布自动控制原理第一章绪论1.1自动控制的发展历史分类经典控制理论、现代控制理论、智能控制（后者包含前者）经典控制理论方法:以传递函数为基础的频域法（线性）对象:单输入-单输出一类定常控制系统的分析与设计问题手段:图解特点:定性分析,这些理论由于其发展较早，现已日臻成熟（主要特点：用图形的方法定性分析闭环系统的稳定性及性能）目标
网站结构优化：加速搜索引擎收录的关键百度网站快速收录搜索引擎
本文来自：百万收录网原文链接：https://www.baiwanshoulu.com/9.html网站结构优化对于加速搜索引擎收录至关重要。以下是一些关键策略，旨在通过优化网站结构来提高搜索引擎的抓取效率和收录速度：一、合理规划网站架构采用扁平化结构：减少网站的层级深度，使搜索引擎爬虫能够更快速地遍历和抓取网站内容。这有助于确保每个页面都能被搜索引擎有效地索引。分类清晰：对于内容丰富的网站，应合
利用 PyTorch 动态计算图和自动求导机制实现自适应神经网络 drebander AI 编程 pytorch 神经网络人工智能
在深度学习任务中，不同任务的复杂度千差万别。为了解决复杂任务对模型容量的需求，同时避免简单任务因过度拟合导致的性能下降，我们可以构建一个能够根据任务自动调整网络结构的神经网络。在PyTorch中，动态计算图和自动求导机制为实现这一目标提供了强大的工具。动态网络结构设计PyTorch的动态计算图允许我们根据运行时的输入数据或任务复杂度，动态创建和修改网络结构。动态添加/移除层：可以在训练过程中根据需
可解释性：走向透明与可信的人工智能一位小说男主人工智能入门深度学习机器学习人工智能神经网络
随着深度学习和机器学习技术的迅速发展，越来越多的行业和领域开始应用这些技术。然而，这些技术的“黑盒”特性也带来了不容忽视的挑战。在许多任务中，尽管这些模型表现出色，取得了相当高的精度，但其决策过程不透明，这对于依赖于机器决策的应用（如金融、医疗、法律等）来说，可能是无法接受的。因此，如何提高模型的可解释性、实现透明和可信的人工智能，成为了当下人工智能领域的重要课题。❤️本文将深入探讨机器学习中的可
单目测距（yolo-目标检测+标定+深度学习目标检测_测距）计算机C9硕士_算法工程师 YOLO 目标检测深度学习
YOLOv5模型介绍YOLOv5是目前最先进的目标检测算法之一，在多个数据集上取得了优秀的表现。相较于YOLOv4，YOLOv5采用了更深的Backbone网络和更高的分辨率输入图像，以提高检测精度和速度。单目测距实现方法在目标检测的基础上，我们可以通过计算物体在图像中的像素大小来估计其距离。具体方法是，首先确定某个物体的实际尺寸，然后根据该物体在图像中的像素大小计算其距离。这个方法可以应用于各种
数据挖掘常用算法模型简介大乔乔布斯数据挖掘线性回归决策树
以下是数据挖掘中常用的算法模型及其简称、英文全称和使用场景的简要介绍：1.决策树（DecisionTree,DT）常用算法：CART:ClassificationandRegressionTreeID3:IterativeDichotomiser3C4.5:基于ID3改进使用场景：分类问题（如信用风险评估、客户分类）回归问题（如预测房价）特点：易解释、适合处理非线性数据。2.随机森林（Random
Depth Anything V2：单目深度估计的更强基线武朵欢Nerissa
DepthAnythingV2：单目深度估计的更强基线项目地址:https://gitcode.com/gh_mirrors/de/Depth-Anything-V2项目介绍DepthAnythingV2是由HKU与TikTok团队合作开发的单目深度估计算法的升级版本。这个框架显著提升了细节处理能力和鲁棒性，相比于基于深度学习的方法，它提供了更快的推理速度、更少的参数量以及更高的深度预测精度。本项
【系统架构设计师】案例专题六（8大系统架构设计之1）：信息系统架构设计考点梳理数据知道系统架构设计师(软考高级)系统架构架构软考高级系统架构设计师案例分析
更多内容请见：备考系统架构设计师-核心总结目录文章目录一、信息系统架构基本概念二、信息系统架构1、信息系统架构分类2、信息系统常用4种架构模型3、企业信息系统的总体框架三、信息系统架构设计方法1、ADM架构开发方法2、信息化总体架构方法3、TOGAF的目标、思想和组件四、信息系统架构风格一、信息系统架构基本概念信息系统架构(InformationSystemArchitecture,ISA)是指对
使用PyTorch实现逻辑回归：从训练到模型保存与加载 Luzem0319 pytorch 逻辑回归人工智能
1.引入必要的库首先，需要引入必要的库。PyTorch用于构建和训练模型，pandas和numpy用于数据处理，matplotlib用于结果的可视化。importtorchimporttorch.nnasnnimporttorch.optimasoptimfromtorch.utils.dataimportDataLoader,TensorDatasetimportpandasaspdimport
Linux 王某人996 Linux
一、概述1.1Linux的历史操作系统，英语OperatingSystem简称为OS。说道操作系统就需要先讲一讲Unix，UNIX操作系统，是一个强大的多用户、多任务操作系统，支持多种处理器架构，按照操作系统的分类，属于分时操作系统，最早由KenThompson、DennisRitchie和DouglasMcIlroy于1969年在AT&T的贝尔实验室开发。而linux就是一款类Unix系统。通常
OpenAI的编程语言和框架，给程序员带来了帮助有哪些 API技术大佬Anzexi58 OpenAI 人工智能人工智能深度学习
OpenAI是一个人工智能开发公司，成立于2015年，总部位于美国旧金山。这家公司致力于研究和开发先进的人工智能技术，旨在将这些技术应用到解决全球一些最棘手的问题上。OpenAI以其卓越的技术和实验室出品的groundbreakingAIpapers而闻名。OpenAI的研究涉及深度学习、自然语言处理、视觉感知、强化学习等多个领域，并已在各种应用中取得了令人瞩目的成果。例如，在机器人领域，Open
网络安全（黑客）——自学2025 网安大师兄 web安全安全网络网络安全 linux
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包前言什么是网络安全网络安全可以基于攻击和防御视角来分类，我们经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。如何成为一名黑客很多朋友在学习安全方面都会半路转行，因为不知如何去学，在这里，我将这个整份答案分为黑客（网络安全）入门必备、黑客（网络安全）职业指南、黑客（网络安全）学习
Pytorch 基础之张量索引攻城狮随笔 Pytorch 机器学习 pytorch 深度学习 python
本次将介绍一下Tensor张量常用的索引与切片的方法：1.index索引index索引值表示相应维度值的对应索引a=torch.rand(4,3,28,28)print(a[0].shape)#返回维度一的第0索引tensorprint(a[0,0].shape)#返回维度一0索引位置，维度二0索引位置的tensorprint(a[0,0,0].shape)#返回维度一0索引，维度二0索引，维度三
简化代码，提高可维护性 Java外观模式解读，让你的代码优雅又高效程序员老马头 java 外观模式开发语言后端
一、引言1.1简介外观模式（FacadePattern）是一种常用的结构型设计模式，它为复杂的子系统提供一个简单的接口，隐藏复杂的实现细节。使用外观模式可以降低客户端与子系统的耦合度，使得客户端更加容易使用子系统，同时也可以提高代码的复用性。1.2设计模式的概念设计模式是一套被反复使用、多数人知晓的、经过分类的、代码设计经验的总结。使用设计模式是为了让代码更加简洁、易于维护和复用。常见的设计模式有
DeepSeek：突破传统的AI算法与下载排行分析 smart_ljh 行业搜索人工智能 AI
DeepSeek的AI算法突破DeepSeek相较于OpenAI以及其它平台的性能对比DeepSeek的下载排行分析（截止2025/1/28AI人工智能相关DeepSeek甚至一度被推上了搜索）未来发展趋势总结在人工智能技术飞速发展的当下，搜索引擎市场也迎来了新的变革。DeepSeek，作为一款基于深度学习技术和大数据算法的搜索引擎，以其独特的优势在国内外市场上引起了广泛关注。下面介绍一下针对De
我们为什么要用大语言模型来迭代数据安全能力？大模型. 语言模型人工智能自然语言处理架构深度学习大数据大模型
在当今科技飞速发展的时代，大语言模型无疑是最炙手可热的话题之一。从OpenAI的GPT系列到谷歌的BERT，这些拥有海量参数的模型宛如智能巨人，正重塑着自然语言处理（NLP）的格局。你或许好奇，大语言模型究竟为何如此备受瞩目？这得从自然语言处理领域的核心任务——文本分类说起。文本分类，就像是给五花八门的文本信息贴上合适的“标签”，无论是判断一封邮件是正常邮件还是垃圾邮件，分析社交媒体上的评论是积极
scikit-learn基本功能和示例代码 weixin_30777913 深度学习机器学习 python scikit-learn
scikit-learn（简称sklearn）是一个广泛使用的Python机器学习库，提供了丰富的工具和算法，涵盖了数据预处理、模型训练、评估和优化等多个方面。scikit-learn是一个功能强大的机器学习库，涵盖了数据预处理、分类、回归、聚类、降维、模型选择与评估等多个方面。通过上述代码示例，您可以快速上手并使用scikit-learn进行机器学习任务。以下是对scikit-learn主要功能
使用 Python 和 scikit-learn 实现 KNN 分类：以鸢尾花数据集为例弥树子 python scikit-learn 分类
在机器学习的世界里，K-NearestNeighbors（KNN）算法是一种简单而强大的分类方法。它基于一个直观的想法：相似的数据点往往属于同一类别。本文将通过Python的scikit-learn库实现KNN分类，以经典的鸢尾花数据集为例，展示从数据加载到模型评估的完整流程。1.KNN算法简介KNN是一种监督学习算法，主要用于分类和回归任务。它的工作原理非常简单：对于一个新的数据点，算法会查找训
machine learning knn算法之使用KNN对鸢尾花数据集进行分类知识鱼丸 machine learning 机器学习算法分类
通过导入必要的scikit-learn导入必要的库，加载给定的数据，划分测试集和训练集之后训练预测和评估即可具体代码如下：importnumpyasnpfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.preprocessingimportStandardS
DeepSeek--通向通用人工智能的深度探索者油泼辣子多加专业名词解释人工智能
一、词源与全称“DeepSeek"由"Deep”（深度）与"Seek"（探索）组合而成，中文译名为"深度求索"。其全称为"深度求索人工智能基础技术研究有限公司"，英文对应"DeepSeekArtificialIntelligenceResearchInstitute"。这一命名体现了企业对深度学习技术与未知领域持续探索的双重追求。二、发展历程初创期（2023）公司成立于中国杭州，创始团队汇聚了来自
linux git clone出现fatal: unable to access Failed to connect to github.com port 443: Timed out解决方案 herosunly C/C++/Linux解决方案 linux git github timeout port 443
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了linuxgitclone出现fatal:unabletoaccessF
AI软件外包需要注意什么外包开发AI软件的关键因素是什么如何选择AI外包开发语言北京动点飞扬软件 AI外包
1.定义目标与需求首先，要明确你希望AI智能体做什么。是自动化任务、数据分析、自然语言处理，还是其他功能？明确目标可以帮助你选择合适的技术和方法。2.选择开发平台与工具开发AI智能体的软件时，你需要选择适合的编程语言、框架和工具。例如：编程语言：Python是最常用的语言，因为它有强大的AI/ML库，如TensorFlow、PyTorch、scikit-learn等。开发平台：你可以使用本地环境、
人脸识别的经典深度学习方法明初啥都能学会深度学习人工智能
人脸识别的经典深度学习方法引言1.卷积神经网络（CNN）1.1LeNet1.2AlexNet1.3VGGNet1.4ResNet2.人脸检测2.1Viola-Jones算法2.2基于深度学习的人脸检测3.人脸特征提取3.1主成分分析（PCA）3.2人脸对齐3.2.1基于特征点的对齐3.2.2基于深度学习的对齐4.人脸识别模型4.1传统机器学习方法4.2基于深度学习的方法5.公式解读5.1卷积运算5
基于深度学习的遥感目标检测系统：UI界面、R-CNN模型与数据集准备 2025年数学建模美赛 R-CNN检测系统人工智能深度学习 r语言 cnn python ui 目标检测
一、引言遥感图像中的目标检测在很多领域，如环境监测、土地利用、城市规划、农业资源监测等方面有着广泛应用。遥感图像具有高分辨率和丰富的空间信息，但同时也带来了目标检测中的许多挑战，特别是在目标尺度变化、遮挡和复杂背景的情况下。因此，采用深度学习技术，尤其是卷积神经网络（CNN）和区域卷积神经网络（R-CNN），在遥感图像目标检测中取得了显著的成果。本文将详细介绍基于深度学习的遥感目标检测系统，使用R
《Kotlin核心编程》下篇张云瀚 kotlin kotlin核心编程
设计模式设计模式分类创建型设计模式：概念：创建型设计模式主要用于对象的创建过程，比如对象的实例化、创建对象的方式和时机等，它关注的是如何将对象的创建和使用分离，使得代码在创建对象时更加灵活、可维护和可扩展。特点：封装对象创建过程；提高灵活性；便于代码复用。常见模式：单例模式、工厂模式、抽象工厂模式、建造者模式、原型模式。结构型设计模式：概念：结构型设计模式主要用于处理类或对象的组合结构，它关注的是
ultralytics 是什么？博刻 AI 学习笔记 python
ultralytics是一个用于计算机视觉任务的Python库，专注于提供高效、易用的目标检测、实例分割和图像分类工具。它最著名的功能是实现YOLO（YouOnlyLookOnce）系列模型，特别是最新的YOLOv8。1.YOLO是什么？YOLO是一种流行的目标检测算法，以其速度快和精度高而闻名。YOLO的核心思想是将目标检测问题转化为一个回归问题，直接预测目标的边界框和类别。YOLOv8是YOL
mysql 树形结构_MySQL 树形结构数据库设计 | 剑花烟雨江南来B mysql 树形结构
程序设计过程中，我们常常用树形结构来表示某些数据的关联关系，如企业的部门上下级、电商平台的商品分类等等，通常而言，我们需要通过数据库来完成数据的持久化。由于关系型数据库没有一个很好的树形结构解决方案，因此设计合适的Schema以及其对应的CURD算法是关键。接下来，我们以电商商品分类结构来介绍几种解决方案。邻接表邻接表就是把所有节点都放在一张表中，然后用一个属性来记录每个节点的父节点。如下：CRE
Kaggle房价预测一名小菜鸟的学习之路深度学习pytorch 深度学习机器学习 python 人工智能神经网络
Kaggle房价预测作为深度学习基础篇章的总结，我们将对本章内容学以致用。下面，让我们动手实战一个Kaggle比赛：房价预测。本节将提供未经调优的数据的预处理、模型的设计和超参数的选择。我们希望读者通过动手操作、仔细观察实验现象、认真分析实验结果并不断调整方法，得到令自己满意的结果。%matplotlibinlineimporttorchimporttorch.nnasnnimportnumpya
C++ 与机器学习：构建高效推理引擎的秘诀 salsm C++编程魔法师 c++机器学习开发语言
随着深度学习模型逐渐从研究走向生产环境，推理能力成为部署中的关键环节。模型的推理引擎需要以极低的延迟快速处理输入数据，同时最大化地利用硬件资源。虽然Python被广泛用于模型的训练和开发，但C++却在推理领域独占鳌头，其性能优势和硬件控制能力无可替代。在这篇文章中，我们将从为什么选择C++、构建高效推理引擎的细节，以及相似的开源项目三个方面深入探讨如何利用C++打造高效的机器学习推理引擎。目录为什
java的(PO,VO,TO,BO,DAO,POJO) Cb123456 VO TO BO POJO DAO
转: http://www.cnblogs.com/yxnchinahlj/archive/2012/02/24/2366110.html ------------------------------------------------------------------- O/R Mapping 是 Object Relational Mapping（对象关系映
spring ioc原理（看完后大家可以自己写一个spring） aijuans spring
最近，买了本Spring入门书：spring In Action 。大致浏览了下感觉还不错。就是入门了点。Manning的书还是不错的，我虽然不像哪些只看Manning书的人那样专注于Manning,但怀着崇敬的心情和激情通览了一遍。又一次接受了IOC 、DI、AOP等Spring核心概念。先就IOC和DI谈一点我的看法。IO
MyEclipse 2014中Customize Persperctive设置无效的解决方法 Kai_Ge MyEclipse2014
高高兴兴下载个MyEclipse2014，发现工具条上多了个手机开发的按钮，心生不爽就想弄掉他！结果发现Customize Persperctive失效！！有说更新下就好了，可是国内Myeclipse访问不了，何谈更新... so~这里提供了更新后的一下jar包，给大家使用！ 1、将9个jar复制到myeclipse安装目录\plugins中 2、删除和这9个jar同包名但是版本号较
SpringMvc上传 120153216 springMVC
@RequestMapping(value = WebUrlConstant.UPLOADFILE) @ResponseBody public Map<String, Object> uploadFile(HttpServletRequest request,HttpServletResponse httpresponse) { try { //
Javascript----HTML DOM 事件何必如此 JavaScript html Web
HTML DOM 事件允许Javascript在HTML文档元素中注册不同事件处理程序。事件通常与函数结合使用，函数不会在事件发生前被执行！注：DOM：指明使用的 DOM 属性级别。 1.鼠标事件属性
动态绑定和删除onclick事件 357029540 JavaScript jquery
因为对JQUERY和JS的动态绑定事件的不熟悉，今天花了好久的时间才把动态绑定和删除onclick事件搞定!现在分享下我的过程。在我的查询页面，我将我的onclick事件绑定到了tr标签上同时传入当前行(this值)参数，这样可以在点击行上的任意地方时可以选中checkbox，但是在我的某一列上也有一个onclick事件是用于下载附件的，当
HttpClient|HttpClient请求详解 7454103 apache 应用服务器网络协议网络应用 Security
HttpClient 是 Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient，然后根据作者实际工作经验给出了一些常见问题的解决方法。HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了，越来越多的 Java 应用程序需
递归逐层统计树形结构数据 darkranger 数据结构
将集合递归获取树形结构: /** * * 递归获取数据 * @param alist:所有分类 * @param subjname:对应统计的项目名称 * @param pk:对应项目主键 * @param reportList: 最后统计的结果集 * @param count:项目级别 */ public void getReportVO(Arr
访问WEB-INF下使用frameset标签页面出错的原因 aijuans struts2
<frameset rows="61,*,24" cols="*" framespacing="0" frameborder="no" border="0">
MAVEN常用命令 avords
Maven库： http://repo2.maven.org/maven2/ Maven依赖查询： http://mvnrepository.com/ Maven常用命令： 1. 创建Maven的普通java项目： mvn archetype:create -DgroupId=packageName
PHP如果自带一个小型的web服务器就好了 houxinyou apache 应用服务器 Web PHP 脚本
最近单位用PHP做网站，感觉PHP挺好的，不过有一些地方不太习惯，比如，环境搭建。PHP本身就是一个网站后台脚本，但用PHP做程序时还要下载apache，配置起来也不太很方便，虽然有好多配置好的apache+php+mysq的环境，但用起来总是心里不太舒服，因为我要的只是一个开发环境，如果是真实的运行环境，下个apahe也无所谓，但只是一个开发环境，总有一种杀鸡用牛刀的感觉。如果php自己的程序中
NoSQL数据库之Redis数据库管理(list类型) bijian1013 redis 数据库 NoSQL
3.list类型及操作 List是一个链表结构，主要功能是push、pop、获取一个范围的所有值等等，操作key理解为链表的名字。Redis的list类型其实就是一个每个子元素都是string类型的双向链表。我们可以通过push、pop操作从链表的头部或者尾部添加删除元素，这样list既可以作为栈，又可以作为队列。 &nbs
谁在用Hadoop？ bingyingao hadoop 数据挖掘公司应用场景
Hadoop技术的应用已经十分广泛了，而我是最近才开始对它有所了解，它在大数据领域的出色表现也让我产生了兴趣。浏览了他的官网，其中有一个页面专门介绍目前世界上有哪些公司在用Hadoop，这些公司涵盖各行各业，不乏一些大公司如alibaba,ebay,amazon,google,facebook,adobe等，主要用于日志分析、数据挖掘、机器学习、构建索引、业务报表等场景,这更加激发了学习它的热情。
【Spark七十六】Spark计算结果存到MySQL bit1129 mysql
package spark.examples.db import java.sql.{PreparedStatement, Connection, DriverManager} import com.mysql.jdbc.Driver import org.apache.spark.{SparkContext, SparkConf} object SparkMySQLInteg
Scala: JVM上的函数编程 bookjovi scala erlang haskell
说Scala是JVM上的函数编程一点也不为过，Scala把面向对象和函数型编程这两种主流编程范式结合了起来，对于熟悉各种编程范式的人而言Scala并没有带来太多革新的编程思想，scala主要的有点在于Java庞大的package优势，这样也就弥补了JVM平台上函数型编程的缺失，MS家.net上已经有了F#，JVM怎么能不跟上呢？对本人而言
jar打成exe bro_feng java jar exe
今天要把jar包打成exe，jsmooth和exe4j都用了。遇见几个问题。记录一下。两个软件都很好使，网上都有图片教程，都挺不错。首先肯定是要用自己的jre的，不然不能通用，其次别忘了把需要的lib放到classPath中。困扰我很久的一个问题是，我自己打包成功后，在一个同事的没有装jdk的电脑上运行，就是不行，报错jvm.dll为无效的windows映像，如截图最后发现
读《研磨设计模式》-代码笔记-策略模式-Strategy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 策略模式定义了一系列的算法，并将每一个算法封装起来，而且使它们还可以相互替换。策略模式让算法独立于使用它的客户而独立变化简单理解： 1、将不同的策略提炼出一个共同接口。这是容易的，因为不同的策略，只是算法不同，需要传递的参数
cmd命令值cvfM命令 chenyu19891124 cmd
cmd命令还真是强大啊。今天发现jar -cvfM aa.rar @aaalist 就这行命令可以根据aaalist取出相应的文件例如：在d：\workspace\prpall\test.java 有这样一个文件，现在想要将这个文件打成一个包。运行如下命令即可比如在d：\wor
OpenJWeb(1.8) Java Web应用快速开发平台 comsci java 框架 Web 项目管理企业应用
OpenJWeb(1.8) Java Web应用快速开发平台的作者是我们技术联盟的成员，他最近推出了新版本的快速应用开发平台 OpenJWeb(1.8)，我帮他做做宣传 OpenJWeb快速开发平台以快速开发为核心，整合先进的java 开源框架，本着自主开发+应用集成相结合的原则，旨在为政府、企事业单位、软件公司等平台用户提供一个架构透
Python 报错：IndentationError: unexpected indent daizj python tab 空格缩进
IndentationError: unexpected indent 是缩进的问题，也有可能是tab和空格混用啦 Python开发者有意让违反了缩进规则的程序不能通过编译，以此来强制程序员养成良好的编程习惯。并且在Python语言里，缩进而非花括号或者某种关键字，被用于表示语句块的开始和退出。增加缩进表示语句块的开
HttpClient 超时设置 dongwei_6688 httpclient
HttpClient中的超时设置包含两个部分： 1. 建立连接超时，是指在httpclient客户端和服务器端建立连接过程中允许的最大等待时间 2. 读取数据超时，是指在建立连接后，等待读取服务器端的响应数据时允许的最大等待时间在HttpClient 4.x中如下设置： HttpClient httpclient = new DefaultHttpC
小鱼与波浪 dcj3sjt126com
一条小鱼游出水面看蓝天，偶然间遇到了波浪。　　小鱼便与波浪在海面上游戏，随着波浪上下起伏、汹涌前进。　　小鱼在波浪里兴奋得大叫：“你每天都过着这么刺激的生活吗？简直太棒了。”　　波浪说：“岂只每天过这样的生活，几乎每一刻都这么刺激！还有更刺激的，要有潮汐变化，或者狂风暴雨，那才是兴奋得心脏都会跳出来。”　　小鱼说：“真希望我也能变成一个波浪，每天随着风雨、潮汐流动，不知道有多么好！”　　很快，小鱼
Error Code: 1175 You are using safe update mode and you tried to update a table dcj3sjt126com mysql
快速高效用：SET SQL_SAFE_UPDATES = 0；下面的就不要看了！今日用MySQL Workbench进行数据库的管理更新时，执行一个更新的语句碰到以下错误提示： Error Code: 1175 You are using safe update mode and you tried to update a table without a WHERE that
枚举类型详细介绍及方法定义 gaomysion enum javaee
转发 http://developer.51cto.com/art/201107/275031.htm 枚举其实就是一种类型，跟int, char 这种差不多，就是定义变量时限制输入的，你只能够赋enum里面规定的值。建议大家可以看看，这两篇文章，《java枚举类型入门》和《C++的中的结构体和枚举》，供大家参考。枚举类型是JDK5.0的新特征。Sun引进了一个全新的关键字enum
Merge Sorted Array hcx2013 array
Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note:You may assume that nums1 has enough space (size that is
Expression Language 3.0新特性 jinnianshilongnian el 3.0
Expression Language 3.0表达式语言规范最终版从2013-4-29发布到现在已经非常久的时间了；目前如Tomcat 8、Jetty 9、GlasshFish 4已经支持EL 3.0。新特性包括：如字符串拼接操作符、赋值、分号操作符、对象方法调用、Lambda表达式、静态字段/方法调用、构造器调用、Java8集合操作。目前Glassfish 4/Jetty实现最好，对大多数新特性
超越算法来看待个性化推荐 liyonghui160com 超越算法来看待个性化推荐
一提到个性化推荐，大家一般会想到协同过滤、文本相似等推荐算法，或是更高阶的模型推荐算法，百度的张栋说过，推荐40%取决于UI、30%取决于数据、20%取决于背景知识，虽然本人不是很认同这种比例，但推荐系统中，推荐算法起的作用起的作用是非常有限的。就像任何
写给Javascript初学者的小小建议 pda158 JavaScript
　　一般初学JavaScript的时候最头痛的就是浏览器兼容问题。在Firefox下面好好的代码放到IE就不能显示了，又或者是在IE能正常显示的代码在firefox又报错了。　　如果你正初学JavaScript并有着一样的处境的话建议你：初学JavaScript的时候无视DOM和BOM的兼容性，将更多的时间花在了解语言本身（ECMAScript）。只在特定浏览器编写代码（Chrome/Fi
Java 枚举 ShihLei java enum 枚举
注：文章内容大量借鉴使用网上的资料，可惜没有记录参考地址，只能再传对作者说声抱歉并表示感谢！一基础 1）语法枚举类型只能有私有构造器（这样做可以保证客户代码没有办法新建一个enum的实例）枚举实例必须最先定义 2）特性 &nb
Java SE 6 HotSpot虚拟机的垃圾回收机制 uuhorse java HotSpot GC 垃圾回收 VM
官方资料，关于Java SE 6 HotSpot虚拟机的garbage Collection，非常全，英文。 http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning &