imjackjia

基于VGG16迁移学习的图像分类算法

本文讲述如何使用自己已经训练好的VGG16模型来实现对图像的自动分类处理。本节中的内容将使用CPU主机而非GPU主机来实现。
主要学习内容有：

使用Pytorch加载ImageNet数据集中已经训练好的模型。
理解什么事VGG模型
实现对输入图像的尺寸及颜色的变换。

1. ImageNet数据集及VGG16模型

ImageNet数据集
Image数据集是斯坦福大学从互联网上收集大量图片后，并对其进行分类整理而形成的图像数据集合。在ILSVRC(ImageNet Large Scale Visual Recognition Challenge)竞赛中井场使用到这一数据集。
在PyTorch中可以轻松地使用ImageNet数据集中的ILSVRC2012数据集（分类数：1000种；训练用数据：120张；验证数据集：5万张；测试集：10万张），以及各种已经训练过的神经网络连接参数和各种已完成学习的模型。
VGG16模型
VGG16模型是在2014年的ILSVRC竞赛中人类人去排名第二的卷积神经网络模型。VGG16模型是由牛静大大学的VGG团队设计的16层神经网络模型，因此也成为VGG16模型。此外，还有层数为11、13、19的VGG模型版本。

2. 环境搭建

本算法运行时使用的Python版本为3.6.2，使用的PyTorch版本时1.0.2。

创建pytorch-bk1

conda create -n pytorch-bk1 python=3.6.2 -y

安装Torch
在网站下载指定版本的PyTorch：torch-1.0.1-cp36-cp36m-win_amd64.whl

然后，执行如下命令进行安装：

pip install torch-1.0.1-cp36-cp36m-win_amd64.whl --force-reinstall

安装torchvision
输入命令：

pip install torchvision==0.2.2  --trusted-host pypi.douban.com

注意：如果之前已经安装过PyTorch或者安装不完全，可以使用后缀--force-reinstall进行强制安装。
安装成功后，测试结果如下：

3. 准备运行文件

在开始运行编写的代码之前，必须先创建本文所涉及程序所使用的文件夹，并下载相关的文件。
程序的下载路径为：https://wwm.lanzouv.com/in8il0cmd1wb

下载完文件夹1_image_classification后，打开文件make_folders_and_data_downloads.ipynb并执行，程序就会自动生成下图所示的文件结构。

文件夹说明：

文件夹1_image_classification中有一个名为data的文件夹，改文件夹中已经准备好的金毛巡回犬的照片。
保存了ImageNet的分类列表的文件imagenet_class_index.json和下一个项目要用到的hymenotera_data也会被下载下来。
文件夹中的“.gitignore”文件用来指定上传文件到Github网站时需要忽略的文件列表。如果文件夹data中可以有很多从其他网站下载的文件，如果全部上传到Github上会十分浪费资源，因此可以使用该文件来指定哪些文件不需要上传到Github。

4. 检查包的import和PyTorch版本

# 导入软件包
import numpy as np
import json
from PIL import Image
import matplotlib.pyplot as plt
%matplotlib inline

import torch
import torchvision
from torchvision import models, transforms

# 确认 PyTorch 的版本号
print("PyTorch Version: ",torch.__version__)
print("Torchvision Version: ",torchvision.__version__)

输出结果为：

PyTorch Version:  1.0.1
Torchvision Version:  0.2.2

5. VGG16已完成训练模型的载入

利用已经训练好的VGG16模型，对文件夹data中金毛巡回犬的照片进行分类处理。
首先，使用ImageNet载入已经训练好参数的VGG16模型。第一次执行这段代码时，由于需要从网络下载参数数据，因此执行时间会稍微长一些。

#VGG-16已完成训练模型的载入
# 第一次执行时，由于需要从网络下载学习好的参数数据，因此执行时间会稍微长一些

#生成VGG-16模型的实例
use_pretrained = True  # 使用已经训练好的参数
net = models.vgg16(pretrained=use_pretrained)
net.eval()  # 设置为推测模式

#  输出模型的网络结构
print(net)

输出执行结果：

从输出结果中可以看出，VGG16模型的网络结构是由名为feature和classifier的两个模块组成的。在这个两个模块中，又分别包含卷积神经网络和全连接层。
可以看到，VGG16的名字虽然是16，但实际上是由38层网络组成的，而不是16层。这是因为16层指的只是其中的卷积神经网络层和全连接层的数量（其中不包括ReLU激活函数、池化层和Dropout层）。下图为VGG16模型的网络结构。

网络输入的图像的尺寸是颜色通道数为3的RGB格式，图像的高度和宽度均为224像素（batch_num,3,224,224）。图像尺寸前面的batch_num表示每个小批次处理的数量。上图中并没有显示最小批处理数量。
输入的图像首先是两次通过由3×3大小的卷积过滤器（64通道）和ReLU激活函数搭配而成的组合的处理，之后通过一个2×2大小的最大池化，这样就可以得到了一个112×112尺寸的一半大小的图像。在总共经过了5次这样卷积层、ReLU激活函数和最大池化的组合处理后，最终通过位于features模块中最后位置的最大池化处理后，数据的尺寸就变为了（512,7，7）。此外，使用PyTorch处理的数据对象被称为张量。
输入数据在通过features模块后，紧接着被传入classifier模块。位于开头的全连接层的输入参数数据为25088，输出参数数量为4096.这里的25088是通过classifier模块的输入图像的总参数量512×7×7=25088计算得到的。
在全连接层之后，接着会通过ReLU层和Dropout层，然后会再次通过一个全连接、 ReLU层和Dropout层的组合，最后通过一个神经数量为1000的分类类目的数量，用于表示输入图像属于1000个分类类别中的哪一个。

6.输入图片的预处理类的编写

现在已经成功地加载了训练好的VGG16模型，接下来编写在图片被输入VGG16前的预处理部分的代码。在将图片输入VGG模型之前，必须先对数据进行预处理。
预处理就是将图片的尺寸转换为224×224，并对颜色信息进行标准化数据处理。对颜色信息进行标准化，就是对每个RGB值用平均值（0.485,0.456,0.406）和标准差（0.229,0.224,0.225）进行归一化处理。这种归一化的条件数据是从ILSVRC2012数据集中的监督数据中计算得到的。先前加载的已经训练好的VGG16模型正是用这一归一化条件对图像进行了预处理之后再进行训练而得到的模型。因此，也需要对输入的图片进行同样的预处理操作。
接下来，将编程实现图片的预处理类的代码。首先，创建了一个BaseTransform类，并尝试执行代码。
具体实现的代码如下所示。需要注意的是，PyTorch与Pillow(PIL)对图像像素的处理顺序是不同的。在PyTorch中，图像是按照颜色通道、高度、宽度的顺序来处理的，而Pillow(PIL)中是按照图像的高度、宽度、颜色通道的顺序处理的。因此，PyTorch中输出的张量的顺序是通过image_transformed=img_transformed.numpy().transpose((1,2,0))这一语句进行转换的。
此外，__call__()这一函数是Python中的通用函数。该函数是在调用类的实例时，没有指定具体方法是被调用的函数。在生成BaseTransform的实例之后，如果不指定函数名而直接调用实例的变量名，__call__()函数内的代码就会被执行。

# 对输入图片进行预处理的类
class BaseTransform():
    """
    调整图片的尺寸，并对颜色进行规范化。

    Attributes
    ----------
    resize : int
       指定调整尺寸后图片的大小
    mean : (R, G, B)
       各个颜色通道的平均值
    std : (R, G, B)
       各个颜色通道的标准偏差
    """

    def __init__(self, resize, mean, std):
        self.base_transform = transforms.Compose([
            transforms.Resize(resize),  #将较短边的长度作为resize的大小
            transforms.CenterCrop(resize),  #从图片中央截取resize × resize大小的区域
            transforms.ToTensor(),  #转换为Torch张量
            transforms.Normalize(mean, std)  #颜色信息的正规化
        ])

    def __call__(self, img):
        return self.base_transform(img)

#确认图像预处理的结果

# 1. 读取图片
image_file_path = './data/goldenretriever-3724972_640.jpg'
img = Image.open(image_file_path)  # [高度][宽度][颜色RGB]

# 2.  显示处理前的图片示
plt.imshow(img)
plt.show()

# 3. 同时显示预处理前后的图片
resize = 224
mean = (0.485, 0.456, 0.406)
std = (0.229, 0.224, 0.225)
transform = BaseTransform(resize, mean, std)
img_transformed = transform(img)  # torch.Size([3, 224, 224])

# 将 ( 颜色、高度、宽度 ) 转换为 ( 高度、宽度、颜色 )，并将取值范围限制在0~1
img_transformed = img_transformed.numpy().transpose((1, 2, 0))
img_transformed = np.clip(img_transformed, 0, 1)
plt.imshow(img_transformed)
plt.show()

下图所示，为图片预处理的输出结果。图像的尺寸被调整为224，颜色信息也进行了归一化处理。

7. 根据输出结果预测标签的后处理类的编写

下面，需要实现将VGG16模型1000维的输出结果转化为分类标签的ILSVRCRPredictor类。在之前下载的JSON文件imagenet_class_index.json中已经事先先保存了ILSVRC的分类标签列表，直接使用即可。
首先对需要实现的功能进行简要说明。从VGG16模型输出的数据被保存在大小为torch.Size([1,1000])的PyTorch张量中，这里需要将其转换为Numpy型变量。因此，首先调用.detach()，将输出结果从网络中分离出来；然后，对被detach的张量进行.numpy()调用，将其转换为Numpy型变量，并用np.argmax()获取最大索引值。所有这些操作都是在这一行代码中完成的maxid=np.argmax(out.detach().numpy())。之后，从字典类型变量ILSVRC_class_index中获取maxid所对应的标签名。

#根据ILSVRC数据，从模型的输出结果计算出分类标签
ILSVRC_class_index = json.load(open('./data/imagenet_class_index.json', 'r'))
ILSVRC_class_index

# 根据输出结果对标签进行预测的后处理类
class ILSVRCPredictor():
    """
    根据ILSVRC数据，从模型的输出结果计算出分类标签

    Attributes
    ----------
    class_index : dictionary
           将类的index与标签名关联起来的字典型变量
    """

    def __init__(self, class_index):
        self.class_index = class_index

    def predict_max(self, out):
        """
        获得概率最大的ILSVRC分类标签名

        Parameters
        ----------
        out : torch.Size([1, 1000])
            从Net中输出结果

        Returns
        -------
        predicted_label_name : str
            预测概率最高的分类标签的名称
        """
        maxid = np.argmax(out.detach().numpy())
        predicted_label_name = self.class_index[str(maxid)][1]

        return predicted_label_name

8. 使用已完成学习的VGG模型对图像进行预测

以上，已经成功创建了图像的预处理类BaseTransform和网络输出的后处理类ILSVRCPredictor。训练完毕的VGG模型结构如下图所示。

输入图片经过BaseTranform的转换后，被作为VGG16模型的输入数据进行输入。模型输出的1000维的数据又经过ILSVRCPredictor的处理，被转换为预测概率最高的分类标签名，并作为最终的输出结果返回。
接下来实现这一连串的处理，并利用已经训练好的VGG模型对图片进行预测。
具体地代码实现如下所示。在将图片输入PyTorch网络中时，需要以最小批次的形式传递，因此这里使用了unsqueeze_(0)，将小批次的维度追加到输入数据中。

# 载入ILSVRC的标签信息，并生成字典型变量
ILSVRC_class_index = json.load(open('./data/imagenet_class_index.json', 'r'))

# 生成ILSVRCPredictor的实例
predictor = ILSVRCPredictor(ILSVRC_class_index)

# 读取输入的图像
image_file_path = './data/goldenretriever-3724972_640.jpg'
img = Image.open(image_file_path)  # [ 高度 ][ 宽度 ][ 颜色RGB]

# 完成预处理后，添加批次尺寸的维度
transform = BaseTransform(resize, mean, std)  #创建预处理类
img_transformed = transform(img)  # torch.Size([3, 224, 224])
inputs = img_transformed.unsqueeze_(0)  # torch.Size([1, 3, 224, 224])

# 输入数据到模型中，并将模型的输出转换为标签
out = net(inputs)  # torch.Size([1, 1000])
result = predictor.predict_max(out)

# 输出预测结果
print("输入图像的预测结果：", result)

输出结果为：

输入图像的预测结果： golden_retriever

执行上述代码，就可以得到golden_retriever这一输出结果，程序准确无误地将图片归类到金毛巡回犬的分类中。
以上就是本次学习内容，完成实现了用ImageNet将已经训练好的VGG16模型载入，并准确地将手头上未知图片（金毛巡回犬的照片）归类到ImageNet的分类中的程序代码。

SpringAOP前置——代理模式兜里ヌ有糖代理模式 java 后端
代理模式是SpringAOP（面向切面编程）的底层原理代理模式的分类静态代理动态代理静态代理角色分析：抽象角色：一般使用抽象类或接口来解决代理角色：代理真实角色，在代理真实角色后，一般会做一些附属操作真实角色：被代理的角色客户：访问代理对象的角色，可以理解为一个处理事务的线程，多为一次业务处理以租房举例子进行理解房东有房子要出租，将房源信息告诉中介，也就是让中介代理房东进行房屋租赁这件事。房东是真
springMVC文件上传和下载 xls丶 spring mvc
[置顶]SpringMVC单文件上传、多文件上传、文件列表显示、文件下载标签：SpringMVC文件上传文件下载列表显示2015-05-1821:0122627人阅读评论(6)收藏举报分类：SpringMVC（8）作者同类文章X•Shrio登陆验证实例详细解读•Spring+Mybatis+SpringMVC后台与前台分页展示实例（附工程）•Spring+Mybatis+SpringMVC+Mav
神经网络初始化 (init) 介绍迷路爸爸180 神经网络人工智能深度学习初始化 init
文章目录引言1.初始化的重要性1.1打破对称性1.2控制方差1.3加速收敛与提高泛化能力2.常见的初始化方法及其应用场景2.1Xavier/Glorot初始化2.2He初始化2.3正交初始化2.4其他初始化方法3.如何设置初始化4.基于BERT的文本分类如何进行初始化4.1项目背景4.2模型构建4.3模型训练与评估4.4结果分析结论参考资料引言在深度学习的世界中，构建一个高效且性能优异的神经网络模
ElasticSearch11-8.x 新特性李宥小哥常用中间件中间件
零、文章目录ElasticSearch11-8.x新特性1、API变更（1）类型（_type）移除在Elasticsearch8.x中，索引中的_type已经被完全移除。这意味着所有文档在同一个索引中将不再区分类型，简化了索引结构，但同时也要求开发者调整应用程序逻辑以适应这一变化。（2）客户端库更新Elasticsearch8.x不再支持rest-high-level-client，而是推荐使用新
Pytorch 三小时极限入门教程 power-辰南人工智能深度学习 pytorch 人工智能
一、引言在当今的人工智能领域，深度学习占据了举足轻重的地位。而Pytorch作为一款广受欢迎的深度学习框架，以其简洁、灵活的特性，吸引了大量开发者投身其中。无论是科研人员探索前沿的神经网络架构，还是工程师将深度学习技术落地到实际项目，Pytorch都提供了强大的支持。本教程将带你从零基础开始，一步步深入了解Pytorch的核心知识，助你顺利踏上深度学习的征程。二、Pytorch基础环境搭建安装An
Python机器学习之XGBoost从入门到实战(基本理论说明) 雪域枫蓝 Python Atificial Intelligence 机器学习 python 分布式
Xgboost从基础到实战XGBoost:eXtremeGradientBoosting*应用机器学习领域的一个强有力的工具*GradientBootingMachines(GBM)的优化表现，快速有效—深盟分布式机器学习开源平台(DistributedmachinelearningCommunity，DMLC)的分支—DMLC也开源流行的深度学习库mxnet*GBM：Machine：机器学习模型
设计模式简介智想天开设计模式技术文章设计模式
本文章为原创，禁止未经授权的转载。对应公众号地址：设计模式简介，更多内容请关注公众号：智想天开1.什么是设计模式？设计模式是一套被反复使用、多数人知晓的、经过分类编目的代码设计经验。它们不是具体的代码，而是解决特定类型问题的通用方案。设计模式旨在提供一种高效、可维护和可扩展的方式来构建软件系统。关键点：重用：通过使用设计模式，可以避免重复造轮子，提升开发效率。沟通：设计模式提供了标准化的术语，促进
【YOLOv8杂草作物目标检测】 stsdddd YOLO目标检测目标检测 YOLO 目标检测人工智能
YOLOv8杂草目标检测算法介绍模型和数据集下载算法介绍YOLOv8在禾本科杂草目标检测方面有显著的应用和效果。以下是一些关键信息的总结：农作物幼苗与杂草检测系统：基于YOLOv8深度学习框架，通过2822张图片训练了一个目标检测模型，用于检测田间的农作物幼苗与杂草对象。该系统支持图片、视频以及摄像头进行目标检测，并能保存检测结果。系统界面可实时显示目标位置、目标总数、置信度、用时等信息。YOLO
深度学习(1) 浅忆へ梦微凉深度学习人工智能深度学习学习方法 python
一、torch的安装基于直接设备情况，选择合适的torch版本，有显卡的建议安装GPU版本，可以通过nvidia-smi命令来查看显卡驱动的版本，在官网中根据cuda版本，选择合适的版本号，下面是安装示例代码GPU：pipinstalltorch==2.5.0torchvision==0.20.0torchaudio==2.5.0--index-urlhttps://download.pytorc
Python 数据建模完整流程指南木觞清 3天入门Python python 开发语言
在数据科学和机器学习中，建模是一个至关重要的过程。通过有效的数据建模，我们能够从原始数据中提取有用的洞察，并为预测或分类任务提供支持。在本篇博客中，我们将通过Python展示数据建模的完整流程，包括数据准备、建模、评估和优化等步骤。1.导入必要的库在进行任何数据分析或建模之前，首先需要导入必需的Python库。这些库提供了各种工具和算法，帮助我们更高效地完成任务。importnumpyasnpim
我学会了整理房间 tailwind-css
讲述自己学会整理房间的过程。以前，我的房间总是乱糟糟的，书本、玩具、衣服到处乱扔。有一次，妈妈让我自己整理房间，我开始学着把书本放进书架，把玩具放进玩具箱，把衣服叠整齐放进衣柜。整理完后，房间变得整洁又舒适。通过整理房间，我学会了分类和收纳，也养成了良好的生活习惯。
nlp培训重点-3 heine162 自然语言处理人工智能
1.文本匹配分类：loader:#-*-coding:utf-8-*-importjsonimportreimportosimporttorchimportrandomimportloggingfromtorch.utils.dataimportDataset,DataLoaderfromcollectionsimportdefaultdictfromtransformersimportBertT
深度学习常用格式转化脚本xml2yolo/coco2yolo/bdd2yolo/frame2video等 qq1309399183 计算机视觉实战项目集合深度学习人工智能格式转化脚本 voc2yolo格式转化数据集格式转换 xml2yolo coco2yolo
文章目录1.**数据集格式转换脚本**`coco2yolo.py`示例注释：注释说明：`xml2yolo.py`示例注释：注释说明：2.**数据集可视化与统计**`vis_yolo_files.py`示例注释：注释说明：3.**其他工具脚本**`frames2video.py`示例注释：注释说明：该项目提供了一系列用于深度学习的数据处理工具，主要功能包括：数据集格式转换：提供多种脚本，将不同格式的
LLMs，即大型语言模型 maopig AI 语言模型人工智能自然语言处理
LLMs，即大型语言模型，是一类基于深度学习的人工智能模型，它们通过海量的数据和大量的计算资源进行训练，可以理解和生成自然语言。LLMs的核心架构是Transformer，其关键在于自注意力机制，使得模型能够同时对输入的所有位置进行“关注”，从而更好地捕捉长距离的语义依赖关系。LLMs在众多领域都有广泛的应用，如自然语言理解（NLU），语言生成，以及语音识别和合成等。例如，它们能够理解人类的语言
随机森林分类算法原理与实验分析 ningaiiii 机器学习与深度学习随机森林分类算法
随机森林分类算法原理与实验分析1.引言随机森林（RandomForest）是一种集成学习方法，它通过构建多个决策树并结合它们的预测结果来进行分类。你可以把它想象成一个“团队决策”的过程：团队中的每个成员（决策树）都独立发表意见，最后通过投票决定最终结果。这种方法不仅提高了模型的准确性，还增强了模型的稳定性和鲁棒性。随机森林的主要特点是通过随机选择样本和特征来构建多个决策树，从而避免单棵决策树可能产
【LLM】大语言模型（LLMs）林九生人工智能语言模型人工智能自然语言处理
大型语言模型（LLMs）1.什么是大型语言模型？大型语言模型（LargeLanguageModel，LLM）是基于深度学习的自然语言处理模型，能够理解和生成自然语言文本。它们通过在大规模文本数据上进行训练，学习语言的语法、语义和各种语言特征，从而可以执行诸如文本生成、翻译、总结、问答等多种语言任务。以下是大型语言模型的定义和基本原理：1.1定义大型语言模型是由大量参数组成的神经网络，这些参数通过在
【Python】已解决：ModuleNotFoundError: No module named ‘sklearn‘ 屿小夏 python sklearn 人工智能
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
[python]通过whl文件安装torchvision和torchaudio及国内whl文件下载地址汇总萌萌哒240 环境配置 python 开发语言
要通过.whl文件安装torchvision和torchaudio，你需要先确保你已经安装了与这些库兼容的PyTorch版本。以下是一个详细的步骤指南，帮助你通过.whl文件安装这些库。1.安装PyTorch首先，确保你已经安装了PyTorch。你可以从PyTorch的官方网站获取适合你系统的安装命令例如，如果你使用的是CUDA11.3和Python3.8，你可以使用以下命令安装PyTorch：p
python如何安装torch_Python安装torch模块报错处理红烧橘子皮 python如何安装torch
Python安装torch模块报错处理前言安装报错解决查找文档解决方案安装torch等待安装完成安装torchvision提示安装完成总结前言因python项目上线，需要在海外服务器上安装指定torch模块安装根据官网https://pytorch.org/安装提示，执行pip3install即可。pip3installtorchtorchvision但安装过程中发生报错，尝试多次执行pip3in
如何快速在Windows 10 + Anaconda 3 中使用Mxnet及gluon qianchess mxnet使用 mxnet win10 anaconda gluon 人工智能
如何快速在Windows10+Anaconda3中使用Mxnet及gluon网络上Mxnet的安装以及使用方法很多，自从其作者之一李沐推出了基于Mxnet的深度学习课程之后，我也尝试着去使用了一下Mxnet。首先第一步就是在自己的系统中安装Mxnet及其相关组建。现在的Mxnet常常会跟其虚拟环境Gluon结合在一起，所以下文就一起阐述一下，顺便记录一下自己踩的坑。注意本文的大部分内容都可以在官网
3D UNet和Swin-UNETR 学無芷境计算机视觉
3DUNet和Swin-UNETR都是用于医学图像分析的深度学习网络，它们对三维（3D）数据进行特征提取和分割。3DUNet3DUNet是UNet架构的一个变体，专门设计用于处理三维医学图像数据。UNet最初是为二维（2D）图像分割任务设计的，具有典型的编码器-解码器结构。3DUNet扩展了这种架构，以便更好地处理具有深度信息的体积数据，如CT或MRI扫描。主要特点：编码器：逐渐下采样图像，提取并
3DUnetCNN 项目常见问题解决方案魏纯漫
3DUnetCNN项目常见问题解决方案3DUnetCNNPytorch3DU-NetConvolutionNeuralNetwork(CNN)designedformedicalimagesegmentation项目地址:https://gitcode.com/gh_mirrors/3d/3DUnetCNN项目基础介绍3DUnetCNN是一个基于PyTorch的3DU-Net卷积神经网络（CNN）
推荐3D UNet实现：深度学习3D体素数据语义分割的利器！滑辰煦Marc
推荐3DUNet实现：深度学习3D体素数据语义分割的利器！去发现同类优质开源项目:https://gitcode.com/在这个快速发展的深度学习时代，3DUNet已经成为3D图像处理领域中不可或缺的工具，尤其在医疗影像分析和3D物体识别等任务上展现出强大的潜力。这个开源项目为我们提供了一个高效、灵活的3DUNet实现，支持Tensorflow、PyTorch和Chainer三种主流深度学习框架。
3D U-Net CNN医学图像分割项目教程尤辰城Agatha
3DU-NetCNN医学图像分割项目教程3DUnetCNNPytorch3DU-NetConvolutionNeuralNetwork(CNN)designedformedicalimagesegmentation项目地址:https://gitcode.com/gh_mirrors/3d/3DUnetCNN1.项目介绍3DU-NetCNN是由Ellisdg开发的Python实现，专门用于医学图像
锐捷路由器网关RG-NBR6135-E和锐捷交换机 Ruijie Reyee RG-ES224GC 电脑登录web方法 zh7314 硬件工程
2025年1月17日22:29:35最近淘了点东西，准备在家里搞一套深度学习的服务器，先把网关和交换机搞到了锐捷路由器网关RG-NBR6135-E电脑登录web方法在拿到机器的时候，如果不是全新建议拿根牙签，差入reset5-10秒,灯光会全部闪几下，重置机器，因为有些机器会配置的ip和网段无法访问默认的web服务ip，在机器上面的默认配置单配置参考：https://baijiahao.baidu
PyTorch机器学习与深度学习技术方法 Teacher.chenchong 机器学习 python 开发语言
近年来，随着AlphaGo、无人驾驶汽车、医学影像智慧辅助诊疗、ImageNet竞赛等热点事件的发生，人工智能迎来了新一轮的发展浪潮。尤其是深度学习技术，在许多行业都取得了颠覆性的成果。另外，近年来，Pytorch深度学习框架受到越来越多科研人员的关注和喜爱。Python基础知识串讲1、Python环境搭建（Python软件下载、安装与版本选择；PyCharm下载、安装；Python之HelloW
集团公司L1-L5级流程框架方法论：（1）L1级流程：为业务价值链，是业务流程的主干；（2）L2级流程：为运作模式层面的业务子流程，因场景不同而差异化；（3）L3级流程：为实现运营模式所需的业公众号：优享智库数字化转型数据治理主数据数据仓库大数据
集团公司L1-L5级流程框架方法论集团公司L1-L5级流程框架方法论L1级流程：业务价值链定义与作用构成要素与其他流程关系案例分析L2级流程：运作模式层面业务子流程场景差异化原因子流程分类与特点跨场景协同策略案例分析L3级流程：业务能力与业务活动业务能力定义及要求业务活动类型与目的与IT系统关系澄清案例分析L4级流程：业务与IT系统交互过程/工作流交互过程描述方法工作流设计原则常见问题与解决方案案
深度学习模块C2f代码详解你是狒狒吗目标检测人工智能计算机视觉 pytorch YOLO 神经网络
C2f是一个用于构建卷积神经网络（CNN）的模块，特别是在YOLOv5和YOLOv8等目标检测模型中。这个模块是一个改进的CSP（CrossStagePartial）Bottleneck结构，旨在提高计算效率和特征提取能力。下面是对C2f类的详细解释：类定义和初始化Python复制classC2f(nn.Module):“”“FasterImplementationofCSPBottleneckw
华为 Ascend 平台 YOLOv5 目标检测推理教程 Lunar* 目标检测华为 YOLO 目标检测
1.背景介绍随着人工智能技术的快速发展，目标检测在智能安防、自动驾驶、工业检测等领域中扮演了重要角色。YOLOv5是一种高效的目标检测模型，凭借其速度和精度的平衡广受欢迎。华为Ascend推理框架（ACL）是AscendCANN软件栈的核心组件，专为AscendAI加速硬件（如Atlas300I）设计，可实现高性能的深度学习推理。在本文中，我们将介绍如何基于华为AscendACL推理框架对YOLO
行为识别的方法人工智能专属驿站深度学习
行为识别主要有以下几大类方法，每类方法各有特点及典型算法：传统方法特点：利用手工设计特征对行为进行表征，再用统计学习的分类方法进行识别。需一定专业知识设计特征，耗费人力物力，对复杂场景、遮挡等适应性差，但对简单背景、规则动作识别效果尚可。典型算法：时空关键点（Space-TimeInterestPoints）：基于视频图像中的关键点在时空维度上的变化来提取动作特征，但可能忽略视频细节，泛化能力较弱
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt

基于VGG16迁移学习的图像分类算法

基于VGG16迁移学习的图像分类算法

1. ImageNet数据集及VGG16模型

2. 环境搭建

3. 准备运行文件

4. 检查包的import和PyTorch版本

5. VGG16已完成训练模型的载入

6.输入图片的预处理类的编写

7. 根据输出结果预测标签的后处理类的编写

8. 使用已完成学习的VGG模型对图像进行预测

你可能感兴趣的:(深度学习,迁移学习,分类,深度学习,pytorch)