小林记录

CV 使用PyTorch构建并训练深度神经网络，详细完整流程

PyTorch训练模型详细完整流程，实操记录

Pytorch基本情况
- 1. 个人用的相关东西的版本
- 2. 总体流程介绍（自己训练的流程整理的）
开始用PyTorch，按照上述的顺序介绍并实现
- 1. 写数据集的txt
- 2. 构建 Dataset 类
- 3. 设置dataloader（待补充详细方法介绍）
- 4. 构建模型
- 5. 加载模型及其参数们
- 6.训练测试和保存模型

Pytorch基本情况

1. 个人用的相关东西的版本

python==3.6.8

torch==1.9.0+cu102

torchvision==0.10.0+cu102

如需要安装的话，可以在终端这样：

pip install torchvision==0.10.0+cu102

2. 总体流程介绍（自己训练的流程整理的）

写数据集的txt

写一个保存了数据集路径和标签信息的txt，这里可以分为 train.txt 和 test.txt 。

构建 Dataset 类

这个类能读取步骤一的txt的内容，并通过 transform 设置Dataset类数据的相关的信息，如toTensor()、等。
并返回一个包含了图片数据和标签的Dataset对象给dataloader。

设置dataloader

就是接收第二步的Dataset对象，并设置训练数据相关的东西，如：batchsize、等。
后面训练就是直接将这个dataloader喂给model就行了。

构建模型
加载模型及其参数们
训练测试保存模型

开始用PyTorch，按照上述的顺序介绍并实现

1. 写数据集的txt

作用：
写数据集的 txt文件，是把数据集的路径和标签信息记录在txt文件中，为了让 pytorch 后面的 Dataset 类能通过读取txt的方式就能读取数据集。
同时在这一步可以通过写 train.txt 、val.txt 和 test.txt 来区分训练集、验证集和测试集。

先说明我的数据集文档情况

DATASET
|—0
|—|—1.bmp
|—|—2.bmp
|—|—3.bmp
|—|—省略号
|—1
|—|—1.bmp
|—|—2.bmp
|—|—3.bmp
|—|—省略号

我只需要把数据集分成训练集和测试集就行了，就只写了 train.txt 和 test.txt。
上代码

'''
         注意这里是这些代码的文件名
project//generate_txt.py
'''
import os
import random

# 指向数据集文件夹DATASET的路径位置
DATA_ROOT = ".//DATASET"
# 0~100，表示训练集和测试集划分的比率，80就是100张图片中有80个划分为训练集
train_test_rate = 80

# 获取DATASET文件夹下文档路径的列表，我这里是只有两个类别 1 和 0
# 就是['DATASET//1', 'DATASET//0']
dir_paths = [os.path.join(DATA_ROOT, p1) for p1 in os.listdir(DATA_ROOT)]
# 建立并以添加的方式打开训练集和测试集的txt
ftrain = open(os.path.join(DATA_ROOT, "train.txt"), "a+")
ftest = open(os.path.join(DATA_ROOT, "test.txt"), "a+")
# 分别遍历各类别的数据集图片
for i, dir_path in enumerate(dir_paths):
	# 因为我的文件夹名字就是label，所以我直接把遍历的index定为label，这里可以根据自己的喜好定
    label = i
    print(f"dirpath:{dir_path}, label:{i}")
    # 获取在某个类别文件夹下的所有图片路径，并保存到一个列表中。
    img_paths = [os.path.join(dir_path, p1) for p1 in os.listdir(dir_path) if p1[-4:].lower().endswith('.bmp')]
    # 遍历某个类别的所有图片路径的列表
    for j, img_path in enumerate(img_paths):
    	# 要保存到txt的内容，就是 图片路径+空格+标签，记得要过行“\n”。
        write_thing = img_path + " " + str(label) + "\n"
        # 随机写到训练集的txt和测试集的txt中
        if random.randint(0, 100) >= 80:
            ftrain.write(write_thing)
        else:
            ftest.write(write_thing)
# 完成前记得关掉ftrain和ftest，养成好习惯
ftest.close()
ftrain.close()

到此，写txt的工作就完成啦。

2. 构建 Dataset 类

作用：
Dataset类就是将txt的内容读取出来，并根据txt里的图片路径去获取数据集图片和标签，并返回一个包含了图片和标签的对象。
怎么做：
其实我们只需要继承pytorch中的Dataset类就可以了，并重写这个类中的两个方法就行了：

get_img_info()：
get_img_info就是去读取txt中的路径和标签，这里可以根据自己保存进txt的形式进行读取。
__ getitem __ (self, index)：
这个方法的作用是读取一张图片的数据和设置一个标签，就是让一张图片数据和标签对应起来。
可能会有点奇怪，为什么写读取一张图片和其对应标签的函数就能让dataset类返回所有数据集的图片和标签了。这是因为我们是继承了Dataset类，而在Dataset类里面是有一个循环来读取每一个路径下的图片和标签，而读取的方法就是__ getitem __ (index)，所以只用写读取一张图片就函数就行了。由于Dataset类中是用index来读取图片的，所以参数不能改变，只能是index。

直接上代码。

'''
     注意这里是这些代码的文件名
project//Dataset.py
'''
from torch.utils.data import Dataset
from PIL import Image


class MyDataset(Dataset):
    def __init__(self, txt_path, transform=None):
        """
        :param data_dir: str, 数据集所在路径
        :param transform: torch.transform，数据预处理
        """
        # data_info存储所有图片路径和标签，方便__getitem__(self, index)用index读取图片
        self.data_info = self.get_img_info(txt_path)
        # 图片的相关参数，如shuffle、等
        self.transform = transform

    # MyDataset类是继承了Dataset类，Dataset类会通过 index 来自动调用__getitem__来读取样本生成对象。
    # 这里就是写 读取每一个样本的方式。
    def __getitem__(self, index):
        path_img, label = self.data_info[index]
        img = Image.open(path_img).convert('RGB')

        if self.transform is not None:
            img = self.transform(img)
        return img, label

    @staticmethod
    # 这里需要写一个读取txt内容的函数，然后Dataset类会通过__getitem__来读取txt中对应图片路径的图片
    def get_img_info(txt_path):
        data_info = []
        f = open(txt_path, 'r')
        for line in f:
            info = line.split(' ')
            data_info.append((info[0], int(info[1][0])))
        return data_info

    def __len__(self):
        return len(self.data_info)

'''
     注意这里是这些代码的文件名
project//train.py
'''
from project.MyDataset import MyDataset
import torchvision
from torch.utils.data import DataLoader

train_txt = "E://pazhouwork//bupi5//bu5//train.txt"
test_txt = "E://pazhouwork//bupi5//bu5//test.txt"
transform = torchvision.transforms.Compose([torchvision.transforms.ToTensor()])


train_dataset = MyDataset(train_txt, transform)
test_dataset = MyDataset(test_txt, transform)

3. 设置dataloader（待补充详细方法介绍）

作用：
就是设置训练时的一些参数，如batchsize、数据采样方法等。
这里我只设置了batchsize和shuffle。
直接上代码

'''
_cbam_jieyue//train.py
'''
batchsize = 32
shuffle = True
train_loader = DataLoader(train_dataset, batch_size=batchsize, shuffle=shuffle)
test_loader = DataLoader(test_dataset, batch_size=batchsize, shuffle=shuffle)

4. 构建模型

直接上代码，首先是调用系统的ResNet50和ResNet101示例，第二个文件代码是构建自己的模型。有需要的话可以调用系统其他的模型，相信大佬们已经很熟练了。

'''
project//model//resnet.py
'''
from torchvision.models.resnet import resnet50, resnet101
import torch

device="cuda" if torch.cuda.is_available() else "cpu"#GPU加速
# device = "cpu"
print(f"Using {device} device")

resnet50 = resnet50().to(device)
resnet101 = resnet101().to(device)

'''
project//model//model.py
'''

import torch
from torch.nn import Module, Sequential, Flatten, Linear, ReLU, Conv2d, AdaptiveAvgPool2d, BatchNorm2d

'''
具体模型结构可以自己定义哦，下面只是我根据自己设计的模型去写的模型架构，里面的内容只是示例，大佬们不必细究哈
如果想要用系统的模型结构的话，可以直接调用。
'''

device="cuda" if torch.cuda.is_available() else "cpu"#GPU加速
print(f"Using {device} device")

class CONV_BLOCK_INIT(Module):
    def __init__(self, in_channel, out_channel):
        super(CONV_BLOCK_INIT, self).__init__()
        self.conv1 = Conv2d(in_channel, in_channel, kernel_size=1, stride=1, padding='same')
    def forward(self, x):
        x = self.conv1(x)

        return x

class CONV_BLOCK_STATE(Module):
    def __init__(self, in_channel):
        super(CONV_BLOCK_STATE, self).__init__()
        self.conv1 = Conv2d(in_channel, in_channel, kernel_size=1, stride=1, padding='same')

    def forward(self, x):
        x = self.conv1(x)
        return x

class CONV_SHORT_CUT(Module):
    def __init__(self, in_channel):
        super(CONV_SHORT_CUT, self).__init__()
        self.conv1 = Conv2d(in_channel, in_channel, kernel_size=1, stride=1, padding='same')
    def forward(self, x):
        x = self.conv1(x)
        return x

class JUMP_RESIDUAL(Module):
    def __init__(self, in_channel, out_channel):
        super(JUMP_RESIDUAL, self).__init__()
        self.relu = ReLU()
    def forward(self, x):
    	x3 = self.relu(x)
        return x3

class DeepNetwork(Module):#继承nn.Module
    def __init__(self):
        super(DeepNetwork,self).__init__()
        self.flatten=Flatten()
        self.feature_init = Conv2d(3, 64, kernel_size=3, stride=1, padding='same')
        self.state1 = JUMP_RESIDUAL(64, 128)
        self.state2 = JUMP_RESIDUAL(128, 256)
        self.state3 = JUMP_RESIDUAL(256, 512)
        self.state4 = JUMP_RESIDUAL(512, 1024)
        self.avgpool = AdaptiveAvgPool2d((1, 1))
        self.classifier = self._make_linear([1024, 128, 32, 2])
        self.relu = ReLU(inplace=True)
    def forward(self,x):
        x_init = self.feature_init(x)
        x1 = self.state1(x_init)
        x2 = self.state2(x1)
        x3 = self.state3(x2)
        x4 = self.state4(x3)
        x_fea = self.avgpool(x4)
        out = self.classifier(x_fea)
        return out

deep_model=DeepNetwork().to(device)
print(deep_model)

5. 加载模型及其参数们

大概就是这些参数比较重要，还有一些初始化之类的，可能会影响训练结果，后面有时间了再加上去哈。

# 选择模型，填写保存模型名称。
# 这里pretrain=True，就是用预训练好的ResNet50来训练自己的数据集。
model = resnet50(pretrain=True)
save_model_path = "model//resnet50.pth"

epochs = 100
learn_rate = 1e-3
optimizer = optim.Adam(model.parameters(), lr=learn_rate)
criterion = CrossEntropyLoss()
judge = 'f1'

6.训练测试和保存模型

主要是写了一个train函数来进行训练；

写train函数的时候要特别注意下面几个操作的顺序
不能交换！！！不能交换！！！不能交换！！！
我记得之前是有一次交换了不知道哪两个，训练了就跟没训练一样，效果特别差，所以特别拿出来说下。

获取预测值
y_pred = model(x)

优化器
optimizer.zero_grad()

获取损失
loss = criterion(y_pred, y)

损失反向传播
loss.backward()

优化器
optimizer.step()

并在train函数的末尾加入test函数来测试，获取目前模型的性能，并判断要不要保存；
然后就是参数设置部分。

'''
project//train.py
'''
import torch
from torch import optim
from torch.nn import CrossEntropyLoss
from tqdm import tqdm

from project.MyDataset import MyDataset
import torchvision
from torch.utils.data import DataLoader
from torch.autograd import Variable
from project.model.resnet import resnet50, resnet101

print('''
##########  start to train  #########
''')
def train(model, train_loader, test_loader, epoch, optimizer, criterion, device, judge):
	# 转换成训练模式
    model.train()
    train_loss = 0
    train_len = 0
    # 这个是为了训练的时候有进度条
    loop = tqdm(enumerate(train_loader), total=len(train_loader))
    
    for i, data in loop:
        x, y = data
		# 用GPU训练需要把训练的数据和标签都放进cuda，如下操作
        if device == 'gpu':
            x = Variable(torch.Tensor(x))
            x = x.cuda()
            y = Variable(y)
            y = y.cuda()
        # 获取预测值
        y_pred = model(x)
        # 优化器
        optimizer.zero_grad()
		# 获取损失
        loss = criterion(y_pred, y)
        
        train_loss += loss
        train_len += len(y_pred)
		# 损失反向传播
        loss.backward()
        optimizer.step()

        # 这个是为了训练的时候有进度条，更新进度条信息
        loop.set_description(f'Epoch [{epoch}]')
        loop.set_postfix(loss=train_loss / train_len)

    print(f'finish epoch {epoch}, start to test.')
    test_loss, judge_score = test(model, test_loader, optimizer, criterion, device, judge=judge)
    train_loss = train_loss / train_len
    return train_loss, test_loss, judge_score

def test(model, test_loader, optimizer, criterion, device, judge):
    model.eval()
    test_loss = 0
    count_pred = 0
    count_correct = 0
    count_correct1 = 0
    count_label1 = 0

    with torch.no_grad():
        for i, data in enumerate(test_loader):
            x, y = data

            if device == 'gpu':
                x = Variable(torch.Tensor(x))
                x = x.cuda()
                y = Variable(y)
                y = y.cuda()

            y_pred = model(x)
            optimizer.zero_grad()
            loss = criterion(y_pred, y)
            test_loss += loss

            pred = y_pred.max(1, keepdim=True)[1]
            count_pred += len(pred)

            count_correct += pred.eq(y.view_as(pred)).sum().item()

            for index_label, label in enumerate(y.tolist()):
                if y == 1:
                    count_label1 += 1
                    if pred[index_label][0] == 1:
                        count_correct1 += 1
    accuracy = count_correct/count_pred
    precision = count_pred - count_label1 - count_correct + 2 * count_correct1
    recall = count_correct1/count_label1
    f1_score = 2 * precision * recall / (precision + recall)
    print(f"accuracy:{accuracy} || precision:{precision} || recall:{recall} || f1_score:{f1_score}\n")
    if judge == 'f1':
        judge_score = f1_score
    elif judge == 'accuracy':
        judge_score = accuracy
    elif judge == 'precision':
        judge_score = precision
    elif judge == 'recall':
        judge_score = recall
    else:
        judge_score = False
    return test_loss / count_pred, judge_score

# 来放训练和测试的损失，方便我后面画图用
train_loss_list = []
test_loss_list = []
# 判断要不要保存模型的指标数值
judge_score_max = 0
# 训练epochs次
for epoch in range(1, epochs+1):
	# 训练部分
    train_loss, test_loss, judge_score = train(model, train_loader, test_loader, epoch, optimizer=optimizer, criterion=criterion, device='cpu', judge=judge)
    
    train_loss_list.append(train_loss)
    test_loss_list.append(test_loss)
	
	# 判断要不要保存模型
    if judge_score == False:
        print("judge_score is none.")
    else:
        judge_score_max = max(judge_score, judge_score_max)
        if judge_score_max == judge_score:
            torch.save(model, save_model_path)
            print(f'save model, cause judge_score is {judge_score}')

# 把损失都保存到txt文件中
ftrain = open('record//train.txt', 'a+')
ftest = open('record//test.txt', 'a+')
ftrain.write(f"{item} " for item in train_loss_list)
ftrain.write(f"{item} " for item in test_loss_list)
ftrain.close()
ftest.close()

GPT-3 面试题
简介1、GPT-3是什么？它是基于什么模型的？GPT-3是一种基于深度学习原理的语言预测模型。它是由OpenAI开发的，可以从互联网数据中生成任何类型的文本。它只需要一小段文本作为输入，就可以生成大量的准确和复杂的机器生成文本²⁴。GPT-3是基于Transformer模型的，使用了仅有解码器的自回归架构。它使用下一个单词预测目标进行训练¹²。GPT-3有8个不同的模型，参数从1.25亿到1750
「日拱一码」035 机器学习——调参过程可视化胖达不服输「日拱一码」机器学习人工智能调参过程可视化神经网络 python 模型可解释性
目录超参数搜索的3D曲面可视化交互式3D可视化神经网络学习率的3D可视化SVM超参数的3D决策边界可视化超参数优化的3D动画超参数搜索的3D曲面可视化##超参数搜索的3D曲面可视化importnumpyasnpimportmatplotlib.pyplotaspltfrommpl_toolkits.mplot3dimportAxes3Dfromsklearn.datasetsimportmake_
边缘计算与量子模型优化驱动医疗诊断新突破
内容概要在医疗人工智能领域，边缘计算与量子模型优化的协同演进正重构诊断系统的技术范式。通过将计算节点前置至医疗设备端，边缘架构有效解决了传统云端模型面临的实时性瓶颈，配合量子优化算法对复杂特征空间的快速寻优能力，使得CT、MRI等高维影像数据的解析效率提升显著。值得关注的是，框架选型直接影响着模型部署的可行性——TensorFlow在移动端推理优化方面的工具链完备性，与PyTorch动态图机制对迭
数据质量是机器学习项目的核心痛点，AI技术能提供智能化解决方案。 zzywxc787 python pandas numpy 人工智能自动化运维 AI编程
一、数据质量诊断系统（Python实现）importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.clusterimportKMeansfromsklearn.ensembleimportIsolationForestfromtensorflow.keras.modelsimportSequentialfromte
精通 triton 使用 MLIR 的源码逻辑 - 第001节：triton 的应用简介
项目使用到MLIR，通过了解triton对MLIR的使用，体会到MLIR在较大项目中的使用方式，汇总一下。1.Triton概述OpenAITriton是一个开源的编程语言和编译器，旨在简化GPU高性能计算（HPC）的开发，特别是针对深度学习、科学计算等需要高效并行计算的领域。既允许开发者编写高度优化的代码，又不必过度关注底层硬件细节。这样，通过简化高性能计算，可以加速新算法的实现和实验。传统GPU
7.机器学习-十大算法之一拉索回归（Lasso）算法原理讲解以山河作礼。 #机器学习算法机器学习算法回归
7.机器学习-十大算法之一拉索回归（Lasso）算法原理讲解一·摘要二·个人简介三·前言四·原理讲解五·算法流程六·代码实现6.1坐标下降法6.2最小角回归法七·第三方库实现7.1scikit-learn实现（坐标下降法）：7.2scikit-learn实现（最小角回归法）：一·摘要拉索回归（LassoRegression）是一种线性回归的正则化形式，它通过引入L1范数惩罚项来实现模型的稀疏性，从
机器学习算法之回归算法福葫芦机器学习回归算法
一、回归算法思维导图二、算法概念、原理、应用场景和实例代码1、线性回归1.1、概念‌‌线性回归算法是一种统计分析方法，用于确定两种或两种以上变量之间的定量关系。‌线性回归算法通过建立线性方程来预测因变量（y）和一个或多个自变量（x）之间的关系。其基本形式为y=wx+e，其中w是权重，x是自变量，e是误差项。1.2、算法原理线性回归算法的核心在于找到最佳的拟合直线，使得预测值与实际值之间的误差最小。
7篇1章7节：机器学习算法解读，与数值预测回归模型构建 MD分析用R探索医药数据科学机器学习算法回归 r语言数据挖掘
机器学习是当今数据分析和人工智能的核心工具之一，其算法广泛应用于分类、回归、排序和推荐等领域。本篇将详细讲解机器学习的四大经典算法类型，并以回归问题为例深入探讨数值预测的关键步骤，包括数据准备、线性回归模型构建、模型预测及误差评估，帮助读者更系统地理解和掌握机器学习的基础知识及实际应用。一、机器学习的算法在数据科学和人工智能的浪潮中，机器学习算法成为了解决各种数据问题的关键工具。机器学习主要处理四
pytorch图像分类全流程（二）前人栽树,后人乘凉 datawhale pytorch pytorch 分类 python
本次使用的是ImageNet1000类别信息，resnet18预训练模型。记录一些一坑和知识点。在传入图片或视频之前我们都会对其进行预处理，归纳下来为四个字母RCTN：缩放、裁剪、转Tensor、归一化，可以使用transforms.Compose()函数打包对应四个函数进行预处理，当然这里有个小坑，transforms.Compose()只接受pillow格式的图像，不能拿opencv传入图片。
PyTorch图像分类系列——流程概览 VAMOT PyTorch图像分类系列 pytorch 深度学习分类计算机视觉
一、加载数据1.使用torchvision.datasets的方法加载经典数据集在此网址查看支持哪些经典数据集：Datasets—Torchvision0.18documentation(pytorch.org)data_train=torchvision.datasets.CIFAR10(root="CIFAR10",train=True,transform=ToTensor(),target_
tensorflow sigmoid_cross_entropy_with_logits 函数解释及公式推导 CrazyWolf_081c
tensorflowsigmoid_cross_entropy_with_logits函数解释及公式推导tensorflow官方文档解释参考pytorch--BCELosspytorch--BCELoss解释参考定义在tensorflow/python/ops/nn_impl.py.功能：计算在给定logits和label之间的sigmoidcrossentropy。测量离散分类任务中的概率误差，
ai绘画生成软件哪个好？几款好用的AI绘画软件分享! 呼酱小宝箱
随着人工智能技术的不断发展，越来越多的AI绘画生成软件被开发出来。这些软件利用深度学习技术，可以将普通照片或图像转化成具备艺术效果的画作。那么，ai绘画生成软件哪个好？首先，让我们来看一下几个常见的AI绘画生成软件，它们分别是：1、DeepDreamDeepDream是由Google开发的一款AI绘画生成软件。它通过卷积神经网络对输入的图片进行处理，从而生成出具有艺术风格的画作。DeepDream
Pytorch图像二分类代码 AlexNet 望舒向晚 Pytorch pytorch 深度学习机器学习
importtorchimporttorch.nnasnnimporttorch.optimasoptimimporttorch.utils.dataimporttorch.nn.functionalasFimporttorchvisionfromtorchvisionimporttransformsfromPILimportImagedefcheck_image(path):try:im=Ima
基于逻辑回归的图像二分类算法实现（Pytorch版）哎呦哥哥、图像分类 pytorch 逻辑回归分类
基于逻辑回归的图像二分类算法实现（Pytorch版）数据集模型代码数据集链接：FastFoodClassificationDataset我们只使用Burger和Pizza这两类。模型代码importtorchimporttorch.nnasnnfromtorchvision.models.utilsimportload_state_dict_from_urlmodel_urls={'resnet5
支持向量机SVM 李昊哲小课 sklearn 人工智能机器学习支持向量机算法机器学习 sklearn 人工智能数据挖掘
支持向量机SVM一、支持向量机算法支持向量机（SupportVectorMachine，SVM）是一种用于分类和回归分析的机器学习算法。分类场景举例（更容易理解）假设现在有一个二维平面上散落着一些点，这些点分为两类，一类是红色的圆形点，另一类是蓝色的方形点。我们的任务就是找到一条直线，能够把这两类点尽可能准确地分开。支持向量机算法做的事情就和这个类似。算法核心思想它不是随便找一条能分开两类数据的直
DeepSeek部署指南：从入门到精通 wujj_whut 热门应用 c++DeepSeek 嵌入式实时数据库
DeepSeek部署指南：从入门到精通引言在人工智能和深度学习领域，模型的部署是一个至关重要的环节。DeepSeek作为一款强大的深度学习框架，其部署过程不仅关系到模型的性能表现，还直接影响到实际应用的效果。本文将详细介绍DeepSeek的部署流程，涵盖从环境配置到实际应用的各个方面，旨在帮助读者全面掌握DeepSeek的部署技巧。一、DeepSeek简介DeepSeek是一款开源的深度学习框架，
【人工智能之深度学习】1. 深度学习基石：神经元模型与感知机的数学本质（附代码实现与收敛性证明） AI_DL_CODE 人工智能之深度学习人工智能深度学习神经元模型感知机赫布法则深度学习基础线性可分
摘要：作为深度学习的基础单元，神经元模型与感知机承载着从生物智能到人工神经网络的桥梁作用。本文从生物神经元的工作机制出发，系统剖析数学建模过程：详解赫布法则的权重更新原理（Δwi=η·xi·y），推导McCulloch-Pitts神经元模型的数学表达（y=Θ(∑wixi−b)），重点证明感知机在linear可分情况下的收敛性——通过Novikoff定理严格推导迭代次数上界，揭示间隔γ对收敛速度的影
深度学习在环境感知中的应用：案例与代码实现
让机器学会“看”世界：深度学习如何赋能环境感知？关键词深度学习|环境感知|计算机视觉|传感器融合|语义分割|目标检测|自动驾驶摘要环境感知是机器与外界互动的“眼睛和耳朵”——从自动驾驶汽车识别行人，到智能机器人避开障碍物，再到城市监控系统检测异常，所有智能系统都需要先“理解”环境，才能做出决策。传统环境感知方法依赖手工特征提取，难以应对复杂场景；而深度学习通过数据驱动的方式，让机器从大量数据中自动
自编码器表征学习：重构误差与隐空间拓扑结构的深度解析码字的字节机器学习自编码器重构误差隐空间
自编码器基础与工作原理自编码器（Autoencoder）作为深度学习领域的重要无监督学习模型，其核心思想是通过模拟人类认知过程中的"压缩-解压"机制实现数据的表征学习。这种由GeoffreyHinton团队在2006年复兴的神经网络结构，本质上是一个试图通过编码-解码过程来复制其输入的系统，却在实现这一看似简单目标的过程中，意外地获得了强大的特征提取能力。基本架构与工作流程典型自编码器由对称的两部
高斯混合模型（GMM）中的协方差矩阵类型与聚类形状关系详解码字的字节机器学习机器学习人工智能高斯混合模型 GMM
高斯混合模型（GMM）简介高斯混合模型（GaussianMixtureModel,GMM）是概率统计与机器学习交叉领域的重要模型，其核心思想是通过多个高斯分布的线性组合来描述复杂数据分布。与单一高斯分布不同，GMM能够捕捉数据中的多模态特性，这使得它在处理真实世界非均匀分布数据时展现出独特优势。从数学形式上看，一个包含K个分量的GMM可表示为：其中(\pi_k)是第k个高斯分量的混合系数（满足(\
基于YOLOv8的Web端交互式目标检测系统设计与实现 YOLO实战营 YOLO 前端目标检测人工智能 ui 目标跟踪计算机视觉
1.引言目标检测是计算机视觉领域的一项重要任务，它在安防监控、自动驾驶、医疗影像分析等领域有着广泛的应用。近年来，随着深度学习技术的快速发展，YOLO(YouOnlyLookOnce)系列算法因其出色的速度和精度平衡而备受关注。本文将详细介绍如何基于最新的YOLOv8模型构建一个Web端交互式目标检测系统，包含完整的UI界面设计和数据集处理流程。本系统将实现以下功能：基于YOLOv8的高效目标检测
基于卷积神经网络与小波变换的医学图像超分辨率算法复现神经网络15044 python 算法 cnn 算法人工智能图像处理开发语言神经网络深度学习
基于卷积神经网络与小波变换的医学图像超分辨率算法复现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。1.引言医学图像超分辨率技术在临床诊断和治疗规划中具有重要意义。高分辨率的医学图像能够提供更丰富的细节信息，帮助医生做出更准确的诊断。近年来，深度学习技术在图像超分辨率领域取得了显著进展。本文将复现一种结合卷积神经网络(CNN)、小波变
深度学习系列-----＞环境搭建（Ubuntu）二师兄用飘柔深度学习历程深度学习 ubuntu 人工智能 pytorch python
1、前言电脑基础系统硬件情况：系统：ubuntu18.04、显卡：GTX1050Ti；后续的环境搭建都在此基础上进行。此次学习选择Pytorch作为深度学习的框架，选择的原因主要由于PyTorch在研究领域特别受欢迎，较多的论文框架也是基于其开发。2、anaconda+python3安装测试在学习深度学习的过程中会涉及到使用不同版本python包的问题，而anaconda可以便捷获取包且对包能够进
深度学习-常用环境配置瑶山 AI linux 人工智能 windows CUDA PyTorch
目录Miniconda安装安装NVIDIA显卡驱动安装CUDA和cnDNNCUDAcuDNNPyTorch安装手动下载测试Miniconda安装最新版Miniconda搭建Python环境_miniconda创建python虚拟环境-CSDN博客安装NVIDIA显卡驱动直接进NVIDIA官网：NVIDIAGeForce驱动程序-N卡驱动|NVIDIA在这里有GeForce驱动程序，立即下载，这是下
机器学习初学者理论初解 Mikhail_G 机器学习人工智能
大家好!为什么手机相册能自动识别人脸？为什么购物网站总能推荐你喜欢的商品？这些“智能”背后，都藏着一位隐形高手——机器学习（MachineLearning）。一、什么是机器学习？简单说，机器学习是教计算机从数据中自己找规律的技术。就像教孩子认猫：不是直接告诉他“猫有尖耳朵和胡须”，而是给他看100张猫狗照片，让他自己总结出猫的特征。传统程序vs机器学习传统程序：输入规则+数据→输出结果（例：按“温
Embedding与向量数据库玖月初玖大模型应用开发基础人工智能 embedding 数据库
1.Embedding是什么EmbeddingModel是一种机器学习模型，它的核心任务是将离散的、高维的符号（如单词、句子、图片、用户、商品等）转换成连续的、低维的向量（称为“嵌入”或“向量表示”），并且这个向量能有效地捕捉原始符号的语义、关系或特征。1.1通俗理解EmbeddingModel是让计算机“理解”世界的核心工具，把“文字、图片、音频”等信息变成一串有意义的数字我们称之为“向量”。类
2023年第10期(NeuroImage)：DomainATM：多中心医学图像数据标准化工具箱影浮科技ImageFlow
基本信息1.标题：DomainATM:Domainadaptationtoolboxformedicaldataanalysis.2.期刊：NeuroImage3.IF/JCR/分区：7.4/Q1/中科院一区4.DOI：10.1016/j.neuroimage.2023.119863目录1、导读2、背景动机3、研究目的4、工具箱介绍5、测试试验6、局限不足1导读域适应（DA）是基于机器学习的现代医
在NLP深层语义分析中，深度学习和机器学习的区别与联系
在自然语言处理（NLP）的深层语义分析任务中，深度学习与机器学习的区别和联系主要体现在以下方面：一、核心区别特征提取方式机器学习：依赖人工设计特征（如词频、句法规则、TF-IDF等），需要领域专家对文本进行结构化处理。例如，传统情感分析需人工定义“情感词库”或通过词性标注提取关键成分。深度学习：通过神经网络自动学习多层次特征。例如，BERT等模型可从原始文本中捕获词向量、句法关系甚至篇章级语义，无
深度学习--利用梯度下降法进行多变量的二分类（感知机）白话学生nit 深度学习分类人工智能
其实这一节涉及到了感知机的相关知识，就把这一节当作是学习感知机的引子吧。什么是二分类我们先来说一下什么是二分类，二分类指的是将结果分为两个互斥的类别，通常用来表示问题的两种可能。为什么用感知机学习二分类常见的解决问题的模型有很多，这里我们使用感知机模型。至于为什么，因为感知机模型很多地方用起来比较简便，就拿我们这一节的问题举一下例子，我们需要依照房子的价格对房子进行分类。在感知机模型中，我们可以使
迁移学习：知识复用的智能迁移引擎 | 从理论到实践的跨域赋能范式大千AI助手人工智能 Python #OTHER 迁移学习人工智能机器学习算法神经网络大模型迁移
让AI像人类一样“举一反三”的通用学习框架本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心定义与基本概念迁移学习（TransferLearning）是一种机器学习范式，其核心思想是：将源领域（SourceDomain）学到的知识迁移到目标领域（TargetDomain），以提升目标任务的性能
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST