有理想的打工人

神经网络分类任务

pytorch框架实现手写数字分类任务

数据集获取
简单的分类实践
创建model简化代码
- 处理训练集和测试集
- 训练和测试的代码实现
完整代码

数据集获取

又是一个新的专辑，我会在这里带大家一起从实战中学习pytorch框架。本节我们介绍手写字体识别的任务，使用的Mnist数据集是在官网下载的，这种获取方式并不常见，我们只在今天的讲解中用到，所以这段的代码不需要理解。

import torch
from pathlib import Path
import requests
import pickle
import gzip

DATA_PATH = Path("data")
PATH = DATA_PATH / "mnist"
PATH.mkdir(parents=True, exist_ok=True)
URL = "http://deeplearning.net/data/mnist/"
FILENAME = "mnist.pkl.gz"
if not (PATH / FILENAME).exists():
        content = requests.get(URL + FILENAME).content
        (PATH / FILENAME).open("wb").write(content)


with gzip.open((PATH / FILENAME).as_posix(), "rb") as f:
        ((x_train, y_train), (x_valid, y_valid), _) = pickle.load(f, encoding="latin-1") # 拿出训练集和测试集

通过以上的代码，我们获得了四个主要的数据部分，x_train代表训练集的数据，它由50000张手写数字的灰度图片构成，每张图片是28*28的矩阵。我们可以用以下代码查看图片信息：

from matplotlib import pyplot
import numpy as np

pyplot.imshow(x_train[1].reshape((28, 28)), cmap="gray")

y_train代表训练集的每张图片所代表的数字，x_valid代表测试集的数据，由10000张与x_train相同的图片构成，y_valid代表测试集每张图片代表的数字。
本次任务是利用神经网络对这些图像进行十分类，我们最终会得到每个图像属于0到9中每一个数字的概率：

这其中，三层网络就是做了三次wx+b操作。每个输入数据有748个特征，我们可以规定每做一次wx+b，会获得所有输入数据的多次特征加权。假如我们想要先得到128个特征，然后得到256个特征，最后完成10分类。为了完成这个任务，w1要选取784×128大小的矩阵，b1要选取128×1的矩阵；w2要选取128×256大小的矩阵，b2要选取256×1的矩阵；w3要选取256×10大小的矩阵，b3要选取10×1的矩阵。学习的过程就是不断地更新w和b的过程，学习完成之后，计算机会保存每次学习中产生的分类效果最好的所有w和b阵。

简单的分类实践

了解了神经网络工作的特点，我们做一个简单的网络看看分类是如何进行的。由于样本并不复杂，我们选择batch大小为64，只有一层的网络，损失函数选择交叉删损失。另外在开始测试之前，我们需要把xb和yb的格式转换一下，torch模块操作的对象是Tensor类型，这个类型和我们常见的ndarray（numpy库用于存储矩阵的类型）很像，也可以保存矩阵。但是ndarry类型是不能被torch模块解析的，所以一定要转换一下。我们采用map函数进行类型的转换，该函数使用方法如下:

a=(1,2,3)
b=(4,5,6)
print(a,b,type(a),type(b))
a,b=map(list,(a,b)) # 将a和b转换成list类型
print(a,b,type(a),type(b))
# 输出为：(1, 2, 3) (4, 5, 6)  
		  [1, 2, 3] [4, 5, 6] <class 'list'> <class 'list'>

了解这些之后，我们开始写测试函数了：

import torch
# torch用到的数据集数据类型需要置为tensor，适合存储在GPU中
import torch.nn.functional as F # functional里包含经典的损失函数、激活函数等

# map函数是一个映射，可以直接将四个ndarray格式的矩阵映射为torch.tensor格式
x_train, y_train, x_valid, y_valid = map(torch.tensor, (x_train,y_train, x_valid, y_valid))
n, c = x_train.shape # n是样本个数，c是每个样本像素点个数

loss_func = F.cross_entropy # 调用经典损失函数：交叉熵损失
def test_1(xb):
    return xb.mm(weights) + bias # 计算w*(xb)+b
    
bs = 64 # 一次训练使用样本的个数

# 先进性对w的随机初始化
# 784个像素点，10个类别，故w是784*10的矩阵
weights = torch.randn([784, 10], dtype = torch.float,requires_grad = True)
# b对结果影响不大，所以以常数作为初始化
# 要做的分类是10分类，所以b要做成10*1的0矩阵
bias = torch.zeros(10, requires_grad=True)

# 计算预测值和真实值间差异大小
print(loss_func(test_1(xb),yb)) # model(xb)代表预测值， yb代表标签
# 输出为：tensor(13.1795, grad_fn=)

这个结果的大小反映了学习效果的好坏，但看上去并不直观。另外，因为w矩阵是随机初始化的，所以每一次运行都会得到不一样的输出结果。

创建model简化代码

在上面的测试函数中，我们用到的是nn.functional，然而如果模型有可学习的参数，最好用nn.Module。Model可以通过简单的代码实现深度学习的很多复杂操作。使用之前，我们需要注意以下的要点：

须继承nn.Module且在其构造函数中调用nn.Module的构造函数；
无需写反向传播函数，nn.Module能够利用autograd自动实现反向传播；
Module中的可学习参数可以通过named_parameters()或者parameters()返回迭代器。

下面我们构建一个满足条件类：

from torch import nn
bs=64
class Mnist_NN(nn.Module): # 创建新类，继承nn.Module类
    def __init__(self):
        super().__init__() # 调用父类的构造函数
        # 模型会自动进行权重参数随机初始化
        self.hidden1 = nn.Linear(784, 128) # 初始化w1，b1
        self.hidden2 = nn.Linear(128, 256) # 初始化w2，b2
        self.out  = nn.Linear(256, 10) # 初始化w3,b3
        self.dropout = nn.Dropout(0.5) # 随机失活,概率为50%，避免过拟合
    # 前向传播需要自己定义，返向传递会自动进行
    def forward(self, x): # 每个输入是784个特征点，batch选的是64，x即为64*784
        x = F.relu(self.hidden1(x)) # 把x变成中间的结果：64*128（64*784矩阵（输入）乘784*128矩阵（w1）+128*1矩阵（b1））
        x = self.dropout(x) # 随机失活
        x = F.relu(self.hidden2(x)) # 把x变成中间的结果：64*256（64*128矩阵（第一隐层）乘784*128矩阵（w2）+128*1矩阵（b2））
        x = self.dropout(x) # 随机失活
        x = self.out(x)
        return x

处理训练集和测试集

我们获取了学习所需用到的数据之后，将其分为两大部分，一部分为训练集，训练集的作用在于找到学习效果最好的w和b，另一部分为测试集，作用在于检验学习的效果好坏。在训练和测试之前还需要经历一轮数据的封装，我们需要把“练习题”（灰度图像）和对应的“答案”（图像代表的数字）全部封装到一起，然后再拆分成64个（一个batch）一组的形式做成一套“试卷”，做过几套试卷（一个epoch）之后，机器就有了一定的识别能力了，这个时候我们就可以对这个学习结果进行测试，测试卷和答案也是用相同的办法封装出来的，并且测试题用到的题型不变，只是题量有所变化（可以取128个图像数据为一组测试题），计算机答题完成后会生成测试卷的分数，根据测试卷的分数就可以判断学习的效果了。这就是计算机学习和检验的全过程。封装用到的模块是TensorDataset和DataLoader，本节我们只做初步了解即可。上代码：

from torch.utils.data import TensorDataset
from torch.utils.data import DataLoader
# 训练集
train_ds = TensorDataset(x_train, y_train) # 把x_train, y_train封装成TensorDataset格式，相当于整理所有题目和答案
# 测试集
valid_ds = TensorDataset(x_valid, y_valid)

def get_data(train_ds, valid_ds, bs): # 继续封装
    train_dl = DataLoader(train_ds, batch_size=bs, shuffle=True) #train_ds转换成DataLoader格式
                                                                 # 把完整的训练集数据（50000个手写数字图像）打包成bs（64）个一组，全部打包之后交给GPU
                                                                 # shuffle=True为打乱数据顺序，训练集需要打乱顺序提升学习效果
                                                                 # 64道题一张卷
    # 测试集不需要打乱顺序
    valid_dl = DataLoader(valid_ds, batch_size=bs *2) # 128道题一张卷
    return train_dl,valid_dl

有了封装，自然就要有解封。计算机做题给出的结果是一张图片属于每个分类的概率，因此需要每做一道题就对一次答案，然后重新修订w和b，从而达到更好的分类效果。为了配合这样的学习方式，我们应当将用以学习的卷子每道题的题目和答案先匹配起来存储备用，这个过程就需要解封了。简单地说，解封的目的就是教计算机如何对答案。python给我们提供了zip函数，它可以快速完成对位匹配。大家看了这段代码就可以了解zip函数是怎么运行的了：

a=[1,2,3]
b=[4,5,6]
c=[4,5,6,7]
print(list(zip(a,b)))
print(list(zip(a,c)))
d=zip(a,b)
for i in zip(*d):
    print(i)
# 输出为：[(1, 4), (2, 5), (3, 6)]
#         [(1, 4), (2, 5), (3, 6)]
#         (1, 2, 3)
#         (4, 5, 6)

以上我们了解了计算机学习和检验的形象过程，接下来我们就要用代码实现这个过程了：

训练和测试的代码实现

import numpy as np
# 学习并检验
# steps：数据集迭代次数
# model：定义好的模型
# loss_func：损失函数
# opt：优化器
def fit(steps, model, loss_func, opt, train_dl, valid_dl):
    for step in range(steps): # 遍历每个epoch（epoch由一个或多个Batch组成，
                              # 因为系统会根据epoch的设定值定义epoch包含的batch量
                              # 所以可以理解成它被动地定义一论学习计算机需要做的试卷数量）
        # 一般在训练模型时加上model.train()，这样会正常使用Batch Normalization和 Dropout
        model.train() # 训练，需要更新所有的权重和偏置
                      # 通常每经历一次外循环，损失都会有所减小，epoch设置越大，最后的训练结果也越好
       
    
    
        # 训练每个batch（每个分组，64个数据）
        for xb, yb in train_dl: # xb对应了某一层的输入，yb对应输入每个样本的标签
            loss_batch(model, loss_func, xb, yb, opt) # 靠opt和loss_func来实现w和b的更新
                                                      # 更新参数即可，不需要接收返回值
        
        # 测试的时候一般选择model.eval()，这样就不会使用Batch Normalization和 Dropout
        model.eval()
        with torch.no_grad(): # 测试，不更新权重参数
            losses, nums = zip( # 将当前的损失及编号单独存放
                *[loss_batch(model, loss_func, xb, yb) for xb, yb in valid_dl]
            )
        val_loss = np.sum(np.multiply(losses, nums)) / np.sum(nums)
        # np.sum(np.multiply(losses, nums)) losses和nums对应相乘再相加(两个都是list类型），计算总损失
        # 总损失计算完成后在计算总的平均损失
        print('当前step:'+str(step+1), '验证集损失：'+str(val_loss))

优化和计算损失是模型中非常重要的两个部分。所谓优化，就是提供w和b的更新方向。每次学习中，每层w和b的第一次初始化都是随机的，但如果w和b的更新方向也是随机的，那么可想而知学习效果必定是很差的。但是有了优化器提供更新方向，w和b的每次更新就都会比上一次效果更好；计算损失则是一套评分系统，因为每一轮完整的学习下来都需要进行一轮测试，计算机做了测试题后需要对测试结果好坏进行评判，因此就需要一套评分系统。从名字上可以看出，损失值越大，学习效果就越糟糕。上述代码中这两个部分是以函数的形式直接使用的，下面我们给出具体函数：

from torch import optim
# 模型实例化，并给出优化算法
def get_model():
    model = Mnist_NN()
    return model, optim.SGD(model.parameters(), lr=0.001) # SGD：梯度下降，lr：学习率，学习率设置过大可鞥会错过最优解情况
                                                          # model.parameters()：该参数可实现每一层w、b的更新，将传递到其他函数中实现更新

# 计算损失
# 按优化模式更新w和b
def loss_batch(model, loss_func, xb, yb, opt=None):
    loss = loss_func(model(xb), yb) # model(xb)：把输入放入模型之中得到预测值
                                    # yb：真实值

    if opt is not None: # 配合优化模式进行更新和计算
        loss.backward() # 反向传播，计算梯度
        opt.step() # 对w和b进行更新，沿着梯度方向更新学习率（lr）个大小
        opt.zero_grad() # 清空之前的梯度。因为torch默认会对梯队进行累加，即上一次的结果会影响到下一次的迭代方向。
                        # 如果不做清空将会影响每次迭代的独立性

    return loss.item(), len(xb) # 返回loss值及训练的样本数量，样本数量用以计算平均损失

这样一来整个模型的部件就全了，我们只把它们按顺序调用一下就可以查看学习的效果：

train_dl, valid_dl = get_data(train_ds, valid_ds, bs)
model, opt = get_model()
step=25 # 分成25个epoch
fit(step, model, loss_func, opt, train_dl, valid_dl)

明显能看出损失值在下降吧，这就是计算机学习效果在逐渐提升的缘故。只不过这样的结果我们看起来并不够直观，毕竟损失值是根据128次测试中预测正确的概率计算得来的：

看不懂公式的小伙伴也没有关系，只需要知道这个值并不能直观的反映我们模型学习后的准确率究竟是多少就好了。想要得到准确率，我们可以用这样一个函数进行计算：

correct=0
total=0
for xb,yb in valid_dl:
    outputs=model(xb) # output是128*10维的矩阵，对应最后一层神经元，输出的是十个分类的概率
    _,predicted=torch.max(outputs.data,1) # 查看10个结果中哪个结果的概率最大
                                          # 注意比较的内容是每个样本对应概率，所以第二个参数置为1而非0
                                          # 返回是最大的值和对应索引，这个任务中索引即识别结果
#     print(outputs.data)
    total+=yb.size(0)
    correct+=(predicted==yb).sum().item() # (predicted==yb).sum()：统计测试集中预测正确的总数
                                          # item()可以将结果转换成数值

print("第"+str(step)+"次学习后预测的准确率为:"+str(100*correct/total)+"%")

就可以获得我们能够理解的准确率信息了：

当然如果不想输出平均损失，可以把这一段代码放到fit函数里，就可以得到以下结果（本次运行中我将优化方法从SGD改为Adam）：

可以看到这样的优化方式比SGD好很多。另外也并不是每一次学习效果都会比之前好，但整体的学习效果确实会随着step的增加而变好的。下面我帮大家把本文的演示、测试代码去除掉，将分类任务的代码实现完整整理出来：

完整代码

import torch
from pathlib import Path
import requests
import pickle
import gzip
import torch.nn.functional as F
from torch.utils.data import TensorDataset,DataLoader
from torch import optim
import numpy as np

DATA_PATH = Path("data")
PATH = DATA_PATH / "mnist"
PATH.mkdir(parents=True, exist_ok=True)
URL = "http://deeplearning.net/data/mnist/"
FILENAME = "mnist.pkl.gz"
if not (PATH / FILENAME).exists():
        content = requests.get(URL + FILENAME).content
        (PATH / FILENAME).open("wb").write(content)


with gzip.open((PATH / FILENAME).as_posix(), "rb") as f:
        ((x_train, y_train), (x_valid, y_valid), _) = pickle.load(f, encoding="latin-1") # 拿出训练集和测试集

loss_func = F.cross_entropy
from torch import nn
bs=64
class Mnist_NN(nn.Module):
    def __init__(self):
        super().__init__() 
        
        self.hidden1 = nn.Linear(784, 128)
        self.hidden2 = nn.Linear(128, 256)
        self.out  = nn.Linear(256, 10)
        self.dropout = nn.Dropout(0.5)
        
    def forward(self, x):
        x = F.relu(self.hidden1(x))
        x = self.dropout(x)
        x = F.relu(self.hidden2(x)) 
        x = self.dropout(x) 
        x = self.out(x)
        return x

x_train, y_train, x_valid, y_valid = map(torch.tensor, (x_train, y_train, x_valid, y_valid))
n, c = x_train.shape

train_ds = TensorDataset(x_train, y_train)

valid_ds = TensorDataset(x_valid, y_valid)

def get_data(train_ds, valid_ds, bs):
    train_dl = DataLoader(train_ds, batch_size=bs, shuffle=True) 

    valid_dl = DataLoader(valid_ds, batch_size=bs *2) # 128道题一张卷
    return train_dl,valid_dl

def get_model():
    model = Mnist_NN()
    return model, optim.Adam(model.parameters(), lr=0.001)
                                                          

def loss_batch(model, loss_func, xb, yb, opt=None):
    loss = loss_func(model(xb), yb)

    if opt is not None:
        loss.backward()
        opt.step()
        opt.zero_grad()

    return loss.item(), len(xb)

def fit(steps, model, loss_func, opt, train_dl, valid_dl):
    for step in range(steps):
        for xb, yb in train_dl:
            loss_batch(model, loss_func, xb, yb, opt)
                                                      
        model.eval()
        with torch.no_grad():
            pass
        
        correct=0
        total=0
        for xb,yb in valid_dl:
            outputs=model(xb)
            _,predicted=torch.max(outputs.data,1)
            total+=yb.size(0)
            correct+=(predicted==yb).sum().item() 
        print("第"+str(step+1)+"次学习后预测的准确率为:"+str(100*correct/total)+"%")
train_dl, valid_dl = get_data(train_ds, valid_ds, bs)
model, opt = get_model()
step=25
fit(step, model, loss_func, opt, train_dl, valid_dl)

那么，本节的讲述就到这里了，下节见~

VideoPrism模型论文速读：一种用于视频理解的基础视觉编码器
1.引言论文介绍了VideoPrism，这是一个通用视频编码器，能够在多种视频理解任务中实现最先进的性能。VideoPrism的目标是通过单一冻结模型处理不同的视频理解任务，包括分类、定位、检索、字幕生成和问答。VideoPrism在预训练过程中使用了大规模的视频-文本对数据和带有噪声平行文本的视频片段。预训练方法在掩码自动编码基础上进行了改进，通过全局-局部蒸馏语义视频嵌入和令牌洗牌方案，使Vi
信而泰×DeepSeek：AI推理引擎驱动网络智能诊断迈向 “自愈”时代
DeepSeek-R1：强大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的新一代AI大模型。其核心优势在于强大的推理引擎能力，融合了自然语言处理（NLP）、深度学习、大规模数据分析等前沿技术。DeepSeek-R1具备卓越的逻辑推理、多模态分析（文本/图像/语音）和实时交互能力，能够高效处理代码生成、复杂问题求解、跨模态学习等高阶任务。凭借其开源、高效、多模态
AI深度噪音抑制技术
这两年人工智能快速发展，AI已经渗透到了各行各业。在噪音抑制技术领域，AI也同样发挥了巨大的作用。AI深度噪音抑制技术是一种利用人工智能和深度学习算法来动态处理和减少音频信号中的噪声，从而提升音频的清晰度和质量。与传统的噪音抑制技术相比，AI深度噪音抑制能够更智能、更精准地分辨出背景噪音与有用的语音或音乐信号，尤其在复杂、多样的环境下表现尤为出色。1.工作原理AI深度噪音抑制技术基于深度神经网络（
通信方式与交换方式详解两圆相切网络规划设计师网络
通信方式与交换方式是通信网络中的核心概念，分别定义了数据传输的基本模式（通信方向与同步机制）和网络节点间的转发策略（路径选择与资源分配）。理解两者的分类与特性，对网络设计、协议选型及性能优化至关重要。一、通信方式（CommunicationModes）通信方式描述数据在传输过程中方向性和同步性的特征，决定了终端设备间的交互模式。1.1按传输方向分类类型定义核心特性典型场景单工通信数据仅能沿单一固定
【深度学习】softmax 回归的从零开始实现与简洁实现 Douglassssssss 深度学习深度学习回归人工智能 softmax回归交叉熵损失函数
前言小时候听过一个小孩练琴的故事，老师让他先弹最简单的第一小节，小孩练了两天后弹不出。接着，老师让他直接去练更难的第二小节，小孩练习了几天后还是弹不出，开始感觉到挫败和烦躁了。小孩以为老师之后会让他从简单的开始练，谁知老师直接让他开始练最难的一小节。小孩不干了，问老师是不是故意刁难他。老师笑笑，让他现在弹弹第一小节试试。神奇的是，小孩竟然发现自己已经能完整弹出来了。这有点像我现在的学习状况，前些天
李开复：AI 2.0 时代的意义 AI大模型应用之禅 java python javascript kotlin golang 架构人工智能
人工智能，深度学习，Transformer，大模型，通用人工智能，AI2.0，伦理问题，未来趋势1.背景介绍人工智能（AI）技术近年来发展迅速，从最初的局限于特定领域的应用，逐渐发展到能够处理更复杂的任务，甚至展现出一些类似人类智能的能力。2010年以来，深度学习技术的兴起，特别是Transformer模型的出现，为AI发展带来了新的突破。这些模型能够处理海量数据，学习复杂的模式，并在自然语言处理
25岁从零开始学习平面设计，会不会太晚？ 93091cdf8ebb
很多新手小白想学平面设计，但是苦于不知从何处入门、怎么样去学。究竟怎样系统学习平面设计？今天就来谈谈平面设计系统学习的方法。更多学习设计内容关注V公众号广告设计之站了解平面设计平面设计是以“视觉”作为沟通和表现的方式，通过文字、图片等媒介有机结合，借此表达视觉上的讯息。平面设计的分类有很多，如：名片设计、标志设计、字体设计、VI视觉形象设计等等。所以设计师要掌握字体排印、视觉艺术、版面、电脑软件等
Day9: OpenCV学习（一）—— 图像基础
系列文章目录上一篇：Day8：Python工程化——模块、包文章目录系列文章目录前言一、安装和导入1.安装二、图像认识1.图像2.图像分类三、基础图像操作1.图像读取2.图像显示3.图像裁剪4.图形尺寸修改5.图像保存6.图像绘制7.视频捕获即显示总结前言OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成
API开发全攻略：从入门到精通的企业级API架构与实战 Android洋芋架构 API设计 RESTful API 微服务架构实战案例
简介API开发已成为现代软件架构的核心能力，掌握API设计与实现技术能显著提升开发效率和系统可扩展性。本文将从零开始，全面解析API的基础概念、架构设计、安全认证、性能优化等关键技术点，并提供完整的Python和Go语言代码实战示例，帮助开发者构建高性能、可扩展的企业级API系统。本文旨在为初学者和进阶开发者提供一份全面的API开发指南。内容涵盖API的基础概念、类型分类、架构设计、安全认证、性能
【Python篇】Python基础——08day.面向对象编程中类和对象的基本概念及属性和方法的常见分类和使用场景 WXX_s python基础篇 python 分类开发语言学习
目录前言一、类和对象1.类→Class1.1概念1.2创建2.对象→Object2.1概念2.2创建二、属性和方法1.实例属性2.实例方法3.类属性4.类方法5.静态方法5.1综合应用6.构造方法7.初始化方法8.魔术方法8.1常用方法8.2案例参考总结前言这章讲的面向对象编程（Object-OrientedProgramming，简称OOP）是一种通过组织对象来设计程序的编程方法。为什么需要类和
C语言：第11天笔记 Star在努力 c语言笔记开发语言
C语言：第11天笔记内容提要函数函数的概述函数的分类函数的定义形参和实参函数的返回值函数的调用函数的声明函数函数的概述**函数：**实现一定功能的，独立的代码模块，对于函数的使用，一定是先定义，后使用。使用函数的优势：①我们可以通过函数提供功能给别人使用。当然我们也可以使用别人提供的函数，减少代码量。②借助函数可以减少重复性的代码。③实现结构化（模块化：C语言中的模块化其实就是多文件+函数）程序设
Python 现代时间序列预测第二版（五）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/22eab741fce9c15dfad894ecf37bdd51译者：飞龙协议：CCBY-NC-SA4.0第十七章：概率预测及更多在整本书中，我们学习了生成预测的不同技术，包括一些经典方法，使用机器学习以及一些深度学习架构。但我们一直在关注一种典型的预测问题——为连续时间序列生成点预测，并且没有层级关系且历史数据足够丰富。我们之所以这样做，是因为这
人的价值就是能让别人生活得更有价值——读荆志强老师的书有感花婆婆
最近读了荆志强老师的专著《快乐地做教育》，前言就提到：教育的本真，就是通过激励为学生赋能，帮助学生产生足够的“自我效能感”，让学生主动获取知识技能、培育情感态度；帮助学生建立自主深度学习的能力。荆志强老师倡导的“赋能教育”主要从两个方面建构：激励型课堂、自主化管理。其中，他还谈到生本教育的学习观：学习是生命成长的过程，它是人自身的一种需要，而不是外在压力的结果。教育的一切行为都应该是为了满足儿童的
281129-李晏林-2022/10/6【day2】尘心_aa8c
总目标是什么？总目标是什么最近3年的成为销售高手要具备的能务：销售主手的标准：1、超强的执行力，2、见客户的胆量3、口才4、分析问题的能务5、推荐产品的话术、6做增值服务的能务7、谈判的能务8、解决客种宊发问题的能力9、控制心态的能力、10、送小礼物的能务关键词：胆量、口才、分析问题、产品话术、小礼物、增值服务、谈判、突发问题、控制心态执行力。以上是成为销售高手的关键能力。汇总分类：心态：目标细分
AI 驱动自动化运维平台架构与实现大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 算法机器学习人工智能决策树大数据
摘要：随着云计算、容器化和大规模分布式系统的普及，传统人工运维方法已难以满足现代IT环境中海量指标、日志和拓扑关系的实时分析与故障响应需求。AI驱动的自动化运维（AIOps）平台通过融合机器学习、深度学习、图分析以及强化学习等多学科技术，实现对海量运维数据的智能感知、预测、诊断和自动化修复。本文深入探讨AI驱动自动化运维平台的整体架构设计与核心技术实现，涵盖数据采集与预处理、AI引擎设计、自动化执
阿里云天池-学习笔记（7.22） 2301_81822737 深度学习
概念的初步认识和学习一、损失函数损失函数是衡量模型预测值与真实值之间差异的一个量度，通过最小化这个差异来优化模型的参数。损失函数的选择直接影响到模型的训练效果和最终性能。二、one-hot编码one-hot编码使用N位状态寄存器来对N个状态进行编码，每个状态都有它独立的寄存器位，并且在任意时候其中只有一位有效（即为1，其余为0）。具体来说，对于每个分类变量，都会为其分配一个唯一的二进制位，并使用该
YOLOv13_SSOD：基于超图关联增强的半监督目标检测框架（原创创新算法）
YOLOv13_SSOD：基于超图关联增强的半监督目标检测框架项目背景随着深度学习技术的快速发展，目标检测在各个领域都取得了显著的进展。然而，现有的监督学习方法在实际应用中面临着标注数据稀缺、泛化能力不足等挑战。特别是在火灾烟雾检测、工业质检等特定场景中，获取大量高质量标注数据的成本极高。为了解决这一问题，本项目基于最新发布的YOLOv13架构，结合EfficientTeacher半监督学习框架，
USB串口通信、握手协议、深度学习等技术要点深度学习教程, 深度学习人工智能网络协议
基于OpenMV的智能车牌识别系统：从硬件到算法的完整实现前言本文将详细介绍一个基于OpenMV微控制器的智能车牌识别系统的设计与实现。该系统集成了嵌入式视觉处理、串口通信协议、深度学习OCR识别等多种技术，实现了从图像采集到车牌识别的完整流程。系统架构概述整体设计思路该车牌识别系统采用分布式架构设计，将计算密集型任务与嵌入式控制分离：┌─────────────┐USB串口通信┌────────
Linux系统编程（六）线程同步、互斥机制小仇学长 Linux linux 线程互斥锁信号量
本文目录前述：同步机制的引入及概念一、互斥锁1.定义2.互斥锁常用方法3.相关函数（1）头文件（2）创建互斥锁（3）销毁互斥锁（4）加锁（5）解锁4.使用例程二、条件变量1.相关函数（1）创建条件变量（2）注销条件变量（3）等待条件变量成立（4）条件变量激发（使条件变量成立）2.使用注意3.使用例程三、信号灯1.分类2.信号灯操作3.相关函数4.使用例程四、原子操作（内核层）1.优势2.常用的原子
线程安全之乐观锁和悲观锁
锁可以从不同的⻆度分类。其中，乐观锁和悲观锁是⼀种分类⽅式。悲观锁：悲观锁就是我们常说的锁。对于悲观锁来说，它总是认为每次访问共享资源时会发⽣冲突，所以必须对每次数据操作加上锁，以保证临界区的程序同⼀时间只能有⼀个线程在执⾏。乐观锁：乐观锁⼜称为“⽆锁”，顾名思义，它是乐观派。乐观锁总是假设对共享资源的访问没有冲突，线程可以不停地执⾏，⽆需加锁也⽆需等待。⽽⼀旦多个线程发⽣冲突，乐观锁通常是使⽤⼀
语音识别开源项目推荐：GitHub热门仓库盘点 AGI大模型与大数据研究院 AI大模型应用开发实战语音识别开源 github ai
2024年必看！GitHub热门语音识别开源项目全解析：从入门到实战关键词语音识别(ASR)、开源项目、GitHub、Whisper、FunASR、PaddleSpeech、深度学习摘要想象一下：开车时只需说一句话就能自动发消息，听英文演讲时实时获得中文翻译，给视障人士读文本时精准转换——这些场景的背后，语音识别（AutomaticSpeechRecognition,ASR）技术正在改变我们与机器
python基础语法复习08——模块化编程洛华363 python python 开发语言
python基础语法目录python基础语法01——基本类型python基础语法02——复合类型python基础语法03——语句构成python基础语法04——函数python基础语法05——递归及装饰器python基础语法06——类与对象python基础语法07——迭代器与生成器文章目录python基础语法目录前言一、模块（Module）1.1什么是模块？1.2模块使用1.3模块分类1.3.1系
OSPF知识之凹の鸥网络智能路由器
在网络工程师、系统工程师等岗位的面试中，OSPF（OpenShortestPathFirst，开放最短路径优先）是高频考点，尤其是对中高级网络岗位（如网络架构师、运维工程师）。以下是OSPF的核心考点和必须掌握的知识点，按优先级分类整理，帮助你高效备考：一、基础概念与核心机制OSPF的定义与特点定义：OSPF是一种基于链路状态（Link-State）的内部网关协议（IGP），用于在自治系统（AS）
Python训练 + Go优化 + C#部署：端到端AI模型的跨语言实践威哥说编程人工智能学习资料库 python golang c#
在现代AI应用中，如何高效地训练、优化、并最终部署AI模型是一项复杂且具有挑战性的任务。在这一过程中，选择合适的编程语言和工具可以显著提高效率和系统的性能。Python作为AI领域的主流语言，具有丰富的深度学习框架（如PyTorch和TensorFlow），在模型训练方面处于领先地位。然而，针对计算密集型任务（如数据预处理、加密等），Go语言因其高效的并发处理和出色的性能，成为优化计算的理想选择。
yolov8涨点系列之替换幽灵卷积GhostConv 没脾气的小玩家 yolov8涨点系列 YOLO 目标检测
文章目录核心思想主要步骤优势yolov8.yaml文件增加CBAMyolov8.yamlyolov8.yaml将Conv卷积替换成GhostConv 幽灵卷积（GhostConv）是一种新颖的卷积操作方法，旨在解决传统卷积神经网络中参数量和计算量过大的问题，尤其适用于资源受限的设备。以下是对幽灵卷积的详细介绍：核心思想常规的卷积操作会产生大量的特征图，其中存在一定的冗余信息。幽灵卷积的核心思
DL00478-涡轮叶片缺陷检测数据集yolo格式1300张左右
涡轮叶片缺陷检测数据集yolo格式1300张左右涡轮叶片缺陷检测数据集YOLO格式解析：提升研究与论文写作的关键要点在研究涡轮叶片缺陷检测的过程中，数据集的选择和格式处理是一个至关重要的环节。特别是当你打算通过卷积神经网络（CNN）等深度学习模型进行缺陷检测时，数据集的标注和格式化直接影响到模型的训练效果和论文的质量。本文将重点探讨涡轮叶片缺陷检测数据集的YOLO格式，并分析如何利用这一格式为研究
分类模型（BERT）训练全流程巴伦是只猫人工智能分类 bert 数据挖掘
使用BERT实现分类模型的完整训练流程BERT(BidirectionalEncoderRepresentationsfromTransformers)是一种强大的预训练语言模型，在各种NLP任务中表现出色。下面我将详细梳理使用BERT实现文本分类模型的完整训练过程。1.准备工作1.1环境配置pipinstalltransformerstorchtensorflowpandassklearn1.2
【Android】UI布局工具及详解米莱虾 #Android ui android
ViewGroup1.简介ViewGroup是一种View，他是View容器，也就是里边可以包含其他View.分类：（1）layout布局类的ViewGroup（2）ScrollView带滚动条的ViewGroup（3）高级View容器（适配器View）（4）其他ViewGroup2.布局类的ViewGroup布局类的容器主要是用来控制子元素的排布方式和排列位置分类：（1）线性布局（2）相对布局（
大模型微调技术的详细解析及对比老兵发新帖人工智能大数据
以下是四种主流大模型微调技术的详细解析及对比，结合技术原理、适用场景与性能表现进行说明：1.Full-tuning（全量微调）核心原理：加载预训练模型的所有参数，用特定任务数据（通常为指令-回答对）继续训练，更新全部权重。相当于对模型整体知识结构进行重构。操作流程：加载预训练模型；用任务数据集（如分类文本）和优化目标（如最小化误差）训练；所有参数参与梯度更新。优势：模型充分学习任务特征，效果通常最
Epoch 老兵发新帖人工智能
在深度学习和机器学习中，Epoch（轮次或周期）是一个核心训练概念，指模型在整个训练数据集上完成一次完整遍历的过程。以下是关于Epoch的详细解析：一、核心定义基本含义Epoch表示模型将所有训练数据完整学习一次的过程。例如：若训练集有10,000个样本，则1个Epoch即模型用这10,000个样本训练一轮。与相关概念的关系Batch（批次）：数据集被分割成的小组（如每批32个样本）。Iterat
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s