m0_57835812

【无标题】pytorch构建利用迁移学习MNIST数据集的加法器实验

文章目录

前言
一、pytorch构建利用迁移学习MNIST数据集的加法器实验要求
二、各个python文件
- 1.main.py
- 2.network4.py
- 3.data_loader.py
三、实验过程
- 总结

前言

迁移学习可以将在一个领域训练的机器学习模型应用到另一个领域，在某种程度上提高了训练模型的利用率，解决了数据缺失的问题，并赋予了智能模型“举一反三”的能力。本实验以之前训练的MNIST手写数字识别模型为基础，实现一个手写数字加法机。

一、pytorch构建利用迁移学习MNIST数据集的加法器实验要求

输入两张手写数字图像，输出这两个数字的和。
利用综合实验三搭建的神经网络。
项目文件夹里面有一个文件夹以及三个文件，文件夹名为data，存放MNIST数据集，三个文件为： main.py、network4.py、 data_loader.py。main为主文件，；network4.py存放神经网络类定义及相关函数；data_loader.py存放负责读入数据的相关方法。

二、各个python文件

1.main.py

代码如下：

import network4
import data_loader
import torch.optim as optim
import torch.nn as nn
import matplotlib.pyplot as plt
from torch.autograd import Variable
import pylab
import torch
import warnings


if __name__=="__main__":
    warnings.filterwarnings("ignore")
    net0 = network4.Transfer()  # 没有迁移的网络
    net1 =network4.Transfer()   # 迁移没固定的网络
    net2 =network4.Transfer()   # 迁移固定的网络
    original_net = network4.ConvNet() #之前的手写数字识别的卷积神经网络
    state_dict = torch.load('model_new902')  # 加载之前的手写数字识别的卷积神经网络保存下来的模型model_new902
    original_net.load_state_dict(state_dict)
    """
    =======================================     ====================================================
    # cycle_training(net,num_epochs=20)         让新的加法机全部重新训练
    
    # cycle_training_to_transfer_pretrained     将旧的手写数字识别的卷积神经网络权重迁移过来，作为新的加法机网络来
    (net,original_net,num_epochs=20):           训练
    
    # cycle_training_to_transfer_fixed          将旧的手写数字识别的卷积层的权重全部迁移到了加法机的两个卷积部件中，
    (net,original_net,num_epochs=20)            但之后保持它们的权重不变，只允许后面的全链接层的权重可训练
    =======================================     ====================================================
    """

    result0= network4.cycle_training(net0,num_epochs=20)
    result1=network4.cycle_training_to_transfer_pretrained(net1,original_net,num_epochs=20)
    result2=network4.cycle_training_to_transfer_fixed(net2,original_net,num_epochs=20)
    network4.show_different_network_training_result(result0[0],result1[0],result2[0]) #展示不同方式训练的加法器网络的效果
    # result_save={'no_transfer':result0,'transfer_pretrained':result1,'transfer_fixed':result2} #将结果转成字典
    # network4.save_results_to_file("pre_data/result903.json",result_save)  # 结果保存到文件

2.network4.py

代码如下：

import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from data_loader import *
import copy
import matplotlib.pyplot as plt
import json
import os

use_save = False #是否将所有运行结果保存下来
save_txt_path='pre_data/result.txt' # 输出结果保存成txt的文件路径
save_figure_path='pre_data/' # 输出图片保存的文件路径
if use_save:
    path_dirname = os.path.dirname(__file__)
    base_path = os.path.join(path_dirname, save_figure_path.replace('/',''))
    if not os.path.exists(base_path):
        os.makedirs(base_path)
use_cuda = torch.cuda.is_available() #定义一个布尔型变量，标志当前的GPU是否可用
# 如果当前GPU可用，则将优先在GPU上进行张量计算
dtype = torch.cuda.FloatTensor if use_cuda else torch.FloatTensor
itype = torch.cuda.LongTensor if use_cuda else torch.LongTensor
# 定义卷积神经网络：6和16为人为指定的两个卷积层
depth = [6, 16]
image_size = 28  #图像的总尺寸28*28
num_classes = 10  #标签的种类数
num_epochs = 20  #训练的总循环周期
batch_size = 64  #批处理的尺寸大小

class ConvNet(nn.Module):
    def __init__(self):
        super(ConvNet, self).__init__()
        self.conv1 = nn.Conv2d(1, depth[0], 5, padding=2)  # 定义一个卷积层，输入通道为1，输出通道为6，窗口大小为5，padding为2
        self.pool = nn.MaxPool2d(2, 2)  # 定义一个池化层，一个窗口为2x2的池化运箅
        # 第二层卷积，输入通道为depth[o]，输出通道为depth[1]，窗口为 5，padding 为2
        self.conv2 = nn.Conv2d(depth[0], depth[1], 5, padding=2)  # 输出通道为depth[1]，窗口为5，padding为2
        # 一个线性连接层，输入尺寸为最后一层立方体的线性平铺，输出层 512个节点
        self.fc1 = nn.Linear(image_size // 4 * image_size // 4 * depth[1], 512)
        # 最后一层线性分类单元，输入为 512，输出为要做分类的类别数
        self.fc2 = nn.Linear(512, num_classes)

    def forward(self, x):  # 该函数完成神经网络真正的前向运算，在这里把各个组件进行实际的拼装
        x = self.conv1(x)  # 第一层卷积
        x = F.relu(x)  # 激活函数用ReLU，防止过拟合
        x = self.pool(x)  # 第二层池化，将图片变小
        x = self.conv2(x)  # 第三层又是卷积，窗口为5，输入输出通道分列为depth[o]=4,depth[1]=8
        x = F.relu(x)  # 非线性函数
        x = self.pool(x)  # 第四层池化，将图片缩小到原来的 1/4
        # 将立体的特征图 tensor 压成一个一维的向量
        # view 函数可以将一个tensor 按指定的方式重新排布
        x = x.view(-1, image_size // 4 * image_size // 4 * depth[1])
        x = F.relu(self.fc1(x))  # 第五层为全连接，ReLU激活函数
        # 以默认0.5的概率对这一层进行dropout操作，防止过拟合
        x = F.dropout(x, training=self.training)
        x = self.fc2(x)  # 全连接
        # 输出层为 log_Softmax，即概率对数值 log(p(×))。采用log_softmax可以使后面的交叉熵计算更快
        x = F.log_softmax(x, dim=1)
        return x


def rightness(predictions, labels):
    """计算预测错误率的函数，其中predictions是模型给出的一组预测结果，batch_size行10列的矩阵，labels是数据之中的正确答案"""
    pred = torch.max(predictions.data, 1)[1]  # 对于任意一行（一个样本）的输出值的第1个维度，求最大，得到每一行的最大元素的下标
    rights = pred.eq(labels.data.view_as(pred)).sum()  # 将下标与labels中包含的类别进行比较，并累计得到比较正确的数量
    return rights, len(labels)  # 返回正确的数量和这一次一共比较了多少元素


def show_testset_total_accuracy(model:str):
    """
    展示模型在原始的网络上的准确率
    Show the accuracy of the model on the original network
    """
    original_net =ConvNet()
    state_dict=torch.load(model)
    original_net.load_state_dict(state_dict)
    print(original_net) #将网络打印出来观看
    # 在测试集上分批运行，并计算总的正确率
    original_net.eval()  # 标志模型当前为运行阶段
    test_loss = 0
    correct = 0
    vals = []

    # 对测试数据集进行循环
    for data, target in test_loader1:
        with torch.no_grad():
            data = data.clone().detach()
        target = target.clone().detach()
        output = original_net(data)  # 将特征数据喂入网络，得到分类的输出
        val = rightness(output, target)  # 获得正确样本数以及总样本数
        vals.append(val)  # 记录结果

    # 计算模型在测试集上的准确率
    rights = (sum([tup[0] for tup in vals]), sum([tup[1] for tup in vals]))
    right_rate = 1.0 * rights[0].numpy() / rights[1]
    print("{}模型在测试集上的准确率：{:.2f}%".format(model,100.0*right_rate))

def read_a_picture(index):
    """
    随便从测试集中读入一张图片，并绘制出来
    Read a picture randomly from the test set and draw it
    """

    idx = index
    muteimg = test_dataset[idx][0].numpy()
    plt.imshow(muteimg[0, ...])
    label=test_dataset[idx][1]
    print('标签是：', label)
    plt.title(str(label))
    plt.show()

def read_two_picture(index1,index2):
    """
    随便从测试集中读入两张图片，并绘制出来
    Read two picture randomly from the test set and draw them

    """

    idx1 = index1
    idx2 = index2
    muteimg1 = test_dataset[idx1][0].numpy()
    muteimg2 = test_dataset[idx2][0].numpy()
    label1 = test_dataset[idx1][1]
    label2 = test_dataset[idx2][1]
    fig, axes = plt.subplots(1,2)  # 创建图实例
    axes[0].imshow(muteimg1[0, ...])
    axes[0].set_title(str(label1))
    axes[1].imshow(muteimg2[0, ...])
    axes[1].set_title(str(label2))
    print('两张图片标签分别是：', label1,label2)
    plt.show()  # 图形可视化

def add_two_pictures_using_the_network(transfer_net,index1=1,index2=2):
    """
    Read two pictures randomly from the test set and add them on the network
    随便从测试集中读入两张图片，并用网络做加法

    """
    with torch.no_grad():
        img1, label1 = test_dataset[index1]
        img2, label2 = test_dataset[index2]
        label_total=label1+label2
        img1=torch.tensor(img1).unsqueeze(dim=0)
        img2 = torch.tensor(img2).unsqueeze(dim=0)
        # print(img1.size(),img2.size())
        outputs = transfer_net(img1,img2)   # .clone().detach().requires_grad_(True)
        _, predicted = torch.max(outputs.data, 1)
        predicted_label_total=predicted.squeeze().numpy()
        print("真实标签A: {} ,真实标签B: {} ,  两个标签的真实和: {}\t 网络预测标签和: {}".format(
            label1,label2,label_total,predicted_label_total))
        read_two_picture(index1,index2)



# =========== 数字加法机 ============
# 数字加法机：输入两张图像，输出这两个手写数字的加法。
class Transfer(nn.Module):
    def __init__(self):
        super(Transfer, self).__init__()
        # 两个并行的卷积通道，第一个通道：
        self.net1_conv1 = nn.Conv2d(1,depth[0] , 5, padding=2)  # 一个输入通道，6个输出通道（6个卷积核），窗口为5，填充2
        self.net_pool = nn.MaxPool2d(2, 2)  # 2*2 池化
        self.net1_conv2 = nn.Conv2d(depth[0], depth[1], 5, padding=2)  # 输入通道4，输出通道16（16个卷积核），窗口5，填充2

        # 第二个通道，注意pooling操作不需要重复定义
        self.net2_conv1 = nn.Conv2d(1, depth[0], 5, padding=2)  # 一个输入通道，6个输出通道（6个卷积核），窗口为5，填充2
        self.net2_conv2 = nn.Conv2d(depth[0], depth[1], 5, padding=2)  # 输入通道4，输出通道16（16个卷积核），窗口5，填充2

        # 全链接层
        self.fc1 = nn.Linear(2 * image_size // 4 * image_size // 4 * depth[1], 1024)  # 输入为处理后的特征图压平，输出1024个单元
        self.fc2 = nn.Linear(1024, 256)  # 输入1024个单元，输出256个单元
        self.fc3 = nn.Linear(256, 64)  # 输入256个单元，输出64个单元
        self.fc4 = nn.Linear(64,19)  # 输入64个单元，输出为19

    def forward(self, x, y, training=True):
        # 网络的前馈过程。输入两张手写图像x和y，输出一个数字表示两个数字的和
        # x,y都是batch_size*image_size*image_size形状的三阶张量
        # 输出为batch_size长的列向量

        # 首先，第一张图像进入第一个通道
        x = F.relu(self.net1_conv1(x))  # 第一层卷积
        x = self.net_pool(x)  # 第一层池化
        x = F.relu(self.net1_conv2(x))  # 第二层卷积
        x = self.net_pool(x)  # 第二层池化
        x = x.view(-1, image_size // 4 * image_size // 4 * depth[1])  # 将特征图张量压平

        y = F.relu(self.net2_conv1(y))  # 第一层卷积
        y = self.net_pool(y)  # 第一层池化
        y = F.relu(self.net2_conv2(y))  # 第二层卷积
        y = self.net_pool(y)  # 第二层池化
        y = y.view(-1, image_size // 4 * image_size // 4 * depth[1])  # 将特征图张量压平

        # 将两个卷积过来的铺平向量拼接在一起，形成一个大向量
        z = torch.cat((x, y), 1)  # cat函数为拼接向量操作，1表示拼接的维度为第1个维度（0维度对应了batch）
        z = self.fc1(z)  # 第一层全链接
        z = F.relu(z)  # 对于深层网络来说，激活函数用relu效果会比较好
        z = F.dropout(z, training=self.training)  # 以默认为0.5的概率对这一层进行dropout操作
        z = self.fc2(z)  # 第二层全链接
        z = F.relu(z)
        z = self.fc3(z)  # 第三层全链接
        z = F.relu(z)
        z = self.fc4(z)  # 第四层全链接
        return z

    def set_filter_values(self, net):
        # 本函数为迁移网络所用，即将迁移过来的网络的权重值拷贝到本网络中
        # 本函数对应的迁移为预训练式
        # 输入参数net为从硬盘加载的网络作为迁移源

        # 逐个儿为网络的两个卷积模块的权重和偏置进行赋值
        # 注意在赋值的时候需要用deepcopy而不能直接等于，或者copy。
        # 这是因为这种拷贝是将张量中的数值全部拷贝到了目标中，而不是拷贝地址
        # 如果不用deepcopy，由于我们将同一组参数（net.conv1.weight.data,bias）
        #  赋予了两组参数（net1_conv1.weight.data，net2_conv1.weight.data）
        # 所以它们会共享源net.conv1.weight.data中的地址，这样对于net1_conv1.weight.data
        # 的训练也自然会被用到了net2_conv1.weight.data中，但其实我们希望它们是两个不同的参数。
        self.net1_conv1.weight.data = copy.deepcopy(net.conv1.weight.data)
        self.net1_conv1.bias.data = copy.deepcopy(net.conv1.bias.data)
        self.net1_conv2.weight.data = copy.deepcopy(net.conv2.weight.data)
        self.net1_conv2.bias.data = copy.deepcopy(net.conv2.bias.data)
        self.net2_conv1.weight.data = copy.deepcopy(net.conv1.weight.data)
        self.net2_conv1.bias.data = copy.deepcopy(net.conv1.bias.data)
        self.net2_conv2.weight.data = copy.deepcopy(net.conv2.weight.data)
        self.net2_conv2.bias.data = copy.deepcopy(net.conv2.bias.data)

        # 将变量加载到GPU上
        self.net1_conv1 = self.net1_conv1.cuda() if use_cuda else self.net1_conv1
        self.net1_conv2 = self.net1_conv2.cuda() if use_cuda else self.net1_conv2

        self.net2_conv1 = self.net2_conv1.cuda() if use_cuda else self.net2_conv1
        self.net2_conv2 = self.net2_conv2.cuda() if use_cuda else self.net2_conv2

    def set_filter_values_nograd(self, net):
        # 本函数为迁移网络所用，即将迁移过来的网络的权重值拷贝到本网络中
        # 本函数对应的迁移为固定权重式
        # 调用set_filter_values为全部卷积核进行赋值
        self.set_filter_values(net)

        # 为了让我们的网络不被训练调整权值，我们需要设定每一个变量的requires_grad为False
        # 即不需要计算梯度值
        self.net1_conv1.weight.requires_grad = False
        self.net1_conv1.bias.requires_grad = False
        self.net1_conv2.weight.requires_grad = False
        self.net1_conv2.bias.requires_grad = False

        self.net2_conv1.weight.requires_grad = False
        self.net2_conv1.bias.requires_grad = False
        self.net2_conv2.weight.requires_grad = False
        self.net2_conv2.bias.requires_grad = False

def rightness_add(y, target):
    # 计算分类准确度的函数，y为模型预测的标签，target为数据的标签
    # 输入的y为一个矩阵，行对应了batch中的不同数据记录，列对应了不同的分类选择，数值对应了概率
    # 函数输出分别为预测与数据标签相等的个数，本次判断的所有数据个数
    preds = y.data.max(dim=1, keepdim=True)[1]
    return (preds.eq(target.data.view_as(preds)).cpu().sum(), len(target))

def cycle_training(net,num_epochs=20):
    fraction = 1
    if use_cuda:
        net = net.cuda()

    criterion = nn.CrossEntropyLoss()
    optimizer = optim.SGD(net.parameters(), lr=0.01, momentum=0.9)
    records = []  # 记录准确率等数值的容器
    # 开始训练网络
    for epoch in range(num_epochs):
        train_rights = []  # 记录训练数据集准确率的容器
        losses = []
        for idx, data in enumerate(zip(train_loader1, train_loader2)):
            if idx >= (len(train_loader1) // fraction):
                break
            ((x1, y1), (x2, y2)) = data
            if use_cuda:
                x1, y1, x2, y2 = x1.cuda(), y1.cuda(), x2.cuda(), y2.cuda()
            net.train()
            optimizer.zero_grad()
            outputs = net(x1.clone().detach().requires_grad_(True), x2.clone().detach().requires_grad_(True))
            labels = y1 + y2
            loss = criterion(outputs, labels.type(torch.long))
            loss.backward()
            optimizer.step()
            loss = loss.cpu() if use_cuda else loss
            losses.append(loss.data.numpy())
            right = rightness_add(outputs.data, labels)  # 计算准确率所需数值，返回数值为（正确样例数，总样本数）
            train_rights.append(right)  # 将计算结果装到列表容器train_rights中
            if (idx + 1) % n_batch == 0:
                val_rights = []  # 记录校验数据集准确率的容器
                val_losses = []
                net.eval()
                for val_data in zip(val_loader1, val_loader2):
                    ((x1, y1), (x2, y2)) = val_data
                    if use_cuda:
                        x1, y1, x2, y2 = x1.cuda(), y1.cuda(), x2.cuda(), y2.cuda()
                    outputs = net(x1.clone().detach().requires_grad_(True), x2.clone().detach().requires_grad_(True))
                    labels = y1 + y2
                    loss = criterion(outputs, labels.type(torch.long))
                    loss = loss.cpu() if use_cuda else loss
                    val_losses.append(loss.data.numpy())

                    right = rightness_add(outputs.data, labels)
                    val_rights.append(right)
                epoch_index = epoch + (idx + 1) / len(train_loader1)
                train_right_ratio = 1.0 * np.sum([i[0].cpu().numpy() for i in train_rights]) / np.sum(
                    [i[1] for i in train_rights])
                val_right_ratio = 1.0 * np.sum([i[0].cpu().numpy() for i in val_rights]) / np.sum(
                    [i[1] for i in val_rights])
                if use_save:
                    with open(save_txt_path,'a') as fw:
                        fw.write('训练周期: {} [{}/{} ({:.0f}%)]\t 训练误差：{:.2f}  校验误差：{:.2f}  训练准确率：{:.2f}%  验证准确率：{:.2f}%\n'.format(
                    epoch, idx * batch_size, training_set_size, 100. * (idx + 1) / len(train_loader1),
                    np.mean(losses), np.mean(val_losses), 100. * train_right_ratio, 100. * val_right_ratio))

                print('训练周期: {} [{}/{} ({:.0f}%)]\t 训练误差：{:.2f}  校验误差：{:.2f}  训练准确率：{:.2f}%  验证准确率：{:.2f}%'.format(
                    epoch, idx * batch_size, training_set_size, 100. * (idx + 1) / len(train_loader1),
                    np.mean(losses), np.mean(val_losses), 100. * train_right_ratio, 100. * val_right_ratio))
                records.append([epoch_index, np.mean(losses), np.mean(val_losses), train_right_ratio, val_right_ratio])
                train_rights = []
                val_rights = []
    test_rights = []
    net.eval()
    for test_data in zip(test_loader1, test_loader2):
        ((x1, y1), (x2, y2)) = test_data
        if use_cuda:
            x1, y1, x2, y2 = x1.cuda(), y1.cuda(), x2.cuda(), y2.cuda()
        outputs = net(x1.clone().detach().requires_grad_(True), x2.clone().detach().requires_grad_(True))
        labels = y1 + y2
        # loss = criterion(outputs, labels.type(torch.long))
        right = rightness_add(outputs.data, labels)
        test_rights.append(right)
    test_right_ratio = 1.0 * np.sum([i[0].cpu().numpy() for i in test_rights]) / np.sum([i[1] for i in test_rights])
    print("最终测试集准确率：{:.2f}%".format(100. * test_right_ratio))
    if use_save:
        with open(save_txt_path, 'a') as fw:
            fw.write("最终测试集准确率：{:.2f}%\n".format(100.*test_right_ratio))
    results = [records, test_right_ratio]
    fig, ax = plt.subplots()
    ax.plot([j[0] for j in records], [i[3] for i in records], c='r', label='Train')
    ax.plot([j[0] for j in records], [i[4] for i in records], c='b', label='Validation')
    ax.legend()
    ax.set_ylabel('accuracy')
    ax.set_xlabel('epoch')
    ax.set_title('no transfer Accuracy')
    if use_save:
        plt.savefig(str(save_figure_path+'no_transfer_Accuracy.png'))
    else:
        plt.show()
    return results


def cycle_training_to_transfer_pretrained(net,original_net,num_epochs=20):
    # 为了比较不同数据量对迁移学习的影响，我们设定了一个加载数据的比例fraction
    # 即我们只加载原训练数据集的1/fraction来训练网络
    fraction = 1
    # 为新网络赋予权重数值，注意我们只将卷积部分的网络进行迁移，而没有迁移全链接层
    net.set_filter_values(original_net)

    if use_cuda:
        net = net.cuda()

    criterion = nn.CrossEntropyLoss()

    # 将需要训练的参数加载到优化器中
    new_parameters = []
    for para in net.parameters():
        if para.requires_grad:  # 我们只将可以调整权重的变量加到了集合new_parameters
            new_parameters.append(para)

    # 将new_parameters加载到了优化器中
    optimizer = optim.SGD(new_parameters, lr=0.01, momentum=0.9)
    records = [] # 记录准确率等数值的容器
    # 开始训练网络
    for epoch in range(num_epochs):
        train_rights = []  # 记录训练数据集准确率的容器
        losses = []
        for idx, data in enumerate(zip(train_loader1, train_loader2)):
            if idx >= (len(train_loader1) // fraction):
                break
            ((x1, y1), (x2, y2)) = data
            if use_cuda:
                x1, y1, x2, y2 = x1.cuda(), y1.cuda(), x2.cuda(), y2.cuda()
            net.train()
            optimizer.zero_grad()
            outputs = net(x1.clone().detach().requires_grad_(True), x2.clone().detach().requires_grad_(True))
            labels = y1 + y2
            loss = criterion(outputs, labels.type(torch.long))
            loss.backward()
            optimizer.step()
            loss = loss.cpu() if use_cuda else loss
            losses.append(loss.data.numpy())
            right = rightness_add(outputs.data, labels)  # 计算准确率所需数值，返回数值为（正确样例数，总样本数）
            train_rights.append(right)  # 将计算结果装到列表容器train_rights中
            if (idx+1) % n_batch == 0:
                val_rights = []  # 记录校验数据集准确率的容器
                val_losses = []
                net.eval()
                for val_data in zip(val_loader1, val_loader2):
                    ((x1, y1), (x2, y2)) = val_data
                    if use_cuda:
                        x1, y1, x2, y2 = x1.cuda(), y1.cuda(), x2.cuda(), y2.cuda()
                    outputs = net(x1.clone().detach().requires_grad_(True), x2.clone().detach().requires_grad_(True))
                    labels = y1 + y2
                    loss = criterion(outputs, labels.type(torch.long))
                    loss = loss.cpu() if use_cuda else loss
                    val_losses.append(loss.data.numpy())

                    right = rightness_add(outputs.data, labels)
                    val_rights.append(right)
                epoch_index=epoch+(idx+1)/len(train_loader1)
                train_right_ratio=1.0 * np.sum([i[0].cpu().numpy() for i in train_rights]) / np.sum([i[1] for i in train_rights])
                val_right_ratio = 1.0 * np.sum([i[0].cpu().numpy() for i in val_rights]) / np.sum([i[1] for i in val_rights])

                if use_save:
                    with open(save_txt_path, 'a') as fw:
                        fw.write(
                            '训练周期: {} [{}/{} ({:.0f}%)]\t 训练误差：{:.2f}  校验误差：{:.2f}  训练准确率：{:.2f}%  验证准确率：{:.2f}%\n'.format(
                                epoch, idx * batch_size, training_set_size, 100. * (idx + 1) / len(train_loader1),
                                np.mean(losses), np.mean(val_losses), 100. * train_right_ratio, 100. * val_right_ratio))

                print('训练周期: {} [{}/{} ({:.0f}%)]\t 训练误差：{:.2f}  校验误差：{:.2f}  训练准确率：{:.2f}%  验证准确率：{:.2f}%'.format(
                    epoch, idx*batch_size, training_set_size,100. * (idx+1) / len(train_loader1),
                    np.mean(losses), np.mean(val_losses), 100.*train_right_ratio,100.*val_right_ratio))
                records.append([epoch_index,np.mean(losses), np.mean(val_losses), train_right_ratio,val_right_ratio])
                train_rights = []
                val_rights = []
    test_rights = []
    net.eval()
    for test_data in zip(test_loader1, test_loader2):
        ((x1, y1), (x2, y2)) = test_data
        if use_cuda:
            x1, y1, x2, y2 = x1.cuda(), y1.cuda(), x2.cuda(), y2.cuda()
        outputs = net(x1.clone().detach().requires_grad_(True), x2.clone().detach().requires_grad_(True))
        labels = y1 + y2
        # loss = criterion(outputs, labels.type(torch.long))
        right = rightness_add(outputs.data, labels)
        test_rights.append(right)
    test_right_ratio = 1.0 * np.sum([i[0].cpu().numpy() for i in test_rights]) / np.sum([i[1] for i in test_rights])
    print("最终测试集准确率：{:.2f}%".format(100.*test_right_ratio))
    if use_save:
        with open(save_txt_path, 'a') as fw:
            fw.write("最终测试集准确率：{:.2f}%\n".format(100.*test_right_ratio))

    results=[records, test_right_ratio]
    fig,ax=plt.subplots()
    ax.plot([j[0] for j in records],[i[3] for i in records],c='r',label='Train')
    ax.plot([j[0] for j in records],[i[4] for i in records],c='b',label='Validation')
    ax.legend()
    ax.set_ylabel('accuracy')
    ax.set_xlabel('epoch')
    ax.set_title('Transfer pretrained Accuracy')

    if use_save:
        plt.savefig(str(save_figure_path + 'Transfer_pretrained_Accuracy.png'))
    else:
        plt.show()

    return results


def cycle_training_to_transfer_fixed(net,original_net,num_epochs=20):
    # 为了比较不同数据量对迁移学习的影响，我们设定了一个加载数据的比例fraction
    # 即我们只加载原训练数据集的1/fraction来训练网络
    fraction = 1
    # 在这个试验中，我们首先将识别器的卷积层的权重全部迁移到了加法机的两个卷积部件中，
    # 但保持它们的权重不变，只允许后面的全链接层的权重可训练

    # 迁移网络，并设置卷积部件的权重和偏置都不计算梯度
    net.set_filter_values_nograd(original_net)
    if use_cuda:
        net = net.cuda()
    criterion = nn.CrossEntropyLoss()

    # 只将可更新的权重值加载到了优化器中
    new_parameters = []
    for para in net.parameters():
        if para.requires_grad:
            new_parameters.append(para)
    optimizer = optim.SGD(new_parameters, lr=0.01, momentum=0.9)
    # 训练整个网络
    records = []
    for epoch in range(num_epochs):
        losses = []
        train_rights = []  # 记录训练数据集准确率的容器
        for idx, data in enumerate(zip(train_loader1, train_loader2)):
            if idx >= (len(train_loader1) // fraction):
                break
            ((x1, y1), (x2, y2)) = data
            if use_cuda:
                x1, y1, x2, y2 = x1.cuda(), y1.cuda(), x2.cuda(), y2.cuda()
            net.train()
            optimizer.zero_grad()
            outputs = net(x1.clone().detach().requires_grad_(True), x2.clone().detach().requires_grad_(True))
            labels = y1 + y2
            loss = criterion(outputs, labels.type(torch.long))
            loss.backward()

            optimizer.step()
            loss = loss.cpu() if use_cuda else loss
            losses.append(loss.data.numpy())
            right = rightness_add(outputs.data, labels)  # 计算准确率所需数值，返回数值为（正确样例数，总样本数）
            train_rights.append(right)  # 将计算结果装到列表容器train_rights中
            if (idx+1) % n_batch == 0:
                val_rights = []  # 记录校验数据集准确率的容器
                val_losses = []
                net.eval()
                for val_data in zip(val_loader1, val_loader2):
                    ((x1, y1), (x2, y2)) = val_data
                    if use_cuda:
                        x1, y1, x2, y2 = x1.cuda(), y1.cuda(), x2.cuda(), y2.cuda()
                    outputs = net(x1.clone().detach().requires_grad_(True), x2.clone().detach().requires_grad_(True))
                    labels = y1 + y2
                    loss = criterion(outputs, labels.type(torch.long))
                    loss = loss.cpu() if use_cuda else loss
                    val_losses.append(loss.data.numpy())
                    right = rightness(outputs.data, labels)
                    val_rights.append(right)
                epoch_index = epoch + (idx+1) / len(train_loader1)
                train_right_ratio = 1.0 * np.sum([i[0].cpu().numpy() for i in train_rights]) / np.sum(
                    [i[1] for i in train_rights])
                val_right_ratio = 1.0 * np.sum([i[0].cpu().numpy() for i in val_rights]) / np.sum(
                    [i[1] for i in val_rights])
                if use_save:
                    with open(save_txt_path, 'a') as fw:
                        fw.write(
                            '训练周期: {} [{}/{} ({:.0f}%)]\t 训练误差：{:.2f}  校验误差：{:.2f}  训练准确率：{:.2f}%  验证准确率：{:.2f}%\n'.format(
                                epoch, idx * batch_size, training_set_size, 100. * (idx + 1) / len(train_loader1),
                                np.mean(losses), np.mean(val_losses), 100. * train_right_ratio, 100. * val_right_ratio))

                print('训练周期: {} [{}/{} ({:.0f}%)]\t 训练误差：{:.2f}  校验误差：{:.2f}  训练准确率：{:.2f}%  验证准确率：{:.2f}%'.format(
                    epoch, idx * batch_size, training_set_size, 100. * (idx+1) / len(train_loader1),
                    np.mean(losses), np.mean(val_losses), 100. * train_right_ratio, 100. * val_right_ratio))
                records.append([epoch_index,np.mean(losses), np.mean(val_losses), train_right_ratio,val_right_ratio])
                train_rights=[]
                val_rights=[]
    test_rights = []
    net.eval()
    for test_data in zip(test_loader1, test_loader2):
        ((x1, y1), (x2, y2)) = test_data
        if use_cuda:
            x1, y1, x2, y2 = x1.cuda(), y1.cuda(), x2.cuda(), y2.cuda()
        outputs = net(x1.clone().detach().requires_grad_(True), x2.clone().detach().requires_grad_(True))
        labels = y1 + y2
        loss = criterion(outputs, labels.type(torch.long))
        right = rightness(outputs.data, labels)
        test_rights.append(right)
    test_right_ratio = 1.0 * np.sum([i[0].cpu().numpy() for i in test_rights]) / np.sum([i[1] for i in test_rights])
    print("最终测试集准确率：{:.2f}%".format(100. * test_right_ratio))
    if use_save:
        with open(save_txt_path, 'a') as fw:
            fw.write("最终测试集准确率：{:.2f}%\n".format(100.*test_right_ratio))
    results = [records, test_right_ratio]
    fig, ax = plt.subplots()
    ax.plot([j[0] for j in records], [i[3] for i in records], c='r', label='Train')
    ax.plot([j[0] for j in records], [i[4] for i in records], c='b', label='Validation')
    ax.legend()
    ax.set_xlabel('epoch')
    ax.set_ylabel('accuracy')
    ax.set_title('Transfer fixed Accuracy')
    if use_save:
        plt.savefig(str(save_figure_path + 'Transfer_fixed_Accuracy.png'))
    else:
        plt.show()

    return results
def show_different_network_training_result(r0,r1,r2):
    """
    展示不同策略训练的网络的结果
    show_different_network_training_result
    """
    fig, ax = plt.subplots()  # 创建图实例
    ax.plot([j[0] for j in r0],[i[4] for i in r0], 'o-', label = 'no transfer')
    ax.plot([j[0] for j in r1],[i[4] for i in r1], 's:', label = 'transfer pretrained')
    ax.plot([j[0] for j in r2],[i[4] for i in r2], '*-', label = 'transfer fixed')
    ax.set_xlabel('epoch')  # 设置x轴名称
    ax.set_ylabel('accuracy')  # 设置y轴名称
    ax.set_title('different network validation accuracy')  # 设置图名
    ax.legend()  # 自动检测要在图例中显示的元素，并且显示
    if use_save:
        plt.savefig(str(save_figure_path + 'different_network_validation_accuracy.png'))
    else:
        plt.show()

def save_results_to_file(save_file_path:str,dict_result:dict):
    """
    保存结果到文件
    :param save_file_path:
    :return: 
    """
    save_dict={}

    for index,value in dict_result.items():#将numpy类型变成python的float类型
        first=value[0]
        last=value[1]
        save_list2=[]
        for fir in first:
            save_list1 = []
            for f in fir:
                save_list1.append(float(f))
            save_list2.append(save_list1)
        save_dict[index]=[save_list2,float(last)]
    json_file = open(save_file_path, mode='w')
    b = json.dumps(save_dict)
    json_file.write(b)
    json_file.close()
    print("结果记录已经保存到{}。。".format(save_file_path))


if __name__=="__main__":
    show_testset_total_accuracy("model_new902")
    # read_a_picture(1)
    # read_two_picture(1,2)

3.data_loader.py


import torch
import torchvision
import torchvision.datasets as dsets
import torchvision.transforms as transforms
import numpy as np
import matplotlib.pyplot as plt
training_set_size=2000 #训练集大小设定

batch_size = 64 # 一个批次的大小，64张图片
n_batch=(training_set_size//batch_size)//6 #多少批次打印输出
transform = transforms.Compose([transforms.ToTensor(),
                                transforms.Normalize([0.1307], [0.3081])])
# 加载MINIST数据，如果没有下载过，就会在当前路径下新建./data子目录，并把文件存放其中
# MNIST数据是属于torchvision包自带的数据，所以可以直接调用。
# 在调用自己的数据的时候，我们可以用torchvision.datasets.ImageFolder或者torch.utils.data.TensorDataset来加载
train_dataset = dsets.MNIST(root=r'./data',  #文件存放路径
                            train=True,   #提取训练集
                            transform=transform,  #将图像转化为Tensor
                            download=True)

# 加载测试数据集
test_dataset = dsets.MNIST(root=r'./data',
                           train=False,
                           transform=transform,
                           download=True)


# 定义两个采样器，每一个采样器都随机地从原始的数据集中抽样数据。抽样数据采用permutation
# 生成任意一个下标重排，从而利用下标来提取dataset中的数据
sample_size = len(train_dataset)
multiple=sample_size//training_set_size
sampler1 = torch.utils.data.sampler.SubsetRandomSampler(
    np.random.choice(range(len(train_dataset)//multiple), sample_size//multiple))
sampler2 = torch.utils.data.sampler.SubsetRandomSampler(
    np.random.choice(range(len(train_dataset)//multiple), sample_size//multiple))

# 定义两个加载器，分别封装了前两个采样器，实现采样。
train_loader1 = torch.utils.data.DataLoader(dataset = train_dataset,
                                           batch_size = batch_size,
                                           sampler = sampler1
                                           )
train_loader2 = torch.utils.data.DataLoader(dataset = train_dataset,
                                           batch_size = batch_size,
                                           sampler = sampler2
                                           )

# 对于校验数据和测试数据，我们进行类似的处理。
val_size = 5000
val_indices1 = range(val_size)
val_indices2 = np.random.permutation(range(val_size))
test_indices1 = range(val_size, len(test_dataset))
test_indices2 = np.random.permutation(test_indices1)
val_sampler1 = torch.utils.data.sampler.SubsetRandomSampler(val_indices1)
val_sampler2 = torch.utils.data.sampler.SubsetRandomSampler(val_indices2)

test_sampler1 = torch.utils.data.sampler.SubsetRandomSampler(test_indices1)
test_sampler2 = torch.utils.data.sampler.SubsetRandomSampler(test_indices2)

val_loader1 = torch.utils.data.DataLoader(dataset = test_dataset,
                                        batch_size = batch_size,
                                        shuffle = False,
                                        sampler = val_sampler1
                                        )
val_loader2 = torch.utils.data.DataLoader(dataset = test_dataset,
                                        batch_size = batch_size,
                                        shuffle = False,
                                        sampler = val_sampler2
                                        )
test_loader1 = torch.utils.data.DataLoader(dataset = test_dataset,
                                         batch_size = batch_size,
                                         shuffle = False,
                                         sampler = test_sampler1
                                         )
test_loader2 = torch.utils.data.DataLoader(dataset = test_dataset,
                                         batch_size = batch_size,
                                         shuffle = False,
                                         sampler = test_sampler2
                                         )

def imshow(img,data_name):
    img = img / 2 + 0.5
    npimg = img.numpy()
    plt.title(data_name)
    plt.imshow(np.transpose(npimg, (1, 2, 0)))
    #plt.imshow(npimg)
    plt.show()
def show_simple(data_to_loader,data_name="train_data"):
    dataiter = iter(data_to_loader)
    images, labels = dataiter.next()
    imshow(torchvision.utils.make_grid(images),data_name=data_name)
    print(' '.join('%2s' % labels[j].numpy() for j in range(len(labels))))
if __name__=="__main__":
    # print(len(train_dataset))
    # print(len(train_loader1))
    show_simple(train_loader1,"train_loader1")

三、实验过程

在data_loader.py中使用torchvision加载并且归一化CIFAR10的训练、验证和测试数据集。并且设定training_set_size=2000
，即将训练集的大小设置成2000的大小，使得其有效模拟数据缺失的情况。接着编写show_simple()函数，以便查看数据集图像内容，做数据集的可视化。训练集的查看数据如下图：

图像的真实标签：
0 8 9 1 9 9 9 1
7 2 1 5 3 4 0 7
3 8 2 2 0 1 1 6
8 8 0 4 6 4 7 5
8 1 3 3 7 4 3 2
7 9 7 2 0 6 1 6
0 0 3 9 9 5 2 7
0 3 1 9 3 6 6 6

在network4.py定义一个卷积神经网络，即Transfer类，该类与之前训练的MNIST手写数字识别模型的卷积层一样。当输入两张图像，构造两个并行的卷积层，提取两张图像的特征。然后将图象特征放入全连接层，因为10种数字图像的和一共有19种结果，所以最终全连接输出层设置为19个单元。
将之前训练的MNIST手写数字识别模型导出，这里导出的模型保存为model_new902，在network4.py中编写show_testset_total_accuracy(model:str)函数，来测试该导出模型的准确率。在network4.py运行该函数，结果如下：

ConvNet(
(conv1): Conv2d(1, 6, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))
(pool): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
(conv2): Conv2d(6, 16, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))
(fc1): Linear(in_features=784, out_features=512, bias=True)
(fc2): Linear(in_features=512, out_features=10, bias=True)
)
model_new902模型在测试集上的准确率：99.22%

可以看到准确率达到99%。该模型已经很好了。

我们先在不依靠之前训练的模型的情况下，在仅有2000张的图像的训练集下，训练这个加法器网络，观察在多少轮达到多高的测试集准确率。这里在network4.py中编写cycle_training(net,num_epochs=20)函数，该函数里定义一个损失函数和优化器，使用分类交叉熵Cross-Entropy 作损失函数，动量SGD做优化器，对不依赖模型的加法器网络进行训练。在main.py文件中调用该方法即可，得运行结果：

…
训练周期: 19 [1536/2000 (78%)] 训练误差：1.90 校验误差：2.00 训练准确率：28.75% 验证准确率：26.56%
训练周期: 19 [1856/2000 (94%)] 训练误差：1.90 校验误差：1.98 训练准确率：25.62% 验证准确率：26.86%
最终测试集准确率：33.72%

我们接下来迁移之前训练的模型，先在network4.py文件中定义Transfer类的set_filter_values(self, net)方法，该方法的作用是将迁移过来的网络的权重值拷贝到本网络中去，接着在network4.py文件中定义cycle_training_to_transfer_pretrained(net,original_net,num_epochs=20)函数，该函数在迁移的情况下，同在仅有2000张的图像的训练集下，训练这个加法器网络（这里只是把之前网络模型的卷积层权值迁移过来，并没有固定，之后训练，随梯度下降，而更新权值），我们可观察在多少轮达到多高的测试集准确率。同样在main.py文件中调用该方法即可，得运行结果：
…
训练周期: 19 [1536/2000 (78%)] 训练误差：0.47 校验误差：0.66 训练准确率：84.38% 验证准确率：79.82%
训练周期: 19 [1856/2000 (94%)] 训练误差：0.45 校验误差：0.69 训练准确率：87.19% 验证准确率：78.96%
最终测试集准确率：88.14%
我们也是迁移之前训练的模型，先在network4.py文件中定义Transfer类的set_filter_values_nograd(self,
net)方法，该方法的作用是将迁移过来的网络的权重值拷贝到本网络中去，并且迁移为固定权重式，接着在network4.py文件中定义cycle_training_to_transfer_fixed(net,original_net,num_epochs=20)函数，该函数在迁移的情况下，同在仅有2000张的图像的训练集下，训练这个加法器网络（这里把之前网络模型的卷积层权值迁移过来，并且固定下来，之后训练不在更新权值，只改改变全连接层的权值），我们可观察在多少轮达到多高的测试集准确率。同样在main.py文件中调用该方法即可，得运行结果：

…
训练周期: 19 [1536/2000 (78%)] 训练误差：0.87 校验误差：0.85 训练准确率：71.25% 验证准确率：73.32%
训练周期: 19 [1856/2000 (94%)] 训练误差：0.86 校验误差：0.87 训练准确率：74.38% 验证准确率：73.22%
最终测试集准确率：82.92%
最后在network4.py文件中定义show_different_network_training_result(r0,r1,r2)函数，该函数展示以上不同策略训练的网络的结果，即可视化不同方式训练的加法器网络的效果，对比验证“迁移学习是否可以将在一个领域训练的机器学习模型应用到另一个领域，在某种程度上是否提高了训练模型的利用率，能否解决了数据缺失的问题，并赋予了智能模型“举一反三”的能力“。在main.py中将以上训练结果作为参数，调用。得到结果：

在没有迁移的加法器网络上，因为训练集只有2000张图片，即使训练轮数达到20轮之多，在验证集上的准确率都不过30%.而迁移了模型的加法器网络，在随着训练轮数的增加，准确率在提升。而固定了的迁移模型略逊于没有固定的迁移模型，这可能是因为之前训练模型的训练集与该训练集的整体特征不太相符，而固定了的模型，没有改进提取特征的能力。

总结

选择一个合适的模型去训练特定任务，发挥预训练模型特征抽象的能力，通过微调，改变它的部分参数或者为其新增部分输出结构后，在小部分数据集上训练，来使整个模型更好的适应特定任务。但在选用预训练模型是小型模型的情况下，可以通过增加训练次数来提高效果。

你可能感兴趣的:(pytorch,迁移学习,深度学习,python)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Python中深拷贝与浅拷贝的区别 yuxiaoyu.
转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python编译器鹿鹿~ Python编译器 Python python 开发语言后端
嘿嘿嘿我又来了啊有些小盆友可能不知道Python其实是有编译器的，也就是PyCharm。你们可能会问到这个是干嘛的又不可以吃也不可以穿好像没有什么用，其实你还说对了这个还真的不可以吃也不可以穿，但是它用来干嘛的呢。用来编译你所打出的代码进行运行（可能这里说的有点不对但是只是个人认为）现在我们来说说PyCharm是用来干嘛的。PyCharm是一种PythonIDE，带有一整套可以帮助用户在使用Pyt
一文掌握python面向对象魔术方法（二）程序员neil python python 开发语言
接上篇：一文掌握python面向对象魔术方法（一）-CSDN博客目录六、迭代和序列化：1、__iter__(self):定义迭代器，使得类可以被for循环迭代。2、__getitem__(self,key):定义索引操作，如obj[key]。3、__setitem__(self,key,value):定义赋值操作，如obj[key]=value。4、__delitem__(self,key):定义
一文掌握python常用的list（列表）操作程序员neil python python 开发语言
目录一、创建列表1.直接创建列表：2.使用list()构造器3.使用列表推导式4.创建空列表二、访问列表元素1.列表支持通过索引访问元素，索引从0开始：2.还可以使用切片操作访问列表的一部分：三、修改列表元素四、添加元素1.append()：在末尾添加元素2.insert()：在指定位置插入元素五、删除元素1.del：删除指定位置的元素2.remove()：删除指定值的第一个匹配项3.pop()：
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
python中的深拷贝与浅拷贝 anshejd70787 python
深拷贝和浅拷贝浅拷贝的时候，修改原来的对象，浅拷贝的对象不会发生改变。1、对象的赋值对象的赋值实际上是对象之间的引用：当创建一个对象，然后将这个对象赋值给另外一个变量的时候，python并没有拷贝这个对象，而只是拷贝了这个对象的引用。当对对象做赋值或者是参数传递或者作为返回值的时候，总是传递原始对象的引用，而不是一个副本。如下所示：>>>aList=["kel","abc",123]>>>bLis
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu