DanzerWoo

Pytorch学习笔记——过拟合、欠拟合及其解决方案

过拟合、欠拟合及其解决方案

1、预备知识

1.1 模型选择

验证数据集：测试集不可用于模型参数的调试，所以需要从训练数据集中分离出一部分数据作为验证数据集用来调参

1.2 K折交叉验证

目前来说深度学习研究的普遍情况是数据量不够庞大，而我们要把模型数据分成训练集、验证集，这样就会导致训练数据更加少，K折交叉验证可以解决这个问题。算法思想大概是，将训练数据集均分成K个不同子集，第 i 次选取 K[ i ] 作为验证集，其余的 K-1 个数据作为训练集，这样我们就有了K组数据，最后将K次训练误差和验证误差取平均得到模型的训练误差和验证误差

2、过拟合和欠拟合

2.1 概念

过拟合：训练集上的误差小于测试集上的误差
欠拟合：模型无法得到较低的训练误差
影响过拟合和欠拟合的两个因素：模型复杂度和训练数据集大小

2.2 影响因素

A、模型复杂度

我们在深度学习模型中是需要寻找一个函数来拟合y，如下所示

Wk是模型的权重，b是偏差，这里意味着K越大，函数模型越复杂，而在训练集固定的情况下，模型复杂度和误差之间有如下关系

也就是说，模型过于简单容易导致欠拟合（不能很好地表达训练数据），模型过于复杂容易导致过拟合（对训练数据表达得过好）

B、训练数据集大小

训练数据集中样本数过少容易导致过拟合，所以我们要根据训练集的大小合理地构建我们的深度学习模型网络

2.3 多项式函数拟合实验

%matplotlib inline
import torch
import numpy as np
import sys
sys.path.append("/home/kesci/input")
import d2lzh1981 as d2l

初始化模型参数

# 预设三元函数参数
n_train, n_test, true_w, true_b = 100, 100, [1.2, -3.4, 5.6], 5
# 随机生成特征值
features = torch.randn((n_train + n_test, 1))
# torch.cat 拼接函数
# torch.pow幂指数函数
poly_features = torch.cat((features, torch.pow(features, 2), torch.pow(features, 3)), 1) 
# 计算真实标签
labels = (true_w[0] * poly_features[:, 0] + true_w[1] * poly_features[:, 1]
          + true_w[2] * poly_features[:, 2] + true_b)
# torch.tensor 数据转换成tensor类型
# np.random.normal 随机生成正态分布噪声
# 因为现实中输出与输入不是标准的线性关系
labels += torch.tensor(np.random.normal(0, 0.01, size=labels.size()), dtype=torch.float)
# features[:2], poly_features[:2], labels[:2]

定义、训练和测试模型

# 定义一个画图函数
# d2l库
def semilogy(x_vals, y_vals, x_label, y_label, x2_vals=None, y2_vals=None,
             legend=None, figsize=(3.5, 2.5)):
    # d2l.set_figsize(figsize)
    d2l.plt.xlabel(x_label)
    d2l.plt.ylabel(y_label)
    # 画第一条线
    d2l.plt.semilogy(x_vals, y_vals)
    # 若x2_vals和y2_vals同时存在，画第二条线，修改为虚线
    if x2_vals and y2_vals:
        d2l.plt.semilogy(x2_vals, y2_vals, linestyle=':')
        d2l.plt.legend(legend)
        
  # python中的赋值方法，设置迭代次数和损失函数
  # num_epochs = 100
  # loss = torch.nn.MSELoss()
  num_epochs, loss = 100, torch.nn.MSELoss()

def fit_and_plot(train_features, test_features, train_labels, test_labels):
    # 初始化网络模型
    net = torch.nn.Linear(train_features.shape[-1], 1)
    # 通过Linear文档可知，pytorch已经将参数初始化了，所以我们这里就不手动初始化了
    
    # 设置批量大小
    batch_size = min(10, train_labels.shape[0])    
    dataset = torch.utils.data.TensorDataset(train_features, train_labels)      # 设置数据集
    train_iter = torch.utils.data.DataLoader(dataset, batch_size, shuffle=True) # 设置获取数据方式
    
    optimizer = torch.optim.SGD(net.parameters(), lr=0.01)                      # 设置优化函数，使用的是随机梯度下降优化
    train_ls, test_ls = [], []
    for _ in range(num_epochs):
        for X, y in train_iter:                                                 # 取一个批量的数据
            l = loss(net(X), y.view(-1, 1))                                     # 输入到网络中计算输出，并和标签比较求得损失函数
            optimizer.zero_grad()                                               # 梯度清零，防止梯度累加干扰优化
            l.backward()                                                        # 求梯度
            optimizer.step()                                                    # 迭代优化函数，进行参数优化
        train_labels = train_labels.view(-1, 1)
        test_labels = test_labels.view(-1, 1)
        train_ls.append(loss(net(train_features), train_labels).item())         # 将训练损失保存到train_ls中
        test_ls.append(loss(net(test_features), test_labels).item())            # 将测试损失保存到test_ls中
    print('final epoch: train loss', train_ls[-1], 'test loss', test_ls[-1])    
    semilogy(range(1, num_epochs + 1), train_ls, 'epochs', 'loss',
             range(1, num_epochs + 1), test_ls, ['train', 'test'])
    print('weight:', net.weight.data,
          '\nbias:', net.bias.data)
    
    # 画图比较
    # 拟合较好模型
    fit_and_plot(poly_features[:n_train, :], poly_features[n_train:, :], labels[:n_train], labels[n_train:])
    # 欠拟合
    fit_and_plot(features[:n_train, :], features[n_train:, :], labels[:n_train], labels[n_train:])
	# 过拟合
	fit_and_plot(poly_features[0:2, :], poly_features[n_train:, :], labels[0:2], labels[n_train:])

思考：backward()和forward()函数的原理

3、过拟合解决方法

3.1 权重衰减

等价于L2范数正则化，通过为模型损失函数增加惩罚项使得模型参数值变小，可以用于解决过拟合

3.2 L2范数正则化

L2范数正则化简单来说就是缩小模型中每一项的大小来达到解决过拟合的作用，以线性回归模型中的均方误差损失函数为例

引入L2范数正则化后损失函数如下

权重W的迭代更新如下

可以看到W的值随λ的增大而减小

3.3 高维线性回归实验

假定线性模型函数如下

引入过拟合我们可以通过控制数据集的大小，以及多维模型的维度，使得模型维度远大于数据集大小

A、L2范数正则化

从零实现

%matplotlib inline
import torch
import torch.nn as nn
import numpy as np
import sys
sys.path.append("/home/kesci/input")
import d2lzh1981 as d2l

# 设置训练集大小为20，测试集为100，权重数量为200
# 这里num_inputs等于权重数量等于模型特征数量
n_train, n_test, num_inputs = 20, 100, 200
# 设置权重和偏差
# w全为0.01，b为0.05
# 这里的矩阵计算涉及到广播机制
true_w, true_b = torch.ones(num_inputs, 1) * 0.01, 0.05

# 为数据增加噪声
features = torch.randn((n_train + n_test, num_inputs))
labels = torch.matmul(features, true_w) + true_b
labels += torch.tensor(np.random.normal(0, 0.01, size=labels.size()), dtype=torch.float)
train_features, test_features = features[:n_train, :], features[n_train:, :]
train_labels, test_labels = labels[:n_train], labels[n_train:]

# 定义参数初始化函数，初始化模型参数并且附上梯度
def init_params():
    w = torch.randn((num_inputs, 1), requires_grad=True)
    b = torch.zeros(1, requires_grad=True)
    return [w, b]
# 定义L2范数惩罚项
def l2_penalty(w):
    return (w**2).sum() / 2

定义训练和测试

batch_size, num_epochs, lr = 1, 100, 0.003
# 线性回归模型 均方误差损失函数
net, loss = d2l.linreg, d2l.squared_loss

dataset = torch.utils.data.TensorDataset(train_features, train_labels)
# pytorch函数，数据生成器
train_iter = torch.utils.data.DataLoader(dataset, batch_size, shuffle=True)
# 画图函数
def fit_and_plot(lambd):
    w, b = init_params()
    train_ls, test_ls = [], []
    for _ in range(num_epochs):
        for X, y in train_iter:
            # 添加了L2范数惩罚项
            l = loss(net(X, w, b), y) + lambd * l2_penalty(w)
            l = l.sum()
            
            if w.grad is not None:
                w.grad.data.zero_()
                b.grad.data.zero_()
            l.backward()
            d2l.sgd([w, b], lr, batch_size)
        train_ls.append(loss(net(train_features, w, b), train_labels).mean().item())
        test_ls.append(loss(net(test_features, w, b), test_labels).mean().item())
    d2l.semilogy(range(1, num_epochs + 1), train_ls, 'epochs', 'loss',
                 range(1, num_epochs + 1), test_ls, ['train', 'test'])
    print('L2 norm of w:', w.norm().item())

对比过拟合和权重衰减

# 过拟合
fit_and_plot(lambd=0)
# 权重衰减
fit_and_plot(lambd=3)

简洁实现

def fit_and_plot_pytorch(wd):
    # 对权重参数衰减。权重名称一般是以weight结尾
    # 初始化模型参数
    # net ，输入，输出
    net = nn.Linear(num_inputs, 1)
    nn.init.normal_(net.weight, mean=0, std=1)
    nn.init.normal_(net.bias, mean=0, std=1)
    # 定义优化器
    optimizer_w = torch.optim.SGD(params=[net.weight], lr=lr, weight_decay=wd) # 对权重参数衰减
    optimizer_b = torch.optim.SGD(params=[net.bias], lr=lr)  # 不对偏差参数衰减
    # 列表装训练误差和测试误差
    train_ls, test_ls = [], []
    # python中的缺省参数_ 
    for _ in range(num_epochs):
        for X, y in train_iter:
            l = loss(net(X), y).mean()
            optimizer_w.zero_grad()
            optimizer_b.zero_grad()
            
            l.backward()
            
            # 对两个optimizer实例分别调用step函数，从而分别更新权重和偏差
            optimizer_w.step()
            optimizer_b.step()
        # 每次迭代记录平均误差
        train_ls.append(loss(net(train_features), train_labels).mean().item())
        test_ls.append(loss(net(test_features), test_labels).mean().item())
        # 画图对比训练误差和测试误差
    d2l.semilogy(range(1, num_epochs + 1), train_ls, 'epochs', 'loss',
                 range(1, num_epochs + 1), test_ls, ['train', 'test'])
    print('L2 norm of w:', net.weight.data.norm().item())
# 过拟合
fit_and_plot_pytorch(0)
# 权重衰减
fit_and_plot_pytorch(3)

B、丢弃法

原理是根据概率p丢弃模型中的隐藏层，剩下的隐藏层除以1-p做拉伸，举例一个输入个数为4，隐藏单元为5，输出个数为3的单隐层感知机如下

其中Φ为激活函数，x为特征值，w为权重参数，b为偏差。当使用丢弃法，且概率为p，hi会有p的概率被清零，1-p的概率除以1-p做拉伸，hi’ 为新的隐藏单元，如下

根据概率论中数学期望的性质可知

丢弃法不改变输入的期望，在训练过程中隐藏层中hi随机清零，输出层的计算不过度依赖任何一个神经元，但是在模型测试的时候不用丢弃法

从零开始实现

%matplotlib inline
import torch
import torch.nn as nn
import numpy as np
import sys
sys.path.append("/home/kesci/input")
import d2lzh1981 as d2l

#定义drop_prob概率丢弃
def dropout(X, drop_prob):
    X = X.float()
    assert 0 <= drop_prob <= 1
    keep_prob = 1 - drop_prob
    # 这种情况下把全部元素都丢弃
    if keep_prob == 0:
        return torch.zeros_like(X)
    mask = (torch.rand(X.shape) < keep_prob).float()
    
    return mask * X / keep_prob

#  生成数据，验证    
X = torch.arange(16).view(2, 8)
dropout(X, 0)
dropout(X, 0.5)

定义网络结构

drop_prob1, drop_prob2 = 0.2, 0.5

def net(X, is_training=True):
    X = X.view(-1, num_inputs)
    H1 = (torch.matmul(X, W1) + b1).relu()
    if is_training:  # 只在训练模型时使用丢弃法
        H1 = dropout(H1, drop_prob1)  # 在第一层全连接后添加丢弃层
    H2 = (torch.matmul(H1, W2) + b2).relu()
    if is_training:
        H2 = dropout(H2, drop_prob2)  # 在第二层全连接后添加丢弃层
    return torch.matmul(H2, W3) + b3

def evaluate_accuracy(data_iter, net):
    acc_sum, n = 0.0, 0
    for X, y in data_iter:
        if isinstance(net, torch.nn.Module):
            net.eval() # 评估模式, 这会关闭dropout
            acc_sum += (net(X).argmax(dim=1) == y).float().sum().item()
            net.train() # 改回训练模式
        else: # 自定义的模型
            if('is_training' in net.__code__.co_varnames): # 如果有is_training这个参数
                # 将is_training设置成False
                acc_sum += (net(X, is_training=False).argmax(dim=1) == y).float().sum().item() 
            else:
                acc_sum += (net(X).argmax(dim=1) == y).float().sum().item() 
        n += y.shape[0]
    return acc_sum / n

训练

num_epochs, lr, batch_size = 5, 100.0, 256  # 这里的学习率设置的很大，原因与之前相同。
loss = torch.nn.CrossEntropyLoss()
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size, root='/home/kesci/input/FashionMNIST2065')
d2l.train_ch3(
    net,
    train_iter,
    test_iter,
    loss,
    num_epochs,
    batch_size,
    params,
    lr)

简洁实现

# 定义网络参数
net = nn.Sequential(
        d2l.FlattenLayer(),
        nn.Linear(num_inputs, num_hiddens1),
        nn.ReLU(),
        nn.Dropout(drop_prob1),
        nn.Linear(num_hiddens1, num_hiddens2), 
        nn.ReLU(),
        nn.Dropout(drop_prob2),
        nn.Linear(num_hiddens2, 10)
        )

for param in net.parameters():
    nn.init.normal_(param, mean=0, std=0.01)

optimizer = torch.optim.SGD(net.parameters(), lr=0.5)
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, batch_size, None, None, optimizer)

笔记内容摘录自：动手学深度学习Pytorch版

2022-09-08 d17210c81c28
Sfbt将赞美和重新建构合称为正向眼光重新建构是xsFTP，一个很重要的技巧与精神，重新建构指的是我们机遇事情，不会只有一个面向，从不同看待事情的眼光看到当事人的特质优点，动机，努力引导他看见事情的其他面向，进而拓展当事人的思考，引发不同的行动，重新建构的另外一个意义是我们了解孩子描述的事情并重新诠释后，赋予相同的时间不同，且正向的意义，看到了事件本身所带来的正面价值，进而形成新的解决方案或是行动
函数接口设计：为什么需要封装数据结构？ ice.Ynov23 数据结构 C++学习笔记算法开发语言
文章目录背景1.提高代码可读性和可维护性问题表现解决方案2.减少参数传递的复杂性问题表现解决方案3.便于扩展和修改问题表现解决方案4.增强数据完整性问题表现解决方案5.降低耦合性6.提高性能（间接优化）何时选择封装数据结构？不适合封装的场景总结对比最佳实践背景在函数接口设计中，我们会面临传递大量参数的场景，此时你是会选择传递多个单独的参数？还是选择封装数据结构（如结构体、类或对象）？1.提高代码可
六项精进打卡11天王尚涛
每日打卡模板姓名：王尚涛公司：为福投资控股集团【日精进打卡第11天】【知～学习】《六项精进》纲要读1遍，共17遍《大学》读1遍共11遍《论语》第12-24页【经典名句分享】付出不亚于任何人的努力；要谦虚不要骄傲；每天都要反省；活着，就要感谢；积善行，思利他；不要有感性的烦恼；若无相欠，怎会相见；人不知而不愠，不亦君子乎；命由我作，福自己求；小人闲居为不善。言不及之而言谓之躁，言及之而不言谓之隐，未
基于R语言的极值统计学及其在相关领域中的实践技术应用科研的力量语言类课程极值统计学
受到气候变化、温室效应以及人类活动等因素的影响，自然界中极端高温、极端环境污染、大洪水和大暴雨等现象的发生日益频繁；在人类社会中，股市崩溃、金融危机等极端情况也时有发生；今年的新冠疫情就是非常典型的极端现象。研究此类极端现象需要新的统计学方法，该类统计学的理论和方法都与传统的基于高斯分布的统计学模型有极大的不同。极值统计学就是专门研究自然界和人类社会中很少发生，然而发生之后有着巨大影响的极端现象的
sqlite加密问题：怎么样打开这个通过sha512加密的sqlite数据库文件？ bug菌¹ 全栈Bug调优(实战版)sqlite c++sqlite加密数据库文件
本文收录于《全栈Bug调优(实战版)》专栏，主要记录项目实战过程中所遇到的Bug或因后果及提供真实有效的解决方案，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！全文目录：问题描述解决方案1.**理解SQLite的加密扩展**2.**确认加密实现方式**3.**根据SHA-512的加密逻辑调整代码**4.**解决方案步骤****方
JSON全面解析：轻量级数据交换的核心技术新人码农11111 json python
目录JSON的本质特征⚙️序列化：数据到字符串的转换反序列化：字符串到数据的还原实际应用场景⚠️常见陷阱与解决方案最佳实践建议在当今数据驱动的时代，JSON（JavaScriptObjectNotation）已成为最流行的轻量级数据交换格式。本文将深入剖析JSON的核心特性及其在Python中的应用，帮助开发者高效处理数据序列化与反序列化。JSON的本质特征JSON采用纯文本格式，具有跨平台、易读
2021-11-13 芷灵君
打卡时间：11月12日-11月13日打卡内容：1.“两个教学大纲”具体指什么？两个教学大纲指的是:1、必须学会并记住的材料；2、课外阅读以及其他知识来源。2.“两个教学大纲”，是如何发展学生的思维能力的？为了牢固地记住公式、规则、结论和其他的概括，学生应该阅读和思考许多无需记住的材料。阅读应和学习紧密联系。如果阅读加深了对事实、现象和事物的认识，而这些事实、现象和事物是保存在记忆中的概括的基础，那
hamburger-react项目安装与使用指南毕腾鉴Goddard
hamburger-react项目安装与使用指南项目简介本指南旨在帮助开发者了解并快速上手hamburger-react项目。该项目托管在GitHub上，可通过此链接访问。它是一个基于React的组件库，专注于实现汉堡菜单效果，为Web应用提供简洁易用的导航解决方案。1.项目目录结构及介绍hamburger-react/│├──public/-包含index.html以及可能的静态资源，如图标或初
全栈Todo应用实战：从零到一的本地部署与深度解析
全栈Todo应用实战：从零到一的本地部署与深度解析前言在现代Web开发中，全栈应用已成为主流。本文将以一个经典的Todo（待办事项）应用为例，详细记录从项目下载、环境配置、后端启动、数据库交互到前端运行的完整流程。我们将深入探讨在此过程中遇到的一个典型问题——CORS与API请求失败，并提供从“快速修复”到“最佳实践”的解决方案。这不仅是一份操作指南，更是一次宝贵的实战经验总结。你将从本博客中学到
React 项目环境变量使用指南啃火龙果的兔子开发DEMO react.js 前端前端框架
在React项目中正确使用环境变量是管理不同环境配置的关键技术。以下是完整的解决方案：1.创建环境变量文件React项目支持以下环境变量文件（按优先级从高到低）：.env.development.local(本地开发环境).env.development(开发环境).env.production.local(生产环境本地覆盖).env.production(生产环境).env(所有环境)示例文件内
VUE解决Error: error:0308010C:digital envelope routines::unsupported的四种解决方案
问题描述：报错：Error:error:0308010C:digitalenveloperoutines::unsupported报错原因：主要是因为nodeJsV17版本发布了OpenSSL3.0对算法和秘钥大小增加了更为严格的限制，nodeJsv17之前版本没影响，但V17和之后版本会出现这个错误。我的node版本是v18+报错详细信息：rror:error:0308010C:digitale
使用Spire.Doc.Free在Python中为Word文档添加批注 Ven% python python word 批注
文章目录技术背景环境准备完整实现代码功能说明：注意事项：总结在文档协作和审阅过程中，批注是极其重要的功能。本文将详细介绍如何使用Python的Spire.Doc.Free库为Word文档添加批注，并提供一个完整的解决方案。技术背景Spire.Doc.Free是一个功能强大且免费的Python库，用于处理Word文档。虽然免费版本有一些限制（如文档处理页数限制等），但它提供了丰富的API用于文档操作
深度学习——CNN（3）飘涯
前言：前面介绍了最基本的Lenet，下面介绍几种其他的网络结构CNN-AlexNet网络结构如下图：从图中可以看出，采用双gpu训练增加LRN归一化层：本质上，这个层也是为了防止激活函数的饱和的。采用dropout防止过拟合基于AlexNet进行微调，诞生了ZF-netCNN-GoogleNetGoogLeNet借鉴了NIN的特性，在原先的卷积过程中附加了11的卷积核加上ReLU激活。这不仅仅提升
Linux和Windows保存Git账号和密码小米加大米Q
场景：Linux和Windows中每次pull的时候都会输入用户名和密码？如图：解决方案：在系统中输入命令：gitconfig--globalcredential.helperstore之后操作不在需要输入用户名和密码。
微算法科技技术突破：用于前馈神经网络的量子算法技术助力神经网络变革 MicroTech2025 量子计算算法神经网络
随着量子计算和机器学习的迅猛发展，企业界正逐步迈向融合这两大领域的新时代。在这一背景下，微算法科技（NASDAQ:MLGO）成功研发出一套用于前馈神经网络的量子算法，突破了传统神经网络在训练和评估中的性能瓶颈。这一创新性的量子算法以经典的前馈和反向传播算法为基础，借助量子计算的强大算力，极大提升了网络训练和评估效率，并带来了对过拟合的天然抗性。前馈神经网络是深度学习的核心架构，广泛应用于图像分类、
【世纪龙科技】智能网联汽车环境感知系统教学难题的创新实践江苏世纪龙科技智能网联汽车汽车仿真教学软件汽车
在职业院校智能网联汽车专业教学中，环境感知系统的教学长期面临三大核心挑战：设备成本高昂导致实训资源不足、抽象原理难以直观呈现、传统教学模式难以满足产业需求。如何让学生在有限的教学条件下，深入理解激光雷达、毫米波雷达等核心部件的工作原理，并掌握实际应用能力？江苏世纪龙科技研发的《智能网联汽车环境感知系统VR教学软件》，为这一教学痛点提供了创新解决方案。聚焦教学痛点，重构学习体验传统实训室中，传感器设
详解NIO Channel类沧澜sincerely Java 高并发 nio
目录什么是NIOChannel？为什么要学习NIOChannel？FileChannelSocketChannelDatagramChannel本篇文章内容的前置知识为NIOBuffer类，如果不了解，可点击链接学习详解NIOBuffer类及其属性和方法-CSDN博客什么是NIOChannel？在JavaNIO中，Channel（通道）是一种广义的I/O抽象，用于表示与数据源或数据目的地之间的连接
如何使用 Docker 部署一个简单的 Node.js 应用 iOS开发届的一个人 node.js
如何使用Docker部署一个简单的Node.js应用在现代的软件开发中，容器化技术已经成为了提高开发效率和简化部署流程的重要工具。Docker是最流行的容器化工具之一，它可以帮助开发者打包应用程序以及其所有的依赖，使其在任何环境下都能一致地运行。本篇博客将向大家展示如何使用Docker来部署一个简单的Node.js应用。1.环境准备在开始之前，我们需要确保系统已经安装了以下工具：Docker：如果
Python 数据分析与可视化：从基础到进阶的技术实现与优化策略女码农的重启 python 数据分析开发语言
数据分析与可视化是数据科学领域的核心技能，Python凭借其丰富的库生态和灵活的编程范式，成为该领域的首选工具。本文将系统讲解Python数据分析与可视化的技术栈实现，从基础操作到性能优化，结合实战场景提供可复用的解决方案。数据分析核心库技术解析Pandas数据处理引擎原理Pandas作为数据分析的基石，其核心优势在于基于NumPy的矢量运算和高效的内存管理。与Excel的单元格级操作不同，Pan
微服务能解决高并发？高并发微服务架构详解：本质、痛点与标准化解决方案
在过去几年中，很多企业希望通过微服务架构来“提升系统性能、支撑高并发”，但在实践中却经常遇到失败的微服务改造，原因大多是对微服务的理解存在偏差。微服务从来不是为了解决高并发问题而存在的，它真正解决的是大规模系统协作标准化和演化解耦的问题。本文将结合一个真实的在线教育平台案例，详细讲解微服务架构的本质作用、技术设计与演进路径。一、微服务不是用来“抗高并发”的某大型在线教育平台在最初上线时，采用的是典
vLLM快速入门：开启高效推理与部署之旅
在如今这个人工智能飞速发展的时代，语言模型的应用已经深入到我们生活的方方面面，从智能聊天机器人到文本生成工具，都离不开强大的语言模型技术支持。而vLLM作为一个专注于高效推理和部署的开源项目，正在为研究人员和开发人员提供一种全新的解决方案，让语言模型的使用变得更加便捷、高效。初识vLLM：背景与意义vLLM（VeryLargeLanguageModelInference）是一个专注于大型语言模型推
养狗渔渔说
其实说真的不想领养我弟弟的狗，可不知道为什么每次弟弟让我帮他的忙，我都尽力帮他。这次养狗也是，就算弟弟没有非要我帮养着，但他一开口我就觉得不帮就觉得欠他的一样。好像弟弟也算准我会帮他一样，心软惹的祸。我听弟弟说养这种叫泰迪的狗只需要给狗粮和水就好，一个月洗几次澡，都是他出钱，想来只是干点苦力活，不用我出钱，就当辛苦点也帮了吧。后来狗到家我才知道错了，真的太闻够味，太臭了，我差点要吐了，我住的家没有
国内第一梯队终端安全产品解析：技术与场景实践粤海科技君安全腾讯iOA 零信任终端安全
国内终端安全市场的第一梯队产品，通常具备技术领先性、场景覆盖度和规模化落地能力。结合2025年最新行业动态与实战案例，以下从技术架构、核心能力和典型应用三个维度，解析当前市场的头部产品及其差异化价值。一、技术架构与市场格局国内终端安全市场呈现"平台化、智能化、场景化"三大趋势。根据赛迪顾问2023年数据，奇安信以18.7%的终端安全市场份额位居首位，其天擎系统通过"终端检测与响应（EDR）+主动防
HPE携手迈阿密自由公园，为迈阿密国际足球俱乐部打造极致球迷体验
近日，慧与科技（NYSE：HPE）宣布与迈阿密自由公园（MiamiFreedomPark）及迈阿密国际足球俱乐部（InterMiamiCF，后简称迈阿密国际）正式达成合作协议。HPE将成为迈阿密自由公园的首个创始合作伙伴和官方技术合作伙伴，及迈阿密国际在网络基础设施、解决方案、混合云等领域的独家合作伙伴。届时，HPE将凭借HPEArubaNetworking、HPEAlletraStorage、H
永远不要，责怪你生命中的任何人知心之友
人来人往，遇见皆缘。生命中的人，有的给我们带来欢喜，有的给我们带来忧愁；有的让我们愉悦，有的让我们悲伤。也有萍水相逢的人，与我们擦肩而过，初见即最后一面。佛说：“一切顺其自然，上天自有安排。”出现在我们生命中的每一个人，无论好坏，都是有意义的。由酸、甜、苦、辣、咸“烹制”的人生，才算有滋有味。01不负不欠，不会遇见《增广贤文》有云：“百年修得同船渡，千年修得共枕眠。”生命中遇见的人，都是命中注定。
Kafka深度解析：架构、原理与应用实践 JouJz kafka 架构 linq
Kafka深度解析：架构、原理与应用实践引言在现代分布式系统架构中，消息队列作为系统解耦、异步通信的核心组件发挥着至关重要的作用。而在众多消息队列解决方案中，ApacheKafka凭借其卓越的性能、高吞吐量和可靠性，已成为企业级数据管道的首选技术。本文将深入剖析Kafka的核心架构、工作原理以及实践应用，帮助开发者全面掌握这一强大的分布式消息系统。一、Kafka概述与核心概念1.1Kafka的诞生
第一章【vue】基础（超详细） ᝰ落念英 vue.js 前端 javascript web 开发语言前端框架 vue
Vue基础Vue在HTML中的引入使用Vue渲染数据Vue可直接渲染定义在data里的数据,渲染动态数据使用“{{}}"包裹示例代码{{message}}{{arr}}{{arr.name}}{{arr.age}}{{obj[2]}}在js中挂载Vue实例Vue实列的作用范围：vue会管理el选项命中的元素及其后代元素是否可以使用其他选择器但是建议使用id选择器是否可以设置其他的dom元素可以使用
人到中年越是不顺时，就越要远离这几亲戚唯美看点
每个人的家庭中都少不了亲戚，过年过节什么的都少不了往来。一是，很久不见都挺想念对方。二是，毕竟有着血缘关系多连联系联系加深感情。虽说，亲戚这种事命定的，不管你怎么样都不能抛开这个关系，可是有的亲戚，简直就像是你前世欠的债一样，惹人麻烦甚是令人无奈。所以，我们在和亲戚来往的过程中也得好好分清哪种亲戚能长久的相处，哪种亲戚就只要在平常走走过场就行。今天我就为大家讲解一下，人越是不顺时，就越要远离这"四
Redis分布式锁深度剖析：从原理到高可用实践 JouJz redis 分布式 wpf
Redis分布式锁深度剖析：从原理到高可用实践引言：分布式环境下的锁之殇在分布式系统中，共享资源互斥访问是保证数据一致性的核心挑战。传统单机锁（如synchronized）在跨进程场景下完全失效，这就是分布式锁的用武之地。Redis凭借其高性能、原子操作等特性，成为实现分布式锁的主流方案。本文将深入解析Redis分布式锁的实现原理、典型问题及工业级解决方案。一、分布式锁的本质要求1.1必须满足的核
ARM嵌入式可编程控制器技术开发拉勾科研工作室 arm开发
PLC自动化设计|毕业设计指导|工业自动化解决方案✨专业领域：PLC程序设计与调试工业自动化控制系统HMI人机界面开发工业传感器应用电气控制系统设计工业网络通信擅长工具：西门子S7系列PLC编程三菱/欧姆龙PLC应用触摸屏界面设计电气CAD制图工业现场总线技术自动化设备调试主要内容：PLC控制系统设计工业自动化方案规划电气原理图绘制控制程序编写与调试毕业论文指导毕业设计题目与程序设计✅具体问题可以
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S

Pytorch学习笔记——过拟合、欠拟合及其解决方案

过拟合、欠拟合及其解决方案

1、预备知识

1.1 模型选择

1.2 K折交叉验证

2、过拟合和欠拟合

2.1 概念

2.2 影响因素

A、模型复杂度

B、训练数据集大小

2.3 多项式函数拟合实验

3、过拟合解决方法

3.1 权重衰减

3.2 L2范数正则化

3.3 高维线性回归实验

A、L2范数正则化

从零实现

简洁实现

B、丢弃法

从零开始实现

简洁实现

你可能感兴趣的:(Pytorch学习笔记——过拟合、欠拟合及其解决方案)