师大阿林

李宏毅深度学习【持续更新】

- pytorch快速入门
- - - csdn快速入门
    - OS包
    - PIL包
    - Opencv包
    - Dataset类
    - Tensorboard的使用
    - torchvision.transforms 的使用
    - torchvision中数据集的使用
    - DataLoader的使用(torch.utils.data)
    - 神经网络的搭建nn.Module
深度学习李宏毅
- Chatgpt
- - 1 研究方向
  - 2 Chatgpt学习的步骤
  - 3 Fine tune vs. Prompt
  - - 期待一｜成为专才，加外挂 or fine tune or Adapter
    - 期待二｜成为通才
    - chain of thought （COT ）Promptting
[一、 Regression回归](https://youtu.be/fegAeph9UaA)
- Overfitting and Regularization
- - 误差error是哪里来的？——寻找调整方法
  - 注意不要这样做！——数据集的划分
- Gradient Descent
- - 1. learning rate 的调整
  - 2 SGD 随机梯度下降（Stochastic Gradient Descent
  - 3 Feature Scaling 特征缩放
  - 4 数学原理
  - 5 GD的一些限制limitation
二、Classification 分类
- 2.1 生成式模型(generative *model*)
- - 2.1.1协方差矩阵（Covariance Matrix）
- 2.2 逻辑回归判别式模型(*discriminative* model)
- - 2.2.1 function set
  - 2.2.2 Goodness of function 好坏
  - 2.2.3 find the best function 寻找参数
- 2.3 辨别模型VS生成模型
- 2.4 Multi-class Classification
- 2.5Limitation of Logistic Regression
- - 2.5.1 f eature transformation
三、DL 深度学习简介
- 3.1 DL的步骤
- - 3.1.1 Fully Connected Feedforward Network 全连接前向传播神经网络、前馈神经网络
  - 3.1.2 定义一个function goodness 好坏— cross entropy 交叉熵
- 3.2 Backpropagation 反向传播
- - 3.2.1 Chain Rule 链式求导
  - 3.2.2 BP过程推导
- 3.3 机器学习任务攻略
- - 3.3.1 在training data 上loss 过大？过小？
  - 3.3.2 N-fold Cross Validation
- 3.4 神经网络训练不起来怎么办？
- - 3.4.1 local minima 局部最小值和 saddle point 鞍点
  - 3.4.2 批次batch

pytorch快速入门

csdn快速入门

https://blog.csdn.net/PolarisRisingWar/article/details/116069338

工具箱dir() 、help() 或者类名??、 ipython交互式操作
pycharm 的好处就是可以看到实时变量的值

OS包

os.path.join() 拼接路径
os.listdir( ) 返回目录下的文件列表

PIL包

from PIL import Image 导入
Image.open(path) 读取图片，读出的图片类型是JepgImageFile类型
img.show() 显示

Opencv包

import cv2
cv2.imread（） 读出的图片类型是numpy

Dataset类

自定义的data类要继承Dataset类

self相当于一个全局变量，以便类中每个函数共享使用，否则就不需要写

eg 数据集url蚂蚁蜜蜂分类数据集和下载连接https://download.pytorch.org/tutorial/hymenoptera_data.zip

from torch.utils.data import Dataset
from PIL import Image
import os
class MyData(Dataset):
    def __init__(self,root_dir,label_dir):
        self.root_dir = root_dir
        self.label_dir = label_dir
        self.path = os.path.join(self.root_dir,self.label_dir)
        self.img_path=os.listdir(self.path)

        
#img_path='/Users/fanzhilin/Downloads/hymenoptera_data/train/ants/0013035.jpg'
    def __getitem__(self,idx):
        img_name = self.img_path[idx]
        img_item_path = os.path.join(self.root_dir,self.label_dir,img_name)
        img =Image.open(img_item_path)
        label = self.label_dir
        return img,label
    
    def __len__(self):
        return len(self.img_path)
    

ants_dataset =MyData('/Users/fanzhilin/Downloads/hymenoptera_data/train','ants')
print(len(ants_dataset))#ants训练集长度

Tensorboard的使用

需要先转换成tensor类型才能显示

add_scalar()

eg 画出y=2x图

from torch.utils.tensorboard import SummaryWriter

writer = SummaryWriter("logs")# 放在当前目录logs目录，可以自己改名字


# 画出 y =2x 
for i in range(100):
   writer.add_scalar("y=2x",2*i,i) 

writer.close()

打开logs文件，在终端运行 tensorboard --logdir=logs ，也可以指定端口–port 6007, 便可以通过网页访问

add_image()、add_images()一次添加多个图片

查看def，需要传入 (torch.Tensor, numpy.array, or string/blobname)类型的y轴数据，需要把图片类型转换一下，从PIL到numpy arrary，需要传入参数dataformats=‘HWC’ 指定每一维的含义

from torch.utils.tensorboard import SummaryWriter
import numpy as np
from PIL import Image

writer = SummaryWriter("logs")
img_path="/Users/fanzhilin/Downloads/hymenoptera_data/train/ants/0013035.jpg"
img_PIL =Image.open(img_path)
img_arrary = np.array(img_PIL)
print(img_arrary.shape)
writer.add_image("ant",img_arrary,1,dataformats='HWC')#从PIL到numpy arrary，需要传入参数dataformats='HWC' 指定每一维的含义

# 画出 y =2x 
for i in range(100):
   writer.add_scalar("y=2x",2*i,i) 
 
writer.close()

torchvision.transforms 的使用

就是一个工具箱

使用注意点⚠️

ToTensor类，为什么需要转换？包含了一些dl的参数
Normalize类，归一化
Resize类

transforms.Resize(x)等比例缩放，将图片短边缩放至size，长宽比保持不变，i.e，如果高度>宽度，则图像将被重新缩放为（size*高度/宽度，size）将图片短边缩放至x，长宽比保持不变 transforms.Resize(x)
Compose 就是将函数进行组合，需要提供一个转换的列表，相对应合并执行

RandomCrop 随机裁剪，用于数据增强

from torchvision import transforms
from PIL import Image
from torch.utils.tensorboard import SummaryWriter
img_path="/Users/fanzhilin/Downloads/hymenoptera_data/train/ants/0013035.jpg"
img=Image.open(img_path)
writer=SummaryWriter("logs")

#ToTensor
trans_tensor = transforms.ToTensor()# 创建对象
img_tensor=trans_tensor(img)#变为tensor
writer.add_image("Totensor",img_tensor,0 )

#Normalize
print(img_tensor[0][0][0])
trans_norm = transforms.Normalize([0.5,0.5,0.5],[2,1,1])
img_norm=trans_norm(img_tensor)
print(img_norm[0][0][0])
writer.add_image("Normalize",img_norm,0 )


#Resize
print(img.size)
trans_resize=transforms.Resize((512,512))
img_resize = trans_resize(img)#PIL 类型
img_resize=trans_tensor(img_resize)#想要在tensorboard显示需要变成tensor类型
writer.add_image("Resize",img_resize,0)
print(img_resize.size())


# Compose resize 结合
trans_resize2 = transforms.Resize(512)
trans_compose = transforms.Compose([trans_resize2,trans_tensor])
img_resize2 = trans_compose(img)
writer.add_image("Resize",img_resize2,1)

#RandomCrop
trans_random=transforms.RandomCrop(400) #(h,w)传入也可以
trans_compose2= transforms.Compose([trans_random,trans_tensor])
for i in range(10):#随机裁剪10个
    img_crop = trans_compose2(img)
    writer.add_image("RandomCrop",img_crop,i)

writer.close()

torchvision中数据集的使用

datasets

官网数据集https://pytorch.org/vision/stable/datasets.html

可以吧url拷贝，用迅雷下载

import torchvision 

dataset_trans=torchvision.transforms.Compose(
    [torchvision.transforms.ToTensor()]
)#把数据集每一个全变成tensor，方便使用tensorboard显示
train_set = torchvision.datasets.CIFAR10(root='./dataset',train=True,transform=dataset_trans,download=True)
test_set = torchvision.datasets.CIFAR10(root='./dataset',train=False,transform=dataset_trans,download=True)
#如果root没有目录会自动建立，建议设置download=true，如果没有回下载到本地，并且会自动解压
print(train_set[0])#第一条
print(train_set.classes)#label

img,traget=train_set[0]#打印查看格式，前一个是img，后一个是label
print(img)
print(traget)
print(test_set.classes[traget])
img.show()

DataLoader的使用(torch.utils.data)

类似抽牌

import torchvision 
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter
test_data = torchvision.datasets.CIFAR10(root='./dataset',train=False,transform=torchvision.transforms.ToTensor())

test_loader  = DataLoader(dataset=test_data,batch_size=4,shuffle=True,num_workers=0,drop_last=False)
#batch_size = 4  从dataset取4个数据，打包返回
#shuffle = True 每次抽取都是随机的
#drop_last=False,最后一次取如果不够取不舍去
img,target = test_data[0]
print(img.shape)
print(target)


writer = SummaryWriter("dataloader")

for epoch in range(2):
    step=0
    for data in  test_loader:
        imgs,targets = data
        # print(imgs.shape)#打包返回的数据torch.Size([4, 3, 32, 32]) 4数据 3通道rgb h w
        # print(targets)#tensor([5, 9, 2, 4]) 是label 
        writer.add_images("Epoch :{}".format(epoch),imgs,step)
        step=step+1

writer.close()

神经网络的搭建nn.Module

Eg 简单的nn

from torch import nn
import torch.nn.functional as F
import torch
class Model(nn.Module):
    def __init__(self):
        super().__init__()
#nn.module内的call方法里调用了forward,通过打断点也可以知道！
    def forward(self,input):
        return input+1
    

nn1=Model()
x= torch.tensor(1)
print(nn1(x))

卷积操作

深度学习李宏毅

2022太乱了，去youtube看2020了，妈的没弹幕看着难受

http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML20.html

python 多环境管理pyenv

https://github.com/pyenv/pyenv

https://zhuanlan.zhihu.com/p/36402791

Chatgpt

1 研究方向

1如何精准提出需求

如何调教

2 如何更正错误

chatgpt的预训练资料只有2021年9月之前的
如何让机器修改一个错误而不弄错别的地方？——Neural editing

3 判断是否ai生成的物件

4是否会泄漏隐私

但是可以绕着弯问他，当问到一定特定问题，让机器忘记Machine Unlearning

2 Chatgpt学习的步骤

由InstructGPT 推测

1学习文字接龙，学到的是几率分布，然后随机抽取一个词出来。但实际每次输出的结果都不同

GPT在网络上大量搜集网络数据，不需要人介入
2人类来引导接龙的方向，并提供正确答案，
3模仿人类的喜欢
4用增强式学习强化学习学习 reward

3 Fine tune vs. Prompt

两个方向：成为通才或专才

所有自然语言处理的问题都是问答QA的问题

https://arxiv.org/abs/1806.08730
让chatgpt自己说说如何针对特定任务产生prompt

期待一｜成为专才，加外挂 or fine tune or Adapter

BERT，类似文字填空的模型

对预训练模型进行改造

加外挂Head
微调参数 fine tune

…

微调Adapter 的参数（ efficient finetune）

语言模型本身不动，只finetune微调adapter参数

期待二｜成为通才

in-context learning 范例学习

可能范例学习只对大型模型有明显效果

题目叙述学习Instruct learning、 instruction tuning

T0模型
FLAN paper

chain of thought （COT ）Promptting

在给机器范例同时，顺便给出推论过程，给出答案
zero - shot COT 甚至直接可以一句话：Lets think step by step

有的时候人也不知道解答的过程是什么
Self—consistency 解决每次结果都不一样
Leat - to - most promptting

把复杂的问题拆解，把难的问题简化，看到数学问题，让机器做in context learing

让机器找prompt

soft prompt 我们给机器的prompt 是向量，可以train，类似于adapter
用reinforcement learning
直接用大型LM 去自己找prompt

把输入输出给他，让LM去给出prompt ，自己催眠自己‍

一、 Regression回归

Overfitting and Regularization

loss function 加上正则化项，不需要考虑bias b的大小

我们要找一个比较平滑的f，而调整b的大小与f的平滑没关系，只是上下移动
lamda越大，train 损失越大，在test 可能越小

lamda越大，说明越偏向考虑w本来的数值，而减少考虑error；

我们喜欢较为smooth的function，但不能太平滑
正则化在loss func再加上一个item，会希望你的参数越小越好，希望曲线越平滑越好，w权重代表希望有多平滑

误差error是哪里来的？——寻找调整方法

来源于一个bias 一个variance

类似于射击，f*是预估的func 、f bar— 是期望、 f hat 是真实值

跟据bias和varience大小关系，有underfitting 、overfitting，

如果undercutting ，则bias大
- 添加更多的feature
- 设计更复杂的model
如果overfitting，则variance大
- 收集更多的data、数据增强
- 正则化Regularization

注意不要这样做！——数据集的划分

真正的测试数据集是没见过的，你在test set的loss不能真实反映

引入validation验证集，解决方法如下

Cross Validation

N-fold Cross Validation

Gradient Descent

复习

1. learning rate 的调整

1 普通的调整方法

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-V3ibQGTU-1680872290781)(/Users/fanzhilin/Library/Application Support/typora-user-images/image-20230328164435356.png)]

一个learning rate ，越来越小，才能收敛
2 Adagrad —adaptive learning rate

不同参数的learning rate不一样

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-i3qu9gz4-1680872290781)(/Users/fanzhilin/Library/Application Support/typora-user-images/image-20230328180147015.png)]

每一个参数都有一个learning rate
- $\eta$ 是学习率，是constant 常量
- g 是偏微分的值，是gradient 梯度斜率
- $\sigma$ 是w过去所有偏微分值的均方根（先取平均值，然后开根号 root mean square）
- t 代表第t次更新
  
  [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Vo8sJ7Vv-1680872290782)(/Users/fanzhilin/Library/Application Support/typora-user-images/image-20230401201113476.png)]
- 简化adagrad
  
  [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-o00TpdKc-1680872290782)(/Users/fanzhilin/Library/Application Support/typora-user-images/image-20230401201227539.png)]
  
  解释为什么要除以g？应该是g越大step要越大，应该是成正比啊？
  
  [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-eTI1S6t4-1680872290782)(/Users/fanzhilin/Library/Application Support/typora-user-images/image-20230401201601336.png)]
  
  直观解释，除是为了看看反差有多大
  
  [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lb7r6niD-1680872290782)(/Users/fanzhilin/Library/Application Support/typora-user-images/image-20230401201538408.png)]
  
  详细解释：
  
  [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3jnD3Xdy-1680872290782)(/Users/fanzhilin/Library/Application Support/typora-user-images/image-20230401230936384.png)]

2 SGD 随机梯度下降（Stochastic Gradient Descent

随机梯度下降（Stochastic Gradient Descent，SGD）是一种优化算法，用于训练机器学习模型。与传统的梯度下降算法不同，SGD在每次更新模型参数时，只使用一小部分随机样本来计算梯度，而不是使用所有训练样本。这使得SGD比传统梯度下降更快速地收敛，特别是在大规模数据集上。

具体地说，SGD的算法流程如下：

从训练数据中随机选择一小批样本（通常称为minibatch）；
计算这个minibatch中样本的梯度；
使用梯度来更新模型参数；
重复1-3步骤，直到满足停止条件（例如达到最大迭代次数或梯度变化很小）。

SGD通常具有更好的泛化性能，因为在每次迭代中，它都会使用不同的训练样本进行更新。此外，SGD通常可以处理更大的数据集，因为它不需要在每次迭代中使用所有的训练数据。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xJOP8Pfv-1680872290782)(/Users/fanzhilin/Library/Application Support/typora-user-images/image-20230401231714549.png)]

3 Feature Scaling 特征缩放

让不同的feature 的scale 一样

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9browA1K-1680872290782)(/Users/fanzhilin/Library/Application Support/typora-user-images/image-20230401231914179.png)]

为什么要这样做？

w1对y的影响比较小，对loss影响小，有比较小的微分，w1方向比较平滑！！

GD时没有向着圆心，效率不高

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-bN1uHpwL-1680872290782)(/Users/fanzhilin/Library/Application Support/typora-user-images/image-20230401232239402.png)]
如何做feature scaling

涉及到均值和方差

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-EszppKNz-1680872290782)(/Users/fanzhilin/Library/Application Support/typora-user-images/image-20230401232356938.png)]有两种常见的特征缩放方法：

归一化（Normalization）：归一化通常是将特征值调整到 [0, 1] 范围内。公式如下：

x_normalized = (x - min(x)) / (max(x) - min(x))

其中 x 是待归一化的特征值，min(x) 和 max(x) 分别表示特征值的最小值和最大值。
标准化（Standardization）：标准化是将特征值调整为均值为 0，标准差为 1 的分布。这样处理后的特征值服从标准正态分布。公式如下：

x_standardized = (x - mean(x)) / std(x)

其中 x 是待标准化的特征值，mean(x) 表示特征值的平均值，std(x) 表示特征值的标准差。

4 数学原理

https://www.youtube.com/watch?v=yKKNr-QKz2Q 50分处

5 GD的一些限制limitation

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tVmqOigs-1680872290783)(/Users/fanzhilin/Library/Application Support/typora-user-images/image-20230401234026897.png)]

二、Classification 分类

2.1 生成式模型(generative model)

https://www.bilibili.com/video/BV1Wv411h7kN?p=16&spm_id_from=pageDriver&vd_source=1fef0ac13db9fd03e4b2ae788361b5c4 神奇宝贝预测

高斯分布

朴素贝叶斯法（Naive Bayes model）

2.1.1协方差矩阵（Covariance Matrix）

协方差矩阵（Covariance Matrix），用于描述多个随机变量之间的协方差关系。协方差是一个衡量两个随机变量线性相关程度和它们各自变化程度的指标。具体来说，如果两个变量的协方差为正值，说明它们随着各自的增加而同增或同减；如果协方差为负值，则表示一个变量的增加对应另一个变量的减小，反之亦然；如果协方差接近于零，说明两个变量之间没有显著的线性关系。

对于 n 个随机变量（X₁，X₂，…，Xₙ），它们的协方差矩阵是一个 n×n 的矩阵，其中第 i 行第 j 列的元素表示随机变量 Xᵢ 和 Xⱼ 之间的协方差，记作 Cov(Xᵢ, Xⱼ)。协方差矩阵可以表示为：


Cov(X) = [Cov(X₁, X₁)  Cov(X₁, X₂) ... Cov(X₁, Xₙ)]
         [Cov(X₂, X₁)  Cov(X₂, X₂) ... Cov(X₂, Xₙ)]
         [   ...          ...     ...    ...    ]
         [Cov(Xₙ, X₁)  Cov(Xₙ, X₂) ... Cov(Xₙ, Xₙ)]

协方差矩阵的对角线上的元素表示每个随机变量的方差（即该变量与自身的协方差），而其他元素表示不同随机变量之间的协方差。协方差矩阵是对称的，即 Cov(Xᵢ, Xⱼ) = Cov(Xⱼ, Xᵢ)。

在多元统计分析、信号处理、金融风险管理等领域，协方差矩阵常用于分析多个随机变量之间的线性关系。此外，在机器学习和数据挖掘中，协方差矩阵也用于特征选择、降维（如主成分分析，PCA）和判别分析等任务。

2.2 逻辑回归判别式模型(discriminative model)

2.2.1 function set

前面讲了概率问题，简化直接找wb

posterior probability：后验概率

逻辑回归其实就是一种神经网络

2.2.2 Goodness of function 好坏

最大似然估计MLE 找到一组w b 以最大化Lwb 即机率

注意这里的L不是损失函数而是似然函数，是让这个training data 在现有概率下找到一组参数，最能拟合这种现有情况

做一个数学转换，找最大转为找最小，让计算容易
二分类交叉熵你Cross entropy

代表的是这两个distribution 有多接近
总结对比

为什么逻辑回归的损失函数不用均方误差MSE?

——左边的推导基础是最大似然函数，而最大似然函数最大化的对象就是概率的乘积，为什么是乘积呢？多个独立事件同时发生的概率就是乘积。所以，左边的loss function求最大值的基础是最大似然函数的求解

从loss图像理解

用cross entropy 可以让train更顺，更新参数更快些，因为离目标远的话微分大、跨的步子也大

2.2.3 find the best function 寻找参数

很奇妙，更新参数的式子与线性回归是一样的

总结：

只不过逻辑回归的 $\hat{y}$ 是1 或者0

2.3 辨别模型VS生成模型

logistic=discriminative，gaussian=generative，逻辑回归是特殊的Gaussian

判别式模型和生成式模型，一个根据与目标函数的损失函数来直接找最合适的w和b，一个根据w和b的生成方式先计算相关参数间接的计算出合适的w和b
虽然是来自同一个function set ，两种模型找到的不是同一组wb

右侧等于直接给定了一个从概率上考量的最佳的w，b。而左侧是随便给你个w，b初值，然后用梯度下降找最优解
discriminative model 的performance 一般会更好一些，但不一定所有情况

解释：

比如朴素贝叶斯naive bayes，他会先脑补

逻辑回归可直接建模预测P(c|x), 概率模型先假定满足某种分布，然后建模，用先验概率（prior probability）求其后验概率

=》可以理解为，逻辑回归自动学习特征之间的关系。概率模型假定特征之间符合某种关系

生成式模型基于假设分布不断修正，在data少的时候performance好一些

2.4 Multi-class Classification

归一化函数softmax =》max指的是对最大值进行强化！

多分类流程总结如下：

交叉熵：用于计算两个模型之间的相似度，完全相同的熵为0

$\hat{y}$ ：这样编码的好处就不像123 这样有距离远近问题

2.5Limitation of Logistic Regression

有的时候逻辑回归有限制

因为逻辑回归在二分类问题找的是一个直线的boundary，

2.5.1 f eature transformation

解决方法：

1 feature transformation特征转换

但我们人工不好去做这件，能不能自动做？

2 .cascading logistics regression models 级联逻辑回归模型

eg 3个逻辑回归接在一起，可以模拟边界

这就是引入神经网络了，多层感知器。svm就是利用核技巧。两种方式都可以解决这个问题

三、DL 深度学习简介

3.1 DL的步骤

3.1.1 Fully Connected Feedforward Network 全连接前向传播神经网络、前馈神经网络

一个神经元就可以看做一个function

如果没有固定的参数叫做function set ，就是我们要找的

当每一层有好多神经元时候
整个神经网络的运算过程—矩阵运算

矩阵运算可以用GPU运算加速

hidden 层对feature进行了提取，最后经过softmax:归一化函数输出分类结果

3.1.2 定义一个function goodness 好坏— cross entropy 交叉熵

对于手写1 -10 识别

我们去计算 $y$ 和 $\hat{y}$ 的cross entropy $C^n$ ，调整网络参数，让total loss最小

这是一个居中的独立公式：
$E = mc^2$
用GD 梯度下降找参数

下面的 $\mu$ 是学习率

如何算微分？因为参数很多，利用toolkit 如pytorch ——backpropagation 是一种有效的方式

为什么要用deep neural network？

3.2 Backpropagation 反向传播

为什么需要bp？

方便计算神经网络参数的微分

3.2.1 Chain Rule 链式求导

3.2.2 BP过程推导

对于total loss 我们只要算出一笔data的C对w微分，然后sum 起来就行全部的

我们先分析一个神经元的情况，对w求偏微分，b同理，根据chain rule

先看第一部分forward pass ：z对w求偏导，得出的值就是上一个神经元的输出的值，秒算

第二部分backward pass ：

C是cost 总的代价函数、 $\sigma$ 是activation function 激活函数

假设上面？已经算出来，可以写作

想象一下，有这样一个类似于神经元的东西

如何计算这两项？
- 如果后面紧接着就是输出层显然好算
- 如果后面还有很多层，继续往后走，得算出后面的才能知道当前的
为了有效率，我们从后往前算，先把后面的算出来
Bp总结

3.3 机器学习任务攻略

3.3.1 在training data 上loss 过大？过小？

Genral Guide

在training 上loss 大

不一定是overfitting啊！

model bias：指的是一层神经网络上的神经元个数不够，不能拟合出适合的函数。

training loss 大，判断到底是model bias 还是optimization 的问题？

下面一些情况是Optimization 的问题
在training data的 loss 小

在testing data loss大，是过拟合overfiting，机器并没有学到真正的function

如何解决overfitting？
- 1. 搜集更多资料，但是不建议
  2. data augmentation 数据增强
  3. constrained model 限制模型、更少神经元、共享参数、半失活神经元来减少过拟合
  4. 正则化 regularization
  5. 更少的feature
  6. dropout

3.3.2 N-fold Cross Validation

在做HW时，遵循下面的方法，引入验证集

测试集参与参数选择，导致结果有偏，不具有参考价值。所以引入验证集。

不要根据测试集调模型，永远不要让测试集参与模型训练，不然会overfit到testing set上，不用管public testing set 结果，用validation set 上loss最小的model就行

Nfold Cross Validation N折交叉验证

交叉验证是为了降低验证集随机取的，正好是都不够靠近描述函数的值的可能性

3.4 神经网络训练不起来怎么办？

3.4.1 local minima 局部最小值和 saddle point 鞍点

training loss 不下降的原因
梯度为0只能说明是critical point！如何判断是哪一种情况？

泰勒展开式逼近

H海塞矩阵 hessian Hij 代表 $\theta~i$ 对L做微分 , $\theta~j$ 对L做微分 ,做两次微分就可以得到

如何判断到底是哪种？

我们只要算出H矩阵，看他的eigen value 特征值情况

矩阵的特征值 $\lambda$ 的正负！
例子
遇到了鞍点，不要害怕！

一种解决方法：H告诉了我们参数更新的方向，找到负的特征值对应的一个特征向量u，来更新theta，就可以让loss变小

例子：

但是的确实不用看，计算量实在是太大
一般我们训练都是卡在了saddlepoint

下面的例子说明最终在loss不动了时候，特征值也不是全是正的

3.4.2 批次batch

什么是batch、epoch
为什么要用batch
1. 从技能冷却角度想象
  
  大大batch并不一定慢，GPU有并行运算

你可能感兴趣的:(python,深度学习)

空间曲线正交投影及其距离计算的理论与实践老歌老听老掉牙 python 正交投影
引言：正交投影的几何本质在三维空间中，正交投影是一种基础而重要的几何变换，它将空间中的点沿特定方向映射到一个平面上。当我们考虑将空间曲线投影到由给定法向量n\mathbf{n}n定义的平面时，这一问题在计算机图形学、CAD/CAM系统和科学计算中具有广泛应用。本文将从数学原理、Python实现到距离计算的等价性问题，全面探讨这一几何操作的深层内涵。设空间曲线由参数方程r(t)=(x(t),y(t)
pip是如何卸载你安装的第三方库的酷python python python
使用pipuninstall命令可以卸载掉你所安装的第三方库，所有与其相关的文件都将被pip整理出来展示并询问是否真的要删除，类似下面的提示pipuninstallnoxFoundexistinginstallation:nox2020.8.22Uninstallingnox-2020.8.22:Wouldremove:d:\python\lib\site-packages\nox-2020.8.
深度学习-常用环境配置瑶山 AI linux 人工智能 windows CUDA PyTorch
目录Miniconda安装安装NVIDIA显卡驱动安装CUDA和cnDNNCUDAcuDNNPyTorch安装手动下载测试Miniconda安装最新版Miniconda搭建Python环境_miniconda创建python虚拟环境-CSDN博客安装NVIDIA显卡驱动直接进NVIDIA官网：NVIDIAGeForce驱动程序-N卡驱动|NVIDIA在这里有GeForce驱动程序，立即下载，这是下
Nginx IP授权页面实现步骤
目标：一、创建白名单文件sudomkdir-p/usr/local/nginx/conf/whitelistsudotouch/usr/local/nginx/conf/whitelist/temporary.conf二、创建Python认证服务文件路径：/opt/script/auth_server.pyimportosimporttimefromflaskimportFlask,request
高阶知识库搭建实战五、（向量数据库Milvus安装）伯牙碎琴大模型数据库 milvus 大模型 AI
以下是关于在Windows环境下直接搭建Milvus向量数据库的教程：本教程分两部分，第一部分是基于docker安装，在Windows环境下直接安装Milvus向量数据库，目前官方推荐的方式是通过Docker进行部署，因为Milvus的运行环境依赖于Linux系统。如果你希望在Windows上直接运行Milvus，可以考虑使用MilvusLite版本，这是一个轻量级的Python库，适用于快速原型
python分布式事务_分布式事务系列（2.1）分布式事务的概念
#1系列目录#2X/OpenDTPDTP全称是DistributedTransactionProcess，即分布式事务模型。之前我们接触的事务都是针对单个数据库的操作，如果涉及多个数据库的操作，还想保证原子性，这就需要使用分布式事务了。而X/OpenDTP就是一种分布式事务处理模型。##2.1X/OpenDTP模型X/Open是一个组织，维基百科上这样说明：X/Open是1984年由多个公司联合创
LLM初识
从零到一：用Python和LLM构建你的专属本地知识库问答机器人摘要：随着大型语言模型（LLM）的兴起，构建智能问答系统变得前所未有的简单。本文将详细介绍如何使用Python，结合开源的LLM和向量数据库技术，一步步搭建一个基于你本地文档的知识库问答机器人。你将学习到从环境准备、文档加载、文本切分、向量化、索引构建到最终实现问答交互的完整流程。本文包含详细的流程图描述、代码片段思路和关键注意事项，
CCF-GESP 等级考试 2025年6月认证Python四级真题解析
1单选题（每题2分，共30分）第1题2025年4月19日在北京举行了一场颇为瞩目的人形机器人半程马拉松赛。比赛期间，跑动着的机器人会利用身上安装的多个传感器所反馈的数据来调整姿态、保持平衡等，那么这类传感器类似于计算机的()。A.处理器B.存储器C.输入设备D.输出设备解析：答案：C。所有传感器都用于采集数据，属于输入设备，故选C。第2题小杨购置的计算机使用一年后觉得内存不够用了，想购置一个容量更
推荐开源项目：Milvus Lite —— 轻量级向量数据库，助力AI应用快速起飞穆希静
推荐开源项目：MilvusLite——轻量级向量数据库，助力AI应用快速起飞项目介绍MilvusLite是知名开源向量数据库Milvus的轻量级版本，专为需要在小型环境中进行向量嵌入和相似性搜索的AI应用设计。通过将MilvusLite导入您的Python应用，您可以直接使用Milvus的核心向量搜索功能。MilvusLite已集成在PythonSDKofMilvus中，只需通过pipinstal
【华为419机考真题】服务器能耗统计，JAVA 题解梦想橡皮擦华为服务器 java 华为OD机试华为OD
最近更新的博客华为od2023|什么是华为od，od薪资待遇，od机试题清单华为OD机试真题大全，用Python解华为机试题|机试宝典【华为OD机试】全流程解析+经验分享,题型分享,防作弊指南华为od机试，独家整理已参加机试人员的实战技巧本篇题解：服务器耗能题目描述服务器有三种运行状态：空载，单任务，多任务，每个时间片的能耗的分别为111、333、444，每个任务由起始时间片和结束时间片定义运行时
python2.x里面的input（）和raw_input（）函数以及3.x中的input（）函数的区别 scuter_yu python python input函数 raw_input函数 3.x中的input函数
在python3.0及以上的版本中，raw_input（）函数已经和我们说再见了，但是呢，input（）函数则很好地替代了消失了的raw_input（）函数。而且现在的input（）函数所返回的值都是字符串，所以对于要有int，float等类型的数值必须进行强制的类型转换。下面让我对3.0的input（）函数做个小总结：>>>str=input("abc:")abc:15>>>str'15'(虽然
代码相关（python）一个月只能修改一次次代码 python
python程序崩溃提示符用python的时候的各个tips矩阵python判断某个矩阵是否满足要求python生成二维随机数文件/档python检查某个文件存不存在python添加有特定字段的文件到列表python矩阵保存为txt文档python按行读文档python写文档python文档操作字符串python用split来拆分字符串python搜索字符串某个字符的位置给字符串前/后添加字符画图
python 密码学模块_Python加密与解密 No module named 'Crypto' weixin_39827304 python 密码学模块
DES加密全称为DataEncryptionStandard，即数据加密标准，是一种使用密钥加密的块算法入口参数有三个：Key、Data、ModeKey为7个字节共56位，是DES算法的工作密钥；Data为8个字节64位，是要被加密或被解密的数据；Mode为DES的工作方式,有两种:加密或解密3DES(即TripleDES)是DES向AES过渡的加密算法使用两个密钥，执行三次DES算法加密的过程是
No module named "Crypto"，如何安装Python三方模块Crypto weixin_30342827 python 操作系统
前两天公司公司老总让我研究怎么用企业微信第三方应用进行官网对接，完成URL回调验证问题。具体如何进行Python的Django网站与企业微信第三方应用进行回调验证的博客地址为：https://www.cnblogs.com/ws17345067708/p/10522472.html这里讲讲，如何在win10下，安装一个非常坑爹的加密算法库，名字叫"Crypto"看了好多博客，没有一个管用的，要么就
Python 报错：ModuleNotFoundError: No module named ‘Crypto‘
Crypto报错解决方案Python报错：ModuleNotFoundError:Nomodulenamed'Crypto'前言问题解决方案Python报错：ModuleNotFoundError:Nomodulenamed‘Crypto’前言Crypto是一个加密模块，它包含了多种加密算法，如AES、DES、RSA等。它不是Python标准库的一部分，需要使用pip安装。pycrypto和Cry
【甲烷数据集】Sentinel-5P 卫星获取的全球甲烷数据集-TROPOMI L2 CH₄ WW、forever 数据集 sentinel
目录数据概述传感器&卫星信息监测目标：甲烷（CH₄）数据产品内容空间与时间覆盖云筛选与协同观测技术文档资源数据下载Python代码绘制CH4数据参考数据概述Sentinel-5PrecursorLevel2Methane(TROPOMIL2CH₄)数据集是由欧洲哥白尼计划的Sentinel-5P卫星获取的，用于监测大气中的甲烷浓度。数据集名称：Sentinel-5PrecursorLevel2Me
非对称加密算法（RSA、ECC、SM2）——密码学基础
对称加密算法（AES、ChaCha20和SM4）Python实现——密码学基础(Python出现Nomodulenamed“Crypto”解决方案)这篇的续篇，因此实践部分少些；文章目录一、非对称加密算法基础二、RSA算法2.1RSA原理与数学基础2.2RSA密钥长度与安全性2.3RSA实现工具与库2.4RSA的局限性三、椭圆曲线密码学(ECC)3.1ECC原理与数学基础3.2常用椭圆曲线标准3.
在NLP深层语义分析中，深度学习和机器学习的区别与联系
在自然语言处理（NLP）的深层语义分析任务中，深度学习与机器学习的区别和联系主要体现在以下方面：一、核心区别特征提取方式机器学习：依赖人工设计特征（如词频、句法规则、TF-IDF等），需要领域专家对文本进行结构化处理。例如，传统情感分析需人工定义“情感词库”或通过词性标注提取关键成分。深度学习：通过神经网络自动学习多层次特征。例如，BERT等模型可从原始文本中捕获词向量、句法关系甚至篇章级语义，无
JAVA 和Python对比 xiayu98020214 在深蓝的日子 python
JAVA和Python对比1.数据类型pythonInt，float，complexnumbers都没有定义到底占用多少个字节空间。都是没有取值范围，也没有无符号的情况。JAVAJAVA有基础数据类型，都有确定占多少个字节2.全局变量python类似c语言，可以定义全局变量，全局的函数。JAVAjava都要定义类才行。3.变量声明python无需声明类型，直接使用。会造成一个困扰，这个变量到底是新
牛客华为机试题解（python版更新中）
目录一、字符串（知识点）HJ1字符串最后一个单词的长度（简单）HJ2计算某字符出现次数（简单）HJ4字符串分隔（简单）HJ5进制转换（简单）HJ10字符个数统计（简单）HJ11数字颠倒（简单）HJ12字符串反转（简单）HJ14字符串排序（简单）HJ17坐标移动（中等）HJ18识别有效的IP地址和掩码并进行分类统计（较难）自己研究的题解，也有借鉴评论区牛人思路，答案不唯一，仅供学习参考，也欢迎大家指
python比java_对比java和python对比
对比java和python对比java和python2011年04月18日1.难易度而言。python远远简单于java。2.开发速度。Python远优于java3.运行速度。java远优于标准python，pypy和cython可以追赶java，但是两者都没有成熟到可以做项目的程度。4.可用资源。java一抓一大把，python很少很少，尤其是中文资源。5.稳定程度。python3和2不兼容，造
深度学习--利用梯度下降法进行多变量的二分类（感知机）白话学生nit 深度学习分类人工智能
其实这一节涉及到了感知机的相关知识，就把这一节当作是学习感知机的引子吧。什么是二分类我们先来说一下什么是二分类，二分类指的是将结果分为两个互斥的类别，通常用来表示问题的两种可能。为什么用感知机学习二分类常见的解决问题的模型有很多，这里我们使用感知机模型。至于为什么，因为感知机模型很多地方用起来比较简便，就拿我们这一节的问题举一下例子，我们需要依照房子的价格对房子进行分类。在感知机模型中，我们可以使
QuecPython-正则表达式移远通信正则表达式 python
该模块通过正则表达式匹配数据。目前支持的操作符较少，部分操作符暂不支持。示例：importureres='''$GNRMC,133648.00,A,3149.2969,N,11706.9027,E,0.055,,311020,,,A,V*18$GNGGA,133648.00,3149.2969,N,11706.9027,E,1,24,1.03,88.9,M,,M,,*6C$GNGLL,3149.2
华为牛客网python考试题库及答案 2401_86114846 服务器
亲爱的朋友们，今天我们要讨论，牛客网华为软件测试题库牛客网华为机试题答案，让我们开始吧！目录一、字符串（知识点）HJ1字符串最后一个单词的长度（简单）HJ2计算某字符出现次数（简单）HJ4字符串分隔（简单）HJ5进制转换（简单）HJ10字符个数统计（简单）HJ11数字颠倒（简单）HJ12字符串反转（简单）HJ14字符串排序（简单）HJ17坐标移动（中等）HJ18识别有效的IP地址和掩码并进行分类统
【Python】LEGB作用域 + re模块 + 正则表达式
文章目录一LEGB作用域二re（RegularExpression）预览1.`re.match()`——从字符串开头匹配2.`re.search()`——搜索整个字符串3.`re.findall()`——返回所有匹配的字符串列表4.`re.finditer()`——返回所有匹配的迭代器5.`re.sub()`——替换匹配的字符串6.`re.split()`——按正则表达式分割字符串7.`re.co
java和ptyhon对比悟能不能悟 java 开发语言
1.语言特性对比维度JavaPython语法风格静态类型，需显式声明变量类型；代码冗长（需分号、大括号）动态类型，变量类型自动推断；简洁（缩进代替大括号，无分号）编程范式严格面向对象（OOP），强制类与对象结构多范式支持（OOP、函数式、命令式），更灵活执行方式编译型（JVM运行字节码）解释型（逐行执行）⚡2.性能与效率执行速度：Java：编译优化后运行效率高，尤其擅长高并发（如电商秒杀系统）。P
数字图像处理与Python语言实现-Box模糊CUDA实现视觉与物联智能数字图像处理与Python实现 python 深度学习计算机视觉图像处理 CUDA
Box模糊CUDA实现文章目录Box模糊CUDA实现1、Box模糊的基本原理2、算法优化：滑动窗口技术3、参数对模糊效果的影响4、Box模糊的优缺点5、与高斯模糊的对比6、实际应用场景7、算法实现7.1PyCUDA实现7.2CuPy实现7.3C++与CUDA实现8、总结在图像处理领域，**Box模糊（方框模糊或均值模糊）**是一种基础且高效的模糊算法，其核心思想是通过对像素邻域内的颜色值取平均值来
关于Python3绕过指纹识别解决ja3指纹的案例水兵没月 python
注意！！！！某XX网站实例仅作为学习案例，禁止其他个人以及团体做谋利用途！！！场景Python采集某网址页面内容aHR0cHM6Ly9jcmVkaXRiai5qeGouYmVpamluZy5nb3YuY24vY3JlZGl0LXBvcnRhbC9jcmVkaXRfc2VydmljZS9wdWJsaWNpdHkvcmVjb3JkL2JsYWNr报错信息requests.exceptions.SSLE
网页返回title“Just a moment...“，python 绕过tls指纹的几种方式记录一下
第一种：使用tls_client第三方库进行绕过importtls_clientsession=tls_client.Session(ja3_string="771,4865-4866-4867-49195-49199-49196-49200-52393-52392-49171-49172-156-157-47-53,0-23-65281-10-11-35-16-5-13-18-51-45-43-
python如何抓取网页里面的文字_如何利用python抓取网页文字、图片内容？ weixin_39917437
想必新老python学习者，对爬虫这一概念并不陌生，在如今大数据时代，很多场景都需要利用爬虫去爬取数据，而这刚好时python领域，如何实现？怎么做？一起来看下吧~获取图片：1、当我们浏览这个网站时，会发现，每一个页面的URL都是以网站的域名+page+页数组成，这样我们就可以逐一的访问该网站的网页了。2、当我们看图片列表时中，把鼠标放到图片，右击检查，我们发现，图片的内容由ul包裹的li组成，箭
ios内付费 374016526 ios 内付费
近年来写了很多IOS的程序，内付费也用到不少，使用IOS的内付费实现起来比较麻烦，这里我写了一个简单的内付费包，希望对大家有帮助。具体使用如下: 这里的sender其实就是调用者，这里主要是为了回调使用。 [KuroStoreApi kuroStoreProductId:@"产品ID" storeSender:self storeFinishCallBa
20 款优秀的 Linux 终端仿真器 brotherlamp linux linux视频 linux资料 linux自学 linux教程
终端仿真器是一款用其它显示架构重现可视终端的计算机程序。换句话说就是终端仿真器能使哑终端看似像一台连接上了服务器的客户机。终端仿真器允许最终用户用文本用户界面和命令行来访问控制台和应用程序。（LCTT 译注：终端仿真器原意指对大型机-哑终端方式的模拟，不过在当今的 Linux 环境中，常指通过远程或本地方式连接的伪终端，俗称“终端”。）你能从开源世界中找到大量的终端仿真器，它们
Solr Deep Paging(solr 深分页) eksliang solr深分页 solr分页性能问题
转载请出自出处：http://eksliang.iteye.com/blog/2148370 作者：eksliang(ickes) blg:http://eksliang.iteye.com/ 概述长期以来，我们一直有一个深分页问题。如果直接跳到很靠后的页数，查询速度会比较慢。这是因为Solr的需要为查询从开始遍历所有数据。直到Solr的4.7这个问题一直没有一个很好的解决方案。直到solr
数据库面试题 18289753290 面试题数据库
1.union ,union all 网络搜索出的最佳答案： union和union all的区别是,union会自动压缩多个结果集合中的重复结果，而union all则将所有的结果全部显示出来，不管是不是重复。 Union：对两个结果集进行并集操作，不包括重复行，同时进行默认规则的排序； Union All：对两个结果集进行并集操作，包括重复行，不进行排序； 2.索引有哪些分类？作用是
Android TV屏幕适配酷的飞上天空 android
先说下现在市面上TV分辨率的大概情况两种分辨率为主 1.720标清，分辨率为1280x720. 屏幕尺寸以32寸为主，部分电视为42寸 2.1080p全高清，分辨率为1920x1080 屏幕尺寸以42寸为主，此分辨率电视屏幕从32寸到50寸都有适配遇到问题，已1080p尺寸为例：分辨率固定不变，屏幕尺寸变化较大。如：效果图尺寸为1920x1080，如果使用d
Timer定时器与ActionListener联合应用永夜-极光 java
功能:在控制台每秒输出一次代码: package Main; import javax.swing.Timer; import java.awt.event.*; public class T { private static int count = 0; public static void main(String[] args){
Ubuntu14.04系统Tab键不能自动补全问题解决随便小屋 Ubuntu 14.04
Unbuntu 14.4安装之后就在终端中使用Tab键不能自动补全，解决办法如下： 1、利用vi编辑器打开/etc/bash.bashrc文件（需要root权限） sudo vi /etc/bash.bashrc 接下来会提示输入密码 2、找到文件中的下列代码 #enable bash completion in interactive shells #if
学会人际关系三招轻松走职场 aijuans 职场
要想成功，仅有专业能力是不够的，处理好与老板、同事及下属的人际关系也是门大学问。如何才能在职场如鱼得水、游刃有余呢？在此，教您简单实用的三个窍门。　　第一，多汇报最近，管理学又提出了一个新名词“追随力”。它告诉我们，做下属最关键的就是要多请示汇报，让上司随时了解你的工作进度，有了新想法也要及时建议。不知不觉，你就有了“追随力”，上司会越来越了解和信任你。　　第二，勤沟通团队的力
《O2O：移动互联网时代的商业革命》读书笔记 aoyouzi 读书笔记
移动互联网的未来：碎片化内容+碎片化渠道=各式精准、互动的新型社会化营销。 O2O：Online to OffLine 线上线下活动 O2O就是在移动互联网时代，生活消费领域通过线上和线下互动的一种新型商业模式。手机二维码本质：O2O商务行为从线下现实世界到线上虚拟世界的入口。线上虚拟世界创造的本意是打破信息鸿沟，让不同地域、不同需求的人
js实现图片随鼠标滚动的效果百合不是茶 JavaScript 滚动属性的获取图片滚动属性获取页面加载
1,获取样式属性值 top 与顶部的距离 left 与左边的距离 right 与右边的距离 bottom 与下边的距离 zIndex 层叠层次例子:获取左边的宽度,当css写在body标签中时 <div id="adver" style="position:absolute;top:50px;left:1000p
ajax同步异步参数async bijian1013 jquery Ajax async
开发项目开发过程中，需要将ajax的返回值赋到全局变量中，然后在该页面其他地方引用，因为ajax异步的原因一直无法成功，需将async:false，使其变成同步的。格式： $.ajax({ type: 'POST', ur
Webx3框架（1） Bill_chen eclipse spring maven 框架 ibatis
Webx是淘宝开发的一套Web开发框架，Webx3是其第三个升级版本；采用Eclipse的开发环境，现在支持java开发；采用turbine原型的MVC框架，扩展了Spring容器，利用Maven进行项目的构建管理，灵活的ibatis持久层支持，总的来说，还是一套很不错的Web框架。 Webx3遵循turbine风格，velocity的模板被分为layout/screen/control三部
【MongoDB学习笔记五】MongoDB概述 bit1129 mongodb
MongoDB是面向文档的NoSQL数据库，尽量业界还对MongoDB存在一些质疑的声音，比如性能尤其是查询性能、数据一致性的支持没有想象的那么好，但是MongoDB用户群确实已经够多。MongoDB的亮点不在于它的性能，而是它处理非结构化数据的能力以及内置对分布式的支持(复制、分片达到的高可用、高可伸缩)，同时它提供的近似于SQL的查询能力，也是在做NoSQL技术选型时，考虑的一个重要因素。Mo
spring/hibernate/struts2常见异常总结白糖_ Hibernate
Spring ①ClassNotFoundException: org.aspectj.weaver.reflect.ReflectionWorld$ReflectionWorldException 缺少aspectjweaver.jar，该jar包常用于spring aop中 ②java.lang.ClassNotFoundException: org.sprin
jquery easyui表单重置(reset)扩展思路 bozch form jquery easyui reset
在jquery easyui表单中尚未提供表单重置的功能，这就需要自己对其进行扩展。扩展的时候要考虑的控件有： combo,combobox,combogrid,combotree,datebox,datetimebox 需要对其添加reset方法，reset方法就是把初始化的值赋值给当前的组件，这就需要在组件的初始化时将值保存下来。在所有的reset方法添加完毕之后，就需要对fo
编程之美-烙饼排序 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; /* *《编程之美》的思路是：搜索+剪枝。有点像是写下棋程序：当前情况下，把所有可能的下一步都做一遍；在这每一遍操作里面，计算出如果按这一步走的话，能不能赢（得出最优结果）。 *《编程之美》上代码有很多错误，且每个变量的含义令人费解。因此我按我的理解写了以下代码： */
Struts1.X 源码分析之ActionForm赋值原理 chenbowen00 struts
struts1在处理请求参数之前，首先会根据配置文件action节点的name属性创建对应的ActionForm。如果配置了name属性，却找不到对应的ActionForm类也不会报错，只是不会处理本次请求的请求参数。如果找到了对应的ActionForm类，则先判断是否已经存在ActionForm的实例，如果不存在则创建实例，并将其存放在对应的作用域中。作用域由配置文件action节点的s
[空天防御与经济]在获得充足的外部资源之前,太空投资需有限度 comsci 资源
这里有一个常识性的问题: 地球的资源,人类的资金是有限的,而太空是无限的..... 就算全人类联合起来,要在太空中修建大型空间站,也不一定能够成功,因为资源和资金,技术有客观的限制.... &
ORACLE临时表—ON COMMIT PRESERVE ROWS daizj oracle 临时表
ORACLE临时表转临时表：像普通表一样，有结构，但是对数据的管理上不一样，临时表存储事务或会话的中间结果集，临时表中保存的数据只对当前会话可见，所有会话都看不到其他会话的数据，即使其他会话提交了，也看不到。临时表不存在并发行为，因为他们对于当前会话都是独立的。创建临时表时，ORACLE只创建了表的结构（在数据字典中定义），并没有初始化内存空间，当某一会话使用临时表时，ORALCE会
基于Nginx XSendfile+SpringMVC进行文件下载 denger 应用服务器 Web nginx 网络应用 lighttpd
在平常我们实现文件下载通常是通过普通 read-write方式，如下代码所示。 @RequestMapping("/courseware/{id}") public void download(@PathVariable("id") String courseID, HttpServletResp
scanf接受char类型的字符 dcj3sjt126com c
/* 2013年3月11日22:35:54 目的：学习char只接受一个字符 */ # include <stdio.h> int main(void) { int i; char ch; scanf("%d", &i); printf("i = %d\n", i); scanf("%
学编程的价值 dcj3sjt126com 编程
发一个人会编程, 想想以后可以教儿女, 是多么美好的事啊, 不管儿女将来从事什么样的职业, 教一教, 对他思维的开拓大有帮助像这位朋友学习: http://blog.sina.com.cn/s/articlelist_2584320772_0_1.html VirtualGS教程 (By @林泰前): 几十年的老程序员，资深的
二维数组（矩阵）对角线输出飞天奔月二维数组
今天在BBS里面看到这样的面试题目, 1，二维数组（N*N），沿对角线方向，从右上角打印到左下角如N=4： 4*4二维数组 { 1 2 3 4 } { 5 6 7 8 } { 9 10 11 12 } {13 14 15 16 } 打印顺序 4 3 8 2 7 12 1 6 11 16 5 10 15 9 14 13 要
Ehcache（08）——可阻塞的Cache——BlockingCache 234390216 并发 ehcache BlockingCache 阻塞
可阻塞的Cache—BlockingCache 在上一节我们提到了显示使用Ehcache锁的问题，其实我们还可以隐式的来使用Ehcache的锁，那就是通过BlockingCache。BlockingCache是Ehcache的一个封装类，可以让我们对Ehcache进行并发操作。其内部的锁机制是使用的net.
mysqldiff对数据库间进行差异比较 jackyrong mysqld
mysqldiff该工具是官方mysql-utilities工具集的一个脚本，可以用来对比不同数据库之间的表结构，或者同个数据库间的表结构如果在windows下，直接下载mysql-utilities安装就可以了，然后运行后，会跑到命令行下： 1）基本用法 mysqldiff --server1=admin:12345
spring data jpa 方法中可用的关键字 lawrence.li java spring
spring data jpa 支持以方法名进行查询/删除/统计。查询的关键字为find 删除的关键字为delete/remove (>=1.7.x) 统计的关键字为count (>=1.7.x) 修改需要使用@Modifying注解 @Modifying @Query("update User u set u.firstna
Spring的ModelAndView类 nicegege spring
项目中controller的方法跳转的到ModelAndView类，一直很好奇spring怎么实现的？ /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version 2.0 (the "License"); * yo
搭建 CentOS 6 服务器(13) - rsync、Amanda rensanning centos
（一）rsync Server端 # yum install rsync # vi /etc/xinetd.d/rsync service rsync { disable = no flags = IPv6 socket_type = stream wait
Learn Nodejs 02 toknowme nodejs
（1）npm是什么 npm is the package manager for node 官方网站：https://www.npmjs.com/ npm上有很多优秀的nodejs包，来解决常见的一些问题，比如用node-mysql，就可以方便通过nodejs链接到mysql，进行数据库的操作在开发过程往往会需要用到其他的包，使用npm就可以下载这些包来供程序调用 &nb
Spring MVC 拦截器 xp9802 spring mvc
Controller层的拦截器继承于HandlerInterceptorAdapter HandlerInterceptorAdapter.java 1 public abstract class HandlerInterceptorAdapter implements HandlerIntercep

李宏毅 深度学习【持续更新】

目录