kgbkqLjm

学习笔记-李沐动手学深度学习（二）（08-09、线性回归、优化算法、梯度下降、Softmax回归、损失函数、图片分类）

总结

以_结尾的方法，好像是原位替换（即原地修改，就地修改变量）如 fill_()

感恩的心：（沐神的直播环境）

08-线性回归+基础优化算法

引言（如何在美国买房）

根据现在行情预测房价

线性回归（简化模型）、线性模型、神经网络

b为偏差

扩展到一般化

线性模型
每个箭头代表一个权重
当层单层神经网络原因：不看输出层，将权重层和input放一起带权重的层只有一层

【书中】

衡量预估质量

1/2是为了求导时把2消去

线性回归（求最优解）

一般的模型都没有显示解，因为有显示解的模型都过于简单（显示解：个人感觉就是能直接用数学方法手动解出来的解）

训练数据

当每个xi是一个列向量样本时， X即一个大矩阵，该矩阵每一行对应一个样本
y是一个列向量，每个yi是一个实数数值，对应预测的房价

参数学习、显示解

损失函数l：模型在每一个数据上的损失求均值就得到损失函数
目标是求最小的损失函数

这里X是一个矩阵，x_{i}的意思是第i条数据，每一条数据都包含了（房间个数，居住面积）等决策信息
argmin是指让后面公式取得最小值的参数大小, min是指公式本身的最小值.

因为线性模型，因此有显示解。下面求：

为了写起来方便，将偏差b也写进来，

此时为了能进行矩阵计算X·W，为矩阵X加入一列全一的特征（增广矩阵？）

最优解是导数为0的，即

此处是唯一一个有最优解的模型，以后学的都不会有了
具体计算过程：

优化算法（初步体验）

后面有专门的章节将优化方法

梯度下降法（含超参数：学习率）

【实际场景】很少直接使用梯度下降，一般都用小批量随机梯度下降
当一个模型没有显示解时，我们会：

下图画的是等高线
梯度是使其增加最快的方向，负梯度就是下降最快的方向

学习率：此处的yita，是超参数，是需要人为指定的（超参数不需要数据来驱动，而是在训练前或者训练中人为的进行调整的参数）

以w0到w1为例：yita相当于每一步走多远（即w0到w1），偏导数（即梯度）相当于确定向哪个方向走（沿负梯度方向就是沿下降最快的方向）
上图中橙框乘红框就相当于 w0到w1、w1到w2的每段向量，则上述等式相当于起点+ yita乘梯度（即要运动的向量）=最终的向量

选太小：每次走的步长有限，需要计算很多次梯度，那么时间和空间成本都太大
后续有教程教选学习率

【常用】小批量随机梯度下降法（Stochastic Gradient Descent）（含超参数：批量大小batch）

每次走一步都计算所有的梯度成本太大。

【补充】吴恩达反向传播

前向传播

缓存cache的意思，就是在正向传播的时候保存对应Z，应用到计算反向传播中
g为激活函数

则对于输入一个样本时，输入即为 a^[0]；输入为一整个训练集时，输入即为A^[0]

前向传播即下图中绿框，从左到右不断计算

反向传播

d即为偏导

代码实现

线性回归（从0实现，不用框架）

从零实现整个方法，包括数据流水线、模型、损失函数、小批量随机梯度下降优化器

生成数据集

标准差：standard deviation
torch.normal() 返回一个张量，包含从给定参数means,std的离散正态分布中抽取随机数。均值means是一个张量，包含每个输出元素相关的正态分布的均值
torch.matmul:两个张量矩阵相乘
reshape中-1表示自动计算，1表示固定，即列向量为1

弹幕说：
这个函数返回的特征与标签，相当于分别把真实的房屋‘关键因素’和对应的‘房价’列出来。这一页的信息，相当于去市场调研收集真实的房屋数据。
features中每一行都包含一个二维数据样本，labels中的每一行都包含一维标签值（一个标签）。

绘制数据集

此处打印看一下第0个样本的样子以及可视化一下所有样本

使用.detach()方法可以将一个张量从当前的计算图中分离出来，使其变成一个不再需要梯度追踪的普通张量，即使它是由需要梯度的操作创建的

从图中也看出横纵轴变量是有线性相关性的

读取小批量

定义一个data_iter函数，接收批量大小、特征矩阵、标签向量作为输入，生成大小为batch_size的小批量

yield就是 return 返回一个值，并且记住这个返回的位置，下次迭代就从这个位置后开始。

%matplotlib inline
import random
import torch
from d2l import torch as d2l

def synthetic_data(w,b,num_exaples):
    """生成 y = Xw + b + 噪声"""
    X = torch.normal(0,1,(num_exaples,len(w)))
    y = torch.matmul(X,w) + b
    y += torch.normal(0,0.01,y.shape)
    return X, y.reshape((-1,1))

true_w = torch.tensor([2,-3.4])
true_b = 4.2
features, labels = synthetic_data(true_w, true_b, 1000)
print('features:',features[0],'\nlabel:',labels[0])

d2l.set_figsize()
d2l.plt.scatter(features[:,(1)].detach().numpy(),labels.detach().numpy(),1)   

# data_iter：把所有样本分成很多个batch，每个batch中的样本数量为batch_size（函数接收批量大小、特征矩阵和标签向量作为输入，生成大小为batch_size的小批量）
def data_iter(batch_size,features,labels):
    num_examples = len(features)  # 样本个数
    indices = list(range(num_examples)) # 样本索引（从0- num_examples-1）
    # 这些样本是随即读取的，没有特定的顺序
    random.shuffle(indices) # 把索引随机打乱
    for i in range(0, num_examples, batch_size): # 遍历所有样本，每次步长为batch_size
        # 每batch_size个样本为一组，拿到该组样本的索引。注：当i+batch_size超出时，取num_examples         
        # batch_indices = torch.tensor(indices[i:min(i+batch_size,num_examples)]) 
        batch_indices = indices[i:min(i+batch_size,num_examples)] # 这么写也行，只是为了拿到索引嘛， 索引用不用tensor感觉均可
        yield features[batch_indices], labels[batch_indices] # 基于样本索引获得对应的特征，及对应的标签
        
batch_size = 10
for X,y in data_iter(batch_size, features, labels):
    print(X, '\n', y) # 取一个批次后，就break跳出了
    break

定义模型、损失函数、优化算法

说明：
1.关于 l.sum().backward()：

%matplotlib inline
import random
import torch
from d2l import torch as d2l

def synthetic_data(w,b,num_exaples):
    """生成 y = Xw + b + 噪声"""
    X = torch.normal(0,1,(num_exaples,len(w)))
    y = torch.matmul(X,w) + b
    y += torch.normal(0,0.01,y.shape)
    return X, y.reshape((-1,1))

true_w = torch.tensor([2,-3.4])
true_b = 4.2
features, labels = synthetic_data(true_w, true_b, 1000)
print('features:',features[0],'\nlabel:',labels[0])

d2l.set_figsize()
d2l.plt.scatter(features[:,(1)].detach().numpy(),labels.detach().numpy(),1)   

def data_iter(batch_size,features,labels):
    num_examples = len(features)  # 样本个数
    indices = list(range(num_examples)) # 样本索引
    # 这些样本是随即读取的，没有特定的顺序
    random.shuffle(indices) # 把索引随即打乱
    for i in range(0, num_examples, batch_size):
        batch_indices = torch.tensor(indices[i:min(i+batch_size,num_examples)]) # 当i+batch_size超出时，取num_examples         
        yield features[batch_indices], labels[batch_indices] # 获得随即顺序的特征，及对应的标签
        
batch_size = 10
for X,y in data_iter(batch_size, features, labels):
    print(X, '\n', y) # 取一个批次后，就break跳出了
    break

# 定义初始化模型参数
w = torch.normal(0,0.01,size=(2,1),requires_grad=True)  # 初始化w：w是长为2的向量，均值为0，标准差为0.01
b = torch.zeros(1,requires_grad=True)

# 定义模型
def linreg(X,w,b):
    """线性回归模型"""
    return torch.matmul(X,w)+b

# 定义损失函数
def squared_loss(y_hat,y):
    """均方损失"""
    return (y_hat - y.reshape(y_hat.shape))**2/2 # 将y统一成与y_hat一样的尺寸   

# 定义优化算法
def sgd(params,lr,batch_size):   # params：参数list，如[w、b]
    """小批量随即梯度下降"""
    with torch.no_grad(): # 设置不更新梯度
        for param in params: # 每个参数进行遍历
            # 每个参数进行更新：因为之前的损失函数没有求均值，所以这里除以 batch_size 求了均值。由于乘法的线性关系，这里除以放在loss的除以是等价的。 
            param -= lr * param.grad / batch_size                
            param.grad.zero_() # 每个参数的梯度清零（以避免影响下次梯度计算）

# 训练过程
lr = 0.03
num_epochs = 3
net = linreg # 这里用线性模型，这样写是很方便net赋予其他模型，只需要改一处，不需要下面所有网络模型名称都改
loss = squared_loss

# 训练过程（都是套路，大同小异，两次for loop）
for epoch in range(num_epochs):  # 第一层for：对数据扫一遍
    for X,y in data_iter(batch_size,features,labels): # 第二层for：每次拿出batch_size大小的一个batch
        l = loss(net(X,w,b),y) # x和y的小批量损失： 输入参数给模型net得到预测值；用预测值和真实值y做损失。此时损失l就是长度为batch_size的向量
        # 因为l是形状是(batch_size,1)，而不是一个标量。l中所有元素被加到一起，并以此计算关于[w,b]的梯度
        l.sum().backward() # 求和算梯度不懂什么意思的可以回看上一节自动求导,求和后算梯度是求每一个y对每一个x的梯度,不求和直接算梯度结果是一个矩阵!不是我们要的结果
        sgd([w,b],lr,batch_size) #使用参数的梯度更新参数（此处可能存在细节问题，但只是为了说明整体上的训练过程，因为 最后一个batch可能样本数量不足batch_size个）
    # 扫完一个epoch后，评价一下（这部分无需更新梯度）
    with torch.no_grad():
        train_l = loss(net(features,w,b),labels)
        print(f'epoch{epoch+1},loss{float(train_l.mean()):f}')   

# 比较真实参数和通过训练学到的参数来评估训练的成功程度
print(f'w的估计误差：{true_w-w.reshape(true_w.shape)}')
print(f'b的估计误差：{true_b-b}')

打印结果：

体验lr太大或太小时的效果：（注意改变lr时要重新初始化一下w和b）
当lr很小时

此时可以考虑增加epoch，但loss还不是特别小

lr太大时，loss为nan，因为可能求导时会除以0，超出傅里叶的计算范围了

线性回归（使用框架）

python中的* （拆包、解包）：在Python中，号表示解包操作，它可以将一个包含多个元素的元组、列表、集合等数据结构解压为多个独立的元素。 表示接受任意多个参数并将其放在一个元组中


下图中左侧为本节图片，等价于右图（即上节手动实现的方式）

import numpy as np
import torch
from torch.utils import data
from d2l import torch as d2l
from torch import nn    
# 0.基本数据准备    
true_w = torch.tensor([2,-3.4])
true_b = 4.2
features, labels = d2l.synthetic_data(true_w,true_b,1000) # 库函数生成人工数据集    

# 1.【与不用框架实现的区别之一】调用框架现有的API来读取数据（把已有的训练数据(features,labels)传入TensorDataset）
def load_array(data_arrays,batch_size,is_train=True):
    """构造一个Pytorch数据迭代器"""
    dataset = data.TensorDataset(*data_arrays) # dataset相当于Pytorch的Dataset。一个星号*，表示对list解开入参（是python中的拆包符号）。      
    return data.DataLoader(dataset,batch_size,shuffle=is_train) # 返回的是从dataset中随机挑选出batch_size个样本出来     

batch_size = 10
data_iter = load_array((features,labels),batch_size) # 返回的数据的迭代器
print(next(iter(data_iter))) # iter(data_iter) 是一个迭代器对象，next是取迭代器里面的元素  

# 2.使用框架的预定义好的层
# nn是神经网络的缩写
net = nn.Sequential(nn.Linear(2,1))

# 3.初始化模型参数
# 以单下划线_结尾的方法都是原位替换
net[0].weight.data.normal_(0,0.01) # 使用正态分布替换掉weight变量里面的数据值。 其中net[0]就是 神经网络net的第一层（即 nn.Linear(2,1)）。
net[0].bias.data.fill_(0)  # 偏差bias变量里面的值设置为0。normal_ ：以单下划线_结尾的方法都是原位替换
print(net[0])

# 4.计算均方误差使用的是MSELoss类，也称为平方L2范数
loss = nn.MSELoss()  #L1是算术差，L2是平方差

# 4.实例化SGD实例
trainer = torch.optim.SGD(net.parameters(),lr=0.03)  # 传入网络中所有的参数（此处指w和b）

# 5.训练过程代码与从零开始时所做的非常相似
num_epochs = 3
for epoch in range(num_epochs):
    for X, y in data_iter:  # 从DataLoader里面一次一次把所有数据拿出来
#         print("X:",X)
#         print("y:",y)
        l = loss(net(X),y) # net(X) 为计算出来的线性回归的预测值
        trainer.zero_grad() # 梯度清零（避免影响其他次计算）
        l.backward()  # pytorch已经帮我们做了 向量.sum()  （即转成了标量），无需手动写了（如上节的l.sum().backward()）
        trainer.step()  # SGD优化器优化模型：调用step()进行模型更新
    l = loss(net(features),labels)  # 当前epoch的loss
    print(f'epoch{epoch+1},loss{l:f}')   # 这行都是l 而不是1

打印结果：

QA

1.可以，直接上面pip就行

2.后面会讲一下二者区别，但是区别不大。
绝对差值在0点时可能不能求导。

3.也可以不求。求不求本质上没区别，不求平均梯度数值会比较大。如果损失不除以n，那么学习率除以n也行，但是只不过除了之后更好调（除n主要就是用来忽略样本规模的）

是的

6.除以谁都没关系，不影响本质，最后求的都是min Loss

7.经验。后续也会讲

8.其实batch_size越小越好，对收敛越好但是大了不行。
采样样本越小，噪音越大，但是噪音对于神经网络是好事情，更利用训练出泛化性强的网络

9.batch_size只要不是特别特别大都行

10.是的。梯度是线性的，和的均值等于均值的和

11.不是。批量大小是一样的即batch_size，随机只每次在样本中随机采集batch_size大小个元素

12.需要。但是一般损失函数和正则会分开，而且正则有很多方法。

13.首先二阶导数不一定能计算，很难算。有时一阶导是向量，二阶导就变成了矩阵
为什么不用牛顿法：
【二阶导不一定能计算，或者方便计算】此处有两个问题，一个是统计模型（损失函数长什么样），一个是优化模型（用什么算法求解），但其实这俩都是错的，因为统计模型是错的，优化模型肯定也求不对，应该是指我们很难找到完全正确、十分精准的损失函数，一般机器学习都求不到最优解（面对实际的问题我们不可能拿到精确的模型，真实的损失函数是非常复杂的）。
因此求出一个统计模型的最优解的意义并不大，因为它是一个错误的模型，因此收敛快不快并不care，我们关心损失函数收敛到那个地方，用牛顿法虽然快，但求的结果可能并不平坦。不一定很快得到的结果就是好的结果（可能泛化性差）
【牛顿法求出的结果不一定比随机梯度求得的结果好，收敛不一定快，即便收敛快、结果也不一定好】
弹幕说：收敛更准确比更快更重要

14.如果损失函数L中没除以n，那么学习率yita除以n

15.从计算图分离：要转换成numpy数据类型，就需要先将其从求梯度的计算图中分离出来（但是具体也看pytorch版本）
16.detach就是pytorch中的
17.是的，如果数据量特别大会爆掉。但是整本书中dataset都不大，如果真实情况下 GPU足够大，load全部也没问题。
实际场景下，数据都存储在硬盘上的

18.弹幕说也可以

19.相当于洗牌之后再把所有的牌抽起来看一遍
20.不用return时，每次需要数据时run一遍即可，现用现生成，节省内存；
用iter就是python的写法，python的习惯

21、22.三种做法：（代码中只是刚好整除了）
（1）【常用】代码中：每次取的范围是： [ i , min(i+batch_size,num_examples)]
（2）丢掉最后不足的样本
（3）从下一个epoch中补一些过来使最后一个batch也满足 batch_size个样本数

24.lr不做衰减也问题不大，此处先不讲这个
24-2.
（1）可以判断相邻两次epoch的loss的变化范围不大（如1%时）
（2）用交叉验证集，当其精度不增加时
（3）算力允许的情况下，epoch多点也没关系

25.是的。除了线性回归模型外，都没有显示解。能求出显示解的模型都太简单了

NPC（np-complete）问题即NP完全问题, 任何一个NP问题都可以在多项式时间内归约为某个NP问题，那么这个问题就成为NPC问题
【NP问题】

26.初始时也可以用同样的值，偷懒就用了随机的
27.求导时会涉及除法，后面也会讲数据稳定性问题
28.不一定，只是此处手动设了，后续就不会了
29.是的
30.就是为了print，同时我们只run了forward，没run backward，即没计算梯度，无需清0
31.因为pytorch不自动帮你清零，如果不人为清零，则后面梯度计算时会在前面的梯度计算的结果上累加

32.后面会单独讲

09-softmax回归+损失函数+图片分类数据集

Softmax回归（具体细节也可看吴恩达）

【softmax算子（操作子）的作用】将所有的输入都拉到[0,1]区间内，且令这些输入经由softmax的输出之和为1（刚好符合概率的感觉）

回归vs分类

下图补充：
回归：
输出的区间是单个自然区间

分类：
多输出，输出的个数等于类别的个数

【分类问题举例】Kaggle上的分类问题

从回归到多类分类

如何从回归问题过渡到分类问题：

【编码和初步计算】均方损失

1.编码
如果有n个类别，则构造一个长度为n的向量y。（one-hot编码）
如果该东西真实类别是i，则yi=1，其他yi=0

下图中yhat 是使得oi取最大值对应的那个类别标号i。
o_i：中o为置信度，o是神经网络的输出
y是真实值，yhat是预测值

【分析】无校验比例

【我们关心的问题1】对于分类问题，我们不关心物体实际的值，而是关心分类正确物体的置信度是不是特别大

下图中yhat 是使得oi取最大值对应的那个类别标号i

我们目的是要使得对正确类别y的置信度 oy能远远大于其他类别的置信度oi，即二者的差大于等于一个阈值（如 derta）
这样能保证我们的模型能够将物体真正的类别和其他类别拉开距离

【softmax定义】【基于指数运算进行映射】校验比例（看书效果更好）

【我们关心的问题2】
同时接问题1，我们还希望分类的预测输出是一个概率，暂时现在我们的输出是一个向量（ o1,…,on）
此时我们引入一个操作子 softmax，作用于o，得到yhat，它是一个长度为n的向量（y1hat,…,ynhat），该向量的每个元素yi都非负、且这些元素之和为1（每个元素就是该物体被预测为当前索引类别的概率）
其中yhat_i
【个人总结softmax作用】【使用exp（即指数）、exp(oi)/xigema exp(ok) 的目的】
（1）通俗版本：将所有的输入都拉到[0,1]区间内，且令这些输入经由softmax的输出之和为1（刚好符合概率的感觉）
（2）将每个元素都映射到非负区间上（这才符合概率）且最后的yhat i更符合概率的特点，值属于[0,1]且之和为1
（因为真实的向量y也是所有元素之和为1，即只有一个1，也可以将其视为概率）

【书上soffmax作用】softmax函数能够将未规范化的预测变换为⾮负数（范围在 0-1）并且总和为1，同时让模型保持可导的性质
【为什么不能直接将oi作为输出】
我们能否将未规范化的预测o直接视作我们感兴趣的输出呢？答案是否定的。因为将线性层的输出直接
视为概率时存在⼀些问题：⼀⽅⾯，我们没有限制这些输出数字的总和为1。另⼀⽅⾯，根据输⼊的不同，它
们可以为负值。

【o与y的关系（这也就是softmax的主要计算原理）】

下图中的softmax的输入O是一个（行）向量

下图中softmax的输入是一个矩阵（可见softmax从0实现一节）

Softmax和交叉熵（Cross Entropy）损失

p和q是两个概率，H表示交叉熵，i为第i个元素，共n个元素
向量y（即加粗的黑体y）是真实值的向量（共n个元素，只有一个元素为1，其余为0），向量yhat是预测得到的向量，
标量y是物体真实类别，标量yhat_i是物体被预测为 i类别的概率

解释下图第一个公式的推导（如绿框）：由于y是⼀个⻓度为n的独热编码向量，所以除了⼀个项以外的所有项j都消失了。
yhat_y：对真实类别y的预测的概率为yhat。即对于分类问题，我们只关心对正确类别的预测值有多大，而不关心对于非正确类别的预测情况

上图中第三个公式的推导

损失函数

【作用】用于衡量真实值和预测值之间的区别

下面：
y：真实值
y’：预测值
除以2：求导后 2和1/2抵消

L2 loss

横轴是y’

④ 【变化规律】当预测值y’跟真实值y隔的比较远的时候，(真实值y为0，预测值就是下面的曲线里的x轴)，梯度比较大，所以参数更新比较多。

⑤ 随着预测值靠近真实值是，梯度越来越小，参数的更新越来越小。

下图中的更新指参数权重的更新

L1 loss

L2也不一定很好，因为当y‘离原点很远时（此例中取真实值y=0），也不一定希望更新的很快，因此看下L1

① 相对L2 loss，L1 loss的梯度就是距离原点时，梯度也不是特别大，权重的更新也不是特别大。会带来很多稳定性的好处。

② 他的缺点是在零点处不可导，并在零点处左右有±1的变化，这个不平滑性导致预测值与真实值靠的比较近的时候，优化到末期的时候，可能会不那么稳定。

Huber’s Robust Loss（鲁棒损失）

Huber’s Robust Loss 结合了L1和L2 loss的优点：
当预测值和真实值的差距不同时，Loss计算方式不同：即预测值和真实值差的比较大时，梯度通过比较均匀的力度调整参数；预测值和真实值差的比较小时（即优化末期），梯度绝对值越来越小，以保证整个参数调整过程是比较平滑的

图像分类数据集（Fashion-MNIST）

0.概述和课件

此处是先初步介绍一下后面要常用到的一个数据集Fashion-MNIST

① MINIST数据集是图像分类中广泛使用的数据集之一，但作为基准数据集过于简单。
② 下面将使用类似但更复杂的Fashion-MNIST数据集。

【代码】

1.导入包

2.准备数据

3.单进程读取batch并可视化的函数

4.多进程读取一个小batch，大小为batch_size

一般要保证读取数据的速度大于训练的速度

%matplotlib inline
import torch
import torchvision
from torch.utils import data
from torchvision import transforms
from d2l import torch as d2l

d2l.use_svg_display()

# 通过ToTensor实例将图像数据从PIL类型变换成32位浮点数格式
# 并除以255使得所有像素的数值均在0到1之间
trans = transforms.ToTensor()
mnist_train = torchvision.datasets.FashionMNIST(root="01_data/01_DataSet_FashionMNIST",train=True,transform=trans,download=True)
mnist_test = torchvision.datasets.FashionMNIST(root="01_data/01_DataSet_FashionMNIST",train=False,transform=trans,download=True)            

def get_fashion_mnist_labels(labels):
    """返回Fashion-MNIST数据集的文本标签"""
    text_labels = ['t-shirt','trouser','pullover','dress','coat',
                   'sandal','shirt','sneaker','bag','ankle boot']
    return [text_labels[int(i)] for i in labels]

def show_images(imgs, num_rows, num_cols, titles=None, scale=1.5):
    """Plot a list of images."""
    figsize = (num_cols * scale, num_rows * scale) # 传进来的图像尺寸，scale 为放缩比例因子
    _, axes = d2l.plt.subplots(num_rows,num_cols,figsize=figsize)
    print(_)
    print(axes) # axes 为构建的两行九列的画布
    axes = axes.flatten()
    print(axes) # axes 变成一维数据
    for i,(ax,img) in enumerate(zip(axes,imgs)):
        if torch.is_tensor(img):
            # 图片张量
            ax.imshow(img.numpy())
            ax.set_title(titles[i])
        else:
            # PIL图片
            ax.imshow(img)
            
X, y = next(iter(data.DataLoader(mnist_train,batch_size=18))) # X，y 为仅抽取一次的18个样本的图片、以及对应的标签值
show_images(X.reshape(18,28,28),2,9,titles=get_fashion_mnist_labels(y))

batch_size = 256
def get_dataloader_workers(): # 一般数据都在硬盘上，不能一次读取完，此时使用4个进程来读
    """使用4个进程来读取的数据"""
    return 4

train_iter = data.DataLoader(mnist_train, batch_size, shuffle=True,
                            num_workers=get_dataloader_workers())

timer = d2l.Timer() # 计时器对象实例化，开始计时
for X,y in train_iter:  # 遍历一个batch_size数据的时间
    continue
f'{timer.stop():.2f}sec' # 计时器停止时，停止与开始的时间间隔事件

5.【完整代码】整合-上述内容到一个函数中（load_data_fashion_mnist）

本节整合代码并实现函数load_data_fashion_mnist 以供后面使用 Fashion-MNIST数据集
额外声明resize参数，以便后续如果模型需要不同size的图片时可以基于此调整

%matplotlib inline
import torch
import torchvision
from torch.utils import data
from torchvision import transforms
from d2l import torch as d2l

d2l.use_svg_display()

# 通过ToTensor实例将图像数据从PIL类型变换成32位浮点数格式
# 并除以255使得所有像素的数值均在0到1之间
trans = transforms.ToTensor()
mnist_train = torchvision.datasets.FashionMNIST(root="01_data/01_DataSet_FashionMNIST",train=True,transform=trans,download=True)
mnist_test = torchvision.datasets.FashionMNIST(root="01_data/01_DataSet_FashionMNIST",train=False,transform=trans,download=True)            

def get_fashion_mnist_labels(labels):
    """返回Fashion-MNIST数据集的文本标签"""
    text_labels = ['t-shirt','trouser','pullover','dress','coat',
                   'sandal','shirt','sneaker','bag','ankle boot']
    return [text_labels[int(i)] for i in labels]

def show_images(imgs, num_rows, num_cols, titles=None, scale=1.5):
    """Plot a list of images."""
    figsize = (num_cols * scale, num_rows * scale) # 传进来的图像尺寸，scale 为放缩比例因子
    _, axes = d2l.plt.subplots(num_rows,num_cols,figsize=figsize)
    print(_)
    print(axes) # axes 为构建的两行九列的画布
    axes = axes.flatten()
    print(axes) # axes 变成一维数据
    for i,(ax,img) in enumerate(zip(axes,imgs)):
        if torch.is_tensor(img):
            # 图片张量
            ax.imshow(img.numpy())
            ax.set_title(titles[i])
        else:
            # PIL图片
            ax.imshow(img)
            
X, y = next(iter(data.DataLoader(mnist_train,batch_size=18))) # X，y 为仅抽取一次的18个样本的图片、以及对应的标签值
show_images(X.reshape(18,28,28),2,9,titles=get_fashion_mnist_labels(y))

batch_size = 256
def get_dataloader_workers():
    """使用4个进程来读取的数据"""
    return 4

train_iter = data.DataLoader(mnist_train, batch_size, shuffle=True,
                            num_workers=get_dataloader_workers())

timer = d2l.Timer()
for X,y in train_iter:
    continue
f'{timer.stop():.2f}sec'  # 扫一边数据集的事件

def load_data_fashion_mnist(batch_size, resize=None): # 额外声明resize参数，以便后续 如果模型需要不同size的图片时可以 基于此调整
    """下载Fashion-MNIST数据集，然后将其加载到内存中"""
    trans = [transforms.ToTensor()]
    if resize:
        trans.insert(0,transforms.Resize(resize)) # 如果有Resize参数传进来，就进行resize操作
    trans = transforms.Compose(trans)
    mnist_train = torchvision.datasets.FashionMNIST(root="01_data/01_DataSet_FashionMNIST",train=True,transform=trans,download=True)
    mnist_test = torchvision.datasets.FashionMNIST(root="01_data/01_DataSet_FashionMNIST",train=False,transform=trans,download=True)            
    return (data.DataLoader(mnist_train, batch_size, shuffle=True, num_workers=get_dataloader_workers()),
           data.DataLoader(mnist_train, batch_size, shuffle=True, num_workers=get_dataloader_workers()))

Softmax-从零实现

1.训练集、测试集抽取

基于上节实现的函数读取数据集的数据

2.初始化参数w、b

因为对于softmax回归来说，input需要是一个向量，因此 784=28*28，将图片展平（但这样会丢失图片的空间信息，后续用卷积神经网络来实现）

size是关键：个人理解
X是的shape是(1,784)，为了XW能计算，且输出为10类，则 W.shape为(784,10)

3.定义Softmax

回顾一下：矩阵可以多不同axis上求和

正文：
此处softmax的对象是一个矩阵，对矩阵做softmax就相当于对其每一行做softmax

分别计算公式中的分子和分母

验证一下上面写的是否正确：符合softmax的预期：每个元素都为非负且在0,1之间，每一行所有元素之和也为1

W.shape为(784,10) （第一步就分析了）

4.交叉熵损失

先补充个细节：如何从所有预测值中根据标号（即类别label）拿到其对应的预测值（即最终预测的概率）
（弹幕说）此处内容涉及python的高级索引

最终拿到的是yhat[0,0], [1,2]

正文：
上面说明的内容就是为了实现获取下图中的 yhat_y：即预测结果中某东西的真实类别（即老师口中的标号）的预测值

5.计算预测正确的数量

因为是分类问题，将预测类别与真实y元素进行比较。

【过程总结】
1.找出yhat中每行（每行代表对一个样本类别的属于各个类别的概率预测值）中预测值最大的元素对应的索引，即预测该样本的类别；
2.将yhat与y中每个元素逐个比较并将每个元素的比较结果保存到cmp中；其中cmp中每个元素都是布尔类型
3.将 cmp转换为y中元素的数据类型（即 int）并求和，得到了所有预测类别正确的样本的数量
4. 预测正确样本数/总样本数 =准确率

【补充】变量1.type(变量2）：将变量1的类型转换为变量2的类型

【补充2】QA中的问题：为什么不在accuracy中直接除以len(y)

因为我们读取batch时最后一个batch中样本数量可能不足 batch_size，
那么此时 accuracy/len(y) 是不对的

6.任意模型的准确率（或称精度）

evaluate_accuracy(net,data_iter)作用：基于给定模型net和数据迭代器data_iter，可以计算该模型在该数据迭代器上的精度
Accumulator类的作用：该类可生成一个累加迭代器

弹幕说：如报Runtime的错误，把自己的Batchsize和进程数改小就可以了，毕竟cpu太拉

%matplotlib inline
import torch
import torchvision
from torch.utils import data
from torchvision import transforms
from d2l import torch as d2l

def get_dataloader_workers():
    """使用4个进程来读取的数据"""
    return 4

def load_data_fashion_mnist(batch_size, resize=None):
    """下载Fashion-MNIST数据集，然后将其加载到内存中"""
    trans = [transforms.ToTensor()]
    if resize:
        trans.insert(0,transforms.Resize(resize)) # 如果有Resize参数传进来，就进行resize操作
    trans = transforms.Compose(trans)
    mnist_train = torchvision.datasets.FashionMNIST(root="01_data/01_DataSet_FashionMNIST",train=True,transform=trans,download=True)
    mnist_test = torchvision.datasets.FashionMNIST(root="01_data/01_DataSet_FashionMNIST",train=False,transform=trans,download=True)            
    return (data.DataLoader(mnist_train, batch_size, shuffle=True, num_workers=get_dataloader_workers()),
           data.DataLoader(mnist_train, batch_size, shuffle=True, num_workers=get_dataloader_workers()))               


batch_size = 256
train_iter, test_iter = load_data_fashion_mnist(batch_size) # 返回训练集、测试集的迭代器     

num_inputs = 784
num_outputs = 10
w = torch.normal(0,0.01,size=(num_inputs,num_outputs),requires_grad=True)
b = torch.zeros(num_outputs,requires_grad=True)

def softmax(X):
    X_exp = torch.exp(X) # 每个都进行指数运算
    partition = X_exp.sum(1,keepdim=True) 
    return X_exp / partition # 这里应用了广播机制

# 实现softmax回归模型
def net(X):
    return softmax(torch.matmul(X.reshape((-1,w.shape[0])),w)+b) # -1为默认的批量大小，表示有多少个图片，每个图片用一维的784列个元素表示      

def cross_entropy(y_hat, y):
    return -torch.log(y_hat[range(len(y_hat)),y]) # y_hat[range(len(y_hat)),y]为把y的标号列表对应的值拿出来。传入的y要是最大概率的标号      

def accuracy(y_hat,y):
    """计算预测正确的数量"""
    if len(y_hat.shape) > 1 and y_hat.shape[1] > 1: # y_hat.shape[1]>1表示不止一个类别，每个类别有各自的概率   
        y_hat = y_hat.argmax(axis=1) # y_hat.argmax(axis=1)为求行最大值的索引
    cmp = y_hat.type(y.dtype) == y # 先判断逻辑运算符==，再赋值给cmp，cmp为布尔类型的数据
    return float(cmp.type(y.dtype).sum()) # 获得y.dtype的类型作为传入参数，将cmp的类型转为y的类型（int型），然后再求和       

# 【基于给定模型net和数据迭代器data_iter，可以计算该模型在该数据迭代器上的精度】可以评估在任意模型net的准确率
def evaluate_accuracy(net,data_iter):  # 当传入一个模型net和数据迭代器data_iter
    """计算在指定数据集上模型的精度"""
    #如果net模型是torch.nn.Module实现的神经网络的话，将它变成评估模式（评估模式下不计算梯度，即只做forward不做backward）
    if isinstance(net,torch.nn.Module):      
        net.eval()  # 将模型设置为评估模式
    metric = Accumulator(2) # 正确预测数、预测总数，metric为累加器的实例化对象，里面存了两个数
    for X, y in data_iter:  # 对于迭代器中每次拿到的一个batch中的X和y
        metric.add(accuracy(net(X),y),y.numel()) # net(X)将X输入模型，获得预测值。y.numel()为y中元素总个数
    return metric[0] / metric[1] # 分类正确的样本数 / 总样本数

# 【该类可生成一个累加迭代器】Accumulator实例中创建了2个变量，用于分别存储正确预测的数量和预测的总数量
class Accumulator:
    """在n个变量上累加"""
    def __init__(self,n):
        self.data = [0,0] * n
        
    def add(self, *args):
        self.data = [a+float(b) for a,b in zip(self.data,args)] # zip函数把两个列表第一个位置元素打包、第二个位置元素打包....
        
    def reset(self):
        self.data = [0.0] * len(self.data)
        
    def __getitem__(self,idx):
        return self.data[idx]

print(evaluate_accuracy(net, test_iter))   # 看一下随机出来的模型和测试迭代器 的效果（因为共10个类别，因此正确率应在10%左右）

【补充】pytorch中的tensor.numel()方法

7.训练函数

train_epoch_ch3：对整个数据集数据迭代一次（即一个epoch）的实现方式

8.动画绘制

自定义一个小动画，可视化训练过程

9.多epoch总训练函数

ch3指在第三章的训练函数，后面会不断完善这个训练函数
metrics：指标

我们一般关注测试的精度test acc

可视化效果：

10.预测数据

从测试集中拿出6个样本预测一下

【完整代码】

个别局部部分的解释可以看具体对应章节的注释

##### %matplotlib inline
import torch
import torchvision
from torch.utils import data
from torchvision import transforms
from d2l import torch as d2l
from IPython import display

def get_dataloader_workers():
    """使用4个进程来读取的数据"""
    return 0

def load_data_fashion_mnist(batch_size, resize=None):
    """下载Fashion-MNIST数据集，然后将其加载到内存中"""
    trans = [transforms.ToTensor()]
    if resize:
        trans.insert(0,transforms.Resize(resize)) # 如果有Resize参数传进来，就进行resize操作
    trans = transforms.Compose(trans)
    mnist_train = torchvision.datasets.FashionMNIST(root="01_data/01_DataSet_FashionMNIST",train=True,transform=trans,download=True)
    mnist_test = torchvision.datasets.FashionMNIST(root="01_data/01_DataSet_FashionMNIST",train=False,transform=trans,download=True)            
    return (data.DataLoader(mnist_train, batch_size, shuffle=True, num_workers=get_dataloader_workers()),
           data.DataLoader(mnist_train, batch_size, shuffle=True, num_workers=get_dataloader_workers()))               


batch_size = 256
train_iter, test_iter = load_data_fashion_mnist(batch_size) # 返回训练集、测试集的迭代器     
# 2.
num_inputs = 784
num_outputs = 10
w = torch.normal(0,0.01,size=(num_inputs,num_outputs),requires_grad=True)  # 重点是size
b = torch.zeros(num_outputs,requires_grad=True)

def softmax(X): # 此处softmax的对象是一个矩阵。对矩阵做softmax就相当于对其每一行做softmax
    X_exp = torch.exp(X) # 每个元素都进行指数运算（即softmax公式中的分子）
    partition = X_exp.sum(1,keepdim=True)  # 按axis=1进行求和，并仍保持原维度（即二维矩阵）（即softmax公式中的分母）
    return X_exp / partition # 这里应用了广播机制（即softmax公式中的分子/分母）

# 实现softmax回归模型
def net(X):
    return softmax(torch.matmul(X.reshape((-1,w.shape[0])),w)+b) # -1表示自动计算一下（为默认的批量大小），表示有多少个图片，每个图片用一维的784列个元素表示      

def cross_entropy(y_hat, y):
    return -torch.log(y_hat[range(len(y_hat)),y]) # y_hat[range(len(y_hat)),y]为把y的标号列表对应的值拿出来。传入的y要是最大概率的标号      

def accuracy(y_hat,y):
    """计算预测正确的数量"""
    if len(y_hat.shape) > 1 and y_hat.shape[1] > 1: # y_hat.shape[1]>1表示不止一个类别，每个类别有各自的概率   
        y_hat = y_hat.argmax(axis=1) # y_hat.argmax(axis=1)为求行最大值的索引
    cmp = y_hat.type(y.dtype) == y # 先判断逻辑运算符==，再赋值给cmp，cmp为布尔类型的数据
    return float(cmp.type(y.dtype).sum()) # 获得y.dtype的类型作为传入参数，将cmp的类型转为y的类型（int型），然后再求和       

# 可以评估在任意模型net的准确率
def evaluate_accuracy(net,data_iter):
    """计算在指定数据集上模型的精度"""
    if isinstance(net,torch.nn.Module): # 如果net模型是torch.nn.Module实现的神经网络的话，将它变成评估模式     
        net.eval()  # 将模型设置为评估模式
    metric = Accumulator(2) # 正确预测数、预测总数，metric为累加器的实例化对象，里面存了两个数
    for X, y in data_iter:
        metric.add(accuracy(net(X),y),y.numel()) # net(X)将X输入模型，获得预测值。y.numel()为样本总数
    return metric[0] / metric[1] # 分类正确的样本数 / 总样本数

# Accumulator实例中创建了2个变量，用于分别存储正确预测的数量和预测的总数量
class Accumulator:
    """在n个变量上累加"""
    def __init__(self,n):
        self.data = [0,0] * n
        
    def add(self, *args):
        self.data = [a+float(b) for a,b in zip(self.data,args)] # zip函数把两个列表第一个位置元素打包、第二个位置元素打包....
        
    def reset(self):
        self.data = [0.0] * len(self.data)
        
    def __getitem__(self,idx):
        return self.data[idx]

# 训练函数
def train_epoch_ch3(net, train_iter, loss, updater):
    if isinstance(net, torch.nn.Module):
        net.train() # 开启训练模式
    metric = Accumulator(3)
    for X, y in train_iter:
        y_hat = net(X)
        l = loss(y_hat,y) # 计算损失
        if isinstance(updater, torch.optim.Optimizer): # 如果updater是pytorch的优化器的话
            updater.zero_grad()
            l.mean().backward()  # 这里对loss取了平均值出来
            updater.step()
            metric.add(float(l)*len(y),accuracy(y_hat,y),y.size().numel()) # 总的训练损失、样本正确数、样本总数   
        else:
            l.sum().backward()
            updater(X.shape[0])
            metric.add(float(l.sum()),accuracy(y_hat,y),y.numel()) 
    return metric[0] / metric[2], metric[1] / metric[2] # 所有loss累加除以样本总数，总的正确个数除以样本总数  


    
class Animator:
    def __init__(self, xlabel=None, ylabel=None, legend=None, xlim=None,
                ylim=None, xscale='linear',yscale='linear',
                fmts=('-','m--','g-.','r:'),nrows=1,ncols=1,
                figsize=(3.5,2.5)): 
        if legend is None:
            legend = []
        d2l.use_svg_display()
        self.fig, self.axes = d2l.plt.subplots(nrows,ncols,figsize=figsize)
        if nrows * ncols == 1:
            self.axes = [self.axes,]
        self.config_axes = lambda: d2l.set_axes(self.axes[0],xlabel,ylabel,xlim,ylim,xscale,yscale,legend)         
        self.X, self.Y, self.fmts = None, None, fmts
        
    def add(self, x, y):
        if not hasattr(y, "__len__"):
            y = [y]
        n = len(y)
        if not hasattr(x, "__len__"):
            x = [x] * n
        if not self.X:
            self.X = [[] for _ in range(n)] 
        if not self.Y:
            self.Y = [[] for _ in range(n)]
        for i, (a,b) in enumerate(zip(x,y)):
            if a is not None and b is not None:
                self.X[i].append(a)
                self.Y[i].append(b)
        self.axes[0].cla()
        for x, y, fmt in zip(self.X, self.Y, self.fmts):
            self.axes[0].plot(x, y, fmt)
        self.config_axes()
        display.display(self.fig)
        display.clear_output(wait=True)

# 总训练函数        
def train_ch3(net,train_iter,test_iter,loss,num_epochs,updater):
    animator = Animator(xlabel='epoch',xlim=[1,num_epochs],ylim=[0.3,0.9],       
                       legend=['train loss','train acc','test acc'])  # 可视化函数（不细讲）
    for epoch in range(num_epochs):  # 变量num_epochs遍数据
        train_metrics = train_epoch_ch3(net,train_iter,loss,updater) # 训练过程相关指标：返回两个值，一个总损失、一个总正确率
        test_acc = evaluate_accuracy(net, test_iter) # 测试数据集上评估精度，仅返回一个值，总正确率  
        animator.add(epoch+1,train_metrics+(test_acc,)) # 可视化：train_metrics+(test_acc,) 仅将两个值的正确率相加，
    train_loss, train_acc = train_metrics
    
# 【实现SGD】小批量随即梯度下降来优化模型的损失函数
lr = 0.1
def updater(batch_size):
    return d2l.sgd([w,b],lr,batch_size)

num_epochs = 10
train_ch3(net,train_iter,test_iter,cross_entropy,num_epochs,updater)

预测数据：

def predict_ch3(net,test_iter,n=6):
    for X, y in test_iter: 
        break # 仅拿出一批六个数据
    trues = d2l.get_fashion_mnist_labels(y)  # 真实label
    preds = d2l.get_fashion_mnist_labels(net(X).argmax(axis=1))  # 预测label
    titles = [true + '\n' + pred for true, pred in zip(trues,preds)]
    d2l.show_images(X[0:n].reshape((n,28,28)),1,n,titles=titles[0:n])
    
predict_ch3(net,test_iter)

Softmax-基于框架实现（nn.Module）

1.拿到数据和迭代器

2.构造softmax回归模型：

nn.Flatten()：将任何维度的tensor转换为2Dtensor（即保留其第0维度，其他维度均展平为一个向量）

3.损失函数与优化算法

后面的课程会不断在该数据集上应用更深、更复杂的模型

import torch
from torch import nn
from d2l import torch as d2l

batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)

# Softmax回归的输出是一个全连接层
# PyTorch不会隐式地调整输入的形状
# 因此，我们定义了展平层(flatten)在线性层前调整网络输入的形状
net = nn.Sequential(nn.Flatten(),nn.Linear(784,10))

def init_weights(m): # 该函数会对网络的每一层都 call一次，其中m就是当前的layer
    if type(m) == nn.Linear:
        nn.init.normal_(m.weight, std=0.01) # 如果当前层是线性层，就将其权重初始化为 均值为0、方差为0.01的随机值

net.apply(init_weights)  # net网络权重初始化：应用init_weights函数到net网络的每一层
print(net.apply(init_weights)) # net网络的参数用的是init_weights初始化参数

# 在交叉熵损失函数中传递未归一化的预测，并同时计算softmax及其对数
loss = nn.CrossEntropyLoss()
# 使用学习率为0.1的小批量随即梯度下降作为优化算法
trainer = torch.optim.SGD(net.parameters(),lr=0.1)

num_epochs = 10
d2l.train_ch3(net,train_iter,test_iter,loss,num_epochs,trainer)

QA

1.softlabel是图像分类问题的实际场景中的一个常用技巧，大概意思就是 softmax理论上的效果在实际中可能不能完全实现？
刚刚讲的是 softmax+one-hot编码：将 n类变成长度为n的向量，只有类别正确的那一类为1，其余均为0 ，然后用softmax去逼近这个纯0、1的分布。
但其存在的问题是（回想softmax公式）很难用指数去逼近1，即要求输出几乎接近无穷大（分子）、分母的其他项都很小，这样最后结果才是1，很难实现

因此提出了改进方案softlabel，将正确类记为0.9，错误类记为0.1（而不是像one-hot这样纯0、1），除以n？这样就使得用softmax去拟合那些很小的数是有可能实现的

2、3.逻辑回归就是当类别n=2是的softmax回归

4.互信息不好算，交叉熵就够用、好用了

5.也不是说我们不关注不正确的类，只是one-hot编码将不正确的类的概率变为0了，所以计算时可以忽略掉不正确的类。
如果是用softlabel，即类比one-hot用 0.9和0.1，那么计算时就不能忽略掉不正确的类了

6.会。但其实只要每个类都有足够多的样本时，还是比较平衡的

7.每次走的步长取决于两点：梯度大小和lr，假设lr固定，那么步长只受梯度（如下图中橙色线）影响，因此对于下图，不管梯度是+1or-1，梯度的绝对值是一样的，因此每步移动的距离都是平均的

而下图则是，当离原点较远时，梯度较大，因此每步步长就较大

8、9.似然函数属于统计学中的概念，因为深度学习后面的模型和统计没有太大关系，因此没有细讲这里
【最小化损失就等价于最大化似然函数】
似然函数简单理解：当给定一个模型（即有了确定的权重）和数据，这个模型权重出现的概率有多大。因此我们要找到最大似然，使得这个权重更合理

10.前面讲过了（回想权重更新公式即可 w1 = w0 - lr * 梯度）
11.可以用

13、14.是的。开多个python进程
课程中单独定义一个设置num_workers的原因是老版本中 windows不支持设置多进程，因此需要在函数中判断一下是不是win系统，如果是就不用多进程
现在支持了，直接写死num也行，不用函数定义

15.有讲究，此处只是为了当前教学，后面会展开讲方差

17.不是。无论batch_size设为几，计算量不变。
只是说能不能想办法增加计算的并行度，以提高效率。
如果增大减小batch_size的没区别，可能说明你在CPU上或模型很小

18.python

19.因为我们读取batch时最后一个batch中样本数量可能不足 batch_size，
那么此时 accuracy/len(y) 是不对的，而是应该像evaluate_accuracy中这样将所有正、负例累加起来再除

20.后面基于GPU会再讲

设一下是好习惯，即设置后不用计算并更新梯度了，性能会好
就是传参穿进去的，如手动实现时手动放进去和基于框架实现时用 net.parameters放进去

23.可能是。后面会通过微调学习率或加入正则项来解决过拟合

24.后面

25.后面
26.自己比一下。

27.可以看下pytorch文档，如将每个类别单独放一个文件夹

29.建议看下统计学习
弹幕说：softmax往前回溯的话应该是模式识别中的最大后验分类

你可能感兴趣的:(李沐动手学深度学习,算法,回归,学习)

情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动李蕾1229
为促进我校教师专业发展，发挥骨干教师的引领带头作用，11月6日下午，我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动。图片发自App会议由教师发展处李蕾主任主持，首先，由范校长宣读新老教师结对名单及双方承担职责。随后，两位新调入教师陈玉萍、莫正杰分别和他们的师傅鲍元美、刘召彬老师签订了师徒结对协议书。图片发自App图片发自App师徒拥抱、握手。有了师傅就有了目标有了方向，相信两位新教师在师
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
回溯 Leetcode 332 重新安排行程 mmaerd Leetcode刷题学习记录 leetcode 算法职场和发展
重新安排行程Leetcode332学习记录自代码随想录给你一份航线列表tickets，其中tickets[i]=[fromi,toi]表示飞机出发和降落的机场地点。请你对该行程进行重新规划排序。所有这些机票都属于一个从JFK（肯尼迪国际机场）出发的先生，所以该行程必须从JFK开始。如果存在多种有效的行程，请你按字典排序返回最小的行程组合。例如，行程[“JFK”,“LGA”]与[“JFK”,“LGB
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
2019-12-22-22:30 涓涓1016
今天是冬至，写下我的日更，是因为这两天的学习真的是能量的满满，让我看到了自己，未来另外一种可能性，也让我看到了这两年这几年的过程中我所接受那些痛苦的来源。一切的根源和痛苦都来自于人生，家庭，而你的原生家庭，你的爸爸和妈妈，是因为你这个灵魂在那一刻选择他们作为你的爸爸和妈妈来的，所以你得接受他，你得接纳他，他就是因为他的存在而给你的学习和成长带来这些痛苦，那其实是你必然要经历的这个过程，当你去接纳的
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
阶段总结反思轻争
马上就要进入10月份了，今天做一下前段时间的总结和反思。前段时间，日更、英语、健身、护肤坚持的比较好。阅读、书法坚持的不好。1.中间被迫停更半个多月，其余时间一直在坚持日更挑战。偶尔也有不想写的时候，就做一下摘抄。因为阅读（输入）没跟上来，所以写作（输出）质量有待进一步加强。2.英语做到了一周至少学习5天，每次不少于30分钟，但是小班课没有跟上更新速度，下一步要争取利用零碎时间补听小班课。3.减肥
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
ARM驱动学习之基础小知识 JT灬新一 ARM 嵌入式 arm开发学习
ARM驱动学习之基础小知识•sch原理图工程师工作内容–方案–元器件选型–采购（能不能买到，价格）–原理图（涉及到稳定性）•layout画板工程师–layout（封装、布局，布线，log）（涉及到稳定性）–焊接的一部分工作（调试阶段板子的焊接）•驱动工程师–驱动，原理图，layout三部分的交集容易发生矛盾•PCB研发流程介绍–方案，原理图(网表)–layout工程师（gerber文件）–PCB板
ARM驱动学习之5 LEDS驱动 JT灬新一嵌入式 C 底层 arm开发学习单片机
ARM驱动学习之5LEDS驱动知识点：•linuxGPIO申请函数和赋值函数–gpio_request–gpio_set_value•三星平台配置GPIO函数–s3c_gpio_cfgpin•GPIO配置输出模式的宏变量–S3C_GPIO_OUTPUT注意点：DRIVER_NAME和DEVICE_NAME匹配。实现步骤：1.加入需要的头文件：//Linux平台的gpio头文件#include//三
ARM驱动学习之4小结 JT灬新一嵌入式 C++arm开发学习 linux
ARM驱动学习之4小结#include#include#include#include#include#defineDEVICE_NAME"hello_ctl123"MODULE_LICENSE("DualBSD/GPL");MODULE_AUTHOR("TOPEET");staticlonghello_ioctl(structfile*file,unsignedintcmd,unsignedlo
展现思维导图魅力，不断挖掘人生宝藏思维导图讲师Mandy
第13期最强思维导图训练营已经结束一周了，但是我依旧是感觉所有学员还在努力的学习，这些学员中有教师、学生、白领、公务员、宝妈等等，只要你努力，只要你想改变自己，任何行业，任何岗位都可以参与进来，28天足以让你见成效，在这28天中，我们的学员不仅仅是收获了一枚毕业证，最重要的是让自己的思维方式得到升级，今天的你为自己投资，明天的你就会感谢你今天的付出，我们来听一听来自13期最强思维导图训练营优秀学员
2019-3-23晨间日记红红火火小耳朵
今天是什么日子起床：7点40就寝：23点半天气：有太阳，不过一会儿出来一会儿进去特别清爽的凉意，还蛮舒服的心情：小激动要给女朋友过生日啦纪念日：田田女士过生日任务清单昨日完成的任务，最重要的三件事：1.英语一对一2.运动计划3.认真护肤习惯养成：调整状态周目标·完成进度英语七天打卡（5/7）轻课阅读（87/180）音标课（25/30）读书（福尔摩斯一章）学习·信息·阅读#英语课#Cookingte
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio