茶桁

32. 深度学习进阶 - Transfer Learning

Hi，你好。我是茶桁。

之前的课程中，咱们学习了CNN的原理，学习了pooling, fully connected是做什么的。还了解了理论上简单的模型也是可以做事情的，只不过在特定的一些情况下要解决问题的时候简单方法效果不太好，所以用了像LSTM，或者RNN、CNN之类的结构。

这些本质上都是在做特征的提取。一个经典的观念是，神经网络其实一共都可以分成两个部分，第一个部分是特征提取，第二个部分是分类器。像fully connected layer，其实就是之后再加上一个Softmax或者log Softmax，在做分类器的实现。

前面在进入全连接层之前，也在进入Softmax或者log Softmax之前，全部做的都是特征提取的事。

不管你是线性函数，就线性变化全连接的这种网络，还是RNN，LSTM或者CNN等等，在进入Softmax之前，这些都是在做特征提取。

Hinton当时的说法我觉得说的很有道理，就说「特征提取的作用是让相似的东西不相似，让不相似的相似」。

意思就是，我们对于任何一个神经网络来说，到最终的这个全连接，加上Softmax，之前的这些东西不管你是输入的是一个图片还是几个文字，还是说一串数据。所谓的让看起来相似的东西不相似是如果有两个图片，或者两组数据，他们在我们人看起来是比较类似的。但是假设他们的label不一样的话，我们整个特征提取的过程是把输入的这两个x，人看起来是一样的，在最后输出的这个地方要尽可能的不一样。所以送到分类器里边，它们结果差距才能大。

如果这两个东西看起来很不一样，就假如说有两只猫，一只猫特别瘦，黑黑的。一只是橘猫，特别的胖，大小也不一样。但这个在图片来说这差距是很大的。我们整个做feature extraction的时候是要把这两张图在最后变成一样，就在最后的时候变得相似。输入的时候不相似，但是经过特征提取其实要把它变相似。这样送入到了Softmax它才会产生分类的作用。

接下来讲了卷积神经网络的计算过程以及整个模型的搭建是什么样的。然后还讲了RES-NET的原理，这个也需要去理解。

Transfer Learning

那么现在，咱们今天就跟大家来介绍一个比较重要的概念，深度学习共同的基础部分，就是transfer learning。

咱们现在的这个深度学习模型变得越来越复杂了。上节课给大家举过这些例子，不同的人提出来了不同的模型，
重点给大家介绍了一个RES-NET和Inception model，也称为GoogleNET。

模型现在其实已经变得越来越复杂，这么复杂的结果是什么呢？结果是我们现在已经很难从头到尾搭建一个模型了。现在的模型结构已经这么复杂了，很少有人能有时间，或者在工作的时候有时间、有精力能从零开始一层一层的去做搭建，这是第一方面。

第二个方面，大家还发现一个特点。在结构中越接近前边虽然任务不一样，比如解决动物分类或者解决人物分类，但是越靠近前边，它们的特征相似度越高。

换句话说，有一个RES-NET专门对人物分类，还有一个是是专门做动物，它们分的类别完全不一样。但是就前边这些CNN的结果往往都很相似，而且是越往前越相似。

这是因为这些过程都是在做特征提取，如果都是一个比较相似的图片任务的话，在这个过程中特征提取其实从刚开始的时候在解析图片上的重要程度，其实要提取的东西都是类似的。

比方说识别我左手的水和我右手的手机，还有我前面站着一个美女，刚开始都是要识别它的轮廓。然后都要识别它的局部的形状，还要识别颜色… 这样的一个直接的结果，其实我们每一层用的filter都是类似的，只要达到一个比较好的结果，前面的这些filter都是类似的。

filter类似是因为filter控制的是我们要提取什么重要特征。那么我们就发现从前到后，其实越是前边越是比较简单的特征，线、块这些，到后边越来越综合。

有了这个之后大家就发现，既然现在模型这么复杂，从头到尾要搭建一个模型已经很难了，我们可以直接用这个模型的结构。

第二我们发现不仅模型的结构可以，模型的权重都也可以。可以用这个模型的权重来训练，直接把这个模型的权重拿过来。

其实也就是说，我们可以直接下载一个模型，把别人训练好的权重一起拿过来，这些东西就是一堆数字。然后它是在task a上弄的，我把它用到了task b上。训练的时候让它不要进行反向传播，在进入全连接层的时候再进行反向传播。

大家把这种学习方式就叫做transfer Learning，迁移学习。我们平时日常在工作的时候经常会这么做。

客观上来讲，不同的任务，任务越类似肯定迁移的时候越好迁移。所以说其实它和任务的相似度以及和数据量的相对大小很有关系。

假设我们两个任务，A和B。这两个任务，A是分类狗，B是分类狼，A原本训练数据集是100W，B的训练集是1W。那么这两个任务比较而言，任务相似度非常大，原任务相对新任务数据量比较大，这个时候基本上迁移学习就非常好迁移，我们都可以不去更改进入全连接层之前的所有内容就可以进行迁移，只需要更改全连接层。也就是特征提取的部分完全平移。

那么如果A任务还是分类狗，B任务是分类汽车。A原本训练数据集是100W，B的训练集是5000W。那这两个任务比较而言，任务相似度非常小，原任务相对新任务数据量是小的，这个时候迁移学习就变得很困难，可能也只有图像线条，颜色这些个特征提取的部分可以迁移，基本是特征提取的最前边的部分。

所以，Transfer Learning的容易程度，在一个二维平面直角坐标系内的两个相关项，也就是x和y轴就是任务相似度和原任务相对新任务数据量的大小。

如果重新训练，怎么样来transfer呢？说了这么多，还是直接来看一个实例, 来看看我们具体该如何做「冻结」。

用的这个数据集, cifar10，这也是一个很经典的数据，它是十个典型的很常见的物品的分类。

咱们先引入必要的库，然后down数据集：

import torchvision
import torch.nn.functional as F
from torchvision.transforms import transforms
import torch
import matplotlib.pyplot as plt
from torch import nn
from icecream import ic


cifar_10 = torchvision.datasets.CIFAR10('.', download=True)

这个文件一共170多兆，大部分人物提取的特征差不多，所以权重可以不用更新，用其他相似任务的参数，相当于新模型初始化的时候，理解为更接近在最优点附近。

它里面的每一个数据的类型是一个PRL的image, 要在PyTorch里对这个图片进行使用，我们需要进行一个预处理。我们需要在前面定义一个方法：

preprocess = transforms.Compose([
    transforms.Resize(224),
    transforms.CenterCrop(224),
    transforms.ToTensor()
])

首先, 我们要先Resize，然后用一个CenterCrop，让图片以中心扩散进行切割。如果有些图片不是正方形，那么第二个操作就是把中间的部分裁一个正方形出来。最后再把它变成一个Tensor。

然后我们需要修改一下数据获取数据时的transform。

cifar_10 = torchvision.datasets.CIFAR10('.', download=True, transform=preprocess)

现在看一下, cifar_10的数据就变成tensor了，shape是[3,224,224]

cifar_10[0][0].shape

---
torch.Size([3, 224, 224])

得到Tensor数据之后，要训练的时候得一次一次的取不同的数值出来，我们要做SGD，随机梯度下降。那么在做这个的时候有一种方法，写个复循环然后每次随机取一些index，再把这些index的值给它取出来，这是一种方法。

还有一种方法，我们可以直接用DataLoader，声明了之后每次要生成一个迭代器，每次会输出一些内容。

train_loader = torch.utils.data.DataLoader(cifar_10, batch_size=512, shuffle=True)

如果要把所有的数据传输进去，它有5万个照片太大了，内存吃不消。所以要把它做成SGD，要每次随机取一个东西。

然后我们来定义一个RES-NET：

resnet = torchvision.models.resnet18()

有了这样的RES-NET之后，它输出的是1000维的，而我们这里其实是需要一个10维的，那我们就需要把它的最后一层给它重新做一下。

feature_num = resnet.fc.in_features
resnet.fc = nn.Linear(feature_num, 10)

如果我们没有这一句，我们可以来看看它会输出什么。

ic(resnet(cifar_10[0][0].unsqueeze(0)))

---
ic| resnet(cifar_10[0][0].unsqueeze(0)): tensor([[-6.9484e-01, ..., 1008e+00]], grad_fn=<AddmmBackward0>)
tensor([[-6.9484e-01, ..., 1.1008e+00]],
       grad_fn=<AddmmBackward0>)

输出的是一个很长的东西，其实是有1,000维的，这里输出了1,000个。

现在如果把它的最后一层全连接层改了，变成10分类，因为这个cifar10是一个是分类问题。

feature_num = resnet.fc.in_features
resnet.fc = nn.Linear(feature_num, 10)
ic(resnet(cifar_10[0][0].unsqueeze(0)))

改完之后输出的数据就是10维的了，大家可以自己去跑一下代码，我这里就不贴了。

接着我们再来生成一个loss函数和一个优化器。

criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(resnet.parameters(), lr=1e-3, momentum=0.9)

criterion是测量尺度、考核标准的意思。parameters是要把所有参数进行拟合，进行重新训练。

epochs = 2
losses = []

for epoch in range(epochs):
    epoch_loss = 0
    for i, (images, labels) in enumerate(train_loader):
        ic(epoch, i)
        predicts = resnet(images)
        loss = criterion(output, labels)
        optimizer.zero_grad()

        loss.backward()
        optimizer.step()

        epoch_loss += loss.item()

        if i > 0:
            print('Epoch: {} batch: {}, loss ==> {}'.format(epoch, i, epoch_loss / i))
    losses.append(epoch_loss / i)

plt.plot(losses)

---

0it [00:00, ?it/s]
ic| epoch: 0, i: 0
1it [00:53, 53.71s/it]ic| epoch: 0, i: 1
2it [01:42, 50.98s/it]
Epoch: 0 batch: 1, loss ==> 4.71190333366394
ic| epoch: 0, i: 2
...
98it [1:12:04, 44.13s/it]
Epoch: 1 batch: 97, loss ==> 1.7719330222336287

现在是这么个结果, 我们先来保存一下，我创建了一个32.log, 用于暂时保存咱们的结果。那因为我训练的时候加了一个tqdm，所以也把时间打印了出来，不过为了避免代码上的误解，所以代码我还是给的没有加tqdm的样子。

现在要迁移怎么迁移呢？很简单，第一步我们需要改一下我们的RES-NET。

resnet = torchvision.models.resnet18(pretrained=True)

我们加一个参数pretrained，然后将值设为True，现在要保留它的数据，保留之前训练的权重。

第二步要冻结它的这些参数，把RES-NET里边所有的parameters，每一个都有一个requires grad，给它定义成false。

for param in resnet.parameters():
    param.requires_grad = False # frozen weights

设置成false之后进行反向传播的时候这个值就不更新了。不更新的话那就相当于冻结了。

之前写的resnet.fc就相当于重写了fc分类层。

resnet.fc = nn.Linear(feature_num, 10) # rewrite fc classifier

假设现在的任务和原来任务不相似，或者说现在原来数据量和现在数据量相比偏小，那么对于这个RES-NET，不能把它所有的requires grad设置成false，要把它前面部分的给它设置成false，后边设置成true。

重写了这个FC classifire之后，新声明的参数默认它是需要进行梯度下降的，所以不需要在这写成false。就在这里，这个FC的grad默认是true。

那到这一步， transfer就结束了，我们可以重新训练来看看。

你会发现，时间上明显快多了。这个就是因为咱们这次训练的参数少了很多。

0it [00:00, ?it/s]ic| epoch: 0, i: 0
1it [00:17, 17.99s/it]ic| epoch: 0, i: 1
2it [00:34, 16.92s/it]
Epoch: 0 batch: 1, loss ==> 5.019284725189209
ic| epoch: 0, i: 2
3it [00:50, 16.54s/it]
Epoch: 0 batch: 2, loss ==> 3.7500953674316406
ic| epoch: 0, i: 3
...
98it [26:04, 15.96s/it]
Epoch: 1 batch: 97, loss ==> 1.108948134884392
...

之前我们每一轮训练几乎都要花个50s左右，现在基本在16左右，速度上提升了3倍。从总时间上我们也可以看出来，训练速度提升了好几倍，从原来的一小时12分钟，直接降到了26分钟。并且，loss也有所提升。

那么我们该怎么去看这个模型的层数，确定哪些是在前面部分，哪些实在后面呢？对于一个模型而言，最简单的办法就是直接print出来，比如说咱们的resnet18：

from torchvision.models import resnet18
print(resnet18())

---
ResNet(
  (conv1): Conv2d(3, 64, kernel_size=(7, 7), stride=(2, 2), padding=(3, 3), bias=False)
  (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
  (relu): ReLU(inplace=True)
  (maxpool): MaxPool2d(kernel_size=3, stride=2, padding=1, dilation=1, ceil_mode=False)
  (layer1): Sequential(
    (0): BasicBlock(
      (conv1): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU(inplace=True)
      (conv2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn2): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    )
    (1): BasicBlock(
      (conv1): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU(inplace=True)
      (conv2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn2): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    )
  )
  (layer2): Sequential(
    (0): BasicBlock(
      (conv1): Conv2d(64, 128, kernel_size=(3, 3), stride=(2, 2), padding=(1, 1), bias=False)
      (bn1): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU(inplace=True)
      (conv2): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn2): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (downsample): Sequential(
        (0): Conv2d(64, 128, kernel_size=(1, 1), stride=(2, 2), bias=False)
        (1): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      )
    )
    (1): BasicBlock(
      (conv1): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn1): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU(inplace=True)
      (conv2): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn2): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    )
  )
  (layer3): Sequential(
    (0): BasicBlock(
      (conv1): Conv2d(128, 256, kernel_size=(3, 3), stride=(2, 2), padding=(1, 1), bias=False)
      (bn1): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU(inplace=True)
      (conv2): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn2): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (downsample): Sequential(
        (0): Conv2d(128, 256, kernel_size=(1, 1), stride=(2, 2), bias=False)
        (1): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      )
    )
    (1): BasicBlock(
      (conv1): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn1): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU(inplace=True)
      (conv2): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn2): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    )
  )
  (layer4): Sequential(
    (0): BasicBlock(
      (conv1): Conv2d(256, 512, kernel_size=(3, 3), stride=(2, 2), padding=(1, 1), bias=False)
      (bn1): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU(inplace=True)
      (conv2): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn2): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (downsample): Sequential(
        (0): Conv2d(256, 512, kernel_size=(1, 1), stride=(2, 2), bias=False)
        (1): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      )
    )
    (1): BasicBlock(
      (conv1): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn1): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU(inplace=True)
      (conv2): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn2): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    )
  )
  (avgpool): AdaptiveAvgPool2d(output_size=(1, 1))
  (fc): Linear(in_features=512, out_features=1000, bias=True)
)

这次我将结果打全，我们可以清晰的看到这个模型里从上到下，从前到后的每一层，最后一层是一个fc。

那除此之后，其实我们可以借用第三方库来进行计算，有一个库叫做torchsummary，

from torchsummary import summary
summary(resnet18(), (3, 224, 224))

---
----------------------------------------------------------------
        Layer (type)               Output Shape         Param #
================================================================
            Conv2d-1         [-1, 64, 112, 112]           9,408
            ...
AdaptiveAvgPool2d-67            [-1, 512, 1, 1]               0
           Linear-68                 [-1, 1000]         513,000
================================================================
Total params: 11,689,512
Trainable params: 11,689,512
Non-trainable params: 0
----------------------------------------------------------------
Input size (MB): 0.57
Forward/backward pass size (MB): 62.79
Params size (MB): 44.59
Estimated Total Size (MB): 107.96
----------------------------------------------------------------

这个去监测模型的层数和信息就更好一些，可以很直观的看到每一层以及整个模型的相关信息。不管是你自己的模型还是第三方预先训练好的其实都可以。我们在后面设置了一下输入的大小，设置了之后，summary在后面参数一共多少就一个一个都给你显示出来了。我们刚才输入的(3, 224, 224)，然后从第一层开始的Output Shape是多少，一层一层的向下就直接有了。

这两个方式都还是很有用的。

那么之后做训练的时候大家要对几个数字稍微多一点敏感性，我们来看，首先我们定义一个loss函数：

def cross_entropy(y, yhat): return -np.sum(y*np.log2(yhat))

然后我们输入下面几个值做测试：

cross_entropy([0, 1], [0.5]*2)
cross_entropy([0, 0, 0, 0, 1], [0.2]*5)
cross_entropy([0]*9 + [1], [0.1] * 10)
cross_entropy([0, 0, 1], [0.33] * 3)

---
1.0
2.321928094887362
3.321928094887362
1.5994620704162712

transfer learning基于的是模型从前往后。前面层学的东西比较基础，到后边学的抽象层次越来越高，看到的是更复杂的一些。

那咱们现在就再来演示一下它到底学的学到都是什么东西。那么为了看一下这个到底学的是什么，我再次贡献一下自己。

这个是早些时候我一个同学帮我画的头像，就拿它来看吧。

首先，我们前面看到打印结果了，resnet18的第一层是conv1，我们来看看第一层：

from PIL import Image

preprocess = transforms.Compose([
    transforms.Resize(224),
    transforms.CenterCrop(224),
    transforms.ToTensor()
])
resnet = torchvision.models.resnet18(pretrained=True)

myself = preprocess(Image.open('./assets/chaheng2.png'))
resnet.conv1(myself.unsqueeze(0))

然后我们就可以看到一堆的tensor数据，这个unsqueeze是将数据改变了一下结构，从myself变成了[[myself]]，改成这样是因为torch每次接收的是一个batch的东西，直接输入一个图片是不行的。

我们看一下它的这个输出,第一个卷积的输出是什么：

我们可以看到，它的shape是[1, 64, 112, 112],那这里边的分别是什么？

第一个维度，这个1是batch的数量。64是filter的channel，所以它输出了64张图片。后面的112和112是一组数据，从这个数据来看，这个图片经过卷积之后，经历了一个缩小的变化。从原来的224缩小到了112，经历了一个下采样。

接着咱们来看一下具体的数据内容，看看output第0个的内容是什么样的：

plt.imshow(output[0][0].detach())

因为结果还在内存里，所以我们永乐一个detach()。

它把我的轮廓给提出来了。

我们再来看看别的是什么样，我们改成[0][2]：

这个貌似是将背景扣了。

我们不一张一张来看了，咱们来将探索过程写个循环，看一下它到底都做了什么。

width = 8
fig, ax = plt.subplots(output[0].shape[0] // width, width, figsize=(20, 20))

for i in range(output[0].shape[0]):
    ix = np.unravel_index(i, ax.shape)
    plt.sca(ax[ix])
    ax[ix].title.set_text('filter-{}'.format(i))

    plt.imshow(output[0][i].detach())

plt.show()

它这64个学到的几乎每个都不一样，那有些是有用的，有些是没用的。有些是从边缘层面上，比如说filter20就是从边缘上，而有一些，比如filter21就是从颜色上。

那么如果我们现在想把第二个、第三个、第四个这些都拿出来的话怎么办？当然理论上可以沿着它的结构给一层一层解出来，但是PyTorch里面给咱们的提供了一个比较简单的方法。

那刚才写的那个代码，其实是在进行前向传播，就我们刚才写代码就是在模拟它的前向传播，forward。PyTorch就给我们提供了一个很方便东西，它可以给前向传播及反向传播的时候注册一个函数。就比如说：

conv_model = [m for _, m in resnet.named_modules() if isinstance(m, torch.nn.Conv2d)]

for m in conv_model:
    m.register_forward_hook()

我们现在把resnet里边所有的model拿出来，然后如果这个model它是卷机，给这些所有的模型注册一个函数。这个函数是是他在进行前向传播的时候会自己调用的，就不需要咱们再手动的去写了。

那我们现在就来将之前写的内容抽象成一个函数visualize_model，在定义这个函数的时候需要注意一下PyTorch的相关API，

那我们在定义的时候，也就需要一样传递这些参数：

def visualize_model(model, input_, output):
    width = 8
    ...
    plt.show()

这样前向传播的时候,它会自动调用。现在我们就可以让它来进行前向传播：

for m in conv_model:
    m.register_forward_hook(visualize_model)

with torch.no_grad():
    resnet(myself.unsqueeze(0))

no_grad的意思是不让它进行反向传播，只进行前向传播。

我们在观察它每一层的结果的时候，就会发现越到后面就越抽象，我们捡中间某一张贴出来来看。

就基本上，这个时候还能勉强辨认出是个任务头像，再往后的结果，我肉眼已经分辨不出来它是个啥了。就这是整个模型一层一层学到的东西，它里边是从刚开始的时候比较的底层、比较的基础，后边会提取的东西越来越多。

就咱们在这里所做的这种权重可视化，有一个比较有趣的应用：deep dream，它就是将刚才这些学到的靠后的权重，然后应用到一张图片上。就我们刚刚可视化那种层数再应用到一些新图片上，就会产生这样的效果。如果感兴趣的可以自己试一下。

好那咱们这个RES-NET和RES-NET可视化，以及transfer learning的内容，到这里就可以告一段落了。整个的深度学习的基础部分，也就到这里结束了。

最后，我们来留一个小作业。

作业

那么本节课的最后，给大家留一个小作业，稍微还是有点难度的，需要大家自己去查阅相关手册才行，不过知识点都是讲过的。作业内容为**「对验证码进行识别」**。

练习内容：训练一个模型，对验证码中的字符进行分类识别，并最终完成验证码识别的任务。

数据集：数据集内包含0-9以及A-Z一共36个字符，训练集中每个字符有50张图片，验证集中每个字符有10张图片，验证码数据集是由随机去除的4个字符图片拼接而成。

需要的相关知识：

数据读取

使用torch搭建、训练、验证模型

模型预测于图片切分

好，给大家提供下思路，我们将我们需要解决的问题分成四步：第一个，先建立字符对照表，第二个，要定义一个datasets和一个dataloader。第三个，需要定义网络结构。第四个，定义模型训练函数。最后，就是验证训练结果。

数据集如下：

链接: https://pan.baidu.com/s/1Ua-nJGqkQO_nDZaLyFqE7g?pwd=uvsd 提取码: uvsd
–来自百度网盘超级会员v6的分享

你可能感兴趣的:(茶桁的AI秘籍,-,核心基础,深度学习,人工智能,迁移学习)

guava loadingCache代码示例 IM 胡鹏飞 Java 工具类介绍
publicclassTest2{publicstaticvoidmain(String[]args)throwsException{LoadingCachecache=CacheBuilder.newBuilder()//设置并发级别为8，并发级别是指可以同时写缓存的线程数.concurrencyLevel(8)//设置缓存容器的初始容量为10.initialCapacity(10)//设置缓存
系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
为什么会出现“与此站点的连接不安全”警告？
当浏览器弹出“与此站点的连接不安全”的红色警告时，不仅会让访客感到不安，还可能直接导致用户流失、品牌信誉受损，甚至引发数据泄露风险。作为网站运营者，如何快速解决这一问题？一、为什么会出现“与此站点的连接不安全”警告？浏览器提示“不安全连接”，本质上是检测到当前网站与用户之间的数据传输未经过加密保护。以下是触发警告的常见原因：1.未安装SSL证书SSL（SecureSocketsLayer）证书是网
什么是证书吊销列表？CRL 解释 WoTrusSSL ssl https
数字证书是安全在线互动的支柱，用于验证身份和确保加密通信。但是，当这些证书被盗用或滥用时，必须立即撤销它们以维持信任。这就是证书撤销列表(CRL)的作用所在。CRL由证书颁发机构(CA)维护，对于识别和撤销已撤销的证书，防止其造成危害至关重要。在本指南中，我们将探讨什么是CRL、它们如何运作以及为什么它们对网络安全至关重要。什么是证书吊销列表(CRL)？证书吊销列表(CRL)是证书颁发机构(CA)
有必要获得WHQL测试认证吗，有什么好处？
什么是WHQL认证？WHQL是MicrosoftWindowsHardwareQualityLab的缩写，中文意思是Windows硬件设备质量实验室，主要是对Windows操作系统的兼容性测试，检验硬件产品和驱动程序在windows系统下的兼容性和稳定性。当某一硬件或软件通过WHQL测试时，制造商可以在其产品包装和广告上使用“DesignedforWindows”标志。该标志可以证明硬件或软件已经
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
驱动程序为什么要做 WHQL 认证? GDCA SSL证书网络协议网络
驱动程序进行WHQL（WindowsHardwareQualityLabs）认证的核心价值在于解决兼容性、安全性和市场准入三大关键问题，具体必要性如下：️‌一、规避系统拦截，保障驱动可用性‌消除安装警告‌未认证的驱动在安装时会触发Windows的‌红色安全警告‌（如“无法验证发布者”），甚至被系统强制拦截。通过WHQL认证的驱动获得微软数字签名，用户可无阻安装‌。满足系统强制要求‌Windows1
求是网：“内卷式”竞争的突出表现和主要危害有哪些？加百力财经研究科技知识人工智能大数据
"内卷式"竞争主要表现为：企业层面的低价竞争、同质化竞争和营销"逐底竞争"；地方政府层面的违规优惠政策、盲目重复建设和设置市场壁垒。危害体现在三个层面：微观上导致"劣币驱逐良币"，损害消费者利益；中观上破坏行业生态，挤压产业链利润空间；宏观上扭曲资源配置，抑制创新活力。什么是“内卷式”竞争？概括其一般特征，是指经济主体为了维持市场地位或争夺有限市场，不断投入大量精力和资源，却没有带来整体收益增长的
WHQL签名怎么申请 GDCA SSL证书 windows
WHQL（WindowsHardwareQualityLabs）签名是微软对硬件和驱动程序进行认证的一种方式，以确保它们与Windows操作系统的兼容性和稳定性。以下是申请WHQL签名的基本步骤，供您参考：1.准备阶段准备硬件设备和驱动程序：确保您的硬件设备已经准备好，并且对应的驱动程序已经经过充分的测试，能够在各种配置和环境下正常工作。获取EV代码签名证书：根据微软的要求，驱动程序进行WHQL认
JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
发票合并工具小朋的软件园前端 javascript java html 服务器
"发票合并工具"是一款专为高效整理票据设计的实用工具，支持将来自不同渠道的发票文件（如PDF文档、各类图片格式）快速整合为排版规范的PDF文件，尤其适用于财务报销场景下的批量票据处理需求。核心功能亮点多格式兼容：无缝导入PDF文件及常见图片格式（.png/.jpg/.jpeg/.bmp），适配多来源发票整合需求。智能布局配置：提供灵活的页面布局选项（每页2/3/4张发票），其中"2合1"模式针对报
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
k8s:安装 Helm 私有仓库ChartMuseum、helm-push插件并上传、安装Zookeeper 云游 docker helm helm-push
ChartMuseum是Kubernetes生态中用于存储、管理和发布HelmCharts的开源系统，主要用于扩展Helm包管理器的功能核心功能‌集中存储‌：提供中央化仓库存储Charts，支持版本管理和权限控制。‌‌跨集群部署‌：支持多集群环境下共享Charts，简化部署流程。‌‌离线部署‌：适配无网络环境，可将Charts存储在本地或局域网内。‌‌HTTP接口‌：通过HTTP协议提供服务，用户
上位机知识篇---SD卡&U盘镜像
常用的镜像烧录软件balenaEtcherbalenaEtcher是一个开源的、跨平台的工具，用于将操作系统镜像文件（如ISO和IMG文件）烧录到SD卡和USB驱动器中。以下是其使用方法、使用场景和使用注意事项的介绍：使用方法下载安装：根据自己的操作系统，从官方网站下载对应的安装包。Windows系统下载.exe文件后双击安装；Linux系统若下载的是.deb文件，可在终端执行“sudodpkg-
【LeetCode 热题 100】24. 两两交换链表中的节点——（解法一）迭代+哨兵 xumistore LeetCode leetcode 链表算法 java
Problem:24.两两交换链表中的节点题目：给你一个链表，两两交换其中相邻的节点，并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题（即，只能进行节点交换）。文章目录整体思路完整代码时空复杂度时间复杂度：O(N)空间复杂度：O(1)整体思路这段代码旨在解决一个经典的链表操作问题：两两交换链表中的节点(SwapNodesinPairs)。问题要求将链表中每两个相邻的节点进行交换
Guava LoadingCache sqyaa. java并发编程 Java知识 jvm 缓存 guava
LoadingCache是GoogleGuava库提供的一个高级缓存实现，它通过自动加载机制简化了缓存使用模式。核心特性自动加载机制当缓存未命中时，自动调用指定的CacheLoader加载数据线程安全：并发请求下，相同key只会加载一次灵活的过期策略支持基于写入时间(expireAfterWrite)和访问时间(expireAfterAccess)的过期可设置最大缓存大小，基于LRU策略淘汰丰富的
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
基于定制开发开源AI智能名片S2B2C商城小程序的社群游戏定制策略研究说私域人工智能小程序游戏
摘要：本文聚焦社群游戏定制领域，深入探讨以社群文化和用户偏好为导向的定制策略。通过分析互动游戏活动、社群文化塑造等关键要素，结合定制开发开源AI智能名片S2B2C商城小程序的技术特性，提出针对性游戏定制方案。研究旨在提升社群用户参与度与游戏体验，为社群游戏发展提供理论支持与实践指导。关键词：社群游戏定制；定制开发开源AI智能名片S2B2C商城小程序；社群文化；用户偏好一、引言在数字化社交蓬勃发展的
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
LeetCode 148. 排序链表：归并排序的细节解析进击的小白菜 2025 Top100 详解 leetcode 链表算法
文章目录题目描述一、方法思路：归并排序的核心步骤二、关键实现细节：快慢指针分割链表1.快慢指针的初始化问题2.为什么选择`fast=head.next`？示例1：链表长度为偶数（`1->2->3->4`）三、完整代码实现四、复杂度分析五、总结题目描述LeetCode148题要求对链表进行排序，时间复杂度需为O(nlogn)，且空间复杂度为O(logn)。由于链表的特殊结构（无法随机访问），归并排序
前端项目架构设计要领
1.架构设计的核心目标在设计前端项目架构时，核心目标是模块化、可维护、可扩展、可测试，以及开发效率的最大化。这些目标可以通过以下几个方面来实现：组件化：将UI功能封装为可复用的组件。模块化：将业务逻辑分解为独立的模块或服务。自动化构建与部署：实现自动化构建、测试和部署流程，减少人为操作的错误。代码规范化与检查：确保团队协作时，代码风格和质量一致。2.项目目录结构设计一个清晰合理的目录结构对大型项目
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
嵌入式系统LCD显示模块编程实践
本文还有配套的精品资源，点击获取简介：本文档提供了一个具有800x480分辨率的3.5英寸液晶显示模块LW350AC9001的驱动程序代码，以及嵌入式系统中使用C/C++语言进行硬件编程的实践指南。该模块的2mm厚度使其适用于空间受限的便携式设备。内容包括驱动程序源代码、硬件控制接口使用方法，以及如何在嵌入式系统中进行图形处理、电源管理与性能优化。1.嵌入式系统原理1.1嵌入式系统概念嵌入式系统是
深入剖析OpenJDK 18 GA源码：Java平台最新发展想法臃肿
本文还有配套的精品资源，点击获取简介：OpenJDK18GA作为Java开发的关键里程碑，提供了诸多新特性和改进。本文章深入探讨了OpenJDK18GA源码，揭示其内部机制，帮助开发者更好地理解和利用这个版本。文章还涵盖了PatternMatching、SealedClasses、Records、JEP395、JEP406和JEP407等特性，以及HotSpot虚拟机、编译器、垃圾收集器、内存模型
微信开发者验证接口开发 362217990 微信开发者 token 验证
微信开发者接口验证。 Token，自己随便定义，与微信填写一致就可以了。根据微信接入指南描述 http://mp.weixin.qq.com/wiki/17/2d4265491f12608cd170a95559800f2d.html 第一步：填写服务器配置第二步：验证服务器地址的有效性第三步：依据接口文档实现业务逻辑这里主要讲第二步验证服务器有效性。建一个
一个小编程题-类似约瑟夫环问题 BrokenDreams 编程
今天群友出了一题：一个数列,把第一个元素删除,然后把第二个元素放到数列的最后,依次操作下去,直到把数列中所有的数都删除,要求依次打印出这个过程中删除的数。 &
linux复习笔记之bash shell (5) 关于减号-的作用 eksliang linux关于减号“-”的含义 linux关于减号“-”的用途 linux关于“-”的含义 linux关于减号的含义
转载请出自出处： http://eksliang.iteye.com/blog/2105677 管道命令在bash的连续处理程序中是相当重要的，尤其在使用到前一个命令的studout（标准输出）作为这次的stdin（标准输入）时，就显得太重要了，某些命令需要用到文件名，例如上篇文档的的切割命令（split）、还有
Unix(3) 18289753290 unix ksh
1)若该变量需要在其他子进程执行，则可用"$变量名称"或${变量}累加内容什么是子进程？在我目前这个shell情况下，去打开一个新的shell，新的那个shell就是子进程。一般状态下，父进程的自定义变量是无法在子进程内使用的，但通过export将变量变成环境变量后就能够在子进程里面应用了。 2)条件判断： &&代表and ||代表or&nbs
关于ListView中性能优化中图片加载问题酷的飞上天空 ListView
ListView的性能优化网上很多信息，但是涉及到异步加载图片问题就会出现问题。具体参看上篇文章http://314858770.iteye.com/admin/blogs/1217594 如果每次都重新inflate一个新的View出来肯定会造成性能损失严重，可能会出现listview滚动是很卡的情况，还会出现内存溢出。现在想出一个方法就是每次都添加一个标识，然后设置图
德国总理默多克：给国人的一堂“震撼教育”课永夜-极光教育
http://bbs.voc.com.cn/topic-2443617-1-1.html德国总理默多克：给国人的一堂“震撼教育”课　安吉拉—默克尔，一位经历过社会主义的东德人，她利用自己的博客，发表一番来华前的谈话，该说的话，都在上面说了，全世界想看想传播——去看看默克尔总理的博客吧！　　德国总理默克尔以她的低调、朴素、谦和、平易近人等品格给国人留下了深刻印象。她以实际行动为中国人上了一堂
关于Java继承的一个小问题。。。随便小屋 java
今天看Java 编程思想的时候遇见一个问题，运行的结果和自己想想的完全不一样。先把代码贴出来！ //CanFight接口 interface Canfight { void fight(); } //ActionCharacter类 class ActionCharacter { public void fight() { System.out.pr
23种基本的设计模式 aijuans 设计模式
Abstract Factory：提供一个创建一系列相关或相互依赖对象的接口，而无需指定它们具体的类。　　Adapter：将一个类的接口转换成客户希望的另外一个接口。A d a p t e r模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。　　Bridge：将抽象部分与它的实现部分分离，使它们都可以独立地变化。　　Builder：将一个复杂对象的构建与它的表示分离，使得同
《周鸿祎自述：我的互联网方法论》读书笔记 aoyouzi 读书笔记
从用户的角度来看,能解决问题的产品才是好产品,能方便/快速地解决问题的产品,就是一流产品. 商业模式不是赚钱模式一款产品免费获得海量用户后,它的边际成本趋于0,然后再通过广告或者增值服务的方式赚钱,实际上就是创造了新的价值链. 商业模式的基础是用户,木有用户,任何商业模式都是浮云.商业模式的核心是产品,本质是通过产品为用户创造价值. 商业模式还包括寻找需求
JavaScript动态改变样式访问技术百合不是茶 JavaScript style属性 ClassName属性
一:style属性格式: HTML元素.style.样式属性="值"; 创建菜单:在html标签中创建或者在head标签中用数组创建 <html> <head> <title>style改变样式</title> </head> &l
jQuery的deferred对象详解 bijian1013 jquery deferred对象
jQuery的开发速度很快，几乎每半年一个大版本，每两个月一个小版本。每个版本都会引入一些新功能，从jQuery 1.5.0版本开始引入的一个新功能----deferred对象。 &nb
淘宝开放平台TOP Bill_chen C++c 物流 C#
淘宝网开放平台首页：http://open.taobao.com/ 淘宝开放平台是淘宝TOP团队的产品，TOP即TaoBao Open Platform，是淘宝合作伙伴开发、发布、交易其服务的平台。支撑TOP的三条主线为： 1.开放数据和业务流程 * 以API数据形式开放商品、交易、物流等业务； &
【大型网站架构一】大型网站架构概述 bit1129 网站架构
大型互联网特点面对海量用户、海量数据大型互联网架构的关键指标高并发高性能高可用高可扩展性线性伸缩性安全性大型互联网技术要点前端优化 CDN缓存反向代理 KV缓存消息系统分布式存储 NoSQL数据库搜索监控安全想到的问题： 1.对于订单系统这种事务型系统，如
eclipse插件hibernate tools安装白糖_ Hibernate
eclipse helios(3.6)版 1.启动eclipse 2.选择 Help > Install New Software...> 3.添加如下地址： http://download.jboss.org/jbosstools/updates/stable/helios/ 4.选择性安装：hibernate tools在All Jboss tool
Jquery easyui Form表单提交注意事项 bozch jquery easyui
jquery easyui对表单的提交进行了封装，提交的方式采用的是ajax的方式，在开发的时候应该注意的事项如下： 1、在定义form标签的时候，要将method属性设置成post或者get，特别是进行大字段的文本信息提交的时候，要将method设置成post方式提交，否则页面会抛出跨域访问等异常。所以这个要
Trie tree(字典树)的Java实现及其应用-统计以某字符串为前缀的单词的数量 bylijinnan java实现
import java.util.LinkedList; public class CaseInsensitiveTrie { /** 字典树的Java实现。实现了插入、查询以及深度优先遍历。 Trie tree's java implementation.(Insert,Search,DFS) Problem Description Igna
html css 鼠标形状样式汇总 chenbowen00 html css
css鼠标手型cursor中hand与pointer Example：CSS鼠标手型效果 <a href="#" style="cursor:hand">CSS鼠标手型效果</a><br/> Example：CSS鼠标手型效果 <a href="#" style=&qu
[IT与投资]IT投资的几个原则 comsci it
无论是想在电商,软件,硬件还是互联网领域投资,都需要大量资金,虽然各个国家政府在媒体上都给予大家承诺,既要让市场的流动性宽松,又要保持经济的高速增长....但是,事实上,整个市场和社会对于真正的资金投入是非常渴望的,也就是说,表面上看起来,市场很活跃,但是投入的资金并不是很充足的......
oracle with语句详解 daizj oracle with with as
oracle with语句详解转在oracle中，select 查询语句，可以使用with,就是一个子查询，oracle 会把子查询的结果放到临时表中，可以反复使用例子:注意，这是sql语句，不是pl/sql语句，可以直接放到jdbc执行的 ----------------------------------------------------------------
hbase的简单操作 deng520159 数据库 hbase
近期公司用hbase来存储日志,然后再来分析 ,把hbase开发经常要用的命令找了出来. 用ssh登陆安装hbase那台linux后用hbase shell进行hbase命令控制台! 表的管理 1）查看有哪些表 hbase(main)> list 2）创建表 # 语法：create <table>, {NAME => <family&g
C语言scanf继续学习、算术运算符学习和逻辑运算符 dcj3sjt126com c
/* 2013年3月11日20:37:32 地点：北京潘家园功能：完成用户格式化输入多个值目的：学习scanf函数的使用 */ # include <stdio.h> int main(void) { int i, j, k; printf("please input three number:\n"); //提示用
2015越来越好 dcj3sjt126com 歌曲
越来越好房子大了电话小了感觉越来越好假期多了收入高了工作越来越好商品精了价格活了心情越来越好天更蓝了水更清了环境越来越好活得有奔头人会步步高想做到你要努力去做到幸福的笑容天天挂眉梢越来越好婆媳和了家庭暖了生活越来越好孩子高了懂事多了学习越来越好朋友多了心相通了大家越来越好道路宽了心气顺了日子越来越好活的有精神人就不显
java.sql.SQLException: Value '0000-00-00' can not be represented as java.sql.Tim feiteyizu mysql
数据表中有记录的time字段（属性为timestamp）其值为：“0000-00-00 00:00:00” 程序使用select 语句从中取数据时出现以下异常： java.sql.SQLException:Value '0000-00-00' can not be represented as java.sql.Date java.sql.SQLException: Valu
Ehcache（07）——Ehcache对并发的支持 234390216 并发 ehcache 锁 ReadLock WriteLock
Ehcache对并发的支持在高并发的情况下，使用Ehcache缓存时，由于并发的读与写，我们读的数据有可能是错误的，我们写的数据也有可能意外的被覆盖。所幸的是Ehcache为我们提供了针对于缓存元素Key的Read（读）、Write（写）锁。当一个线程获取了某一Key的Read锁之后，其它线程获取针对于同
mysql中blob,text字段的合成索引 jackyrong mysql
在mysql中，原来有一个叫合成索引的，可以提高blob,text字段的效率性能，但只能用在精确查询，核心是增加一个列，然后可以用md5进行散列，用散列值查找则速度快比如： create table abc(id varchar(10),context blog,hash_value varchar(40)); insert into abc(1,rep
逻辑运算与移位运算 latty 位运算逻辑运算
源码：正数的补码与原码相同例+7 源码：00000111 补码：00000111 （用8位二进制表示一个数）负数的补码：符号位为1，其余位为该数绝对值的原码按位取反；然后整个数加1。 -7 源码： 10000111 ，其绝对值为00000111 取反加一：11111001 为-7补码已知一个数的补码，求原码的操作分两种情况：
利用XSD 验证XML文件 newerdragon java xml xsd
XSD文件（XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。具体使用方法和定义请参看： http://www.w3school.com.cn/schema/index.asp java自jdk1.5以上新增了SchemaFactory类可以实现对XSD验证的支持，使用起来也很方便。以下代码可用在J
搭建 CentOS 6 服务器(12) - Samba rensanning centos
（1）安装 # yum -y install samba Installed: samba.i686 0:3.6.9-169.el6_5 # pdbedit -a rensn new password:123456 retype new password:123456 …… （2）Home文件夹 # mkdir /etc
Learn Nodejs 01 toknowme nodejs
（1）下载nodejs https://nodejs.org/download/ 选择相应的版本进行下载（2）安装nodejs 安装的方式比较多，请baidu下我这边下载的是“node-v0.12.7-linux-x64.tar.gz”这个版本（1）上传服务器（2）解压 tar -zxvf node-v0.12.
jquery控制自动刷新的代码举例 xp9802 jquery
1、html内容部分复制代码代码示例: <div id='log_reload'> <select name="id_s" size="1"> <option value='2'>-2s-</option> <option value='3'>-3s-</option