梆子井欢喜坨

李宏毅2020机器学习深度学习(3) CNN卷积神经网络笔记+作业

1. 背景知识
- 1.1 CNN(卷积神经网络)结构介绍
- 1.2 卷积层
- 1.3 Pooling池化层
- 1.4 经过一次卷积与池化的结果
- 1.5 Flatten
- 1.6 注意Filter的维度
- 1.7 补充：1x1卷积
- 1.8 CNN学到了什么
2. 作业描述
3. 数据预处理
4. 在train set 上训练，参考val set上的结果调参
5. 在总的训练集上训练

1. 背景知识

1.1 CNN(卷积神经网络)结构介绍

整体结构图如下所示：

输入数据（如一张图片）会经过许多卷积运算和Pooling池化层，最后拉平为一维再送给一个全连接的神经网络。
首先确定卷积网络中的一些术语：

Kernel size（核的大小），核的大小定义了卷积的视图。
Stride（步长）：它定义了在图像中滑动时，Kernels的步长。Stride=1表示Kernels逐像素滑动通过图像。Stride=2表示Kernels通过每步移动2个像素（即跳过1个像素）在图像中滑动。我们可以使用Stride >= 2对图像进行下采样。
Padding（填充）：Padding定义了图像边框的处理方式。

1.2 卷积层

用不同的Filter去检测图片中是否有特定的pattern。
将Filter在原图像中滑动，与相应区域作对应元素相乘并求和。
注明一下，这里做的其实是互相关函数运算，而不是真正意义上的二维卷积。

6x6的图像，用3x3的Filter处理后，变为4x4的图像（未填充边界）。feature map是每一个feature从原始图像中提取出来的“特征”。其中的值，越大表示对应位置和feature的匹配越完整，越小表示对应位置和feature的反面匹配越完整，而值接近0的表示对应位置没有任何匹配或者说没有什么关联。

每个Filter，都会生成一个新的图像。

可以将Filter中的值看作神经网络中的权重。

1.3 Pooling池化层

卷积操作后，我们得到了一张张有着不同值的feature map，尽管数据量比原图少了很多，但还是过于庞大（比较深度学习动不动就几十万张训练图片），因此接下来的池化操作就可以发挥作用了，它最大的目标就是减少数据量。
池化分为两种，Max Pooling 最大池化、Average Pooling平均池化。
以最大池化为例，选择池化尺寸为2x2，在其内选出最大值写入新的feature map。

1.4 经过一次卷积与池化的结果

生成了一个比原始图像要小的新图像，他的channel数量等于filter的数量。

1.5 Flatten

就是将原本的数据拉成一维，送入一个全连接神经网络。

1.6 注意Filter的维度

假设输入一个1x28x28的二维平面图像。
第一个卷积层有25个3x3的Fliter，每个Filter的参数有9个。
经过第一次卷积操作以后，输出图像维度变为25x26x26。（有多少个filter，就生成多少个新图像）
经过第一次Max Pooling后，输出图像维度变为25x13x13(是个立体的)。
第二个卷积层有50个3x3的Fliter，每个Filter的参数有25x3x3 = 225个。
现在每个Filter要处理的图像不再是平面的了！

1.7 补充：1x1卷积

可以用来控制降维和升维

1.8 CNN学到了什么

将第k个filter的输出求和，记为 $a^{k}$ ，为激活度。现在要求一个输入数据x，能使激活值最大，也就是找到和这个filter对应的pattern最相似的图像。取前12个图像如下，则这些filter就是要在图像中寻找这样的特征。

CNN能够发现图像中是否具有某种特征，而不用在意到底在哪里具有这种特征，这样就不用死板地逐一像素匹配。

2. 作业描述

通过CNN卷积神经网络对食物图片进行分类

训练集与验证集中图片格式为 ‘[类别]_[编号].jpg’

3. 数据预处理

主要是根据图片的文件名切分出图片所属类别，用以计算loss和分类正确率acc
对图片的操作在注释里写得比较详细了，这里不再赘述

# Read image 利用OpenCV(cv2)读入照片并存放在numpy array中
# label 是一个布尔变量，代表需不需要回传y值
def readfile(path, label):
    image_dir = sorted(os.listdir(path))
    # 图像大小为128X128，有RGB三个通道
    x = np.zeros((len(image_dir), 128, 128, 3), dtype=np.uint8)
    y = np.zeros((len(image_dir)), dtype=np.uint8)
    for i, file in enumerate(image_dir):
        img = cv2.imread(os.path.join(path, file))
        x[i, :, :] = cv2.resize(img,(128, 128))
        if label:
            # 训练集图像命名方式为"[类别](数字)_[该类第几张图片](数字).jpg
            # 这里是从图片名称中取出其类别
            y[i] = int(file.split("_")[0])
    if label:
      return x, y
    else:
      return x

4. 在train set 上训练，参考val set上的结果调参

train set和val set中的数据都有标签，我们先在train set上训练模型，并对比模型在train set和val set上预测的正确率。
如果模型在val set上的正确率不高，说明模型的泛化性能不好。
需要调整cnn的参数

5. 在总的训练集上训练

在确保val set，train set上正确率都不错后
将两个训练集合为一个总的训练集
这里优化的就是权重w了

根据训练出的模型为testing data中的图片打标签
感觉识别的结果还是挺不错的~Amazing!

最后放上完整代码：

# -*- coding: utf-8 -*-

# import需要的模组
import os
import numpy as np
import cv2
import torch
import torch.nn as nn
import torchvision.transforms as transforms
from torch.utils.data import DataLoader, Dataset
import time


# 自定义图片加载
class ImgDataset(Dataset):

    def __init__(self, x, y=None, transform = None):
        self.x = x
        # label is required to be a longTensor
        self.y = y
        if y is not None:
            self.y = torch.LongTensor(y)
        self.transform = transform
    
    def __len__(self):
        return len(self.x)

    def __getitem__(self,index):
        X = self.x[index]
        if self.transform is not None:
            X = self.transform(X)
        if self.y is not None:
            Y = self.y[index]
            return X, Y
        else:
            return X


# 自己定义一个子类
class Classifier(nn.Module):
    def __init__(self):
        super(Classifier, self).__init__()
        # torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride, padding)
        ## in_channels: 输入数据的通道数，例如RGB图片通道数为3
        ## out_channels: 输出数据的通道数，就是filter的数量
        ## kernel_size: 卷积核大小
        ## stride:步长，stride=（2,3），则左右扫描步长为2，上下为3
        ## padding: 零填充

        # torch.nn.MaxPool2d(kernel_size, stride, padding)
        # input 維度 [3, 128, 128] 
        # 卷积网络
        self.cnn = nn.Sequential(
            nn.Conv2d(3, 64, 3, 1, 1), # [64, 128, 128]
            nn.BatchNorm2d(64),        # 归一化
            nn.ReLU(),
            nn.MaxPool2d(2, 2, 0),     # [64, 64, 64]

            # 经过一次卷积层后，通道数 = filter的数目
            nn.Conv2d(64, 128, 3, 1, 1), # [128, 64, 64]
            nn.BatchNorm2d(128),
            nn.ReLU(),
            nn.MaxPool2d(2, 2, 0),       # [128, 32, 32]

            nn.Conv2d(128, 256, 3, 1, 1), # [256, 32, 32]
            nn.BatchNorm2d(256),
            nn.ReLU(),
            nn.MaxPool2d(2, 2, 0),      # [256, 16, 16]

            nn.Conv2d(256, 512, 3, 1, 1), # [512, 16, 16]
            nn.BatchNorm2d(512),
            nn.ReLU(),
            nn.MaxPool2d(2, 2, 0),       # [512, 8, 8]

            nn.Conv2d(512, 512, 3, 1, 1), # [512, 8, 8]
            nn.BatchNorm2d(512),
            nn.ReLU(),
            nn.MaxPool2d(2, 2, 0),       # [512, 4, 4]
        )

        # 将卷积输出flatten之后，送入普通的全连接神经网络
        self.fc = nn.Sequential(
            nn.Linear(512*4*4, 1024),
            nn.ReLU(),
            nn.Linear(1024, 512),
            nn.ReLU(),
            nn.Linear(512, 11) # 结果分为11类
        )
    
    def forward(self, x):
        out = self.cnn(x)
        # flatten view()相当于numpy中resize()的功能
        out = out.view(out.size()[0], -1)
        return self.fc(out)


# Read image 利用OpenCV(cv2)读入照片并存放在numpy array中
# label 是一个布尔变量，代表需不需要回传y值
def readfile(path, label):
    image_dir = sorted(os.listdir(path))
    # 图像大小为128X128，有RGB三个通道
    x = np.zeros((len(image_dir), 128, 128, 3), dtype=np.uint8)
    y = np.zeros((len(image_dir)), dtype=np.uint8)
    for i, file in enumerate(image_dir):
        img = cv2.imread(os.path.join(path, file))
        x[i, :, :] = cv2.resize(img,(128, 128))
        if label:
            # 训练集图像命名方式为"[类别](数字)_[该类第几张图片](数字).jpg
            # 这里是从图片名称中取出其类别
            y[i] = int(file.split("_")[0])
    if label:
      return x, y
    else:
      return x


# 此函数将testing set预测结果转换为真实食物类别名称
# 0-Bread, 1-Dairy product, 2-Dessert, 3-Egg 
# 4-Fried food 5-Meat, 6-Noodles/Pasta, 7-Rice
# 8-Seafood 9-Soup, 10-Vegetable/Fruit.
def my_rename(class_num):
    foodname = ['Bread',
                'Dairy product',
                'Dessert','Egg',
                'Fried food',
                'Meat',
                'NoodlesOrPasta',
                'Rice',
                'Seafood',
                'Soup',
                'VegetableOrFruit']
    class_name = foodname[int(class_num)]
    return class_name


# 此函数为测试集图片打上标签
def tag_pic(rename_path, prediction):
    # 获取该目录下所有文件，存入列表中
    # 确保此处顺序与预测输出一致
    fileList=sorted(os.listdir(rename_path))
    try:
        if len(fileList) == len(prediction):
            for i, y in enumerate(prediction):
                classname = my_rename(prediction[i])
                # 设置旧文件名（就是路径+文件名）
                # os.sep添加系统分隔符
                oldname = rename_path + os.sep + fileList[i]   
                # 设置新文件名
                newname = rename_path + os.sep + classname + '_' + fileList[i]
                # 用os模块中的rename方法对文件改名
                os.rename(oldname,newname)  
    except Exception as error:
        print('图片打标签发生错误')
        print(error)
        with open(os.path.join(rename_path,"predict.csv"), 'w') as f:
            f.write('Id,Category\n')
            for i, y in  enumerate(prediction):
                f.write('{},{}\n'.format(i, y))


if __name__ == "__main__":
    # 用readfile函数读取training set, validation srt, testing set
    workspace_dir = 'D:/workspace/lhy_data/hw3/food-11'
    path_model = 'D:/workspace/lhy_DL_Hw_me/Hw3/'
    train_x, train_y = readfile(os.path.join(workspace_dir,"training"), True)
    print("Size of training data = {}".format(len(train_x)))
    val_x, val_y = readfile(os.path.join(workspace_dir, "validation"), True)
    print("Size of validation data = {}".format(len(val_x)))
    test_x = readfile(os.path.join(workspace_dir, "testing"), False)
    print("Size of Testing data = {}".format(len(test_x)))

    # 在 Pytorch 中，我們可以利用 torch.utils.data 的 Dataset 及 DataLoader 來"包装" data
    # 使后续的 training 及 testing 更为方便。
    # Dataset 需要重载两个函数：__len__ 及 __getitem__
    # __len__ 必須要回传 dataset 的大小，而 __getitem__ 則定义了当程式利用取值時，dataset 应该要怎么回传资料
    # training 时做data augmentation
    train_transform = transforms.Compose([
        transforms.ToPILImage(),
        transforms.RandomHorizontalFlip(), # 随机将图片水平翻转
        transforms.RandomRotation(15), # 随机旋转图片
        transforms.ToTensor(), # 将图片转成Tensor,并把数值normalize到[0,1] 
    ])
    # testing 时不需要做data augmentation
    test_transform = transforms.Compose([
        transforms.ToPILImage(),
        transforms.ToTensor(),
    ])

    batch_size = 128
    train_set = ImgDataset(train_x, train_y, train_transform)
    val_set = ImgDataset(val_x, val_y, test_transform)
    # torch中的DataLoader主要是用来将给定数据集中的样本打包成一个一个batch的
    train_loader = DataLoader(train_set, batch_size = batch_size, shuffle=True)
    val_loader = DataLoader(val_set, batch_size=batch_size, shuffle=False)
    
    # 训练部分
    # 使用training set训练，并使用validation set寻找最好的参数
    model = Classifier().cuda()
    loss = nn.CrossEntropyLoss() # 因为是分类任务，损失函数使用交叉熵
    optimizer = torch.optim.Adam(model.parameters(), lr=0.001) # 优化器选择adam
    num_epoch = 30

    for epoch in range(num_epoch):
        epoch_start_time = time.time()
        train_acc = 0.0
        train_loss = 0.0
        val_acc = 0.0
        val_loss = 0.0

        model.train() # 确保model是在train model(开启dropout等...)
        # 每次训练batch_size大小的数据
        for i, data in enumerate(train_loader):
            # data[0]:data;data[1]:label
            optimizer.zero_grad()
            train_pred = model(data[0].cuda()) # 调用model的forward函数
            batch_loss = loss(train_pred, data[1].cuda()) # 计算loss，注意prediction和label必须同时在CPU和GPU上
            batch_loss.backward()   # 反向传播求导
            optimizer.step()        # 优化器更新参数

            train_acc += np.sum(np.argmax(train_pred.cpu().data.numpy(),axis = 1) == data[1].numpy())
            train_loss += batch_loss.item() #  item是得到一个元素张量里面的元素值

        # 固定BN和dropout层
        model.eval()
        with torch.no_grad():
            for i, data in enumerate(val_loader):
                val_pred = model(data[0].cuda())
                batch_loss = loss(val_pred, data[1].cuda())

                val_acc += np.sum(np.argmax(val_pred.cpu().data.numpy(),axis = 1) == data[1].numpy())
                val_loss += batch_loss.item()

            # 完成一轮训练后，打印训练结果
            print('[%03d/%03d] %2.2f sec(s) Train Acc: %3.6f Loss: %3.6f | Val Acc: %3.6f loss: %3.6f' % (epoch + 1, num_epoch, time.time()-epoch_start_time, train_acc/train_set.__len__(), train_loss/train_set.__len__(), val_acc/val_set.__len__(), val_loss/val_set.__len__()))

    # 得到好的参数后，我们使用training set和validation set 共同训练
    # 因为数据变多，模型效果较好
    # 合并数据
    train_val_x = np.concatenate((train_x, val_x), axis = 0)
    train_val_y = np.concatenate((train_y, val_y), axis = 0)
    train_val_set = ImgDataset(train_val_x, train_val_y, train_transform)
    train_val_loader = DataLoader(train_val_set, batch_size = batch_size, shuffle=True)
    
	# 最好的参数是怎么选择的？
    # 不断运行上面的代码，根据val_set中的表现，调整Classifier()中cnn的结构，提高模型的泛化性能
    model_best = Classifier().cuda()  
    loss = nn.CrossEntropyLoss() 
    optimizer = torch.optim.Adam(model_best.parameters(), lr=0.001) # optimizer 使用 Adam
    num_epoch = 30
    for epoch in range(num_epoch):
        epoch_start_time = time.time()
        train_acc = 0.0
        train_loss = 0.0

        model_best.train()
        for i, data in enumerate(train_val_loader):
            optimizer.zero_grad()
            train_pred = model_best(data[0].cuda())
            batch_loss = loss(train_pred, data[1].cuda())
            batch_loss.backward()
            optimizer.step()

            train_acc += np.sum(np.argmax(train_pred.cpu().data.numpy(), axis=1) == data[1].numpy())
            train_loss += batch_loss.item()

            #將結果 print 出來
        print('[%03d/%03d] %2.2f sec(s) Train Acc: %3.6f Loss: %3.6f' % (epoch + 1, num_epoch, time.time()-epoch_start_time, train_acc/train_val_set.__len__(), train_loss/train_val_set.__len__()))
    
    # 在测试集上利用训练好的模型进行预测
    test_set = ImgDataset(test_x, transform = test_transform)
    test_loader = DataLoader(test_set, batch_size = batch_size, shuffle=False) # 这里随机打乱了，还能正确给test文件夹中的图片打标签吗？(答：显然不能)
    
    model_best.eval()
    prediction = []
    with torch.no_grad():
        for i, data in enumerate(test_loader):
            test_pred = model_best(data.cuda())
            test_label = np.argmax(test_pred.cpu().data.numpy(), axis=1)
            for y in test_label:
                prediction.append(y)
        
    # 将testing_tagged文件夹里的图片进行命名
    rename_path = 'D:/workspace/lhy_data/hw3/food-11/testing_tagged'
    tag_pic(rename_path, prediction)
                
# # 模型的加载与保存
# state_sict = model_best.state_dict()
# torch.save(model_best, path_model + 'model.pkl')
# torch.save(state_sict, path_model + 'model_state_dict.pkl.pkl')
# net_load = torch.load(path_model + 'model.pkl')
# model_best = net_load

李剑专访：走出投资的洞穴爱吃番茄great
柏拉图的洞穴寓言出自《理想国》。洞穴中有一群囚徒，他们把岩壁上的投影当成真实的一切。当囚徒们被解放以后，大多数人反而不知所措,宁愿继续停留在原来的状态。有些人甚至会迁怒于揭露真相的人。不过还是有少数人能够接受真相，毅然走出洞穴，奔向自由。技术投资者就是面壁起舞的囚徒，他们把K线图当做投资本身。而价值投资者就是最终走出洞穴的人，他们看到了光明的世界，看清了投资的本质。李剑就是少数走出洞穴的人，他的“
我校顺利举行2020年新团员入团宣誓仪式马小包
2020年11月4日，我校团总支在学院三号楼319教室举行2020年新团员入团宣誓仪式。仪式邀请了院团委老师出席，我校全体老师以及新老团员共95人参加了宣誓仪式。入团宣誓仪式在庄严的国歌声中拉开帷幕。全体起立、奏唱国歌团总支负责老师介绍了本次发展新团员的相关情况并宣读了新团员名单。老师宣读本次发展新团员名单老师与团员代表合影留念在团学会代表同学的带领下，全体团员在鲜红的团旗下郑重宣誓，用誓词表达了
2020.4.7童言童语之谁知盘中餐，粒粒皆辛苦琳srt执行师
我和昕昕一起整土，准备种蘑菇。昕昕用玩具铲子铲土，我们需要铲走的土很多，弄了很久，昕昕突然说出一句“粒粒皆辛苦啊”。哈哈，这句话是在昕昕不愿意把饭吃完的时候，我爸经常在他耳边叨叨的。孩子听过的话，看过的书，都是他的语言材料，就像做饭需要的食材一样。然而只有材料并不足够，当孩子在生活中有所体验，或者有情感的触动，这些材料会被激活，成为属于孩子自己的语言。当昕昕体会到劳动的辛苦，自己说出这句诗的时候，
2021:乐早起|遇见更好的自己|（180/365）Ⅰ如胶如漆的爱情，却被它所拆散梦想加油站
每日语录强则易折，柔弱才会赢。——曾仕强（处事篇）导语早起已经很多年，以前早起没有固定的时间点，有的时候会四点起来，有的时候会六点起来，虽然都在“早起”，但早起的效率和质量并不如所愿。2020年09月20日开始，自己发起“在路上”早起习惯养成圈子，经过一系列实践和调整，最终把自己的早起时间点定为04:00。我发起的早起圈子，注重的是早起之后做什么，也就是说，每个人都有一个适合自己的早起点。根据自己
“陕西男子活埋母亲”事件：获救后母亲担心儿子被判重刑你就是你自己
近日，陕西靖边“男子将母亲活埋进墓坑”事件持续引发关注。1.事情的始末是这样的：2020年5月2日，58岁的马某在自己家中将瘫痪在床79岁的母亲王某芳用手推车拉走，次日凌晨2时许独自一人推着车子回到家中，家人见状向其询问母亲去向，马某某谎称送往庆阳的客车上去亲戚家了。凌晨4点左右，马某离开家人的视线，独自一人出走失联至今未归。5日上午，马某的妻子张某报警后，警方立即对马某和其母亲进行寻找。在找到马
咏物诗的“三形”“四境” 学写诗词
在写咏物诗时,通常是"物"赋之以形,"我"赋之以神。根据这个原则,我们把咏物诗分为三种形态第一种,有形无神。所谓"有形无神"是指诗只专在描摹所咏之物,却无"我"之寄托。一般有形无神容易失于浮浅,清淡无味。所以有形无神,死物一个。但如果适当加入一点理趣,则又不失为佳作。比如唐代李峤的《风》:解落三秋叶,能开二月花。过江千尺浪,入竹万竿斜。全诗无一字写"风",却句句写风,这就是"趣",有了"趣",咏物
Matlab打开慢、加载慢的解决办法 RickyWasYoung matlab windows 开发语言
安装完毕后直接打开会非常慢，而且打开了之后还得加载很久才能运行解决办法如下：1.找到路径“D:\ProgramFiles\Polyspace\R2020a\licenses”（我是把matlab安装在D盘了，如果是其他盘修改路径即可），该路径记为A2.复制该路径下的lic文件的名称“license_LAPTOP-XXXXXXXX_123456_R2020a.lic”（名称不同，找到这个文件就ok）
任彬彬诗集《我和春天叫了个板》序孔孟之乡
鲁西南的金乡县曾是大诗人李白喜欢的地方，他在这里写下过数首诗篇，其中两首——《金乡送韦八之西京》、《送友人》——堪称传世之作。像“狂风吹我心，西挂咸阳树”，再如“浮云游子意，落日故人情”，已成历代传唱名句。这样的一块可以让诗人流连不已、诗意沛然的土地，是应当产生诗人并收获诗歌的。但是在李白走后，这里有过长时间的寂寞。好在新的诗人终于打破了这种寂寥，中国当下新批判现实主义的代表诗人李飞骏，就是金乡县
2020.2.22 XTW西土瓦
多人聊天，好用的技巧多人聊天，聊的好不好，就看大家的回应，有来有往，或者制造矛盾文章还有好几个聊天技巧，技巧很多更多的是平时聊天去运用。
中原焦点团队网络初级29期李俊坚持分享第78天2021.10.14 世因你而美丽
月考成绩出来之前，儿子每天回来乐呵呵，跟我有说有笑的，还哼着小曲儿。现在回来都是无精打采的，话不多，吃完东西，有气无力地说一句:“我开始写作业了。”坐在沙发上写一会儿，睡的时候差不多有十二点，只有听到他关房门的声音，我的心里才踏实，担心他熬夜伤身体。儿子这几天早上起床比才开学那段时间晚了20分钟，早饭也吃得少了。今早的意大利面有点咸了，也许是想着我一大早做的，还是勉强吃了几口，吃了一个鸡蛋，喝一碗
DataWhale 二月组队学习-深入浅出pytorch-Task04 －273.15K DataWhale组队学习学习 pytorch 人工智能
一、自定义损失函数1.损失函数的作用与自定义意义在深度学习中，损失函数（LossFunction）用于衡量模型预测结果与真实标签之间的差异，是模型优化的目标。PyTorch内置了多种常用损失函数（如交叉熵损失nn.CrossEntropyLoss、均方误差nn.MSELoss等）。但在实际任务中，可能需要针对特定问题设计自定义损失函数，例如：处理类别不平衡问题（如加权交叉熵）实现特殊业务需求（如对
开启富而喜悦的人生，从成长、自律开始！ yy财富姐姐
大家好，今天是2020年8月4日，是我学习成长1000天打卡的第201天。今天继续和大家学习《家里的黄金》人类最重要的资产是头脑总结篇之五第三部分开采你的黄金一、把你的定位和角色从消费者转移到供应商代表，你将会像沃尔玛一样分得利润并赚到金钱。而不是像传统消费者一样只是花钱。将自己定位为供应商代表，能让你将家用产品和服务的支出转变为收入，还能在此过程中拥有自己的人生。二，所有营销手段都有相同的目标建
2020-01-26 构建幸福
李云焦点解决短期治疗网络初级19坚持分享第（48）（10）（81）天2020.01.26星期日今天的约练。真正的来访者角色情绪真的是很无法形容的那种伤痛。咨询师静静的倾听、陪伴、静静的倾听、陪伴、稳稳地贴着来访者。倾听、陪伴、同理，真的是伤心痛绝。咨询师倾听、陪伴、同理，紧紧地贴着。咨询师紧紧抓住来访者的关键的话语，围着一条主线任凭来访者情绪宣泄，以来访者为主，被者带进去，跳出来，再进去跟着来访者
2020-01-09 感恩123
张芝若原创分享218天今天在办公室里说起我们班的三个学习有困难的学生，我表达了对这三位孩子的一种愧疚。林梦琪是一个留守儿童，接受知识又很难，每当看到他站起来读书很不流畅，班里边其他同学都在干巴巴的等着他，我会不耐烦的给他空过去。发现一道很简单的课文她都没背会，读起来可能也会吭吭呲呲，我会不耐烦，没有耐心，也没有时间领着她，读着别人已经背会的课文。有时候还会当着他的面说出父母不负责任的话。林浩辰是林
2020-12-09 幸福大黑鸭
IT1.LeetCode：汇总区间Java编写2020-12-09（228.汇总区间）2.《Java从入门到精通》明日科技：P351~355阅读记xmind笔记，并自己实现实例。知识点之前确实都学过，但还是再系统复习一下吧。3.《Semantic-awareWorkflowConstructionandAnalysisforDistributedDataAnalyticsSystems》：粗读关键
大模型核心概念 | 嵌入模型（Embedding）、向量模型（Vector Model）
一、核心概念解析1.1嵌入模型（Embedding）作为AI领域的核心基础技术，嵌入模型通过将非结构化数据映射为低维稠密向量，实现语义特征的深度捕捉：文本嵌入：如将语句转换为1536维向量，使"机器学习"与"深度学习"的向量余弦相似度达0.92跨模态嵌入：支持图像与文本的联合向量空间映射，如CLIP模型实现文图互搜1.2向量模型（VectorModel）作为嵌入技术的下游应用体系，主要包含两大方向
Python实现神经网络算法指南代码编织匠人 python 神经网络算法
Python实现神经网络算法指南神经网络是一种模拟人脑神经元结构进行信息处理的机器学习算法。在深度学习领域中，神经网络是最为强大的算法之一。Python作为一门简单易学的编程语言，也成为了许多人选择实现神经网络算法的首选语言。在本篇文章中，我们将通过Python代码来实现神经网络算法。导入必要的库为了实现神经网络算法，我们需要导入一些必要的Python库，包括numpy和matplotlib。其中
2020-03-15 倚杖客
总有写点东西的欲望，但每次写几句话，就不想再往下写了！想写心中所想，却觉得即便写了也毫无意义，反不如不写！10年前的QQ空间，那时候经常写些东西，现在想了，真是无病呻吟，哗众取宠吧，毫无意义！现在想写，却无从写起，却道天凉好个秋！都是过来人，原来古人早看透了！
用Python实现神经网络(四)
使用多层神经网络我们展示如何用TensorFlow构建多层神经网络###低出生率数据LowBirthratedata:#Columns Variable Abbreviation#---------------------------------------------------------------------#Lo
基于DTLC-AEC与DTLN的轻量级实时语音增强系统设计与实现神经网络15044 仿真模型神经网络机器学习图像处理 cnn 人工智能机器人
基于DTLC-AEC与DTLN的轻量级实时语音增强系统设计与实现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。1.引言在当今的互联网通信时代，实时语音通信已成为人们日常生活中不可或缺的一部分。然而，语音通信质量常常受到回声、背景噪声等因素的严重影响。为了解决这些问题，我们需要高效的语音增强技术。本文将详细介绍如何将DTLC-AEC（深度学习回声消
求爱遭拒，怒砸8个红绿灯扳倒15棵树：珍爱生命，远离暴力清竹幽雅
原创不易，未经允许，请勿转载！微博刷到一则新闻：湖南一男子李某追求女同事被拒，一气之下竟用砖头砸烂路边8个红绿灯、踢烂6个垃圾桶、砸坏1个变电箱、扳倒15棵树木。最后，被以涉嫌寻衅滋事罪逮捕。看到这则新闻后，头皮一阵发麻。你有追求爱的权利，同样，我也有拒绝的权利。不幸中的万幸，还好李某有最后一丝理智，恭喜那位逃过一劫的姑娘，大难之后必有福报。他为什么会砸了红绿灯还没消气，一连破坏了多个公共物品才停
周一来了翰霖妈妈
2020.04.13~复盘我的4月目标：❥每周爬山❥TA赢赋能2.0成长学院课程❥方向，目标，计划，想清楚❥精读两本育儿书今日行动（做了什么）❥《正面管教》精读营❥练字❥七院长【家庭幸福】~贴心伴侣❥梦想之旅第三天今日见识（学到了什么）❥【家庭幸福】~贴心伴侣经营婚姻的前提是明白婚姻生命像一条河，夫妻关系是上流，亲子关系是下流，送给孩子最好的礼物就是父母相爱。幸福是什么幸福就是老了还能享福，夫妻之
目标检测-YOLOv5 wydxry 深度学习目标检测 YOLO 人工智能深度学习
YOLOv5介绍YOLOv5是YOLO系列的第五个版本，由Ultralytics团队发布。虽然YOLOv5并非JosephRedmon原团队发布，但它在YOLOv4的基础上进行了重要的优化和改进，成为了深度学习目标检测领域中的热门模型之一。YOLOv5的优势不仅体现在其性能上，还包括其简洁易用、部署便捷的特点。相较于YOLOv4，YOLOv5对于代码框架的重构、推理速度的提升，以及模型的轻量化等方
困境是磨难也是礼物静默小太阳
艰难的2020年刚刚过去，疫情的反弹让2021年的开年也变得不那么顺利。但这也不全是坏事，很多事情，是磨难也是馈赠。《总有一天你会变成自己喜欢的样子》这本书中观点:困难就是礼物。不要觉得这句话老套，其实很少有人能记住它，并把它贯彻在生活中。人类学家做过这样的设想:如果人类在诞生之初便衣食无忧，不必为生存而奋斗，不经历磨难和挫折，那么直到今天，人类文明可能还处于原始的蒙昧年代。世界的大局就是这样，对
日更77：妈妈要远行小玄鸟
十岁玄鸟/文俗话说：“儿行千里母担忧。”而我却要说：“母行千里儿担忧。”妈妈今天要出差，要独自一个人坐动车去厦门。于是，我一放学就帮妈妈收拾行李。妈妈把衣服折叠好，我帮妈妈一件一件放入行李箱，并且摆得整整齐齐。妈妈的行李中一半是衣服，还有一半是书。以前妈妈出门，都会带上我，可是这次的行程中，没有我，也没有姨姨。所以，我有点不放心妈妈，我开始叮嘱妈妈一些注意事项。如坐火车的时候，不能带易燃易爆物品；
半夜姐姐屋进小偷，男子抓捕时捅死小偷，是正当防卫吗？如何处罚一丝不苟的法律人
“半夜姐姐屋里进了小偷，姐姐妹妹都在家，我抓小偷，是正当防卫？抓的过程中虽然小偷死了，但是也不能判我11年？”凌晨4时小偷蒙面进入男子姐姐房中，被发现后，小偷躲到床底，男子找到小偷后，欲抓住小偷，遭到反抗，男子持刀捅了小偷腹部致死。这天凌晨4时许，被害人李涛蒙面潜入王强家中盗窃财物。王强和父亲、姐姐、妹妹正在家中睡觉。李涛进入住在二楼的姐姐王红的房间翻找东西时惊醒了姐姐王红，被王红喝问后跑出去，王
夏至晓春_bea7
2020年6月21日夏至公元前七世纪，先人用土圭测日影，确定了夏至。至的意思是极限。夏为阳，夏至意味着阳的增长到达极限。物极必反，所以就有“阳极阴生”、“夏至一阴生”的变化。“一阴生”是指阳气生发到了极致开始转为收藏的状态。我们就此进入一年中最热的三伏天。此时人体为适应外部环境，阳气多散在体外，体内脏腑阳气偏弱，吃不好、睡不实、出汗多、消耗多。而人们为了抵抗炎热，又食生冷、贪凉爽，让寒气不知不觉侵
100天（57）||知识的边界真的很远，它真的有边界吗？慕子清蒸
昨天也是我试工的第1天，是一个韩国的品牌。中文名名字霹雳霸，英文名字Rapido然后发现了两个问题：第1个是WPS必须好好学起来，还有英文必须学起来。好多介绍都是英文的。还发现rapido的设计师是非常非常有名气，英文名字叫wrong，这个名字叫李长荣。它其中涉及的一个系列是根据中国的敦煌石窟，结合韩国的进口面料元素设计的几款衣服。01那个品牌，是一个工作还是一个学习的机会我并不知道我有没有设计方
端到端神经网络视频编解码器介绍码流怪侠音视频基础深度学习-PyTorch 神经网络视频编解码人工智能 github DCVC 端到端神经网路音视频
一、技术演进：从模块优化到全局智能的范式跃迁传统编解码器的效率天花板（1990-2017）架构局限：H.264/HEVC依赖手工设计的运动估计、DCT变换、熵编码模块，各模块独立优化导致全局效率损失。高分辨率瓶颈：4K/8K视频普及后，码率与画质矛盾激化，HEVC在VR场景下码率仍需>20Mbps才能保持无伪影画质。端到端神经编解码的爆发期（2017-2024）2017奠基年：Ballé团队提出超
诡妻地仙（王献）灵异新书全章节在线阅读云轩书阁
诡妻地仙（王献）灵异新书全章节在线阅读主角：王献简介：我出生那天，接生婆和母亲死在了我的面前...有人说，当时找到我时.......关注微信公众号【看精灵】去回个书號【7299】，即可阅读【诡妻地仙】小说全文！第10章十几分钟的路程，我们就来到了李瘸子的院门口。“李瘸子！你在不在家啊，赶紧给我开门！”夏妈重重地拍着那木板门，竟然硬生生的给拍开了。木板门看着破破烂烂的，有跟没有一样。夏妈气势汹汹地冲
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，

李宏毅2020机器学习深度学习(3) CNN卷积神经网络 笔记+作业

目录