Horizon2333

台大李宏毅机器学习作业4(HW4)——可解释机器学习

最近刚开始学习机器学习，看的是台湾大学李宏毅老师的视频课程Machine Learning 2019，李宏毅老师课程共有8个作业，在网上大约可以搜到前三个作业的解答，分别是PM2.5预测，人薪酬的二分类和表情分类，我在做这三次作业中主要参考了秋沐霖的三篇博客，链接如下：
作业1：线性回归预测PM2.5----台大李宏毅机器学习作业1(HW1)
作业2：Logistic回归预测收入----台大李宏毅机器学习作业2(HW2)
作业3：基于卷积神经网络的面部表情识别(Pytorch实现)----台大李宏毅机器学习作业3(HW3)

说回作业4，作业4的主题是可解释机器学习，作业4的ppt提出了以下任务：

Task1 - Saliency Map
这一部分就是求输出对输入图像的梯度，输入图像中梯度比较大的部分就是对输出有较大影响的部分。

Task2 - Filter Visualization
这一部分是滤波器的可视化，即卷积神经网络中的卷积核的可视化，上课提到的方式是用梯度上升的方法改变输入图像，使某个滤波器被激活的程度达到最大，并将此时的输入图像显示出来，此时显示的图像就是这个滤波器检测的pattern。通常浅层滤波器用于检测最基础的元素比如色彩或者灰度，深层次的滤波器用来探测线条、纹路等更加复杂的特征。

Task-3 Lime
这个任务就是使用Local Interpretable Model-Agnostic Explanations的方法来进行可解释机器学习，这个方法首先将输入划分为不同的segment，之后将一部分segment去掉观察结果的变化，从而区分出图像中对分类把握贡献为正的segment和为负的segment。在python有lime这个包可以直接调用。

这个部分首先需要train一个表情识别的model，我继续使用了从秋沐霖大佬作业3中复制的代码训练出来的model，不过要对代码进行一定程度的修改，首先添加了保存test acc最高的模型的代码，其次添加了GPU训练的一些代码来利用手里的GPU加速训练，还对模型添加了一些修改从而可以访问每一层的输出，这是为了方便后面的卷积核可视化。我修改后的代码如下，如果有不妥的地方可以参考秋沐霖大佬的博客来进行修改。并且代码中使用的csv文件也可以从那里下载。

import torch
import torch.utils.data as data
import torch.nn as nn
import torch.optim as optim
import numpy as np
import pandas as pd
import cv2
import time

#device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

# 参数初始化
def gaussian_weights_init(m):
    classname = m.__class__.__name__
    # 字符串查找find，找不到返回-1，不等-1即字符串中含有该字符
    if classname.find('Conv') != -1:
        m.weight.data.normal_(0.0, 0.04)

# 验证模型在验证集上的正确率
def validate(model, dataset, batch_size):
    val_loader = data.DataLoader(dataset, batch_size)
    result, num = 0.0, 0
    for images, labels in val_loader:
        images = images.cuda()
        labels = labels.cuda()
        pred = model.forward(images)
        pred = np.argmax(pred.data.cpu().numpy(), axis=1)
        labels = labels.data.cpu().numpy()       
        result += np.sum((pred == labels))
        num += len(images.cpu())
    acc = result / num
    return acc

class FaceDataset(data.Dataset):
    # 初始化
    def __init__(self, root):
        super(FaceDataset, self).__init__()
        self.root = root
        df_path = pd.read_csv(root + '\\dataset.csv', header=None, usecols=[0])
        df_label = pd.read_csv(root + '\\dataset.csv', header=None, usecols=[1])
        self.path = np.array(df_path)[:, 0]
        self.label = np.array(df_label)[:, 0]

    # 读取某幅图片，item为索引号
    def __getitem__(self, item):
        # 图像数据用于训练，需为tensor类型，label用numpy或list均可
        face = cv2.imread(self.root + '\\' + self.path[item])
        # 读取单通道灰度图
        face_gray = cv2.cvtColor(face, cv2.COLOR_BGR2GRAY) 
        # 高斯模糊
        # face_Gus = cv2.GaussianBlur(face_gray, (3,3), 0)
        # 直方图均衡化
        face_hist = cv2.equalizeHist(face_gray)
        # 像素值标准化
        face_normalized = face_hist.reshape(1, 48, 48) / 255.0
        face_tensor = torch.from_numpy(face_normalized)
        face_tensor = face_tensor.type('torch.FloatTensor')
        label = self.label[item]
        return face_tensor, label

    # 获取数据集样本个数
    def __len__(self):
        return self.path.shape[0]

class FaceCNN(nn.Module):
    # 初始化网络结构
    def __init__(self):
        super(FaceCNN, self).__init__()
        
        # 第一次卷积、池化
        self.conv1 = nn.Sequential(
            # 输入通道数in_channels，输出通道数(即卷积核的通道数)out_channels，卷积核大小kernel_size，步长stride，对称填0行列数padding
            # input:(bitch_size, 1, 48, 48), output:(bitch_size, 64, 48, 48), (48-3+2*1)/1+1 = 48
            nn.Conv2d(in_channels=1, out_channels=64, kernel_size=3, stride=1, padding=1), # 卷积层
            nn.BatchNorm2d(num_features=64), # 归一化
            nn.RReLU(inplace=True), # 激活函数
            # output(bitch_size, 64, 24, 24)
            nn.MaxPool2d(kernel_size=2, stride=2), # 最大值池化
        )
        
        # 第二次卷积、池化
        self.conv2 = nn.Sequential(
            # input:(bitch_size, 64, 24, 24), output:(bitch_size, 128, 24, 24), (24-3+2*1)/1+1 = 24
            nn.Conv2d(in_channels=64, out_channels=128, kernel_size=3, stride=1, padding=1),
            nn.BatchNorm2d(num_features=128),
            nn.RReLU(inplace=True),
            # output:(bitch_size, 128, 12 ,12)
            nn.MaxPool2d(kernel_size=2, stride=2),
        )
        
        # 第三次卷积、池化
        self.conv3 = nn.Sequential(
            # input:(bitch_size, 128, 12, 12), output:(bitch_size, 256, 12, 12), (12-3+2*1)/1+1 = 12
            nn.Conv2d(in_channels=128, out_channels=256, kernel_size=3, stride=1, padding=1),
            nn.BatchNorm2d(num_features=256),
            nn.RReLU(inplace=True),
            # output:(bitch_size, 256, 6 ,6)
            nn.MaxPool2d(kernel_size=2, stride=2),
        )

        # 参数初始化
        self.conv1.apply(gaussian_weights_init)
        self.conv2.apply(gaussian_weights_init)
        self.conv3.apply(gaussian_weights_init)

        # 全连接层
        self.fc = nn.Sequential(
            nn.Dropout(p=0.2),
            nn.Linear(in_features=256*6*6, out_features=4096),
            nn.RReLU(inplace=True),
            nn.Dropout(p=0.5),
            nn.Linear(in_features=4096, out_features=1024),
            nn.RReLU(inplace=True),
            nn.Linear(in_features=1024, out_features=256),
            nn.RReLU(inplace=True),
            nn.Linear(in_features=256, out_features=7),
        )
        self.features = nn.Sequential(*list(self.children())[:4])

    # 前向传播
    def forward(self, x):
        x = self.conv1(x)
        x = self.conv2(x)
        x = self.conv3(x)
        # 数据扁平化
        x = x.view(x.shape[0], -1)
        y = self.fc(x)
        return y

def train(train_dataset, val_dataset, batch_size, epochs, learning_rate, wt_decay):
    # 载入数据并分割batch
    train_loader = data.DataLoader(train_dataset, batch_size)
    # 构建模型
    model = FaceCNN()
    model = model.cuda()
    # 损失函数
    loss_function = nn.CrossEntropyLoss()
    loss_function = loss_function.cuda()
    # 优化器
    optimizer = optim.SGD(model.parameters(), lr=learning_rate, weight_decay=wt_decay)
    # 学习率衰减
    # scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=10, gamma=0.8)
    # 逐轮训练
    print('Start to train!')
    starttime = time.time()
    best_acc = 0
    for epoch in range(epochs):
        # 记录损失值
        loss_rate = 0
        # scheduler.step() # 学习率衰减
        model.train() # 模型训练
        for images, labels in train_loader:
            images = images.cuda()
            labels = labels.cuda()
            # 梯度清零
            optimizer.zero_grad()
            # 前向传播
            output = model.forward(images)
            # 误差计算
            loss_rate = loss_function(output, labels)
            # 误差的反向传播
            loss_rate.backward()
            # 更新参数
            optimizer.step()
            
        # 打印每轮的损失
        #print('After {} epochs , the loss_rate is : '.format(epoch+1), loss_rate.item())
        model.eval() # 模型评估
        acc_train = validate(model, train_dataset, batch_size)
        acc_val = validate(model, val_dataset, batch_size)
        print('After {} epochs , the acc_train is : '.format(epoch), acc_train)
        print('After {} epochs , the acc_val is : '.format(epoch), acc_val)
        if(acc_val > best_acc):
            torch.save(model.state_dict(), 'model.pth')
            best_acc = acc_val
            print ('Model Saved!')
        
    
    
    model.eval() # 模型评估
    acc_train = validate(model, train_dataset, batch_size)
    acc_val = validate(model, val_dataset, batch_size)
    print('After {} epochs , the acc_train is : '.format(epoch+1), acc_train)
    print('After {} epochs , the acc_val is : '.format(epoch+1), acc_val)
    endtime = time.time()
    print('time cost:', int((endtime - starttime) / 60), 'min', int((endtime - starttime) % 60), 's')
    return model

def main():
    # 数据集实例化(创建数据集)
    train_dataset = FaceDataset(root='face\\train')
    val_dataset = FaceDataset(root='face\\val')
    print('Data set over!')
    # 超参数可自行指定
    model = train(train_dataset, val_dataset, batch_size=32, epochs=100, learning_rate=0.1, wt_decay=0)
    # 保存模型
    torch.save(model, 'model_net1.pkl')


if __name__ == '__main__':
    main()

还没想好我的模型怎么上传，如果大家需要我就上传一波，不过准确率才刚刚60%的样子，决定暂时还是先不献丑了。

有了训练好的model就可以来着手解决这个作业了。
首先，Saliency Map可以通过输出对输入求微分得到，使用pytorch的自动求导机制可以很方便地实现这一点。

def compute_saliency_maps(x, y, model):
    model.eval()
    x.requires_grad_()
    y_pred = model(x.cuda())
    loss_func = torch.nn.CrossEntropyLoss()
    loss = loss_func(y_pred, y.cuda().long())
    loss.backward()
    
    saliency = x.grad.abs().squeeze().data
    print(saliency.size())
    return saliency

上面这部分代码就可以使用backward函数来计算对输入的梯度，取其绝对值作为返回值返回。之后进行可视化：

def show_saliency_maps(x, y, model):
    x_org = x.squeeze()
    x = torch.tensor(x)
    y = torch.tensor(y)
    # Compute saliency maps for images in X
    saliency = compute_saliency_maps(x, y, model)
    print(saliency[0,0,0])
    # Convert the saliency map from Torch Tensor to numpy array and show images
    # and saliency maps together.
    saliency = saliency.detach().cpu()
    
    num_pics = x_org.shape[0]
    for i in range(num_pics):
        # You need to save as the correct fig names
        plt.imsave('saliency\\pic_'+ str(i) + '.jpg', x_org[i], cmap=plt.cm.gray)
        plt.imsave('saliency\\saliency_'+ str(i) + '.jpg', saliency[i], cmap=plt.cm.jet)
        if(i == 7):
            plt.figure()
            plt.subplot(1,3,1)
            plt.imshow(x_org[i], cmap='gray')
            plt.subplot(1,3,2)
            plt.imshow(saliency[i], cmap='gray')
            #plt.colorbar()
            plt.subplot(1,3,3)
            subx = x_org[i]
            for j in range(saliency[i].size()[0]):
                for k in range(saliency[i].size()[1]):
                    if(saliency[i,j,k]*1000000 < 0.04):
                        subx[j,k] = 0
            plt.imshow(subx, cmap='gray')

上述代码将saliency map分别计算出来并保存到文件夹saliency里面，并且用matplotlab画出了第七张人脸的saliency map（因为这个看起来效果还算不错）。结果如下：

emmm跟想象中好像不太一样，不过我这模型也比较弱，好歹可以看出来人脸上的点是比较多的，证明人脸对结果的影响要比头发或者背景大。可以修改上面代码的i=7从而可视化其他人脸，不过一部分也保存在saliency文件夹下面了，如果找不到在代码旁边新建一个叫这个的文件夹，再运行一遍应该就没有问题了。不过要修改上面saliency[i,j,k]*1000000 < 0.04的参数，否则可能第三张图什么都没有或者什么都没过滤掉，我发现不同的人脸求出来的saliency在数量级上差距还是比较大的。

在做第二个任务之前，既然要可视化卷积核，首先要能得到卷积核的输出，这里我忘记了在哪里copy的下面的代码了。

class LayerActivations:
    features = None
 
    def __init__(self, model, layer_num):
        self.hook = model[layer_num].register_forward_hook(self.hook_fn)
 
    def hook_fn(self, module, input, output):
        self.features = output.cpu()
 
    def remove(self):
        self.hook.remove()

这一部分即可提取每一层的输出，如果不改秋沐霖大佬的代码是没法执行这个的，因为模型没办法索引，我主要是在模型定义的__init__函数最后添加了下面一句。

self.features = nn.Sequential(*list(self.children())[:4])

之后写了一堆画图代码来进行可视化。

	conv_out = LayerActivations(model.features[0], 0)  # 提出第 一个卷积层的输出
    o = model(Variable(torch.tensor(x_train[0]).view(1,1,48,48).cuda()))
    conv_out.remove()  #
    act = conv_out.features  # act 即 第0层输出的特征
    # 可视化 输出
    fig1 = plt.figure(1,figsize=(20, 50))
    fig1.suptitle('Convolution layer 1 output')
    
    for i in range(act.size()[1]):
        ax = fig1.add_subplot(8, 8, i+1, xticks=[], yticks=[])
        ax.imshow(act[0][i].detach().numpy(), cmap="gray")
    
    conv_out = LayerActivations(model.features[1], 0)
    o = model(Variable(torch.tensor(x_train[0]).view(1,1,48,48).cuda()))
    conv_out.remove()  #
    act = conv_out.features  # act 即 第0层输出的特征
    # 可视化 输出
    fig3 = plt.figure(3,figsize=(20, 50))
    fig3.suptitle('Convolution layer 2 output')
    
    for i in range(act.size()[1]):
        ax = fig3.add_subplot(8, 16, i+1, xticks=[], yticks=[])
        ax.imshow(act[0][i].detach().numpy(), cmap="gray")
    
    conv_out = LayerActivations(model.features[2], 0)  # 提出第 一个卷积层的输出
    o = model(Variable(torch.tensor(x_train[0]).view(1,1,48,48).cuda()))
    conv_out.remove()  #
    act = conv_out.features  # act 即 第0层输出的特征
    # 可视化 输出
    fig5 = plt.figure(5,figsize=(20, 50))
    fig5.suptitle('Convolution layer 3 output')
    
    for i in range(act.size()[1]):
        ax = fig5.add_subplot(16, 16, i+1, xticks=[], yticks=[])
        ax.imshow(act[0][i].detach().numpy(), cmap="gray")

由于这里有3层卷积层，分别有64，128，256个卷积核，所以我就把他们的输出都显示出来了。
第一层卷积层输出

第二层卷积层输出

第三层卷积层输出

其实没太看懂做了什么，不过大概都是对这个输入图像的处理。

下面就可以进行task2来可视化卷积核了，首先要计算某个卷积核对输入的梯度，代码如下

def compute_gradients(x, model, filter_model, filter_id):
    gradient = torch.zeros(x.shape)
    model.eval()
    conv_out = LayerActivations(filter_model, 0)  # 提出第 一个卷积层的输出 
    o = model(x)
    conv_out.remove()  #
    act = conv_out.features  # act 即 第0层输出的特征
    
    activation = torch.sum(act[:,filter_id,:,:])
    activation.backward()
    
    gradient = x.grad.data
    return gradient

这里注释有点不太对，忽略它，输入参数model是整个model，fiter_model是某一层卷积层，filter_id是这个卷积层里第几个卷积核，对这个卷积核的响应求和再反向传播，就可以求出它对输入的梯度。
梯度上升的代码如下：

def visualize_filter(x, model, filter_model, filter_number, epochs, learning_rate):
    images = []
    for k in range(filter_number):
        for i in range(epochs):
            gradients = compute_gradients(x,model,filter_model,k)
            #self.gradients /= (torch.sqrt(torch.mean(torch.mul(self.gradients, self.gradients))) + 1e-5)
            x = x.cpu() + gradients.cpu() * learning_rate
            x = Variable(x.cuda(), requires_grad = True)
        images.append(x.cpu().detach().numpy().squeeze())
        print('Filter '+str(k+1)+' visualize over!')
    return images

这个就是最简单的梯度上升，learning rate由参数确定，循环epochs次之后得到结果返回。
将所有滤波器可视化的代码如下（又是一堆画图代码）

	#initialize input x
    x = []
    for i in range(48):
        x_temp = []
        for j in range(48):
            x_temp.append(random.gauss(0,0.5))
        x.append(x_temp)
    x = np.array(x).reshape(1,1,48,48)
    x = Variable(torch.tensor(x).float().cuda(), requires_grad = True)
        
    newx = visualize_filter(x,model,model.features[0], 64, 100, 0.1)
    
    fig2 = plt.figure(2,figsize=(20, 50))
    for i in range(64):
        ax = fig2.add_subplot(8, 8, i+1, xticks=[], yticks=[])
        ax.imshow(newx[i], cmap="gray")
    fig2.suptitle('Convolution layer 1 maximizition')
        
    newx = visualize_filter(x,model,model.features[1], 128, 100, 0.1)
    
    fig4 = plt.figure(4,figsize=(20, 50))
    for i in range(128):
        ax = fig4.add_subplot(8, 16, i+1, xticks=[], yticks=[])
        ax.imshow(newx[i], cmap="gray")
    fig4.suptitle('Convolution layer 2 maximizition')
    
    newx = visualize_filter(x,model,model.features[2], 256, 100, 0.1)
    
    fig6 = plt.figure(6,figsize=(20, 50))
    for i in range(256):
        ax = fig6.add_subplot(16, 16, i+1, xticks=[], yticks=[])
        ax.imshow(newx[i], cmap="gray")
    fig6.suptitle('Convolution layer 3 maximizition')

这一部分代码运行还挺慢的，要稍微等一会，得到的结果如下：
第一层卷积层可视化：

第二层卷积层可视化：

第三层卷积层可视化：

从结果来看，很显然第一层卷积层检测的东西是灰度，不同卷积核检测不同的灰度；从第二层的卷积核可视化结果来看，有横的竖的斜的条纹，这个应该是用来检测这样复杂一点的特征的，至于第三个就看不太懂了，应该是更高级的pattern。
不过我觉得这样有点奇怪，从第二层卷积层开始就是将上一层卷积层的输出作为输入，这相当于固定了前面卷积层的参数，从而可视化的卷积核是不是它与前面的卷积核组合的结果，感觉应该把这层卷积层单独提取出来做梯度上升，不过我暂时还不会改也就算了。

既然都是做梯度上升，我想到同样可以用这个办法来可视化使某个类别输出最大的输入图像，就是让机器告诉我们什么样的人脸是最符合他对这种类别的认识的。类似地梯度上升的代码

def visualize_class(x, model, epochs, learning_rate):
    images = []
    for k in range(7):
        for i in range(epochs):
            gradients = torch.zeros(x.shape)
            model.eval()
            output = model(x)
            activation = output[0,k]
            activation.backward()
            
            gradients = x.grad.data
            x = x.cpu() + gradients.cpu() * learning_rate
            x = Variable(x.cuda(), requires_grad = True)
        images.append(x.cpu().detach().numpy().squeeze())
        print('Class '+str(k+1)+' visualize over!')
    return images

又是一堆画图代码

    #initialize input x
    x = []
    for i in range(48):
        x_temp = []
        for j in range(48):
            x_temp.append(random.gauss(0,0.5))
        x.append(x_temp)
    x = np.array(x).reshape(1,1,48,48)
    x = Variable(torch.tensor(x).float().cuda(), requires_grad = True)
        
    newx = visualize_class(x,model, 100, 0.1)
    
    fig7 = plt.figure(2,figsize=(20, 50))
    for i in range(7):
        print(i,' : ',model(Variable(torch.tensor(newx[i]).view(1,1,48,48).cuda())))
        ax = fig7.add_subplot(1, 7, i+1, xticks=[], yticks=[])
        ax.set_title(class_judge(i))
        ax.imshow(newx[i], cmap="gray")
    fig7.suptitle('Class maximizition')

最终结果如下：

果然通常是没有好的结果的，要想机器认为最符合某种表情的输入与人的判断相同的话，要对这个过程添加正则化，不过我也不会。

task3 lime的话要安装lime这个package，lime的第一步是将图像划分为不同的segment，这里使用了skimage.segmentation来完成这个工作。
再lime之前首先要写两个函数作为lime某些函数的参数，分别是

def predict(input):
    return model(torch.tensor(input)[:,0:1,:,:,0].float().cuda()).cpu().detach().numpy()

def segmentation(input):
    #print(np.shape(input))
    return slic(input)

之后就是lime和画图的代码

    x_train_rgb = np.stack((x_train[0:10],)*3, axis=-1).squeeze()
    #x_train_rgb = Variable(torch.tensor(x_train_rgb).cuda())
    #print(x_train_rgb.size())
    # Initiate explainer instance
    print(np.shape(x_train_rgb))
    explainer = lime_image.LimeImageExplainer()
    
    # Get the explaination of an image
    explaination = explainer.explain_instance(
                                image=x_train_rgb[0:10], 
                                classifier_fn=predict,
                                segmentation_fn=segmentation,
                            )
    
    # Get processed image
    image, mask = explaination.get_image_and_mask(
                                    label=explaination.top_labels[0],
                                    #torch.tensor(y_train[0:10]).long(),
                                    negative_only=False,
                                    positive_only=True,
                                    hide_rest=False,
                                    num_features=7,
                                    min_weight=0.0
                                )
    img_boundry1 = mark_boundaries(image, mask).squeeze()
    # save the image
    fig8 = plt.figure(8,figsize=(20, 50))
    for i in range(np.shape(img_boundry1)[0]):
        ax = fig8.add_subplot(2, 5, i+1, xticks=[], yticks=[])
        ax.imshow(img_boundry1[i])
    fig8.suptitle('Positive area')
        
    image, mask = explaination.get_image_and_mask(
                                    label=explaination.top_labels[0],
                                    #torch.tensor(y_train[0:10]).long(),
                                    negative_only=True,
                                    positive_only=False,
                                    hide_rest=False,
                                    num_features=7,
                                    min_weight=0.0
                                )
    img_boundry2 = mark_boundaries(image, mask).squeeze()
    # save the image
    fig9 = plt.figure(9,figsize=(20, 50))
    for i in range(np.shape(img_boundry2)[0]):
        ax = fig9.add_subplot(2, 5, i+1, xticks=[], yticks=[])
        ax.imshow(img_boundry2[i])
    fig9.suptitle('Negative area')
    
    image, mask = explaination.get_image_and_mask(
                                    label=explaination.top_labels[0],
                                    #torch.tensor(y_train[0:10]).long(),
                                    negative_only=False,
                                    positive_only=False,
                                    hide_rest=False,
                                    num_features=7,
                                    min_weight=0.0
                                )
    img_boundry3 = mark_boundaries(image, mask).squeeze()
    # save the image
    fig10 = plt.figure(10,figsize=(20, 50))
    for i in range(np.shape(img_boundry3)[0]):
        ax = fig10.add_subplot(2, 5, i+1, xticks=[], yticks=[])
        ax.imshow(img_boundry3[i])
    fig10.suptitle('Green:Positive area,Red:Negative area,Yellow:boundary')

lime的用法我也不是太懂，不过通过查资料什么的还是让它跑起来了，因为不太懂，我也就不胡乱解释这些参数了。直接上结果：

图中绿色是对结果影响为正的区域，红色是对结果影响为负的区域，居然有好多区域集中在人脸外边，看来训练的模型跑偏了。

上面就是我完成这个作业的全部过程了，其实是代码东拼西凑加调bug的过程，写在这里供大家借鉴一下子。完整代码会贴在最后，注意其中的参数

#control display image
saliency_map = 0
filter_output = 0
filter_visualization = 0
class_visualization = 0
lime = 0
model_path = 'E:\\李宏毅机器学习\\ML_code\\3expression_recognition\\3expression_recognition\\model.pth'

完成了上面5个步骤，令上面某个参数为1即可运行该步骤的代码，因为画图实在是太多了，一下子都显示出来很头疼，所以分成5部分，不把某些改成1的话就不会运行，相当于就只加载了数据和模型。记得还要修改model_path为模型所在的路径，否则模型就加载不出来。

这算是我第一次写机器学习方面的博客，我是一个机器学习的初学者，中间肯定有很多错误，博客写的也很烂，希望能给大家提供帮助，毕竟找李宏毅老师ppt和作业链接弄了好久，代码也写了好久。如有不妥欢迎指正讨论，谢谢大家。另外写这一篇也不容易，转载请注明出处。
最后单独感谢一下秋沐霖大佬写了前三次作业的博客，否则我这一部分也无从谈起，而且博客写的水平也比我高很多，并且找他借鉴代码也同意了，万分感谢！

最后全部代码如下：

# -*- coding: utf-8 -*-

import random
import cv2
import numpy as np
import torch
import torch.nn as nn
from torch.autograd import Variable
import matplotlib.pyplot as plt
from lime import lime_image
from skimage.segmentation import slic,mark_boundaries

# 参数初始化
def gaussian_weights_init(m):
    classname = m.__class__.__name__
    # 字符串查找find，找不到返回-1，不等-1即字符串中含有该字符
    if classname.find('Conv') != -1:
        m.weight.data.normal_(0.0, 0.04)

def load_data():
    # 从csv中读取有用的信息
    x = np.loadtxt('data.csv')
    x = x.reshape(np.shape(x)[0], 48, 48)
    y = np.loadtxt('label.csv')
    
    print(np.shape(x),np.shape(y))
    # 划分训练集与验证集
    x_train, x_test = x[0:24000, :, :], x[24000:-1, :, :]
    y_train, y_test = y[0:24000], y[24000:-1]
    
    x_train=x_train.reshape(x_train.shape[0],1,48,48)
    x_test=x_test.reshape(x_test.shape[0],1,48,48)
    x_train=x_train.astype('float32')
    x_test=x_test.astype('float32')
    #one-hot encoding
    #y_train=np_utils.to_categorical(y_train,7)
    #y_test=np_utils.to_categorical(y_test,7)
    x_train=x_train/255
    x_test=x_test/255
    #x_test=np.random.normal(x_test)
    return (x_train,y_train),(x_test,y_test)

class FaceCNN(nn.Module):
    # 初始化网络结构
    def __init__(self):
        super(FaceCNN, self).__init__()
        
        # 第一次卷积、池化
        self.conv1 = nn.Sequential(
            # 输入通道数in_channels，输出通道数(即卷积核的通道数)out_channels，卷积核大小kernel_size，步长stride，对称填0行列数padding
            # input:(bitch_size, 1, 48, 48), output:(bitch_size, 64, 48, 48), (48-3+2*1)/1+1 = 48
            nn.Conv2d(in_channels=1, out_channels=64, kernel_size=3, stride=1, padding=1), # 卷积层
            nn.BatchNorm2d(num_features=64), # 归一化
            nn.RReLU(inplace=True), # 激活函数
            # output(bitch_size, 64, 24, 24)
            nn.MaxPool2d(kernel_size=2, stride=2), # 最大值池化
        )
        
        # 第二次卷积、池化
        self.conv2 = nn.Sequential(
            # input:(bitch_size, 64, 24, 24), output:(bitch_size, 128, 24, 24), (24-3+2*1)/1+1 = 24
            nn.Conv2d(in_channels=64, out_channels=128, kernel_size=3, stride=1, padding=1),
            nn.BatchNorm2d(num_features=128),
            nn.RReLU(inplace=True),
            # output:(bitch_size, 128, 12 ,12)
            nn.MaxPool2d(kernel_size=2, stride=2),
        )
        
        # 第三次卷积、池化
        self.conv3 = nn.Sequential(
            # input:(bitch_size, 128, 12, 12), output:(bitch_size, 256, 12, 12), (12-3+2*1)/1+1 = 12
            nn.Conv2d(in_channels=128, out_channels=256, kernel_size=3, stride=1, padding=1),
            nn.BatchNorm2d(num_features=256),
            nn.RReLU(inplace=True),
            # output:(bitch_size, 256, 6 ,6)
            nn.MaxPool2d(kernel_size=2, stride=2),
        )

        # 参数初始化
        self.conv1.apply(gaussian_weights_init)
        self.conv2.apply(gaussian_weights_init)
        self.conv3.apply(gaussian_weights_init)

        # 全连接层
        self.fc = nn.Sequential(
            nn.Dropout(p=0.2),
            nn.Linear(in_features=256*6*6, out_features=4096),
            nn.RReLU(inplace=True),
            nn.Dropout(p=0.5),
            nn.Linear(in_features=4096, out_features=1024),
            nn.RReLU(inplace=True),
            nn.Linear(in_features=1024, out_features=256),
            nn.RReLU(inplace=True),
            nn.Linear(in_features=256, out_features=7),
        )
        self.features = nn.Sequential(*list(self.children())[:4])

    # 前向传播
    def forward(self, x):
        x = self.conv1(x)
        x = self.conv2(x)
        x = self.conv3(x)
        # 数据扁平化
        x = x.view(x.shape[0], -1)
        y = self.fc(x)
        return y

def compute_saliency_maps(x, y, model):
    model.eval()
    x.requires_grad_()
    y_pred = model(x.cuda())
    loss_func = torch.nn.CrossEntropyLoss()
    loss = loss_func(y_pred, y.cuda().long())
    loss.backward()
    
    saliency = x.grad.abs().squeeze().data
    print(saliency.size())
    return saliency

def show_saliency_maps(x, y, model):
    x_org = x.squeeze()
    x = torch.tensor(x)
    y = torch.tensor(y)
    # Compute saliency maps for images in X
    saliency = compute_saliency_maps(x, y, model)
    print(saliency[0,0,0])
    # Convert the saliency map from Torch Tensor to numpy array and show images
    # and saliency maps together.
    saliency = saliency.detach().cpu()
    
    num_pics = x_org.shape[0]
    for i in range(num_pics):
        # You need to save as the correct fig names
        plt.imsave('saliency\\pic_'+ str(i) + '.jpg', x_org[i], cmap=plt.cm.gray)
        plt.imsave('saliency\\saliency_'+ str(i) + '.jpg', saliency[i], cmap=plt.cm.jet)
        if(i == 7):
            plt.figure()
            plt.subplot(1,3,1)
            plt.imshow(x_org[i], cmap='gray')
            plt.subplot(1,3,2)
            plt.imshow(saliency[i], cmap='gray')
            #plt.colorbar()
            plt.subplot(1,3,3)
            subx = x_org[i]
            for j in range(saliency[i].size()[0]):
                for k in range(saliency[i].size()[1]):
                    if(saliency[i,j,k]*1000000 < 0.04):
                        subx[j,k] = 0
            plt.imshow(subx, cmap='gray')

# 提取不同层输出
class LayerActivations:
    features = None
 
    def __init__(self, model, layer_num):
        self.hook = model[layer_num].register_forward_hook(self.hook_fn)
 
    def hook_fn(self, module, input, output):
        self.features = output.cpu()
 
    def remove(self):
        self.hook.remove()

def compute_gradients(x, model, filter_model, filter_id):
    gradient = torch.zeros(x.shape)
    model.eval()
    conv_out = LayerActivations(filter_model, 0)  # 提出第 一个卷积层的输出 
    o = model(x)
    conv_out.remove()  #
    act = conv_out.features  # act 即 第0层输出的特征
    
    activation = torch.sum(act[:,filter_id,:,:])
    activation.backward()
    
    gradient = x.grad.data
    return gradient

def visualize_filter(x, model, filter_model, filter_number, epochs, learning_rate):
    images = []
    for k in range(filter_number):
        for i in range(epochs):
            gradients = compute_gradients(x,model,filter_model,k)
            #self.gradients /= (torch.sqrt(torch.mean(torch.mul(self.gradients, self.gradients))) + 1e-5)
            x = x.cpu() + gradients.cpu() * learning_rate
            x = Variable(x.cuda(), requires_grad = True)
        images.append(x.cpu().detach().numpy().squeeze())
        print('Filter '+str(k+1)+' visualize over!')
    return images

def visualize_class(x, model, epochs, learning_rate):
    images = []
    for k in range(7):
        for i in range(epochs):
            gradients = torch.zeros(x.shape)
            model.eval()
            output = model(x)
            activation = output[0,k]
            activation.backward()
            
            gradients = x.grad.data
            x = x.cpu() + gradients.cpu() * learning_rate
            x = Variable(x.cuda(), requires_grad = True)
        images.append(x.cpu().detach().numpy().squeeze())
        print('Class '+str(k+1)+' visualize over!')
    return images

def class_judge(class_number):
    if(class_number == 0):
        out = 'angry'
    elif(class_number == 1):
        out = 'disgust'
    elif(class_number == 2):
        out = 'fear'
    elif(class_number == 3):
        out = 'happy'
    elif(class_number == 4):
        out = 'sad'
    elif(class_number == 5):
        out = 'surprise'
    elif(class_number == 6):
        out = 'natural'
    return out

def predict(input):
    return model(torch.tensor(input)[:,0:1,:,:,0].float().cuda()).cpu().detach().numpy()

def segmentation(input):
    #print(np.shape(input))
    return slic(input)


#control display image
saliency_map = 0
filter_output = 0
filter_visualization = 0
class_visualization = 0
lime = 0
model_path = 'E:\\李宏毅机器学习\\ML_code\\3expression_recognition\\3expression_recognition\\model.pth'

(x_train,y_train),(x_test,y_test)=load_data()

model = FaceCNN()
model.load_state_dict(torch.load(model_path))
model.cuda()
#print(type(model.features[0][0]))

if(saliency_map == 1):
    # using the first ten images for example
    show_saliency_maps(x_train[0:10], y_train[0:10], model)

if(filter_output == 1):
    conv_out = LayerActivations(model.features[0], 0)  # 提出第 一个卷积层的输出
    o = model(Variable(torch.tensor(x_train[0]).view(1,1,48,48).cuda()))
    conv_out.remove()  #
    act = conv_out.features  # act 即 第0层输出的特征
    # 可视化 输出
    fig1 = plt.figure(1,figsize=(20, 50))
    fig1.suptitle('Convolution layer 1 output')
    
    for i in range(act.size()[1]):
        ax = fig1.add_subplot(8, 8, i+1, xticks=[], yticks=[])
        ax.imshow(act[0][i].detach().numpy(), cmap="gray")
    
    conv_out = LayerActivations(model.features[1], 0)
    o = model(Variable(torch.tensor(x_train[0]).view(1,1,48,48).cuda()))
    conv_out.remove()  #
    act = conv_out.features  # act 即 第0层输出的特征
    # 可视化 输出
    fig3 = plt.figure(3,figsize=(20, 50))
    fig3.suptitle('Convolution layer 2 output')
    
    for i in range(act.size()[1]):
        ax = fig3.add_subplot(8, 16, i+1, xticks=[], yticks=[])
        ax.imshow(act[0][i].detach().numpy(), cmap="gray")
    
    conv_out = LayerActivations(model.features[2], 0)  # 提出第 一个卷积层的输出
    o = model(Variable(torch.tensor(x_train[0]).view(1,1,48,48).cuda()))
    conv_out.remove()  #
    act = conv_out.features  # act 即 第0层输出的特征
    # 可视化 输出
    fig5 = plt.figure(5,figsize=(20, 50))
    fig5.suptitle('Convolution layer 3 output')
    
    for i in range(act.size()[1]):
        ax = fig5.add_subplot(16, 16, i+1, xticks=[], yticks=[])
        ax.imshow(act[0][i].detach().numpy(), cmap="gray")

if(filter_visualization == 1):
    #initialize input x
    x = []
    for i in range(48):
        x_temp = []
        for j in range(48):
            x_temp.append(random.gauss(0,0.5))
        x.append(x_temp)
    x = np.array(x).reshape(1,1,48,48)
    x = Variable(torch.tensor(x).float().cuda(), requires_grad = True)
        
    newx = visualize_filter(x,model,model.features[0], 64, 100, 0.1)
    
    fig2 = plt.figure(2,figsize=(20, 50))
    for i in range(64):
        ax = fig2.add_subplot(8, 8, i+1, xticks=[], yticks=[])
        ax.imshow(newx[i], cmap="gray")
    fig2.suptitle('Convolution layer 1 maximizition')
        
    newx = visualize_filter(x,model,model.features[1], 128, 100, 0.1)
    
    fig4 = plt.figure(4,figsize=(20, 50))
    for i in range(128):
        ax = fig4.add_subplot(8, 16, i+1, xticks=[], yticks=[])
        ax.imshow(newx[i], cmap="gray")
    fig4.suptitle('Convolution layer 2 maximizition')
    
    newx = visualize_filter(x,model,model.features[2], 256, 100, 0.1)
    
    fig6 = plt.figure(6,figsize=(20, 50))
    for i in range(256):
        ax = fig6.add_subplot(16, 16, i+1, xticks=[], yticks=[])
        ax.imshow(newx[i], cmap="gray")
    fig6.suptitle('Convolution layer 3 maximizition')

if(class_visualization == 1):
    #initialize input x
    x = []
    for i in range(48):
        x_temp = []
        for j in range(48):
            x_temp.append(random.gauss(0,0.5))
        x.append(x_temp)
    x = np.array(x).reshape(1,1,48,48)
    x = Variable(torch.tensor(x).float().cuda(), requires_grad = True)
        
    newx = visualize_class(x,model, 100, 0.1)
    
    fig7 = plt.figure(2,figsize=(20, 50))
    for i in range(7):
        print(i,' : ',model(Variable(torch.tensor(newx[i]).view(1,1,48,48).cuda())))
        ax = fig7.add_subplot(1, 7, i+1, xticks=[], yticks=[])
        ax.set_title(class_judge(i))
        ax.imshow(newx[i], cmap="gray")
    fig7.suptitle('Class maximizition')

if(lime == 1):
    x_train_rgb = np.stack((x_train[0:10],)*3, axis=-1).squeeze()
    #x_train_rgb = Variable(torch.tensor(x_train_rgb).cuda())
    #print(x_train_rgb.size())
    # Initiate explainer instance
    print(np.shape(x_train_rgb))
    explainer = lime_image.LimeImageExplainer()
    
    # Get the explaination of an image
    explaination = explainer.explain_instance(
                                image=x_train_rgb[0:10], 
                                classifier_fn=predict,
                                segmentation_fn=segmentation,
                            )
    
    # Get processed image
    image, mask = explaination.get_image_and_mask(
                                    label=explaination.top_labels[0],
                                    #torch.tensor(y_train[0:10]).long(),
                                    negative_only=False,
                                    positive_only=True,
                                    hide_rest=False,
                                    num_features=7,
                                    min_weight=0.0
                                )
    img_boundry1 = mark_boundaries(image, mask).squeeze()
    # save the image
    fig8 = plt.figure(8,figsize=(20, 50))
    for i in range(np.shape(img_boundry1)[0]):
        ax = fig8.add_subplot(2, 5, i+1, xticks=[], yticks=[])
        ax.imshow(img_boundry1[i])
    fig8.suptitle('Positive area')
        
    image, mask = explaination.get_image_and_mask(
                                    label=explaination.top_labels[0],
                                    #torch.tensor(y_train[0:10]).long(),
                                    negative_only=True,
                                    positive_only=False,
                                    hide_rest=False,
                                    num_features=7,
                                    min_weight=0.0
                                )
    img_boundry2 = mark_boundaries(image, mask).squeeze()
    # save the image
    fig9 = plt.figure(9,figsize=(20, 50))
    for i in range(np.shape(img_boundry2)[0]):
        ax = fig9.add_subplot(2, 5, i+1, xticks=[], yticks=[])
        ax.imshow(img_boundry2[i])
    fig9.suptitle('Negative area')
    
    image, mask = explaination.get_image_and_mask(
                                    label=explaination.top_labels[0],
                                    #torch.tensor(y_train[0:10]).long(),
                                    negative_only=False,
                                    positive_only=False,
                                    hide_rest=False,
                                    num_features=7,
                                    min_weight=0.0
                                )
    img_boundry3 = mark_boundaries(image, mask).squeeze()
    # save the image
    fig10 = plt.figure(10,figsize=(20, 50))
    for i in range(np.shape(img_boundry3)[0]):
        ax = fig10.add_subplot(2, 5, i+1, xticks=[], yticks=[])
        ax.imshow(img_boundry3[i])
    fig10.suptitle('Green:Positive area,Red:Negative area,Yellow:boundary')
    
plt.show()

你可能感兴趣的:(台大李宏毅机器学习作业4(HW4)——可解释机器学习)

【PX4】Ubuntu20.04安装PX4教程 davidson1471 PX4 git 无人机 linux ubuntu
*建议早上安装*1.下载以往版本从github上clone源码gitclonehttps://github.com/PX4/PX4-Autopilot.git进入PX4-Autopilot文件夹cdPX4-Autopilot查看当前分支，位于origin/maingitstatus查看所有远程分支，带release的gitbranch-r|grep"release"切换到发行分支v1.12gitc
Go 语言使用Protobuf 进行序列化详解尘鹄 Go 语言学习之路 golang 开发语言后端 rpc go
文章目录Go语言使用Protobuf进行序列化详解1.Protobuf是什么?2.安装Protobuf及Go依赖3.编写.proto文件4.实现序列化和反序列化Go语言使用Protobuf进行序列化详解1.Protobuf是什么?以下是Protobuf官方中文文档的概述:Protobuf(ProtocolBuffers)是一种语言中立、平台中立的可扩展机制，用于序列化结构化数据。它类似于JSON，
web前端期末大作业：婚纱网页主题网站设计——唯一旅拍婚纱公司网站HTML+CSS+JavaScript IT-司马青衫前端课程设计 html
‍静态网站的编写主要是用HTMLDⅣV+CSSJS等来完成页面的排版设计‍，一般的网页作业需要融入以下知识点：div布局、浮动定位、高级css、表格、表单及验证、js轮播图、音频视频Fash的应用、uli、下拉导航栏、鼠标划过效果等知识点，学生网页作业源码，制作水平和原创度都适合学习或交作业用，记得点赞。精彩专栏推荐【作者主页——获取更多优质源码】【web前端期末大作业——毕设项目精品实战案例(1
灵犀X2：人形机器人的新篇章 Anima.AI 机器人
简介灵犀X2是智元机器人推出的最新款人形机器人，很可能是其前代产品灵犀X1的升级版本。灵犀X1作为一款开源的模块化机器人，其机械设计和软件代码完全公开，全球开发者都可以参与优化和创新。这款机器人身高130厘米，体重33公斤，具备34到44个自由度（DegreesofFreedom,DoF，即关节活动范围），能够执行轻型任务，如端茶送水、整理房间等。灵犀X2在继承这些特性的基础上，可能进一步提升了动
Webpack打包构建流程码上跑步 webpack 前端 node.js
webpack的打包构建流程为什么需要打包？在前端有非常多的资源，如css、js、vue、vue、图片、字体等。有些资源需要加工处理1.ts->jsts-loader2.css->css-loader+style-loader3.图片->file-loader+url-loader4.html->html-webpack-plugin需要对产物进行优化optimization（webpack优化配
机器学习实战——音乐流派分类（主页有源码）喵了个AI 机器学习实战机器学习分类人工智能
✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨1.简介音乐流派分类是音乐信息检索（MusicInformationRetrieval,MIR）中的一个重要任务，旨在通过分析音频信号的特征，将音乐自动分类到不同的流派（如古典、摇滚、爵士、流行等）。随着数字音乐平台的普及，音乐流派分类技术被广泛应用于音乐推荐、自动标签生成和音乐库管理
github 仓库查看git第一次commit的记录 HHHHy2019 GIT github git
github仓库查看git第一次commit的记录步骤我们这里选仓库TuSimple/naive-ui，首页显示这个仓库最新的git的状态是8978fa923minutesagoGitstats4,460commits，说明现在有4460个commit。我们再点击4,460commits进入查看commit的页面，滑到最底部，点击Older，（网址）地址栏显示为https://github.com
Linux提权sudo篇璃靡 linux 网络安全安全
文章目录linux提权01.CVE-2019-1428702.sudoapt03.sudoapach204.sudoash05.sudoawk06.sudobase6407.sudobash08.sudocp09.sudocpulimit10.sudocurl11.sudodate12.sudodd13.sudodstat14.sudoed15.sudoenv16.exiftool17.sudoe
Linux提权-02 sudo提权藤原千花的败北权限提升 linux 运维网络安全
文章目录1.sudo提权原理1.1原理1.2sudo文件配置2.提权利用方式2.1sudo权限分配不当2.2sudo脚本篡改2.3sudo脚本参数利用2.4sudo绕过路径执行2.5sudoLD_PRELOAD环境变量2.6sudocaching2.7sudo令牌进程注入3.参考4.附录什么是环境变量**一、环境变量是什么？****二、为什么`sudo`可以重置环境变量？****1.防止权限提升攻
前端实现版本更新自动检测✅ 水煮白菜王前端 Vue JavaScript 前端 vue.js javascript
作者简介：水煮白菜王，一位资深前端劝退师文章专栏：前端专栏，记录一下平时在博客写作中，总结出的一些开发技巧和知识归纳总结✍。感谢支持目录一、背景二、实现原理2.1逻辑2.2一些好处三、具体实现3.1工程化封装3.2关键方法解析脚本哈希获取：对比逻辑：四、全部代码4.1vue34.2vue2五、注意事项与常见问题5.1可能出现的问题5.2浏览器兼容方案一、背景在现代Web应用中，部署前端版本更新后及
什么是XSS 藤原千花的败北 web漏洞 xss 前端 web安全网络安全
文章目录前言1.前端知识2.什么是XSS3.漏洞挖掘4.参考前言之前对XSS的理解就是停留在弹窗，认为XSS这种漏洞真的是漏洞吗？安全学习了蛮久了，也应该对XSS有更进一步的认识了。1.前端知识现代浏览器是一个高度复杂的软件系统，由多个核心组件协同工作，旨在高效、安全地呈现网页内容并执行交互逻辑。对一般用户来讲，其主要功能就是向服务器发出请求，在窗口中展示用户所选择的网络资源。这里所说的资源一般是
Oracle创建表空间、删除、状态、重命名、修改、增加、移动水煮白菜王 Oracle oracle 数据库
目录Oracle基本学习笔记创建表空间1.表空间创建格式3.表空间状态属性4.重命名表空间5.修改表空间数据文件的大小6.删除表空间的数据文件7.修改表空间中数据文件的状态8.表空间中数据文件的移动Oracle基本学习笔记创建表空间需要使用CREATETABLESPACE语句。其基本语法如下:CREATE[TEMPORARYIUNDO]TABLESPACEtablespacename[DATAFI
【推荐项目】044-中医门诊管理系统蜗牛 | ICU 推荐项目 java 前端框架毕设 spring mybatis
044-中医门诊管理系统介绍javaspringbootvuejs中医门诊管理系统为了帮助您更清晰地整理中医门诊管理系统的功能，我将按照您提供的角色和功能进行归类和整理。以下是整理后的功能列表：角色划分核心管理员医生药师用户（普通患者）管理端功能（核心管理员）统计用户统计（按注册时间、活跃度等）药物销售统计处方统计咨询统计用户管理用户列表（查看、编辑、删除）用户角色分配用户权限管理医生管理医生列表
python catia catalog文件_Python封装的获取文件目录的函数卢新生 python catia catalog文件
获取指定文件夹中文件的函数，网上学习时东拼西凑的结果。注意，其中文件名如1.txt，文件路径如D:\文件夹\1.txt；direct为第一层子级importos#filePath输入文件夹全路径#mode#1递归获取所有文件名;#2递归获取所有文件路径;#3获取direct文件名;#4获取direct文件路径;#5获取direct文件名和direct子文件夹名;#6获取direct文件路径和dir
springMVC RestFul接口设计模式详解，包括前后端设计详解。@GetMapping、@PostMapping、@PutMapping@DeleteMapping@PathVariable 漫慢丶 springmvc restful 设计模式 java
目录1、什么是RestFul接口设计模式2、使用该接口设计模式后端还需要配置什么3、使用该接口设计模式前端需要注意什么4、Controller具体实现方式1、什么是RestFul接口设计模式RestFul这是一种springmvc接口的设计模式，用来区别不同类型的请求，来匹配控制器处理映射。例如请求URL为/test/那么中根据Get、put、post等请求方式，就可以具体映射到对应的控制器方法。
linux: make & autoconf & automake & autoreconf & aclocal mzhan017 gcc linux build
文章目录参考make首先需要写一个makefileMakefile包含的内容targetvariable两步走语法\规则定义操作隐式规则先决条件order-onlyforceFORCE变量变量的高级功能陷阱建议使用变量时，加括号/大括号变量的替换$$@$indentationmaybenon-portableautoconfM4shautomakeconfigure参考http://savanna
AI大模型零基础金融人如何一周自学大模型，从零基础到入门，看这篇就够了！冻感糕人~ 人工智能金融 AI大模型 LLM 大模型技术大模型学习路线大模型基础
前几天参加了字节跳动在上海举办的火山引擎Force原动力大会，OpenAI也连续开了12天发布会，最近堪称科技界的春晚了。如果说2022年ChatGPT横空出世把人工智能的发展带上了一个新的台阶，那么2024年末，大模型对工作、生活的全面“侵入”让我们越来越接近库兹韦尔所描述的那个奇点时刻。作为金融民工，我们想通过这篇文章讲讲从用户的角度如何一周快速掌握大模型，以及为什么我建议每一个金融从业人员（
推荐一款革命性的游戏对话管理工具：Godot 4 Dialogue Manager 袁菲李
推荐一款革命性的游戏对话管理工具：Godot4DialogueManager项目地址:https://gitcode.com/gh_mirrors/go/godot_dialogue_manager项目介绍在游戏开发领域中，对白设计是构建沉浸式剧情和角色深度的关键。Godot4DialogueManager，一个专为Godot引擎打造的开源插件，提供了直观且强大的分支对话编辑器和运行时解决方案。这
【每日一题 | 2025】3.3 ~ 3.9 Guiat 每日一题每日一题
个人主页：Guiat归属专栏：每日一题文章目录1.【3.3】10387[蓝桥杯2024省A]训练士兵2.【3.4】P8601[蓝桥杯2013省A]剪格子3.【3.5】P9241[蓝桥杯2023省B]飞机降落4.【3.6】P10578[蓝桥杯2024国A]旋转九宫格5.【3.7】P8642[蓝桥杯2016国AC]路径之谜6.【3.8】P8694[蓝桥杯2019国AC]估计人数7.【3.9】数字接龙正
C++随机数宁玉AC c学习 c++开发语言
目录一、名著参考二、详解1.rand()函数2.time(0)3.srand(time(0))4.获取指定范围内的随机数（含指定位数）一、名著参考可以使用cstdlib头文件中的rand()函数来获得随机整数；这个函数返回0~RAND_MAX之间的随机整数；rand()函数生成的是伪随机数。即每次在同一个系统上执行这个函数的时候，rand()函数生成同一序列的数。rand()函数的算法使用一个叫种
Linux 提权藤原千花的败北权限提升网络安全 linux 运维网络安全
文章目录前言1.内核漏洞提权脏牛（CVE-2016-5195）2.不安全的系统配置项2.1SUID/SGID提权2.2sudo提权2.3定时任务提权2.4capabilities提权3.第三方软件提权TomcatmanagerNginx本地提权（CVE-2016-1247）Redis未授权4.参考前言Linux提权总结1.内核漏洞提权内核管理着组件（如系统上的内存）和应用程序之间的通信。这个关键作
【推荐项目】 043-停车管理系统蜗牛 | ICU 推荐项目 spring boot vue.js java 前端框架
043-停车管理系统介绍使用springbootvuejsmysql技术搭建框架。智能停车管理系统描述后端框架：采用SpringBoot与MySQL的强强联合，为系统提供稳健、高效的服务支撑。前端框架：前端选用Vue.js，打造流畅、美观的用户交互界面。管理员功能：用户信息管理：轻松管理用户信息，包括新增、编辑、删除及查询用户。界面清晰，操作便捷，确保用户数据的安全与准确。车位信息管理：实时查看车
docker命令实战运用部署服务云原生的爱好者 docker 容器运维
1.接上篇博文，先讲一下如何利用docker来对容器进行一个守护进程的启动，以及如何进入日期，如下：[root@cjr~]#dockerimagesREPOSITORYTAGIMAGEIDCREATEDSIZEcentoslatest5d0da3dc97643yearsago231MB[root@cjr~]#dockerrun-td--nametestcentos:latest1b0cfe7658
Llama3.1是AI界的Linux？先部署起来再说！ AI大模型探索者人工智能 linux 运维语言模型 ai LLama llama
前言就在昨天，Meta发布了Llama3.1，这次带来的中杯、大杯和超大杯3个版本。从纸面数据来看，Llama3.1超大杯已经能跟GPT-4Omni、Claude3.5Sonnet分庭抗礼了。而中杯和大杯更是将同量级的对手摁在地上摩擦。要知道，Llama的对手可是闭源模型啊工友们！小扎同志说，开源AI会成为行业的标准，就像Linux一样！不管怎么说，既然你开源了，那我就在本地部署起来吧。本文使用O
新导则下的防洪评价报告编制方法及洪水建模实践技术吹翻书页的风水文水利地质地下水环境科学 arcgis 防洪评价报告编制 HEC-RAS软件二维水动力模型计算
目录1、《防洪评价报告编制导则解读河道管理范围内建设项目编制导则》（SL/T808-2021）解读2、防洪评价相关制度与解析3、防洪评价地形获取及常用计算4、HEC-RAS软件原理及特点5、HEC-RAS地形导入6、一维数学模型计算7、基于数学模型软件的一维构筑物的水动力模型计算及本章内容在报告中编写方法8、数值模型软件概述及数据基础处理9、基于数学模型软件的二维水动力模型计算析及结果输出及评价章
java面试题框架篇老汤姆. 面试 java spring boot 开发语言
文章目录1.Spring框架1.1Spring两大核心：IOC与AOPIOCDIAOP切面=切入点表达式+通知方法关于JDK代理和CGlib代理总结(高程/架构)!!!AOP常用注解1.2BeanFactory(懒加载初始bean)和ApplicationContext(立即初始bean)有什么区别1.3Spring框架用到了哪些设计模式1.4spring框架的优缺点1.5Spring常用注解2.
Docker Compose国内镜像一键部署dify llody_55 GPT docker 容器运维 ai AI编程
克隆代码gitclonehttps://github.com/langgenius/dify.git进入docker目录cddocker修改.env部分#将环境模版文件变量重命名cp.env.example.env#修改.env,修改nginx的host和端口,避免端口冲突NGINX_SERVER_NAME=192.168.1.223NGINX_PORT=1880NGINX_SSL_PORT=14
ARM64环境部署EFK8.15.3收集K8S集群容器日志 llody_55 kubernetes 容器云原生运维 es java elasticsearch
环境规划主机IP系统部署方式ES版本CPU架构用户名密码192.168.1.225Ubuntu22.04.4LTSdockerelasticsearch:8.15.3ARM64elasticllodyi4TMmZDES集群部署创建持久化目录(所有节点)mkdir-p/data/es/{data,certs,logs,plugins}mkdir-p/data/es/certs/{ca,es01}服务
centos7升级curl到最新版包含离线安装方法 llody_55 vim
当前版本[root@consul~]#curl-Vcurl7.29.0(x86_64-redhat-linux-gnu)libcurl/7.29.0NSS/3.53.1zlib/1.2.7libidn/1.28libssh2/1.8.0Protocols:dictfileftpftpsgopherhttphttpsimapimapsldapldapspop3pop3srtspscpsftpsmtp
目标检测项目 sho_re 神经网络人工智能 pytorch 目标检测
·识别图片中有哪些物体并且找到物体的存在位置多任务：位置+类别目标种类与数量繁多的问题目标尺度不均的问题遮挡、噪声等外部环境干扰VOC数据集：PASCALVOC挑战赛(ThePASCALVisualObjectClasses)是一个世界级的计算机视觉挑战赛。4大类，20小类VOC2007：9963图片/24640目标VOC2012：23080图片/54900目标·COCO数据集：起源于微软2014
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st