Torture_L

【天池竞赛】心跳数据挖掘

天池学习赛心跳数据挖掘 168分攻略

Chapter 1. 赛题解析

就如比赛界面所介绍的一般，这里再复述一遍

'''
本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事 —— 心跳信号分类预测。

赛题以心电图心跳信号数据为背景，要求选手根据心电图感应数据预测心跳信号所属类别，其中心跳信号对应正常病例以及受不同心律不齐和心肌梗塞影响的病例，这是一个多分类的问题。通过这道赛题来引导大家了解医疗大数据的应用，帮助竞赛新人进行自我练习、自我提高。
'''

赛题以心电图心跳信号分类为任务，数据为一段心跳信号序列，其中每个样本的信号序列采样频次一致，长度相等。

训练集有十万条数据，每个测试集都有两万条数据。

数据的字段表如下：

Field	Description
id	为心跳信号分配的唯一标识
hearbeat_signals	心跳信号序列
label	心跳信号类别(0,1,2,3)

分类的测评分数计算公式为：
$\sum|y_i-\hat y_i|$
也就是L1Loss。

作为入门赛，本题的难度不算特别大，最开始的时候，每一频率采样的序号信息都是叠加放在hearbeat_signals属性里的，拆分后的表现为一段时间序列。

我们来看下数据，首先先导入需要的依赖库：

import pandas as pd
import numpy as np
import os

创建一个工作环境：

env="TianChi_Data"
if os.path.exists(env):
    pass
else:
    os.mkdir(env)

借助Pandas模块，读取数据：

train=pd.read_csv(r".\train.csv") # 训练数据
test=pd.read_csv(r".\testA.csv") # 测试数据

之前我们说信号数据是被叠加在字段下的，所以现在要做的就是将信号从字段中分开。下面是一个标准的处理代码：

# 将数据简单处理：数据切割以及打标签
train_list = []

for items in train.values:
    train_list.append([items[0]] + [float(i) for i in items[1].split(',')] + [items[2]])

# 转化到DataFrame方便处理
train = pd.DataFrame(np.array(train_list))
train.columns = ['id'] + [str(i) for i in range(len(train_list[0]) - 2)] + ['label']

test_list = []
for items in test.values:
    test_list.append([items[0]] + [float(i) for i in items[1].split(',')])
    
test = pd.DataFrame(np.array(test_list))
test.columns = ['id'] + [str(i) for i in range(len(test_list[0]) - 1)]

# 模型数据集准备
x_train = train.drop(['id', 'label'], axis=1)
y_train = train['label']
x_test = test.drop(['id'], axis=1)

好了，我们已经处理完了数据，那么接下来按理来说，要进行过的就是EDA数据探索性分析。

首先来看看数据的分布，我们通过柱状图进行展示：

bars=[y_train[y_train==i].count() for i in y_train.unique()]
plt.bar([i for i in y_train.unique()],bars,width=0.2)
plt.show()

柱状图能够快速的让我们了解数据的分布和数量关系，比如这里，我们发现，1类数据是最多的，推测这应该是正常心跳。关于心电图序列的具体意义，还是需要看几篇论文去了解，这里我们就简单的当做信号序列吧。

此时心跳序列共有205个频率，每个频率都对应着一个[0,1]之间的浮点值，推测其已经完成了标准化，因此我们在后面的数据预处理过程中可以不需要再进行标准化了。

数据在每一个频次上的统计量为：

emmm可以发现，三类数据在0-130左右表现出很强的脉动，之后又断崖式下降，可能是突然的心悸，或者是类似室上性心动过速这种心脏病。零类数据我们一开始推测其为正常数据，在标准差上，波动性较小，相对稳定。一类数据变化最频繁，心跳比较不规律，但二类和零类差别不大，应该是一个区分难点。

好了，针对上面的分析，我们可以简单得到一些结论：

这是一个一维时间序列数据
数据的区间范围在[0,1]
数据存在大量拖尾0，可能是由于离开机器导致的
数据样本分布不均匀
数据样本量较大

针对存在的问题，我们可以进行：

上采样、加入噪声的方式对样本不均衡问题进行处理
对于大量拖尾零，可以考虑一个截断区间，但区间如何选取是个十分麻烦的事情
不需要进行标准化

Chapter 2. Baseline

Baseline可以分为数据预处理、模型准备、训练、测试、预测五个部分。

2.1 数据预处理

这部分我们其实已经提到过了，这里直接给一段完整的：

import pandas as pd
import numpy as np
import torch.nn as nn
import matplotlib.pyplot as plt
from imblearn.over_sampling import SMOTE
import torch
import time
from sklearn.model_selection import train_test_split
from tqdm import tqdm

#----------------------------数据预处理---------------------------------#
train=pd.read_csv(r"train.csv")
test=pd.read_csv(r"testA.csv")

# 将数据简单处理：数据切割以及打标签
train_list = []

for items in train.values:
    train_list.append([items[0]] + [float(i) for i in items[1].split(',')] + [items[2]])
    
train = pd.DataFrame(np.array(train_list))
train.columns = ['id'] + [str(i) for i in range(len(train_list[0]) - 2)] + ['label']

test_list = []
for items in test.values:
    test_list.append([items[0]] + [float(i) for i in items[1].split(',')])
test = pd.DataFrame(np.array(test_list))
test.columns = ['id'] + [str(i) for i in range(len(test_list[0]) - 1)]
# 模型数据集准备
x_train = train.drop(['id', 'label'], axis=1)
y_train = train['label']
x_test = test.drop(['id'], axis=1)


# 使用 SMOTE 对数据进行上采样以解决类别不平衡问题
smote = SMOTE(random_state=1024, n_jobs=-1)
k_x_train, k_y_train = smote.fit_resample(x_train, y_train)  

# 将训练集转换为适应 CNN 输入的 shape
k_x_train = np.array(k_x_train).reshape(k_x_train.shape[0], k_x_train.shape[1], 1)
# 分割训练集和测试集
X_train,X_test,Y_train,Y_test=train_test_split(k_x_train,k_y_train,test_size=0.25,random_state=1)

# 转换成 tensor
train_norm = torch.FloatTensor(X_train)
label_train=torch.LongTensor(Y_train).reshape(-1,1)
label_train = torch.zeros(label_train.shape[0], 4).scatter_(1, label_train, 1) # 生成one-hot

test_norm=torch.FloatTensor(X_test)
label_test=torch.LongTensor(Y_test).reshape(-1,1)
label_test = torch.zeros(label_test.shape[0], 4).scatter_(1, label_test, 1) # 生成one-hot

2.2 模型准备阶段

这个阶段我们需要一个数据集和加载器，用来迭代我们的数据。

class TDataset(Data.Dataset):
    def __init__(self,x,y):
        self.x=x
        self.y=y
    def __getitem__(self,idx):
        data=self.x[idx]
        label=self.y[idx]
        return data,label
    def __len__(self):
        return len(self.x)
        
dataset=TDataset(train_norm,label_train)
train_data=torch.utils.data.DataLoader(dataset,batch_size=32,shuffle=True)

dataset=TDataset(test_norm,label_test)
test_data=torch.utils.data.DataLoader(dataset,batch_size=32,shuffle=True)

然后，我们需要一个精度评估，这里我们采用了Label Smooth方法，用来减少分类数据非黑即白可能导致的过拟合问题，提升泛化能力。

class AbsLoss(nn.Module):
    def __init__(self,ls=0.1,cn=4):
        self.ls=ls
        self.cn=cn
        super(AbsLoss, self).__init__()
    def forward(self,x,y):
        y=torch.clamp(y.float(),min=self.ls/(self.cn-1),max=1.0-self.ls)
        return torch.sum(torch.sum(torch.abs(x-y)))

2.3 模型训练与测试阶段

这个阶段就是单纯的定义优化器、定义损失函数、进行训练。

def Train(model,seed=1,epochs=200):
    device="cuda" if torch.cuda.is_available() else "cpu"
    model=model.to(device)
    Mloss=None
    path="./TianChi/best_model%d.pth"%seed
    # 设置损失函数,这里使用的是均方误差损失
    criterion=AbsLoss()
    # 设置优化函数和学习率lr
    optimizer = torch.optim.Adam(model.parameters(),lr=0.00001, betas=(0.9, 0.999), eps=1e-08, weight_decay=0)

    
    criterion=criterion.to(device)
    model.train()
    start_time = time.time()
    total_loss=0
    for epoch in range(epochs):
        for seq, y_train in tqdm(train_data):

            seq,y_train=seq.to(device),y_train.to(device)
            optimizer.zero_grad()
            y_pred = model(seq)
            y_train=y_train.to(torch.int64)
            loss = criterion(y_pred, y_train)
            loss.backward()
            optimizer.step()
            total_loss+=loss
        if Mloss==None:
            Mloss=total_loss.tolist()
        else:
            if total_loss.tolist()<Mloss:
                Mloss=total_loss.tolist()
                torch.save(model.state_dict(),path)
                print("Saving")
        print(f'Epoch: {epoch+1:2} Loss: {total_loss}')  
        total_loss=0
        
    print(f'\nDuration: {time.time() - start_time:.0f} seconds')
    return model

生成一个模型然后进行训练：

m=Net1()
Train(m,1)

加载最优的参数

m.load_state_dict(torch.load("./TianChi/best_model1.pth"))

训练则大同小异，在with torch.no_grad()和model.eval()情况下计算test与label[test]的L1Loss即可

2.4 预测阶段

我们选择平权投票的方式进行。

Test_pre=torch.FloatTensor(x_test.values)
Test_pre=Test_pre.reshape(x_test.shape[0],x_test.shape[1], 1)

此时，这些模型是被训练好了的，这里不一一展示了。

models=[m1,m,m1_c,m4_c,m5,m6]

进行平权投票

pre=None
with torch.no_grad():
    cnt=0
    for i in models:
        i.to("cpu")
        i.eval()
        v=i(Test_pre)

        if pre==None:
            pre=v
            
        else:
            pre+=v
    pre/=6

控制结果阈值输出：

# 设定初始后处理阈值
thr = [0.49, 0.49, 0.49, 0.49]

# 输出结果阈值处理
def result_thr_process(result):
    temp = result.T.copy()
    for j in [1, 2, 3, 0]: #由于0类是大类，放在最后做阈值处理
        for i in range(temp.shape[1]):
            if temp[j,i] > thr[j]:
                temp[:,i] = 0
                temp[j,i] = 1
    return temp

r=result_thr_process(pre.data.numpy())

将数据输出保存即可。

D=pd.DataFrame(r.T)
D.to_excel(r"Pre1.xlsx")

Chapter 3. 模型选用

3.1 概述

这类时间序列分类问题，KNN并不是个很好的选择，因为我们注意到0类和2类样本之间是比较相似的，贝叶斯网络准确率应该不会很高，比较好的选择可以是梯度提升树、随机森林这类模型，比如lightgbm，优点是运算速度快，精度高，但需要足够好的特征，也就是非常考验特征工程。

当然，我们这里不用机器学习的方法，为什么呢，因为lgbm的得分大概在500-1000+，上榜的分数至少也要194，远达不到我们的要求。

所以，我们考虑采用深度学习的方式进行模型训练。

首先考虑的就是一维卷积神经网络，CNN能够挖掘出局部隐藏信息，提升训练精度。其次是LSTM，长短期记忆模型，这个模型常用于文本分析，它可以顾及上下文关系，也可以用于时间序列推测，但是本题并不是时间序列推测，而是分类问题，所以LSTM并不能作为最后的输出层。再有是对模型的一些改进结构，比如ResNet，一维RepVGG等结构，这些改进结构可能能取得不错的进展。

在噪声增强方面，我们尝试用GAN进行训练，预期是构造出一堆fake数据喂给模型，增强模型的泛化能力，但是效果并不理想，也可能是GAN模型选用和训练参数的问题。

除却单模分析，我们可以借助机器学习中的集成学习方式，对这些模型进行集成分析，提高对噪声的鲁棒性和模型精度。我们考虑了两个方向，一个是多个模型投票，一个是stacking方式，即将多个模型的输出作为新模型的输入。stacking在测试集上的表现优异，但是在最终测试集上的表现却不如人意，可能是出现了过拟合现象。

我们最终选择多模融合+平权投票的方式进行训练，使用的网络类型和代码如下：

网络	架构
Net1	CNN
Net2	CNN
Net3	CNN
Net4	CNN+LSTM
Net5	CNN
Net6	ResNet

3.2 模型选择

1️⃣ Net1

class Net1(nn.Module):
    def __init__(self):
        super(Net1, self).__init__()
        self.conv1=nn.Conv1d(in_channels = 1,out_channels = 64,kernel_size = 11,stride = 1,padding = 5)
        self.bn1=nn.BatchNorm1d(1)
        self.hidden=nn.Sequential(
            nn.LeakyReLU(),
            nn.Conv1d(64, 128,11,5),
            nn.BatchNorm1d(128),
            nn.LeakyReLU(),
            nn.Conv1d(128, 256,6,3),
            nn.BatchNorm1d(256),
            nn.LeakyReLU(),
            nn.Conv1d(256, 256,11,1,padding=5,dilation=2),
            nn.BatchNorm1d(256),
            nn.LeakyReLU(),
            nn.AdaptiveMaxPool1d(output_size=4),
            
            nn.Dropout(),
            nn.Flatten(),
            nn.Linear(256 * 4, 256),
            nn.LeakyReLU(),
            nn.Linear(256, 128),
            
            nn.LeakyReLU(),
            
            nn.Linear(128, 4),
            nn.Softmax(dim=1)
        )

    def forward(self,x):
        x = x.view(x.size(0),1,x.size(1))
        x=self.bn1(x)
        x=self.conv1(x)
        return self.hidden(x)

2️⃣Net2

class Net2(nn.Module):
    def __init__(self):
        super(Net2, self).__init__()
        self.conv1=nn.Conv1d(in_channels = 1,out_channels = 32,kernel_size = 7,stride = 1,padding = 5)
        self.conv2=nn.Conv1d(in_channels = 1,out_channels = 32,kernel_size = 11,stride = 1,padding = 7)
        self.conv3=nn.Conv1d(in_channels = 1,out_channels = 32,kernel_size = 17,stride = 1,padding = 10)
        self.re=nn.LeakyReLU(0.2)
        self.bn1=nn.BatchNorm1d(32)
        
        self.Conv=nn.Sequential(
            nn.ReLU(),
            nn.Conv1d(32, 64,11,1),
            nn.BatchNorm1d(64),
            nn.ReLU(),
            nn.Conv1d(64, 128,3,1),
            nn.BatchNorm1d(128),
            nn.ReLU(),
            nn.AdaptiveMaxPool1d(output_size=4)
        )
        self.fl=nn.Flatten()
        self.Linear=nn.Sequential(

            nn.LeakyReLU(),
            nn.Dropout(0.1),
            nn.Linear(128*4, 256),
            nn.LeakyReLU(),
            nn.Linear(256, 1024),
            nn.LeakyReLU(),
            nn.Linear(1024, 4),
            nn.Softmax(dim=1)
        )


    def forward(self,x):
        x = x.view(x.size(0),1,x.size(1))
        x1=self.conv1(x)
        x3=self.conv3(x)
        x2=self.conv2(x)
        x=self.re(self.bn1(x1+x2+x3))
        x=self.Conv(x)
        x=self.fl(x)
    
        
       
        return self.Linear(x)

3️⃣ Net3

class Net3(nn.Module):

    def __init__(self):
        super(Net3,self).__init__()
        self.conv1 = nn.Conv1d(in_channels = 1,out_channels = 32,kernel_size = 11,stride = 1,padding = 5)
        self.conv2 = nn.Conv1d(32,64,11,1,5)
        self.conv3 = nn.Conv1d(64,128,3,1,1)
        self.conv4 = nn.Conv1d(128,256,3,1,1)
        self.bn1 = nn.BatchNorm1d(1)
        self.bn2 = nn.BatchNorm1d(32)
        self.bn3 = nn.BatchNorm1d(64)
        self.bn4 = nn.BatchNorm1d(128)
        self.maxpool = nn.MaxPool1d(4)
        self.re = nn.LeakyReLU()
        self.dp = nn.Dropout(0.1)
        self.linear = nn.Sequential(
            nn.Linear(256*4*3,1024),
            nn.LeakyReLU(),
            nn.Linear(1024,128),
            nn.LeakyReLU(),
            nn.Linear(128,4),
            nn.Softmax(dim=1)
        )

    def forward(self,x):
        x = x.view(x.size(0),1,x.size(1))
        x = self.bn1(x)
        x = self.bn2(self.re(self.conv1(x)))
        x = self.re(self.conv2(x))
        x = self.maxpool(x)
        x = self.bn3(x)
        x = self.bn4(self.relu(self.conv3(x)))
        x = self.re(self.conv4(x))
        x = self.maxpool(x)
        x = self.dp(x)
        x = x.view(x.size(0),-1)
        x = self.linear(x)
        return x

4️⃣ Net4

class Net4(nn.Module):

    def __init__(self):
        super(Net4,self).__init__()
        self.conv1 = nn.Conv1d(in_channels = 1,out_channels = 32,kernel_size = 11,stride = 1,padding = 5)
        self.conv2 = nn.Conv1d(32,64,11,1,5,dilation=2)
        self.conv3 = nn.Conv1d(64,128,9,1,5)
        self.conv4 = nn.Conv1d(128,256,3,1,1)
        self.bn1 = nn.BatchNorm1d(1)
        self.bn2 = nn.BatchNorm1d(32)
        self.bn3 = nn.BatchNorm1d(64)
        self.bn4 = nn.BatchNorm1d(128)
        self.fl=nn.Flatten()
        self.maxpool = nn.AdaptiveMaxPool1d(output_size=4)
        self.re = nn.LeakyReLU()
        self.dp = nn.Dropout(0.1)
        self.linear = nn.Sequential(
            nn.Linear(256*4*3,1024),
            nn.LeakyReLU(),
            nn.Linear(1024,128),
            nn.LeakyReLU(),
            nn.Linear(128,4),
            nn.Softmax(dim=1)
        )

        self.ls=nn.LSTM(256*4,1024)


    def forward(self,x):
        x = x.view(x.size(0),1,x.size(1))
        x = self.bn1(x)
        x = self.bn2(self.re(self.conv1(x)))
        x = self.re(self.conv2(x))
        x = self.maxpool(x)
        x = self.bn3(x)
        x = self.bn4(self.relu(self.conv3(x)))
        x = self.re(self.conv4(x))
        x = self.maxpool(x)
        x = self.dp(x)
        x,h=self.ls(self.fl(x))
        x = self.dp(x)
        x = x.view(x.size(0),-1)
        x = self.linear(x)
        return x

5️⃣ CNN5

class Net5(nn.Module):
    def __init__(self):
        super(Net5, self).__init__()
        self.conv_layer1 = nn.Sequential(
            nn.Conv1d(in_channels=1, out_channels=16, kernel_size=3, padding=1),
            nn.BatchNorm1d(16),
            nn.ReLU()
        )
        # 下采样down-sampling
        self.sampling_layer1 = nn.Sequential(
            nn.Conv1d(in_channels=16, out_channels=32, kernel_size=3, padding=1),
            nn.BatchNorm1d(32),
            nn.ReLU(),
            nn.MaxPool1d(kernel_size=2, stride=2), 
        )

        self.conv_layer2 = nn.Sequential(
            nn.Conv1d(in_channels=32, out_channels=64, kernel_size=3, padding=1), 
            nn.BatchNorm1d(64),
            nn.ReLU()
        )

        self.sampling_layer2 = nn.Sequential(
            nn.Conv1d(in_channels=64, out_channels=128, kernel_size=3, padding=1), 
            nn.BatchNorm1d(128),
            nn.ReLU(),
            nn.MaxPool1d(kernel_size=2, stride=2), 
        )

        self.conv_layer3 = nn.Sequential(
            nn.Conv1d(in_channels=128, out_channels=256, kernel_size=3, padding=1), 
            nn.BatchNorm1d(256),
            nn.ReLU()
        )

        self.sampling_layer3 = nn.Sequential(
            nn.Conv1d(in_channels=256, out_channels=512, kernel_size=3, padding=1),  
            nn.BatchNorm1d(512),
            nn.ReLU(),
            nn.MaxPool1d(kernel_size=2, stride=2),  
        )

        self.lr = nn.Sequential(
            nn.Linear(in_features=512*25, out_features=256*25),
            nn.ReLU(),
            nn.Linear(in_features=256*25, out_features=128*25),
            nn.ReLU(),
            nn.Linear(in_features=128*25, out_features=64*25),
            nn.ReLU(),
            nn.Linear(in_features=64*25, out_features=4)
        )

        self.sf = nn.Softmax(dim=1)

    def forward(self, x):
        x=x.view(x.shape[0],x.shape[-1],x.shape[-2])
        x = self.conv_layer1(x)
        x = self.sampling_layer1(x)
        x = self.conv_layer2(x)
        x = self.sampling_layer2(x)
        x = self.conv_layer3(x)
        x = self.sampling_layer3(x)
        x = x.view(x.size(0), -1)  
        x = self.lr(x)

        return self.sf(x)

6️⃣ Net6

class Bottlrneck(torch.nn.Module):
    def __init__(self,In_channel,Med_channel,Out_channel,downsample=False):
        super(Bottlrneck, self).__init__()
        self.stride = 1
        if downsample == True:
            self.stride = 2

        self.layer = torch.nn.Sequential(
            torch.nn.Conv1d(In_channel, Med_channel, 1, self.stride),
            torch.nn.BatchNorm1d(Med_channel),
            torch.nn.LeakyReLU(),
            torch.nn.Conv1d(Med_channel, Med_channel, 3, padding=1),
            torch.nn.BatchNorm1d(Med_channel),
            torch.nn.LeakyReLU(),
            torch.nn.Conv1d(Med_channel, Out_channel, 1),
            torch.nn.BatchNorm1d(Out_channel),
            torch.nn.LeakyReLU(),
        )

        if In_channel != Out_channel:
            self.res_layer = torch.nn.Conv1d(In_channel, Out_channel,1,self.stride)
        else:
            self.res_layer = None

    def forward(self,x):
        if self.res_layer is not None:
            residual = self.res_layer(x)
        else:
            residual = x
        return self.layer(x)+residual


class ResNet(torch.nn.Module):
    def __init__(self,in_channels=1,classes=4):
        super(ResNet, self).__init__()
        self.features = torch.nn.Sequential(
            torch.nn.Conv1d(in_channels,64,kernel_size=11,stride=1,padding=5),
            torch.nn.MaxPool1d(3,2,1),

            Bottlrneck(64,64,256,False),
            Bottlrneck(256,64,256,False),
            Bottlrneck(256,64,256,False),

            torch.nn.AdaptiveAvgPool1d(output_size=4),
            torch.nn.Dropout(0.1)
        )
        self.classifer = torch.nn.Sequential(
            torch.nn.Linear(256*4,1024),
            nn.BatchNorm1d(1024),
            nn.LeakyReLU(),
            torch.nn.Linear(1024,256),
            nn.BatchNorm1d(256),
            nn.LeakyReLU(),
            torch.nn.Linear(256,4),
            torch.nn.Softmax(dim=-1)
        )

    def forward(self,x):
        x=x.view(x.shape[0],1,-1)
        x = self.features(x)
        x = x.view(x.shape[0],-1)
        x = self.classifer(x)
        return x

3.3 模型叠加

另外提一下，如何进行stacking，首先要有一个新模型，这个模型一般不会太复杂

class Linear1(nn.Module):
    def __init__(self,inChannel):
        super(Linear1,self).__init__()
        self.Linear=nn.Sequential(
            nn.Linear(inChannel,64),
            nn.BatchNorm1d(64),
            nn.LeakyReLU(),
            nn.Linear(64,128),
            nn.BatchNorm1d(128),
            nn.LeakyReLU(),
            nn.Linear(128,4),
            nn.Softmax(dim=1)
        )

    def forward(self,x):
        return self.Linear(x)

我们对多个模型的容器models里面的每个模型都进行训练，并将输出数据叠加：

star=[i*50000 for i in range(6)]
# 因为数据量太多了我内存不够，所以拆开来

with torch.no_grad():
    TD=None
    for i in range(len(star)-1):
        Train_val=test_norm[star[i]:star[i+1]]
        T=models[0](Train_val)
        for i in models[1:]:
            T=torch.cat([T,i(Train_val)],dim=1) # 这是贴到一起的方法
        if TD==None:
            TD=T
        else:
            TD=torch.cat([TD,T])

这种叠加是在列上叠加，也就是每个模型都能叠出来4个特征，例如我们有10个模型，那么输出大小为：
$[n u m, 4 * 10]$
还有种是直接加上去的，这里没有进行尝试，可以试一下。

然后利用这个数据，对我们最后一个模型进行训练即可。注意这里的test_norm是处理好了的测试集。

3.4 GAN生成假数据

首先我们要有一个生成器，和一个判别器，这两个模型性能要差不多，最后可以达到纳什均衡。

from torch.autograd import Variable

class Generator(nn.Module):
    def __init__(self,inC):
        # 生成器要做的就是把随机噪声转化为图像像素
        super(Generator, self).__init__()

        def block(in_feat,out_feat,normalize=True):
            # in: 初始化随机噪声
            # out: 指定神经元输出

            # 做个最简单的全连接
            layers=[nn.Linear(in_feat,out_feat)]
            if normalize:
                # batch初始化
                layers.append(nn.BatchNorm1d(out_feat,0.8))
            # leakrelu激活函数
            layers.append(nn.LeakyReLU(0.2,inplace=True))
            return layers

        self.model=nn.Sequential(
            *block(inC,128,normalize=False),
            *block(128, 256),
            *block(256, 512),
            *block(512, 1024),
            nn.Linear(1024, 205),
            nn.Tanh()
        )

    def forward(self,z):
        x=self.model(z)
        return x

# 判别器
class Discriminator(nn.Module):
    def __init__(self):
        super(Discriminator, self).__init__()

        self.model=nn.Sequential(
            # 判别器要做的就是识别图像状态
            nn.Linear(205,512),
            nn.LeakyReLU(0.2,inplace=True),
            nn.Linear(512,256),
            nn.LeakyReLU(0.2,inplace=True),
            nn.Linear(256,1),
            # 需要映射到01
            nn.Sigmoid()
        )

    def forward(self,img):
        validity=self.model(img)
        return validity

# 损失函数
# 用的是BCEloss
# 即计算样本正确识别信息熵
loss=torch.nn.BCELoss()
device="cuda" if torch.cuda.is_available() else "cpu"

# 创建生成器
gen=Generator(64)
dis=Discriminator()
# 是否调用GPU
cuda=True if torch.cuda.is_available() else False
Tensor=torch.cuda.FloatTensor if cuda else torch.FloatTensor

if cuda:
    gen.cuda()
    dis.cuda()
    loss.cuda()

# 定义优化器
opt_G=torch.optim.Adam(gen.parameters(),lr=0.0005,betas=(0.9, 0.99))
opt_D=torch.optim.Adam(dis.parameters(),lr=0.0005,betas=(0.9, 0.99))

重点是训练过程，如何获得某一类标签的fake数据呢？首先我们要获得该类的真实数据。

举个栗子：

label=torch.LongTensor(Y_train).reshape(-1,1)
cls=0
idx=(label==cls).reshape(-1)
d=train_norm[idx]
lab_idx=label[idx]
label_c = torch.zeros(lab_idx.shape[0], 4).scatter_(1, lab_idx, 1)
dataset=TDataset(d,label_c) 

train_data_c=torch.utils.data.DataLoader(dataset,batch_size=32,shuffle=True)

然后就是我们的博弈过程啦：

for epoch in range(200):
    g_loss_train=0
    d_loss_train=0
    for i,(input,target) in tqdm(enumerate(train_data_c)):
        input=input.to(device)
        input=input.squeeze()
        num_img=input.size(0)
        real_label = torch.ones(num_img)
        fake_label = torch.zeros(num_img)
        real_label = real_label.reshape(real_label.size(0), -1).to(device)
        fake_label = fake_label.reshape(fake_label.size(0), -1).to(device)
        
        # 训练判别器
        real_out=dis(input)
        try:
            d_loss_real=loss(real_out,real_label)
        except:
            continue
        real_score=real_out
        
        z=torch.randn((num_img,64)).to(device)
        fake_img=gen(z)
        fake_out=dis(fake_img)
        try:
            d_loss_fake=loss(fake_out,fake_label)
        except:
            continue
        
        d_loss=d_loss_fake+d_loss_real
        opt_D.zero_grad()
        d_loss.backward()
        opt_D.step()
        
        # 训练生成器
        z=torch.randn((num_img,64)).to(device)
        fake_img=gen(z)
        output=dis(fake_img)
        try:
            g_loss=loss(output,real_label)
        except:
            continue
        
        opt_G.zero_grad()
        g_loss.backward()
        opt_G.step()
        
        g_loss_train+=g_loss.item()
        d_loss_train+=d_loss.item()
    
    print("[G_loss: %d] [D_loss: %d]"%(g_loss_train,d_loss_train))

训练好的生成器就能生成对应类别的数据了，将其设为真实数据混入原始数据，提高模型的鲁棒性和泛化能力。

noise=Variable(Tensor(np.random.normal(0,1,(10000,64))))
x=gen(noise)

Chapter 4. 总结

Dropout需要放在线性层之前
要先做激活层，再做BN
划分数据集可能会导致序号打乱，此时不能直接转成Tensor,可以采用A.to_numpy()重新获取序号

转成one-hot编码有很多方式，其中一种可以是：

label_train = torch.zeros(label_train.shape[0], 4).scatter_(1, label_train, 1)

你可能感兴趣的:(Data,Mining,Python,PyTorch,数据挖掘,python,人工智能)

一文理清概念：数据中台(DMP)-数据仓库(DW)-数据湖(DL)-湖仓一体-数据治理(DG) Debug_Snail Hadoop Big Data Data Science 数据仓库大数据数据中台数据湖数据治理
数据仓库、数据中台、数据湖、湖仓一体是数据管理和分析领域的重要概念，它们在功能、架构和应用场景上各有特点，同时也在演进中相互关联和补充。以下是对它们的定义和关系的详细解析：1.核心概念（1）数据仓库（DataWarehouse,DW）定义：一种面向主题的、集成的、稳定的数据存储系统，用于支持企业决策分析（如BI、报表）。数据通常经过ETL（抽取、转换、加载）处理，以结构化形式存储，采用Schema
Oracle创建表空间、删除、状态、重命名、修改、增加、移动水煮白菜王 Oracle oracle 数据库
目录Oracle基本学习笔记创建表空间1.表空间创建格式3.表空间状态属性4.重命名表空间5.修改表空间数据文件的大小6.删除表空间的数据文件7.修改表空间中数据文件的状态8.表空间中数据文件的移动Oracle基本学习笔记创建表空间需要使用CREATETABLESPACE语句。其基本语法如下:CREATE[TEMPORARYIUNDO]TABLESPACEtablespacename[DATAFI
【Python 第五篇章】数据类型蜗牛 | ICU Python 专栏 python windows 开发语言
一、列表详解list.append(x)在列表末尾添加一个元素。list.extend(iterable)用可迭代对象的元素扩展列表。list.insert(i,x)在指定位置插入元素，第一个参数是插入元素的索引，第二个是值。list.remove(x)从列表中删除第一个值为x的元素。list.pop([i])移除列表中给定位置的条目，并返回该条目。如果未指定索引号，则a.pop()将移除并返回列
python catia catalog文件_Python封装的获取文件目录的函数卢新生 python catia catalog文件
获取指定文件夹中文件的函数，网上学习时东拼西凑的结果。注意，其中文件名如1.txt，文件路径如D:\文件夹\1.txt；direct为第一层子级importos#filePath输入文件夹全路径#mode#1递归获取所有文件名;#2递归获取所有文件路径;#3获取direct文件名;#4获取direct文件路径;#5获取direct文件名和direct子文件夹名;#6获取direct文件路径和dir
Python：每日一题之错误票据努力的敲码工蓝桥杯每日一题 python 蓝桥杯
题目描述某涉密单位下发了某种票据，并要在年终全部收回。每张票据有唯一的ID号。全年所有票据的ID号是连续的，但ID的开始数码是随机选定的。因为工作人员疏忽，在录入ID号的时候发生了一处错误，造成了某个ID断号，另外一个ID重号。你的任务是通过编程，找出断号的ID和重号的ID。假设断号不可能发生在最大和最小号。输入描述输入描述要求程序首先输入一个整数N(N<100)表示后面数据行数。接着读入N行数据
AI大模型零基础金融人如何一周自学大模型，从零基础到入门，看这篇就够了！冻感糕人~ 人工智能金融 AI大模型 LLM 大模型技术大模型学习路线大模型基础
前几天参加了字节跳动在上海举办的火山引擎Force原动力大会，OpenAI也连续开了12天发布会，最近堪称科技界的春晚了。如果说2022年ChatGPT横空出世把人工智能的发展带上了一个新的台阶，那么2024年末，大模型对工作、生活的全面“侵入”让我们越来越接近库兹韦尔所描述的那个奇点时刻。作为金融民工，我们想通过这篇文章讲讲从用户的角度如何一周快速掌握大模型，以及为什么我建议每一个金融从业人员（
Python控制批量插入Catia文件并修改文件定义及PN 一盘红烧肉 python
改了两天，总算初步摸清楚了Catia中的文件结构，实现了使用Python控制批量修改文件名及定义使用Pycatia在Product中插入Part并改名及定义
redis持久化 xing.xing redis
目录redis持久化RDB（RedisDatabase）持久化AOF（AppendOnlyFile）持久化redis持久化在Redis中，持久化是确保数据在Redis服务器重启后不丢失的关键功能。Redis提供了两种主要的数据持久化方式：RDB（RedisDatabase）持久化和AOF（AppendOnlyFile）持久化。Redis的默认持久化方式是RDB（快照）。在Redis启动时，它会定期
PySide2是 Qt 库的 Python 绑定之一 WwwwwH_PLUS #Qt qt python 开发语言
PySide2是Qt库的Python绑定之一，它为Python程序员提供了创建跨平台桌面应用程序的工具和功能。PySide2是Qt5.x系列的Python绑定，而Qt本身是一个跨平台的图形用户界面（GUI）框架，广泛用于开发各种类型的桌面应用程序，包括多种平台（Windows、Linux、macOS）的应用。主要特点跨平台支持：PySide2可以在Windows、Linux和macOS上运行，允许
Python学习第十一天 Leo来编程 Python学习 python
疑惑：有很多人不知道是不是也分不清什么是单核？什么是多核？什么是时间片？进程？线程？那么在讲进程和线程前我先举个例子更好理解这些概念。单核例子：比如你是一个厨师（计算机）在一个厨房（CPU）里需要同时做3个菜（进程）、每个菜需要准备不同的调料以及协作（线程），那么这个厨师需要不断地切换时间（时间片）来达到同时在一个时间将三个菜做完。多核的话其实对应的例子就是多个厨师，这样的例子太多了因为万物皆对象
python学习第三天 Leo来编程 Python学习 python 开发语言
条件判断条件判断使用if、elif和else关键字。它们用于根据条件执行不同的代码块。#条件判断age=18ifage0:#也可以写if(s>0)但是没必要因为python给个提示建议去掉保证代码的按照缩进来进行更加规范print("这个数字是大于0的数字!")#这行代码属于if语句的代码块elifs==0:print("这个数字是等于0的数字!")#这行代码属于elif语句的代码块else:pr
ARM64环境部署EFK8.15.3收集K8S集群容器日志 llody_55 kubernetes 容器云原生运维 es java elasticsearch
环境规划主机IP系统部署方式ES版本CPU架构用户名密码192.168.1.225Ubuntu22.04.4LTSdockerelasticsearch:8.15.3ARM64elasticllodyi4TMmZDES集群部署创建持久化目录(所有节点)mkdir-p/data/es/{data,certs,logs,plugins}mkdir-p/data/es/certs/{ca,es01}服务
三种优化算法旅者时光算法算法 python 开发语言
本文将总结遗传算法、粒子群算法、模拟退火三种优化算法的核心思路，并使用python完整实现。实际上，越来越多的优秀算法已经被封装为一个易用的接口。很多时候，一行代码就能实现我们的需求。但了解这些算法的基本逻辑，能够使用最基本的代码实现它。无论对于提升我们的编程能力还是解决问题的能力，都会大有裨益。甚至，改变我们思考问题的方式。1、遗传算法遗传算法，顾名思义，就是借鉴了生物通过遗传变异来逐渐适应环境
vue3新增修改页面，字段来源于其他表大波V5 vue.js elementui javascript
确定取消constunitOptions=ref([]);constlistAdspunitAllLocal=async()=>{if(!unitOptions.value.length){constresUnit=awaitlistAdspunitAll();unitOptions.value=resUnit.data;}}//单位生成ID-Name映射字典constidToNameUnitMa
使用 Python 合并微信与支付宝账单，生成财务报告 python后端
最近用思源笔记记东西上瘾，突然想每个月存一份收支记录进去。但手动整理账单太麻烦了，支付宝导出一份CSV，微信又导出一份，格式还不一样，每次复制粘贴头都大。干脆写了个Python脚本一键处理，核心就干两件事：把俩平台的CSV账单合并到一起自动生成带分类表格的Markdown（直接拖进思源就能渲染）代码主要折腾了这些：支付宝账单前24行都是废话，直接skiprows=24跳过去，GBK编码差点让我栽跟
Python Flask 在网页应用程序中处理错误和异常 dowhileprogramming python flask 开发语言
PythonFlask在网页应用程序中处理错误和异常PythonFlask在网页应用程序中处理错误和异常PythonFlask在网页应用程序中处理错误和异常在我们所有的代码示例中，我们没有注意如何处理用户在浏览器中输入错误的URL或向我们的应用程序发送错误的参数集的情况。这不是设计意图，但目的是首先关注网页应用程序的关键组件。网页框架的美妙之处在于，它们通常默认支持错误处理。如果发生任何错误，将自
成功案例丨开发时间从1小时缩短到3分钟：如何利用历史数据训练AI模型，预测设计性能？ Altair澳汰尔 PhysicsAI 仿真 AI 机器学习 HyperWorks 数据分析
案例简介PhysicsAI™助力HEROMOTOCORP实现设计效率提升99%印度领先的跨国摩托车和踏板车制造商HeroMotoCorpLtd.（以下简称Hero）致力于通过将人工智能（AI）和机器学习技术融入有限元分析（FEA）流程，以加速产品开发周期。在其首个AI驱动项目——摩托车把手设计优化中，Hero采用了PhysicsAI™几何深度学习解决方案，利用历史数据训练AI模型并预测设计性能。A
农业生产模拟和农业政策分析：WOFOST模型与PCSE模型安装、运行、数据准备；农田农作物生长模拟和产量预测等 WangYan2022 作物模型农业 WOFOST模型 PCSE模型农田生态系统作物模型农业生产模拟
WOFOST（WorldFoodStudies）和PCSE（PythonCropSimulationEnvironment）是两个用于农业生产模拟的模型：WOFOST是一个经过多年开发和验证的模型，被广泛用于全球的农业生产模拟和农业政策分析；采用了模块化的结构，可以对不同的农作物和环境条件进行参数化和适应；WOFOST可用于长期模拟，能够模拟整个作物生长周期，包括播种、生长、收获等各个阶段；WOF
scala针对复杂数据源导入与分隔符乱码处理 Tometor scala javascript 后端 java 数据结构
复杂的数据源，和奇怪的数据格式是生产中经常遇到的难题，本文将探讨如何解析分隔符混乱的数据，和如何导入各种数据源文件一、非标准分隔符处理当数据源的分隔符混乱或不统一时（如,、|、\t混合使用），可采用以下方法：1.1动态检测分隔符//示例：自动检测前100行的常用分隔符valsampleLines=spark.read.text("data.csv").limit(100).collect()val
PyTorch实现CNN：CIFAR-10图像分类实战教程吴师兄大模型 PyTorch pytorch cnn CIFAR-10图像分类人工智能 python 卷积神经网络开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
数据分析与AI丨AI Fabric：数据和人工智能架构的未来 Altair澳汰尔数据分析 ai RapidMiner 知识图谱人工智能
AIFabric架构是模块化、可扩展且面向未来的，是现代商业环境中企业实现卓越的关键。在当今商业环境中，数据分析和人工智能领域发展可谓日新月异。几乎每天都有新兴技术诞生，新的应用场景不断涌现，前沿探索持续拓展。可遗憾的是，众多企业在利用数据和人工智能方面，脚步总是滞后。这是每个行业进行创新和获得竞争优势的冲刺阶段，但正如大多数企业时常感受到的那样，大规模实施下一代数据和AI工具说起来容易做起来难。
Manus演示案例：英伟达财务估值建模解锁投资洞察的深度剖析 ylfhpy Manus 深度学习人工智能机器学习机器翻译 Manus
在当今瞬息万变的金融投资领域，精准剖析企业价值是投资者决胜市场的关键。英伟达（NVIDIA），作为科技行业的耀眼明星，其在人工智能和半导体领域的卓越表现备受瞩目。Manus凭借专业的财务估值建模能力，深入挖掘英伟达的潜在价值，为投资者提供了一份极具价值的分析报告。Manus在接到为英伟达进行详细财务估值建模的任务后，迅速且有条不紊地开展工作。数据收集是建模的基石，其重要性不言而喻。在收集英伟达公司
基于Python+Vue开发的电影订票管理系统源码+运行步骤冷琴1996 Python系统设计 python vue.js 开发语言
项目简介该项目是基于Python+Vue开发的电影订票管理系统（前后端分离），这是一项为大学生课程设计作业而开发的项目。该系统旨在帮助大学生学习并掌握Python编程技能，同时锻炼他们的项目设计与开发能力。通过学习基于Python的电影订票管理系统项目，大学生可以在实践中学习和提升自己的能力，为以后的职业发展打下坚实基础。技术学习之路主要功能影片管理：管理系统可以录入、修改和查询影片的基本信息，如
Python通过YOLO格式TXT标签文件在图像中画框 CHERISH_KDX python YOLO 人工智能
使用场景检测数据集标注是否有误：在目标检测算法中需要标注自己的数据集，为了更加方便的检查数据集标注是否有误，可以使用该工具将标注结果绘制在图像中并查看。美化识别结果中的检测框：在一些目标检测场景中，YOLO检测算法原始的检测框绘制会导致重叠、颜色冲突、字体过大等问题。可以使用该工具进行修改。代码importosimportcv2classcheck_label:def__init__(self,c
基于llama_cpp 调用本地模型（llama）实现基本推理月光技术杂谈大模型初探 llama llama.cpp python LLM 集成显卡本地模型 AI
零基础实践本地推理模型基本应用：基于llama_cpp的本地模型调用。本文先安装llama_cpppython库，再编写程序，利用其调用llama-2-7b-chat.Q4_K_M.ggu模型。背景llama_cpp是一个基于C++的高性能库（llama.cpp）的Python绑定，支持在CPU或GPU上高效运行LLaMA及其衍生模型（如LLaMA2），并通过量化技术（如GGUF格式）优化内存使用
python实现查找满足条件的数字 qq_恰同学少年 python
问题：一个四位数，知道其前两位和后两位分别相等，并且这个数还是一个平方数，求出这个数。一个四位数，范围只能是1000~9999，前两位和后两位分别相等，也就是说，它的结构应该是aabb。最后，这个数是一个平方数。有的小伙伴可能不知道啥叫平方数，暂且解释下，所谓的平方数就是指该数等于一个整数的平方。比如3的平方是9，那么我们就说9是个平方数。第一步，这是个四位数，前两位和后两位分别相等，我们将满足条
python中常用的内置模块举例（入门级整理） qq_恰同学少年 python
python对于初学者可以说是十分友好的一门编程语言，不仅语法简单，而且它自身还包含了十分丰富的第三方模块，我仅就将我自己常用的一些内置模块（自带的，无需安装）做一下简单的总结和介绍：1.turtleturtle，是python中比较好玩一个模块，它有一个专有名称“海龟作图”，光看名字就应该能够猜到它是用来干嘛的，没错，就是来画图的，它可以通过某些语句来控制一个点在白板上的运动轨迹，它在白板上走过
QPython双核攻略：从零基础到AI开发，你的手机就是全栈训练营程之编 python 开发语言青少年编程人工智能
主题一：《编程小白必看！在手机上种下你的第一行代码》✨北京优趣天下信息技术有限公司重磅出品我们比谁都清楚：✔️86%的初学者因环境配置放弃编程✔️72%的上班族只有碎片化学习时间✔️95%的自学者需要即时答疑支持为什么QPython成为2025现象级学习工具？▸全栈开发环境：解释器+编辑器+控制台三合一▸AI导师常驻：集成DeepSeek代码助手（支持中英双语提问）▸极速学习路径：Q派课程7天完成
Python学习指南：系统化路径 + 避坑建议程之编 Python全栈通关秘籍青少年编程 python 开发语言人工智能机器学习
新手小白学习编程就像搭积木——需要从基础开始，逐步构建知识体系。以下是为你量身定制的Python学习路径，帮你告别杂乱，高效入门！一、学习前的关键认知明确目标：想用Python做什么？数据分析（如Excel自动化、可视化）Web开发（如搭建网站）人工智能（如机器学习）自动化办公（如处理文件、邮件）目标不同，后续学习侧重点不同（但基础通用）。避免误区：❌只看教程不写代码✅边学边动手，哪怕抄代码也要运
获取表格指定行指定列数据故事里故去自用 javascript 前端开发语言
//获取表格元素vartable=document.getElementsByTagName("table")[0];//获取表格的tbody元素vartbody=table.querySelector("tbody");//获取所有tr元素varrows=tbody.querySelectorAll("tr");//初始化结果数组vardata=[];//遍历行，从第200行开始，到第1000行
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p