甜甜圈Sweet Donut

【模式识别与深度学习】用gan,wgan,wgan-gp来拟合指定形状的高斯分布:pytorch对抗网络

基于PyTorch实现生成对抗网络

拟合给定分布
要求可视化训练过程
实验报告
对比GAN、WGAN、WGAN-GP（稳定性、性能）
对比不同优化器的影响

效果：

图片效果：

注：代码需要一个叫points.mat的文件，point.mat里存储了原始图像，也就是上面兰色的M形状的图案。
需要跑的话在下面的网址进行下载：
https://download.csdn.net/download/qinglingls/11243079
实验报告:
https://download.csdn.net/download/qinglingls/11243082

代码：
gan.py

#coding=utf-8
import torch.autograd
import torch.nn as nn
from torch.autograd import Variable
from torchvision import transforms
from torchvision import datasets
from torchvision.utils import  save_image
import scipy.io as sio
import matplotlib.pyplot as plt
import numpy as np  #二维数组
from torch.autograd import Variable
import torch
import torch.nn as nn
import matplotlib
from PIL import Image
import os

torch.cuda=True
batch_size=2048  #batch大小
num_epoch=10000  # 迭代次数
z_dimension=2  #噪声维度

matplotlib.use("TkAgg")
'''
载入训练数据
'''
data = sio.loadmat('points.mat');
xx_train=np.array(data['xx'])
plt.figure(1)
plt.scatter(xx_train[:,0],xx_train[:,1])
#plt.show()

'''
定义迭代的batch大小
'''
def iterate_minibatch(x, batch_size, shuffle=True):
    indices = np.arange(x.shape[0])
    if shuffle:
        np.random.shuffle(indices)
    for i in range(0, x.shape[0], batch_size):
        yield x[indices[i:i + batch_size], :]
'''
for x_batch in iterate_minibatch(xx_train, batch_size=batch_size):
    print(x_batch.shape)
'''

#定义判别器  #####Discriminator######使用多层网络来作为判别器
#将图片28x28展开成784，然后通过多层感知器，中间经过斜率设置为0.2的LeakyReLU激活函数，
# 最后接sigmoid激活函数得到一个0到1之间的概率进行二分类。
class discriminator(nn.Module):
    def __init__(self):
        super(discriminator,self).__init__()
        self.dis=nn.Sequential(
            nn.Linear(2,50),#输入特征数为2，输出为10
            #nn.ReLU(True),  # relu激活
            nn.LeakyReLU(0.2),#进行非线性映射
            nn.Linear(50,50),#进行一个线性映射
            #nn.ReLU(True),  # relu激活
            nn.LeakyReLU(0.2),
            nn.Linear(50,1),
            #nn.Sigmoid()#也是一个激活函数，二分类问题中，
            # sigmoid可以班实数映射到【0,1】，作为概率值，
            # 多分类用softmax函数
        )
        self.sigmoid = nn.Sigmoid()
    def forward(self, x):
        x=self.dis(x)
        x = self.sigmoid(x)
        return x
####### 定义生成器 Generator #####
#输入一个2维的0～1之间的高斯分布，然后通过第一层线性变换将其映射到10维,
# 然后通过LeakyReLU激活函数，接着进行一个线性变换，再经过一个LeakyReLU激活函数，
# 然后经过线性变换将其变成784维，最后经过Tanh激活函数是希望生成的假的图片数据分布
# 能够在-1～1之间。
class generator(nn.Module):
    def __init__(self):
        super(generator,self).__init__()
        self.gen=nn.Sequential(
            nn.Linear(2,50),#用线性变换将输入映射到10维
            nn.ReLU(True),#relu激活
            nn.Linear(50,2),#线性变换
            #nn.ReLU(True),#relu激活
            #nn.Linear(10,2),#线性变换
            #nn.Tanh()#Tanh激活使得生成数据分布在【-1,1】之间
        )
    def forward(self, x):
        x=self.gen(x)
        return x
#创建对象
D=discriminator()
G=generator()
if torch.cuda:
    D=D.cuda()
    G=G.cuda()
#########判别器训练train#####################
#分为两部分：1、真的图像判别为真；2、假的图像判别为假
#此过程中，生成器参数不断更新
#首先需要定义loss的度量方式  （二分类的交叉熵）
#其次定义 优化函数,优化函数的学习率为0.0003
criterion = nn.BCELoss() #是单目标二分类交叉熵函数
#d_optimizer=torch.optim.Adam(D.parameters(),lr=0.0001)
#g_optimizer=torch.optim.Adam(G.parameters(),lr=0.0001)

#d_optimizer = torch.optim.Adam(G.parameters(), lr=0.001, betas=(0.5, 0.999))
#g_optimizer = torch.optim.Adam(D.parameters(), lr=0.001, betas=(0.5, 0.999))
g_optimizer = torch.optim.RMSprop(G.parameters(), lr=0.0005,alpha=0.9)
d_optimizer = torch.optim.RMSprop(D.parameters(), lr=0.0005,alpha=0.9)
iterator=0
###########################进入训练##判别器的判断过程#####################
for epoch in range(num_epoch): #进行多个epoch的训练
    x =  np.linspace(-1.2, 2.4, 200)
    y =  np.linspace(-1, 1.8, 200)
    X, Y = np.meshgrid(x, y)
    m, n = X.shape
    point = []
    for i in range(m):
        for j in range(n):
            point.append([X[i][j], Y[i][j]])
    point = np.array(point)
    iterator=0
    for x_batch in iterate_minibatch(xx_train, batch_size=batch_size,shuffle=True):
        iterator=iterator+1
        #print(x_batch.shape)
        #print(iterator)
        # =============================训练判别器==================
        x_batch=torch.from_numpy(x_batch).float()#batch_size个数据，每个数据二维

        real_point = Variable(x_batch).cuda()  # 将tensor变成Variable放入计算图中

        real_label = Variable(torch.ones(batch_size)).cuda()  # 定义真实的点点label为1
        fake_label = Variable(torch.zeros(batch_size)).cuda()  # 定义假的点点的label为0

        # 计算真实点点的损失
        real_out = D(real_point)  # 将真实点点放入判别器中
        d_loss_real = criterion(real_out, real_label)  # 得到点点图片的loss
        #print("d_loss_real: %s",d_loss_real)
        real_scores = real_out  # 得到真实点点的判别值，输出的值越接近1越好
        #print("real_scores: %s",real_scores)

        # 计算假的图片的损失
        z = Variable(torch.randn(batch_size, z_dimension)).cuda()  # 随机生成一些噪声
        fake_point = G(z)  # 随机噪声放入生成网络中，生成一个假的点点
        fake_out = D(fake_point)  # 判别器判断假的点点
        d_loss_fake = criterion(fake_out, fake_label)  # 得到假的点点的loss
        #print("d_loss_fake: %s",d_loss_fake)
        fake_scores = fake_out  # 得到假点点的判别值，对于判别器来说，假点点的损失越接近0越好
        #print("fake_scores: %s",fake_scores)

        #损失函数和优化
        d_loss = d_loss_real + d_loss_fake  # 损失包括判真损失和判假损失
        d_optimizer.zero_grad()  # 在反向传播之前，先将梯度归0
        d_loss.backward()  # 将误差反向传播
        d_optimizer.step()  # 更新参数

        # ==================训练生成器============================
        ################################生成网络的训练###############################
        # 原理：目的是希望生成的假的图片被判别器判断为真的图片，
        # 在此过程中，将判别器固定，将假的图片传入判别器的结果与真实的label对应，
        # 反向传播更新的参数是生成网络里面的参数，
        # 这样可以通过更新生成网络里面的参数，来训练网络，使得生成的图片让判别器以为是真的
        # 这样就达到了对抗的目的
        # 计算假的图片的损失

        # generate noise z 生成噪声z
        z_batch = Variable(torch.randn(batch_size, z_dimension)).cuda()  # 随机生成一些噪声
        fake_point = G(z_batch)  # 随机噪声输入到生成器中，得到一副假的点点
        output = D(fake_point)  # 经过判别器得到的结果
        g_loss = criterion(output, real_label)  # 得到的假的点点与真实的点点的label的loss
        # bp and optimize
        g_optimizer.zero_grad()  # 梯度归0
        g_loss.backward()  # 进行反向传播
        g_optimizer.step()  # .step()一般用在反向传播后面,用于更新生成网络的参数
    # 打印中间的损失
    print('Epoch[{}/{}],d_loss:{:.6f},g_loss:{:.6f} '
              'D real: {:.6f},D fake: {:.6f}'.format(
            epoch, num_epoch, d_loss.data.item(), g_loss.data.item(),
            real_scores.data.mean(), fake_scores.data.mean()  # 打印的是真实点点的损失均值
        ))
    fake_images = fake_point.cpu().data
    point_data = point.astype(np.float32)
    point_data = torch.from_numpy(point_data)
    point_data = point_data.cuda()
    decision = D(point_data)
    plt.cla()
    plt.scatter(point[:, 0], point[:, 1], c=decision.data.cpu().numpy()[:, 0], marker='.',cmap='gray')
    plt.scatter(xx_train[:, 0], xx_train[:, 1], c='#00CED1')
    plt.scatter(fake_images[:, 0], fake_images[:, 1], c='#0C143F')
    print(fake_images.shape)
    print(xx_train.shape)
    plt.draw()
    plt.pause(0.01)
    '''
        if epoch == 0:
            real_images = to_img(real_point.cpu().data)
            save_image(real_images, './img/real_images.png')
        fake_images = to_img(real_point.cpu().data)
        save_image(fake_images, './img/fake_images-{}.png'.format(epoch + 1))
    '''

# 保存模型
torch.save(G.state_dict(), './generator.pth')
torch.save(D.state_dict(), './discriminator.pth')

wgan

在gan的基础上进行修改：

去除sigmoid
不使用具有动量的优化方法，比如使用Adam，转而使用诸如RMSProp，SGD等方法，使用RMSProp，因为该方法可以处理梯度不稳定的情况。
需要对discriminator的权重做修整限制以确保lipschitz连续约束,代码示例如下
for p in netD.parameters():
p.data.clamp_(clamp_lower, clamp_upper)
这里的clamp_lower和clamp_upper是文章中的约束范围,这里的取值是经验参数，有人推荐使用-0.01和0.01
将BCEloss 改为非log的loss，按照文章的记载，通常会使用直接同1和-1做比较，代码示例如下
one=t.FloatTensor([1])
mone=-1*one
…
output=netd(input)
output.backward(one)
output2=netd(fake_pic)
output2.backward(mone)

wgan.py

#coding=utf-8
import torch.autograd
import torch.nn as nn
from torch.autograd import Variable
from torchvision import transforms
from torchvision import datasets
from torchvision.utils import  save_image
import scipy.io as sio
import matplotlib.pyplot as plt
import numpy as np  #二维数组
from torch.autograd import Variable
from torchvision.utils import make_grid
import torch
import torch.nn as nn
import matplotlib
import os

torch.cuda=True
batch_size=2048  #batch大小
num_epoch=10000  # 迭代次数
z_dimension=2  #噪声维度

matplotlib.use("TkAgg")
'''
载入训练数据
'''
data = sio.loadmat('points.mat');
xx_train=np.array(data['xx'])
plt.figure(1)
plt.scatter(xx_train[:,0],xx_train[:,1])
#plt.show()

'''
定义迭代的batch大小
'''
def iterate_minibatch(x, batch_size, shuffle=True):
    indices = np.arange(x.shape[0])
    if shuffle:
        np.random.shuffle(indices)
    for i in range(0, x.shape[0], batch_size):
        yield x[indices[i:i + batch_size], :]
'''
for x_batch in iterate_minibatch(xx_train, batch_size=batch_size):
    print(x_batch.shape)
'''

'''
生成噪声
'''


#定义判别器  #####Discriminator######使用多层网络来作为判别器
#将图片28x28展开成784，然后通过多层感知器，中间经过斜率设置为0.2的LeakyReLU激活函数，
# 最后接sigmoid激活函数得到一个0到1之间的概率进行二分类。
class discriminator(nn.Module):
    def __init__(self):
        super(discriminator,self).__init__()
        self.dis=nn.Sequential(
            nn.Linear(2,50),#输入特征数为2，输出为10
            #nn.LeakyReLU(0.2),#进行非线性映射
            nn.ReLU(True),
            nn.Linear(50,50),#进行一个线性映射
            #nn.LeakyReLU(0.2),
            nn.ReLU(True),
            nn.Linear(50,1),
            #nn.Sigmoid()#也是一个激活函数，二分类问题中，
            # sigmoid可以班实数映射到【0,1】，作为概率值，
            # 多分类用softmax函数
        )
        #self.sigmoid = nn.Sigmoid()
    def forward(self, x):
        x=self.dis(x)
        # x = self.sigmoid(x)
        return x
####### 定义生成器 Generator #####
#输入一个2维的0～1之间的高斯分布，然后通过第一层线性变换将其映射到10维,
# 然后通过LeakyReLU激活函数，接着进行一个线性变换，再经过一个LeakyReLU激活函数，
# 然后经过线性变换将其变成784维，最后经过Tanh激活函数是希望生成的假的图片数据分布
# 能够在-1～1之间。
class generator(nn.Module):
    def __init__(self):
        super(generator,self).__init__()
        self.gen=nn.Sequential(
            nn.Linear(2,50),#用线性变换将输入映射到10维
            nn.ReLU(True),#relu激活
            nn.Linear(50,2),#线性变换
            #nn.ReLU(True),#relu激活
            #nn.Linear(10,2),#线性变换
            #nn.Tanh()#Tanh激活使得生成数据分布在【-1,1】之间
        )
    def forward(self, x):
        x=self.gen(x)
        return x

#创建对象
D=discriminator()
G=generator()
if torch.cuda:
    D=D.cuda()
    G=G.cuda()
#########判别器训练train#####################
#分为两部分：1、真的图像判别为真；2、假的图像判别为假
#此过程中，生成器参数不断更新
#首先需要定义loss的度量方式  （二分类的交叉熵）
#其次定义 优化函数,优化函数的学习率为0.0003
#criterion = nn.BCELoss() #是单目标二分类交叉熵函数
#d_optimizer=torch.optim.Adam(D.parameters(),lr=0.0001)
#g_optimizer=torch.optim.Adam(G.parameters(),lr=0.0001)

#d_optimizer = torch.optim.Adam(G.parameters(), lr=0.001, betas=(0.5, 0.999))
#g_optimizer = torch.optim.Adam(D.parameters(), lr=0.001, betas=(0.5, 0.999))
g_optimizer = torch.optim.RMSprop(G.parameters(), lr= 0.001,alpha=0.9)
d_optimizer = torch.optim.RMSprop(D.parameters(), lr= 0.001,alpha=0.9)
iterator=0
one=torch.FloatTensor(batch_size,1).zero_()+1
#print(one),print(one.shape)
minus_one=-1*one
#print(minus_one),print(minus_one.shape)
###########################进入训练##判别器的判断过程#####################
for epoch in range(num_epoch): #进行多个epoch的训练
    # iterator=0
    x = np.linspace(-1.2, 2.4, 200)
    y = np.linspace(-1, 1.8, 200)
    X, Y = np.meshgrid(x, y)
    m, n = X.shape
    point = []
    for i in range(m):
        for j in range(n):
            point.append([X[i][j], Y[i][j]])
    point = np.array(point)
    for x_batch in iterate_minibatch(xx_train, batch_size=batch_size,shuffle=True):

        iterator=iterator+1
        #print(x_batch.shape)
        #print(iterator)

        # modification: clip param for discriminator
        for parm in D.parameters():
            parm.data.clamp_(-0.4, 0.4)
        # 学到后面，如果不发生变化了，就把上面数改大一些。

        # =============================训练判别器==================
        D.zero_grad()
        # train netd with real img
        x_batch=torch.from_numpy(x_batch).float()#batch_size个数据，每个数据二维

        real_point = Variable(x_batch).cuda()  # 将tensor变成Variable放入计算图中

        #real_label = Variable(torch.ones(batch_size)).cuda()  # 定义真实的点点label为1
        #fake_label = Variable(torch.zeros(batch_size)).cuda()  # 定义假的点点的label为0

        ## train netd with real img
        # 计算真实点点的损失
        real_out = D(real_point)  # 将真实点点放入判别器中
        real_out.backward(one.cuda())
        #d_loss_real=real_out
        #d_loss_real = criterion(real_out, real_label)  # 得到点点图片的loss
        #print("d_loss_real: %s",d_loss_real)
        #real_scores = real_out  # 得到真实点点的判别值，输出的值越接近1越好
        #print("real_scores: %s",real_scores)

        ## train netd with fake img
        # 计算假的图片的损失
        ## train netd with fake img
        #z = Variable(torch.randn(batch_size, z_dimension)).cuda()  # 随机生成一些噪声
        z_batch = Variable(torch.randn(batch_size, z_dimension)).cuda()  # 随机生成一些噪声
        fake_point = G(z_batch).detach()  # 随机噪声放入生成网络中，生成一个假的点点
        fake_out = D(fake_point)  # 判别器判断假的点点
        fake_out.backward(minus_one.cuda())
        #d_loss_fake=fake_out
        #d_loss_fake = criterion(fake_out, fake_label)  # 得到假的点点的loss
        #print("d_loss_fake: %s",d_loss_fake)
        #fake_scores = fake_out  # 得到假点点的判别值，对于判别器来说，假点点的损失越接近0越好
        #print("fake_scores: %s",fake_scores)


        #损失函数和优化
        #d_loss = d_loss_real + d_loss_fake  # 损失包括判真损失和判假损失
        #d_optimizer.zero_grad()  # 在反向传播之前，先将梯度归0
        #d_loss.backward()  # 将误差反向传播
        d_optimizer.step()  # 更新参数

        # ==================训练生成器============================
        ################################生成网络的训练###############################
        # 原理：目的是希望生成的假的图片被判别器判断为真的图片，
        # 在此过程中，将判别器固定，将假的图片传入判别器的结果与真实的label对应，
        # 反向传播更新的参数是生成网络里面的参数，
        # 这样可以通过更新生成网络里面的参数，来训练网络，使得生成的图片让判别器以为是真的
        # 这样就达到了对抗的目的
        # 计算假的图片的损失

        # train netd more: because the better netd is,
        # the better netg will be
        if (iterator + 1) % 1 == 0:
            # generate noise z 生成噪声z
            G.zero_grad()
            z_batch = Variable(torch.randn(batch_size, z_dimension)).cuda()  # 随机生成一些噪声
            fake_point = G(z_batch)  # 随机噪声输入到生成器中，得到一副假的点点
            real_out = D(fake_point)  # 经过判别器得到的结果
            real_out.backward(one.cuda())
            #g_loss = real_out
            # g_loss = criterion(output, real_label)  # 得到的假的点点与真实的点点的label的loss
            # bp and optimize
            #g_optimizer.zero_grad()  # 梯度归0
            # g_loss.backward()  # 进行反向传播
            g_optimizer.step()  # .step()一般用在反向传播后面,用于更新生成网络的参数

    #fake_u=G(z_batch)
    #points=make_grid(fake_u.data*0.5+0.5).cpu()#chw
    #plt.imshow(points.permute(1, 2, 0).numpy())  # HWC
    #plt.show()

    print(epoch)
    #print(num_epoch)
    print(real_out.mean())
    #print(d_loss.shape)
    print(fake_out.mean())
    #print(g_loss.shape)
    #print(real_scores.mean())
    #print(real_scores.shape)
    #print(fake_scores.mean())
    #print(fake_scores.shape)
    # 打印中间的损失
    #print('Epoch[{}/{}],d_loss:{:.6s},g_loss:{:.6s} '
     #         'D real: {:.6s},D fake: {:.6s}'.format(
      #      epoch, num_epoch, d_loss.data.mean(), g_loss.data.mean(),
       #     real_scores.data, fake_scores.data.mean()  # 打印的是真实点点的损失均值
       # ))
    fake_images = fake_point.cpu().data
    point_data = point.astype(np.float32)
    point_data = torch.from_numpy(point_data)
    point_data = point_data.cuda()
    decision = D(point_data)
    plt.cla()
    plt.scatter(point[:, 0], point[:, 1], c=decision.data.cpu().numpy()[:, 0], marker='.', cmap='gray')
    plt.scatter(xx_train[:, 0], xx_train[:, 1], c='#00CED1')
    plt.scatter(fake_images[:, 0], fake_images[:, 1], c='#0C143F')
    #print(fake_images.shape)
    #print(xx_train.shape)
    plt.draw()
    plt.pause(0.01)
    '''
        if epoch == 0:
            real_images = to_img(real_point.cpu().data)
            save_image(real_images, './img/real_images.png')
        fake_images = to_img(real_point.cpu().data)
        save_image(fake_images, './img/fake_images-{}.png'.format(epoch + 1))
    '''

# 保存模型
torch.save(G.state_dict(), './generator.pth')
torch.save(D.state_dict(), './discriminator.pth')

Wgan-gp

相对于WGAN的情况WGAN-GP主要是将原有的discriminator 的权重clipping修改为gradient penalty:

然后训练过程改一改，就成了。

wgan-gp

#coding=utf-8
import torch.autograd
import torch.nn as nn
from torch.autograd import Variable
from torchvision import transforms
from torchvision import datasets
from torchvision.utils import  save_image
import scipy.io as sio
import matplotlib.pyplot as plt
import numpy as np  #二维数组
from torch.autograd import Variable
import torch.autograd as autograd
from torchvision.utils import make_grid
import torch
import torch.nn as nn
import matplotlib
import os

torch.cuda=True
BATCH_SIZE=2048  #batch大小
ITERS=10000  # 迭代次数
z_dimension=2  #噪声维度
LAMBDA = 10 # Gradient penalty lambda hyperparameter

matplotlib.use("TkAgg")
'''
载入训练数据
'''
data = sio.loadmat('points.mat');
xx_train=np.array(data['xx'])
plt.figure(1)
plt.scatter(xx_train[:,0],xx_train[:,1])
#plt.show()

'''
定义迭代的batch大小
'''
def iterate_minibatch(x, BATCH_SIZE, shuffle=True):
    indices = np.arange(x.shape[0])
    if shuffle:
        np.random.shuffle(indices)
    for i in range(0, x.shape[0], BATCH_SIZE):
        yield x[indices[i:i + BATCH_SIZE], :]
'''
for x_batch in iterate_minibatch(xx_train, BATCH_SIZE=BATCH_SIZE):
    print(x_batch.shape)
'''

def calc_gradient_penalty(netD, real_data, fake_data):
    #print real_data.size()
    alpha = torch.rand(BATCH_SIZE, 1)
    alpha = alpha.expand(real_data.size())
    alpha = alpha.cuda(0)
    interpolates = alpha * real_data + ((1 - alpha) * fake_data)
    interpolates = interpolates.cuda(0)
    interpolates = autograd.Variable(interpolates, requires_grad=True)
    disc_interpolates = netD(interpolates)
    gradients = autograd.grad(outputs=disc_interpolates, inputs=interpolates,
                              grad_outputs=torch.ones(disc_interpolates.size()).cuda(0),
                              create_graph=True, retain_graph=True, only_inputs=True)[0]
    gradient_penalty = ((gradients.norm(2, dim=1) - 1) ** 2).mean() * LAMBDA
    return gradient_penalty

#定义判别器  #####Discriminator######使用多层网络来作为判别器
#将图片28x28展开成784，然后通过多层感知器，中间经过斜率设置为0.2的LeakyReLU激活函数，
# 最后接sigmoid激活函数得到一个0到1之间的概率进行二分类。
class discriminator(nn.Module):
    def __init__(self):
        super(discriminator,self).__init__()
        self.dis=nn.Sequential(
            nn.Linear(2,50),#输入特征数为2，输出为10
            #nn.LeakyReLU(0.2),#进行非线性映射
            nn.ReLU(True),
            nn.Linear(50,50),#进行一个线性映射
            #nn.LeakyReLU(0.2),
            nn.ReLU(True),
            nn.Linear(50,1),
            #nn.Sigmoid()#也是一个激活函数，二分类问题中，
            # sigmoid可以班实数映射到【0,1】，作为概率值，
            # 多分类用softmax函数
        )
        self.sigmoid = nn.Sigmoid()
    def forward(self, x):
        x=self.dis(x)
        # x = self.sigmoid(x)
        return x
####### 定义生成器 Generator #####
#输入一个2维的0～1之间的高斯分布，然后通过第一层线性变换将其映射到10维,
# 然后通过LeakyReLU激活函数，接着进行一个线性变换，再经过一个LeakyReLU激活函数，
# 然后经过线性变换将其变成784维，最后经过Tanh激活函数是希望生成的假的图片数据分布
# 能够在-1～1之间。
class generator(nn.Module):
    def __init__(self):
        super(generator,self).__init__()
        self.gen=nn.Sequential(
            nn.Linear(2,50),#用线性变换将输入映射到10维
            nn.ReLU(True),#relu激活
            nn.Linear(50,2),#线性变换
            #nn.ReLU(True),#relu激活
            #nn.Linear(10,2),#线性变换
            #nn.Tanh()#Tanh激活使得生成数据分布在【-1,1】之间
        )
    def forward(self, x):
        x=self.gen(x)
        return x

#创建对象
D=discriminator()
G=generator()
if torch.cuda:
    D=D.cuda()
    G=G.cuda()
#########判别器训练train#####################
#分为两部分：1、真的图像判别为真；2、假的图像判别为假
#此过程中，生成器参数不断更新
#首先需要定义loss的度量方式  （二分类的交叉熵）
#其次定义 优化函数,优化函数的学习率为0.0003
#criterion = nn.BCELoss() #是单目标二分类交叉熵函数
#d_optimizer=torch.optim.Adam(D.parameters(),lr=0.0001)
#g_optimizer=torch.optim.Adam(G.parameters(),lr=0.0001)

#d_optimizer = torch.optim.Adam(G.parameters(), lr=0.001, betas=(0.5, 0.999))
#g_optimizer = torch.optim.Adam(D.parameters(), lr=0.001, betas=(0.5, 0.999))
g_optimizer = torch.optim.RMSprop(G.parameters(), lr= 0.001,alpha=0.9)
d_optimizer = torch.optim.RMSprop(D.parameters(), lr= 0.002,alpha=0.9)
iterator=0
one=torch.FloatTensor(BATCH_SIZE,1).zero_()+1
#print(one),print(one.shape)
minus_one=-1*one
#print(minus_one),print(minus_one.shape)
###########################进入训练##判别器的判断过程#####################
for epoch in range(ITERS): #进行多个epoch的训练
    # iterator=0
    x = np.linspace(-1.2, 2.4, 200)
    y = np.linspace(-1, 1.8, 200)
    X, Y = np.meshgrid(x, y)
    m, n = X.shape
    point = []
    for i in range(m):
        for j in range(n):
            point.append([X[i][j], Y[i][j]])
    point = np.array(point)
    for p in D.parameters():  # reset requires_grad
        p.requires_grad = True  # they are set to False below in netG update
    for x_batch in iterate_minibatch(xx_train, BATCH_SIZE=BATCH_SIZE,shuffle=True):

        iterator=iterator+1
        #print(x_batch.shape)
        #print(iterator)


        # modification: clip param for discriminator
        #for parm in D.parameters():
         #   parm.data.clamp_(-0.4, 0.4)
        # 学到后面，如果不发生变化了，就把上面数改大一些。

        # =============================训练判别器==================
        D.zero_grad()
        # train netd with real img
        x_batch=torch.from_numpy(x_batch).float()#BATCH_SIZE个数据，每个数据二维

        real_point = Variable(x_batch).cuda()  # 将tensor变成Variable放入计算图中

        #real_label = Variable(torch.ones(BATCH_SIZE)).cuda()  # 定义真实的点点label为1
        #fake_label = Variable(torch.zeros(BATCH_SIZE)).cuda()  # 定义假的点点的label为0

        ## train netd with real img
        # 计算真实点点的损失
        real_out = D(real_point)  # 将真实点点放入判别器中
        real_out=real_out.mean()
        real_out.backward(minus_one.cuda())
        #d_loss_real=real_out
        #d_loss_real = criterion(real_out, real_label)  # 得到点点图片的loss
        #print("d_loss_real: %s",d_loss_real)
        #real_scores = real_out  # 得到真实点点的判别值，输出的值越接近1越好
        #print("real_scores: %s",real_scores)

        ## train netd with fake img
        # 计算假的图片的损失
        ## train netd with fake img
        #z = Variable(torch.randn(BATCH_SIZE, z_dimension)).cuda()  # 随机生成一些噪声
        z_batch = Variable(torch.randn(BATCH_SIZE, z_dimension)).cuda()  # 随机生成一些噪声
        fake_point = autograd.Variable(G(z_batch).data)  # 随机噪声放入生成网络中，生成一个假的点点
        #fake_point = G(z_batch).detach()  # 随机噪声放入生成网络中，生成一个假的点点
        inputv = fake_point
        fake_out = D(fake_point)  # 判别器判断假的点点
        fake_out =fake_out.mean()  # 判别器判断假的点点
        fake_out.backward(one.cuda())

        # train with gradient penalty
        gradient_penalty = calc_gradient_penalty(D, real_point.data, fake_point.data)
        gradient_penalty.backward()
        #d_loss_fake=fake_out
        #d_loss_fake = criterion(fake_out, fake_label)  # 得到假的点点的loss
        #print("d_loss_fake: %s",d_loss_fake)
        #fake_scores = fake_out  # 得到假点点的判别值，对于判别器来说，假点点的损失越接近0越好
        #print("fake_scores: %s",fake_scores)


        #损失函数和优化
        #d_loss = d_loss_real + d_loss_fake  # 损失包括判真损失和判假损失
        #d_optimizer.zero_grad()  # 在反向传播之前，先将梯度归0
        #d_loss.backward()  # 将误差反向传播
        D_cost = fake_out - real_out + gradient_penalty
        Wasserstein_D = real_out - fake_out
        d_optimizer.step()  # 更新参数

    # ==================训练生成器============================
    ################################生成网络的训练###############################
    # 原理：目的是希望生成的假的图片被判别器判断为真的图片，
    # 在此过程中，将判别器固定，将假的图片传入判别器的结果与真实的label对应，
    # 反向传播更新的参数是生成网络里面的参数，
    # 这样可以通过更新生成网络里面的参数，来训练网络，使得生成的图片让判别器以为是真的
    # 这样就达到了对抗的目的
    # 计算假的图片的损失

    # train netd more: because the better netd is,
    # the better netg will be
    #if (iterator + 1) % 1 == 0:
    for p in D.parameters():
        p.requires_grad = False  # to avoid computation
    D.zero_grad()
    G.zero_grad()
    # generate noise z 生成噪声z
    z_batch = Variable(torch.randn(BATCH_SIZE, z_dimension)).cuda()  # 随机生成一些噪声
    fake_point = G(z_batch)  # 随机噪声输入到生成器中，得到一副假的点点
    Generator=D(fake_point)
    Generator = Generator.mean()
    Generator.backward(minus_one.cuda())
    Generator_cost = -Generator
    #real_out = D(fake_point)  # 经过判别器得到的结果
    #real_out.backward(one.cuda())
    # g_loss = real_out
    # g_loss = criterion(output, real_label)  # 得到的假的点点与真实的点点的label的loss
    # bp and optimize
    # g_optimizer.zero_grad()  # 梯度归0
    # g_loss.backward()  # 进行反向传播
    g_optimizer.step()  # .step()一般用在反向传播后面,用于更新生成网络的参数

    # Write logs and save samples
    #lib.plot.plot('', D_cost.cpu().data.numpy())
    #plot('', Generator_cost.cpu().data.numpy())
    #lib.plot.plot('', Wasserstein_D.cpu().data.numpy())
    print(Generator_cost)
    print(D_cost)
    print(Wasserstein_D)

    #fake_u=G(z_batch)
    #points=make_grid(fake_u.data*0.5+0.5).cpu()#chw
    #plt.imshow(points.permute(1, 2, 0).numpy())  # HWC
    #plt.show()

    print(epoch)
    #print(ITERS)
    print(real_out.mean())
    #print(d_loss.shape)
    print(fake_out.mean())
    #print(g_loss.shape)
    #print(real_scores.mean())
    #print(real_scores.shape)
    #print(fake_scores.mean())
    #print(fake_scores.shape)
    # 打印中间的损失
    #print('Epoch[{}/{}],d_loss:{:.6s},g_loss:{:.6s} '
     #         'D real: {:.6s},D fake: {:.6s}'.format(
      #      epoch, ITERS, d_loss.data.mean(), g_loss.data.mean(),
       #     real_scores.data, fake_scores.data.mean()  # 打印的是真实点点的损失均值
       # ))
    fake_images = fake_point.cpu().data
    point_data = point.astype(np.float32)
    point_data = torch.from_numpy(point_data)
    point_data = point_data.cuda()
    decision = D(point_data)
    plt.cla()
    plt.scatter(point[:, 0], point[:, 1], c=decision.data.cpu().numpy()[:, 0], marker='.', cmap='gray')
    plt.scatter(xx_train[:, 0], xx_train[:, 1], c='#00CED1')
    plt.scatter(fake_images[:, 0], fake_images[:, 1], c='#0C143F')
    #print(fake_images.shape)
    #print(xx_train.shape)
    plt.draw()
    plt.pause(0.01)
    '''
        if epoch == 0:
            real_images = to_img(real_point.cpu().data)
            save_image(real_images, './img/real_images.png')
        fake_images = to_img(real_point.cpu().data)
        save_image(fake_images, './img/fake_images-{}.png'.format(epoch + 1))
    '''

# 保存模型
torch.save(G.state_dict(), './generator.pth')
torch.save(D.state_dict(), './discriminator.pth')

你可能感兴趣的:(python,机器学习,wgan,gan,wgan-gp)

Opacus库快速上手！使用Opacus库在Mnist数据集实现差分隐私还不秃顶的计科生快捷操作编程技巧 pycharm
第一部分：代码实现（1）基础配置python:3.8,opacus1.1.1，torch1.12.1pipinstallopacus==1.1.1具体实现方式是参考opacus官网以及（4）的参考文献。opacus官网为：GitHub-pytorch/opacus：使用差分隐私训练PyTorch模型（2）完整代码#-*-coding:utf-8-*-#Step1:导入必要的库和模块importto
GitHub每日最火火火项目（3.7） FutureUniant github日推 github 人工智能计算机视觉音视频 ai
ai-hedge-fund项目介绍：ai-hedge-fund是由virattt开发的项目，本质上是一个将人工智能技术应用于对冲基金领域的团队或平台。在金融市场中，对冲基金旨在通过各种策略获取超额收益，而人工智能具备强大的数据分析和预测能力，二者结合能为投资决策带来新的思路和方法。该项目可能运用机器学习、深度学习等人工智能算法，对大量的金融数据进行深入分析，包括股票、债券、期货等市场的历史价格、交
sklearn库安装吧啦吧啦吡叭卜 sklearn 人工智能 python
已经安装了numpy、matplotlib、scipy这些库一直报错×pythonsetup.pyegg_infodidnotrunsuccessfully.│exitcode:1╰─>[15linesofoutput]The'sklearn'PyPIpackageisdeprecated,use'scikit-learn'ratherthan'sklearn'forpipcommands.Her
Python基础：Python简明知识框架若北辰 Python实战练习 python 开发语言
Python是一种高级编程语言，以其简单易学、强大的功能和广泛的应用领域而著称。以下是Python的主要知识框架：一、基础知识语法基础变量与数据类型：整数、浮点数、字符串、布尔值运算符：算术运算符、比较运算符、逻辑运算符、赋值运算符控制结构：条件语句（if,elif,else）、循环（for,while）函数与作用域：定义函数、参数、返回值、局部与全局变量数据结构列表（List）：可变序列，支持索
[原创](Modern C++)现代C++的关键性概念: 非常独特的std::sentinel_for概念(哨兵概念) 我不是代码教父 #C/C++探究 c++sentinel 开发语言
[作者]常用网名:猪头三出生日期:1981.XX.XX企鹅交流:643439947个人网站:80x86汇编小站编程生涯:2001年~至今[共24年]职业生涯:22年开发语言:C/C++、80x86ASM、ObjectPascal、Objective-C、C#、R、Python、PHP、Perl、开发工具:VisualStudio、Delphi、XCode、C++Builder、Eclipse技能种
教学使用python实现某某短剧下载实现流程阴-影 python 开发语言
#短剧爬取实现流程笔记#第一步：打开浏览器，搜索快手进入官网在官网里面找到小剧场，点击进去，然后右键检查或者F12打开开发者工具，刷新一下网页，点击网络面板，英文的就是（network）#第二部在里面找json数据，每一个都点击一下，看预览数据visionTubeEpisode是否有这个字典，在里面找到photo在里面找到photoUrl，然后浏览器地址栏请求一下网址，看是否是我们想要的#第三步#
AI智能体，AI computer use：浏览器使用（Browser Use）项目实际体验，deepseek r1，百度云，满血版几道之旅 Dify与Langflow 智能体（Agent）知识库人工智能
文章目录前言BrowserUse项目简介支持的大模型快速开始windows安装uv安装虚拟环境激活之安装相关的python库安装playwright趁着这个空当，咱去把deepseekv1搞一下构建BrowserUse智能体报错错误解决后，重新运行前言Agent项目中，一个重要的组成部分便是电脑使用。甚至，我感觉，对于openai这种的，实力比较强的公司，电脑使用几乎可以70%地与Agent划等号
慕慕手记项目日记熟悉SQLAIChemy ORM框架 2025-3-5 Martinenbule 慕慕手记项目日志 lua 开发语言
慕慕手记项目日记熟悉SQLAIChemyORM框架2025-3-5SQLAIChemy框架SQLAlchemy是一个功能强大的PythonSQL工具包和对象关系映射（ORM）框架，用于简化数据库操作。它提供了全套企业级持久化模式，既支持纯SQL开发，也支持高级ORM操作，是Python生态中最流行的数据库工具之一。安装SQLAlChemy使用以下命令进行安装pipinstallsqlalchemy
Jetson系列: tensorrt-python推理yolov5（一） weixin_55083979 jetson系列 YOLO pytorch 深度学习
目录一.onnx模型导出二.TensorRT模型本地序列化三.算法整体Pipline架构四.算法整体Pipline实现一.onnx模型导出在使用tensorrt进行加速之前需要将自己的torch模型转为onnx格式的，这个操作很基础就不赘述了，自己根据自己的任务、部署设备选择合适的batch/infersize/opsetyolov5官方导出onnx脚本Example:```pythonfromp
Browser-Use Web UI：浏览器自动化与AI的完美结合 blues_C AI测试：从入门到进阶前端 ui 自动化人工智能自动化测试 python AI
Browser-UseWebUI：浏览器自动化与AI的完美结合前言简介一、克隆项目二、安装与环境配置1.Python版本要求2.安装依赖3.安装Playwright4.配置环境变量（非必要步骤）三、启动WebUI四、配置1.Agent设置2.大模型设置3.浏览器相关设置4.运行Agent结语前言WebUI是在Browser-Use的基础上，加上了UI操作界面，同时也对一些功能进行了扩展，降低了使用
python量化数据15：计算同花顺涨停次日涨跌幅表现 ETF股债基指标 linux 运维服务器
一、环境安装pipinstallpandaspipinstallrequestspipinstallmootdx二、代码frommootdx.quotesimportQuotesimportpandasaspdimportrequestsimporttimeimportjsonclient=Quotes.factory(market='std')defget_open_limit_pool(dat
python量化数据8：计算东方财富KDJ指标数值金叉死叉 ETF股债基指标 python 开发语言
一、KDJ计算公式K:SMA(RSV,5,1);D:SMA(K,M1,1);J:3*K-2*D;defKDJ(CLOSE,HIGH,LOW,N=9,M1=3,M2=3):'''超卖超买类RSV赋值:(收盘价-N日内最低价的最低值)/(N日内最高价的最高值-N日内最低价的最低值)*100输出K:RSV的M1日[1日权重]移动平均输出D:K的M2日[1日权重]移动平均输出J:3*K-2*D'''RSV
Python读取Excel利用某列匹配图片嵌入到Excel中—是嵌入不是浮动的（值得一看）WPS篇一晌小贪欢 Python自动化办公 python excel wps 图片嵌入单元格 python办公 python办公自动化
目录专栏导读库的安装数据源准备预览结果注意事项1、获取Excel的A列表头以及索引2、Excel路径为绝对路径！绝对路径！3、图片文件夹文件文件夹名做字典（请修改您的正则）4、适当调整单元格的宽高5、一定要改从哪列开始（下列数字2表示从B列开始）6、最后Left+xx\Top+xx,适当调整，非常重要6、嵌入步骤：非常重要，点击一张图片Ctrl+a(全选),右击嵌入代码总结专栏导读欢迎来到Pyth
django中序列化器serializer 的高级使用和需要注意的点小赖同学啊 python django sqlite python
在DjangoRESTframework（DRF）中，序列化器（Serializer）是一个强大的工具，用于将复杂的数据类型（如Django模型实例）转换为Python原生数据类型，以便将其渲染为JSON、XML等格式，同时也能将接收到的外部数据反序列化为Django模型实例。以下将介绍序列化器的高级使用方法以及需要注意的点。高级使用1.嵌套序列化器当模型之间存在关联关系（如外键、多对多关系）时，
华为OD机试Python - Excel单元格数值统计 steven_my 华为OD机试 Python 华为od python javascript c++java 华为OD机试算法
Excel单元格数值统计前言：本专栏将持续更新互联网大厂机试真题，并进行详细的分析与解答，包含完整的代码实现，希望可以帮助到正在努力的你。关于大厂机试流程、面经、面试指导等，如有任何疑问，欢迎联系我，wechat：steven_moda；email：nansun0903@163.com；备注：CSDN。题目描述Excel工作表中对选定区域的数值进行统计的功能非常实用。仿照Excel的这个功能，请对
【AI-42】如何调整参数和超参 W Y 人工智能
在机器学习和深度学习中，参数和超参数是两个重要概念，以下是一些常见的参数和超参数及其作用：参数权重（Weight）解释：可以将权重想象成连接不同神经元之间的“桥梁”，其大小决定了一个神经元的输出对下一个神经元的影响程度。权重越大，说明前一个神经元对后一个神经元的影响就越大；权重越小，影响就越小。作用：在模型训练过程中，权重不断调整，使得模型能够学习到输入数据中的各种特征和模式，从而实现对数据的准确
使用Python和机器学习技术对高中物理题目进行分类的示例代码 max500600 python 机器学习 python 分类
以下是一个使用Python和机器学习技术对高中物理题目进行分类的示例代码。我们将使用自然语言处理（NLP）技术处理题目的文本信息，并使用朴素贝叶斯分类器进行分类。步骤概述数据准备：准备包含高中物理题目的数据集，每个题目都有对应的类别标签。文本预处理：对题目文本进行清洗和特征提取。模型训练：使用训练数据训练分类模型。模型评估：使用测试数据评估模型的性能。预测：使用训练好的模型对新的物理题目进行分类。
华为OD机试：Excel单元格数值统计问题解决方案（C++、Java、JavaScript、Python）详解 m0_57781768 华为od excel c++
华为OD机试：Excel单元格数值统计问题解决方案（C++、Java、JavaScript、Python）详解在华为OD机试中，Excel单元格数值统计问题是一个常见的算法考题，它模拟了Excel中对表格区域进行数值统计的功能。此题的核心在于解析Excel中单元格内容，并对指定区域的数值进行求和操作。通过这篇文章，我们将详细介绍该问题的解决思路，并给出C++、Java、JavaScript、Pyt
Django 视图 lsx202406 开发语言
Django视图引言Django是一个高级的PythonWeb框架，它鼓励快速开发和干净、实用的设计。在Django中，视图是Web应用程序的核心，负责处理客户端请求并生成响应。本文将详细介绍Django视图的概念、作用以及如何使用视图来构建Web应用程序。视图的概念在Django中，视图是一个Python函数或类，它负责接收HTTP请求并返回HTTP响应。视图是Django框架中处理客户端请求的
【Python小工具】桌面悬浮题库搜索+AI问答助手 - 支持快捷键&窗口置顶(支持某星考试客户端) SJY_ssr python
【Python小工具】桌面悬浮题库搜索+AI问答助手-支持快捷键&窗口置顶注：本文章只做简单介绍，完整代码请转到github仓库(https://github.com/SJYssr/CX_EXAM_python)工具亮点三合一高效功能：题库检索+AI问答+自动输入智能窗口管理：支持置顶显示/透明度调节/快速隐藏双AI引擎支持：讯飞星火&DeepSeek自由切换极简交互设计：全快捷键操作，鼠标右键快
Python 在 AI 领域的应用：从零构建你的第一个 AI 模型嵌入式Jerry Python python 人工智能开发语言嵌入式硬件 windows ubuntu
引言人工智能（AI）已经成为现代科技的核心，而Python是AI领域最受欢迎的编程语言之一。其强大的库和框架，如TensorFlow、PyTorch、scikit-learn，使AI开发变得更加简单高效。本文将带你深入理解Python在AI中的应用，并通过机器学习（MachineLearning）和深度学习（DeepLearning）的实际示例，讲解如何构建一个AI模型。1.Python为什么适合
Python自学指南：从入门到进阶（第一天） Small踢倒coffee_氕氘氚经验分享笔记 python
Python作为一门简洁、易读且功能强大的编程语言，深受初学者和专业开发者的喜爱。无论你是编程新手，还是有一定编程经验想学习新语言，Python都是一个绝佳的选择。本文将为你提供一份详细的Python自学指南，帮助你从入门到进阶。---##一、为什么选择Python？1.**简单易学**：Python语法简洁，接近自然语言，适合初学者快速上手。2.**应用广泛**：Python在数据分析、人工智能
图像处理篇---opencv中的图像特征 Ronin-Lotus 图像处理篇深度学习篇图像处理 opencv 人工智能 python
文章目录前言一、纹理特征：局部二值模式（LBP）1.LBP简介2.LBP计算步骤3.OpenCV实现4.优点5.缺点二、形状特征：Hu矩1.Hu矩简介2.Hu矩计算步骤3.OpenCV实现4.优点5.缺点三、其他可用于传统机器学习的特征1.颜色特征颜色直方图颜色矩2.边缘特征Canny边缘检测HOG（方向梯度直方图）3.关键点特征SIFTSURF4.纹理特征Haralick纹理特征5.几何特征轮廓
深度学习篇---Opencv中的机器学习和深度学习 Ronin-Lotus 深度学习篇图像处理篇深度学习 opencv 机器学习 python
文章目录前言一、OpenCV中的机器学习1.概述2.使用步骤步骤1：准备数据步骤2：创建模型步骤3：训练模型步骤4：预测3.优点简单易用轻量级实时性4.缺点特征依赖性能有限二、OpenCV中的深度学习1.概述图像分类（如ResNet、MobileNet）目标检测（如YOLO、SSD）语义分割（如DeepLab）人脸检测（如OpenFace）2.使用步骤步骤1：加载模型步骤2：准备输入数据步骤3：推
Python的那些事第四十一篇：简化数据库交互的利器Django ORM 暮雨哀尘数据库 sqlite oracle django SQLAlchemy python sql
DjangoORM：简化数据库交互的利器摘要随着互联网技术的飞速发展，Web开发越来越受到重视。Django作为一款流行的PythonWeb框架，以其高效、安全、可扩展等特点受到了广大开发者的喜爱。其中，DjangoORM（对象关系映射）是Django框架的核心组件之一，它为开发者提供了一种简单而强大的方式来与数据库进行交互。本文将深入探讨DjangoORM的原理、优势、使用方法以及一些高级技巧，
Oracle 12c多租户架构总结 weixin_34235135 数据库 python
2019独角兽企业重金招聘Python工程师标准>>>Oracle数据库12c的一大创新即是其采用的多租户架构。对于多租户这项新功能，业内的评价褒贬不一。有的声音认为，这项功能的用处不是特别大，但在某些场景或特定的环境下，多租户依然有它的用处。其最大的用处就在于整合数据库。在一些小的系统环境中，多租户的特点就可以显现出来，其可以进行有效的整合，这样可以减少成本、降低管理的复杂度。多租户架构通过对不
Python接口自动化测试：断言封装详解程序员潇潇软件测试 python 开发语言软件测试自动化测试功能测试程序人生职场和发展
在进行API接口测试时，断言起着至关重要的作用。断言是用于验证预期结果与实际结果是否一致的过程。在Python中，我们可以利用一些库来实现断言功能。1.安装必要的库在Python中，我们主要会使用两个库：requests和jsonpath。requests库用于发送HTTP请求，而jsonpath库则用于解析JSON数据。首先，我们需要安装这两个库。打开命令行，输入以下命令：pipinstallr
全面掌握Python&Java分层自动化测试：从单元测试到安全检测的完整指南 jardonwang1 python java
分层自动化（LayeredAutomation）是一种软件测试策略，通过将自动化测试分为不同层次或阶段，针对不同类型的测试需求，确保测试覆盖的全面性以及提高测试效率。这种方法通过分解复杂的测试任务，将其分配到适当的层级，从而降低测试的维护成本并提高自动化测试的稳定性和复用性。通常，分层自动化包括以下几层：1.单元测试层(UnitTestLayer)定义：单元测试是针对代码中的最小功能单元（通常是函
pip安装Python包时，遇到错误“required to install pyproject.toml-based projects” 烤着地瓜数星星 python pip 开发语言
1.确保你的Python环境是最新的。在命令行中运行以下命令更新pip：pipinstall--upgradepip2.确保你已经安装了setuptools和wheel这两个Python包：pipinstallsetuptoolswheel3.如果问题仍然存在，你可能需要检查你是否安装了正确的Python版本。某些Python包可能只支持特定版本的Python。你可以使用以下命令检查你的Pytho
Python 自然语言处理实战： NLTK 与 spaCy，文本分析的左右护法清水白石008 python Python题库 python 自然语言处理 easyui
Python自然语言处理实战：NLTK与spaCy，文本分析的左右护法引言在信息爆炸的时代，文本数据以前所未有的速度增长，蕴藏着巨大的信息和价值。从社交媒体的评论，到浩如烟海的文档，文本数据无处不在，成为了解用户意图、挖掘商业情报、洞察社会趋势的关键来源。然而，文本数据本质上是非结构化的，计算机难以直接理解和处理。自然语言处理(NaturalLanguageProcessing,NLP)技术应运而
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S