Deep learning：四十二(Denoise Autoencoder简单理解)

　　前言：

　　当采用无监督的方法分层预训练深度网络的权值时，为了学习到较鲁棒的特征，可以在网络的可视层（即数据的输入层）引入随机噪声，这种方法称为Denoise Autoencoder(简称dAE)，由Bengio在08年提出，见其文章Extracting and composing robust features with denoising autoencoders.使用dAE时，可以用被破坏的输入数据重构出原始的数据（指没被破坏的数据），所以它训练出来的特征会更鲁棒。本篇博文主要是根据Benigio的那篇文章简单介绍下dAE，然后通过2个简单的实验来说明实际编程中该怎样应用dAE。这2个实验都是网络上现成的工具稍加改变而成，其中一个就是matlab的Deep Learning toolbox，见https://github.com/rasmusbergpalm/DeepLearnToolbox，另一个是与python相关的theano，参考：http://deeplearning.net/tutorial/dA.html.

　　基础知识：

　　首先来看看Bengio论文中关于dAE的示意图，如下：

　　 Deep learning：四十二(Denoise Autoencoder简单理解)

　　由上图可知，样本x按照qD分布加入随机噪声后变为 ,按照文章的意思，这里并不是加入高斯噪声，而是以一定概率使输入层节点的值清为0，这点与上篇博文介绍的dropout（Deep learning：四十一(Dropout简单理解)）很类似，只不过dropout作用在隐含层。此时输入到可视层的数据变为，隐含层输出为y，然后由y重构x的输出z，注意此时这里不是重构，而是x.

　　Bengio对dAE的直观解释为：1.dAE有点类似人体的感官系统，比如人眼看物体时，如果物体某一小部分被遮住了，人依然能够将其识别出来，2.多模态信息输入人体时（比如声音，图像等），少了其中某些模态的信息有时影响也不大。3.普通的autoencoder的本质是学习一个相等函数，即输入和重构后的输出相等，这种相等函数的表示有个缺点就是当测试样本和训练样本不符合同一分布，即相差较大时，效果不好，明显，dAE在这方面的处理有所进步。

　　当然作者也从数学上给出了一定的解释。

　　1. 流形学习的观点。一般情况下，高维的数据都处于一个较低维的流形曲面上，而使用dAE得到的特征就基本处于这个曲面上，如下图所示。而普通的autoencoder，即使是加入了稀疏约束，其提取出的特征也不是都在这个低维曲面上（虽然这样也能提取出原始数据的主要信息）。

　　 Deep learning：四十二(Denoise Autoencoder简单理解)

　　2.自顶向下的生成模型观点的解释。3.信息论观点的解释。4.随机法观点的解释。这几个观点的解释数学有一部分数学公式，大家具体去仔细看他的paper。

　　当在训练深度网络时，且采用了无监督方法预训练权值，通常，Dropout和Denoise Autoencoder在使用时有一个小地方不同：Dropout在分层预训练权值的过程中是不参与的，只是后面的微调部分引入；而Denoise Autoencoder是在每层预训练的过程中作为输入层被引入，在进行微调时不参与。另外，一般的重构误差可以采用均方误差的形式，但是如果输入和输出的向量元素都是位变量，则一般采用交叉熵来表示两者的差异。

　　实验过程：

　　实验一：

　　同样是用mnist手写数字识别数据库，训练样本数为60000，测试样本为10000，采用matlab的Deep Learning工具箱（https://github.com/rasmusbergpalm/DeepLearnToolbox），2个隐含层，每个隐含层节点个数都是100，即整体网络结构为：784-100-100-10. 实验对比了有无使用denoise技术时识别的错误率以及两种情况下学习到了的特征形状，其实验结果如下所示：

　　没采用denoise的autoencoder时特征图显示：

　　 Deep learning：四十二(Denoise Autoencoder简单理解)

　　测试样本误差率：9.33%

　　采用了denoise autoencoder时的特征图显示：

　　 Deep learning：四十二(Denoise Autoencoder简单理解)

　　测试样本误差率：8.26%

　　由实验结果图可知，加入了噪声后的自编码器学习到的特征要稍好些（没有去调参数，如果能调得一手好参的话，效果会更好）。

　　实验一主要部分的代码及注释：

　　Test.m:

%% //导入数据

load mnist_uint8;

train_x = double(train_x)/255;

test_x  = double(test_x)/255;

train_y = double(train_y);

test_y  = double(test_y);



%% //实验一：采用denoising autoencoder进行预训练

rng(0);

sae = saesetup([784 100 100]); % //其实这里nn中的W已经被随机初始化过

sae.ae{1}.activation_function       = 'sigm';

sae.ae{1}.learningRate              = 1;

sae.ae{1}.inputZeroMaskedFraction   = 0.;

sae.ae{2}.activation_function       = 'sigm';

sae.ae{2}.learningRate              = 1;

sae.ae{2}.inputZeroMaskedFraction   = 0.; %这里的denoise autocoder相当于隐含层的dropout,但它是分层训练的

opts.numepochs =   1;

opts.batchsize = 100;

sae = saetrain(sae, train_x, opts);% //无监督学习，不需要传入标签值，学习好的权重放在sae中，

                                    %  //并且train_x是最后一个隐含层的输出。由于是分层预训练

                                    %  //的，所以每次训练其实只考虑了一个隐含层，隐含层的输入有

                                    %  //相应的denoise操作

visualize(sae.ae{1}.W{1}(:,2:end)')

% Use the SDAE to initialize a FFNN

nn = nnsetup([784 100 100 10]);

nn.activation_function              = 'sigm';

nn.learningRate                     = 1;

%add pretrained weights

nn.W{1} = sae.ae{1}.W{1}; % //将sae训练好了的权值赋给nn网络作为初始值，覆盖了前面的随机初始化

nn.W{2} = sae.ae{2}.W{1};

% Train the FFNN

opts.numepochs =   1;

opts.batchsize = 100;

nn = nntrain(nn, train_x, train_y, opts);

[er, bad] = nntest(nn, test_x, test_y);

str = sprintf('testing error rate is: %f',er);

disp(str)





%% //实验二：采用denoising autoencoder进行预训练

rng(0);

sae = saesetup([784 100 100]); % //其实这里nn中的W已经被随机初始化过

sae.ae{1}.activation_function       = 'sigm';

sae.ae{1}.learningRate              = 1;

sae.ae{1}.inputZeroMaskedFraction   = 0.5;

sae.ae{2}.activation_function       = 'sigm';

sae.ae{2}.learningRate              = 1;

sae.ae{2}.inputZeroMaskedFraction   = 0.5; %这里的denoise autocoder相当于隐含层的dropout,但它是分层训练的

opts.numepochs =   1;

opts.batchsize = 100;

sae = saetrain(sae, train_x, opts);% //无监督学习，不需要传入标签值，学习好的权重放在sae中，

                                    %  //并且train_x是最后一个隐含层的输出。由于是分层预训练

                                    %  //的，所以每次训练其实只考虑了一个隐含层，隐含层的输入有

                                    %  //相应的denoise操作

figure,visualize(sae.ae{1}.W{1}(:,2:end)')

% Use the SDAE to initialize a FFNN

nn = nnsetup([784 100 100 10]);

nn.activation_function              = 'sigm';

nn.learningRate                     = 1;

%add pretrained weights

nn.W{1} = sae.ae{1}.W{1}; % //将sae训练好了的权值赋给nn网络作为初始值，覆盖了前面的随机初始化

nn.W{2} = sae.ae{2}.W{1};

% Train the FFNN

opts.numepochs =   1;

opts.batchsize = 100;

nn = nntrain(nn, train_x, train_y, opts);

[er, bad] = nntest(nn, test_x, test_y);

str = sprintf('testing error rate is: %f',er);

disp(str)

　　也可以类似于上篇博文跟踪Dropout代码一样，这里去跟踪下dAE代码。使用sae时将输入层加入50%噪声的语句：

　　sae.ae{1}.inputZeroMaskedFraction = 0.5;

　　继续跟踪到sae的训练过程，其训练过程也是采用nntrain()函数，里面有如下代码：

if(nn.inputZeroMaskedFraction ~= 0)



　　batch_x = batch_x.*(rand(size(batch_x))>nn.inputZeroMaskedFraction); % //在输入数据上加入噪声，rand()为0-1之间的均匀分布

　　代码一目了然。

　　实验二：

　　这部分的实验基本上就是网页教程上的：http://deeplearning.net/tutorial/dA.html，具体细节可以参考教程的内容，里面讲得比较详细。由于其dAE的实现是用了theano库，所以首先需要安装theano以及与之相关的一系列库，比如在ubuntu下安装就可以参考网页Installing Theano和Easy Installation of an optimized Theano on Ubuntu，很容易成功（注意在测试时有些不重要的小failure可以忽略掉）。下面是我安装theano时的各版本号：

　　ubuntu 13.04,linux操作系统.

　　python： 2.7.4，编程语言包.

　　python-numpy 1.7.1，python的数学运算包，包含矩阵运算.

　　python-scipy 0.11，有利于稀疏矩阵运算.

　　python-pip,1.1,python的包管理软件.　　

　　python-nose,1.1.2,有利于thenao的测试.

　　libopenblas-dev,0.2.6,用来管理头文件的.

　　git,1.8.1,用来下载软件版本的.

　　gcc,4.7.3,用来编译c的.

　　theano,0.6.0rc3,多维矩阵操作，优化，可与GPU结合的python库.

　　这个实验也是用的mnist数据库，不过只用了一个隐含层节点，节点个数为500. 实验目的只是为了对比在使用denoise前后的autoencoder学习到的特征形状的区别。

　　没用denoise时的特征：

　　 Deep learning：四十二(Denoise Autoencoder简单理解)

　　使用了denoise时的特征：

　　 Deep learning：四十二(Denoise Autoencoder简单理解)

　　由图可见，加入了denoise后学习到的特征更具有代表性。

　　实验二主要部分的代码及注释：

　　dA.py:

#_*_coding:UTF-8_*_
import cPickle

import gzip

import os

import sys

import time

import numpy

import theano

import theano.tensor as T #theano中一些常见的符号操作在子库tensor中

from theano.tensor.shared_randomstreams import RandomStreams

from logistic_sgd import load_data

from utils import tile_raster_images

import PIL.Image #绘图所用



class dA(object):

    def __init__(self, numpy_rng, theano_rng=None, input=None,

                 n_visible=784, n_hidden=500,

                 W=None, bhid=None, bvis=None):

        self.n_visible = n_visible

        self.n_hidden = n_hidden

        if not theano_rng:

            theano_rng = RandomStreams(numpy_rng.randint(2 ** 30))

        if not W:

            initial_W = numpy.asarray(numpy_rng.uniform(

                      low=-4 * numpy.sqrt(6. / (n_hidden + n_visible)),

                      high=4 * numpy.sqrt(6. / (n_hidden + n_visible)),

                      size=(n_visible, n_hidden)), dtype=theano.config.floatX)

            W = theano.shared(value=initial_W, name='W', borrow=True) #W,bvis,bhid都为共享变量

        if not bvis:

            bvis = theano.shared(value=numpy.zeros(n_visible, dtype=theano.config.floatX), borrow=True)

        if not bhid:

            bhid = theano.shared(value=numpy.zeros(n_hidden, dtype=theano.config.floatX), name='b', borrow=True)

        self.W = W

        self.b = bhid

        self.b_prime = bvis

        self.W_prime = self.W.T

        self.theano_rng = theano_rng

        if input == None:

            self.x = T.dmatrix(name='input')

        else:

            self.x = input #保存输入数据

        self.params = [self.W, self.b, self.b_prime]



    def get_corrupted_input(self, input, corruption_level):

        return  self.theano_rng.binomial(size=input.shape, n=1,

                                         p=1 - corruption_level,

                                         dtype=theano.config.floatX) * input #binomial()函数为产生0，1的分布，这里是设置产生1的概率为p



    def get_hidden_values(self, input):

        return T.nnet.sigmoid(T.dot(input, self.W) + self.b)



    def get_reconstructed_input(self, hidden):

        return  T.nnet.sigmoid(T.dot(hidden, self.W_prime) + self.b_prime)



    def get_cost_updates(self, corruption_level, learning_rate): #每调用该函数一次，就算出了前向传播的误差cost，网络参数及其导数

        tilde_x = self.get_corrupted_input(self.x, corruption_level)

        y = self.get_hidden_values(tilde_x)

        z = self.get_reconstructed_input(y)

        L = - T.sum(self.x * T.log(z) + (1 - self.x) * T.log(1 - z), axis=1)

        cost = T.mean(L)

        gparams = T.grad(cost, self.params)

        updates = []

        for param, gparam in zip(self.params, gparams):

            updates.append((param, param - learning_rate * gparam)) #append列表中存的是参数和其导数构成的元组

        return (cost, updates)



# 测试函数

def test_dA(learning_rate=0.1, training_epochs=15,

            dataset='data/mnist.pkl.gz',

            batch_size=20, output_folder='dA_plots'):

    datasets = load_data(dataset)

    train_set_x, train_set_y = datasets[0] #train_set_x矩阵中每一行代表一个样本

    n_train_batches = train_set_x.get_value(borrow=True).shape[0] / batch_size #求出batch的个数

    index = T.lscalar()    # index to a [mini]batch

    x = T.matrix('x')  # the data is presented as rasterized images

    if not os.path.isdir(output_folder):

        os.makedirs(output_folder)

    os.chdir(output_folder)



    # 没有使用denoise时

    rng = numpy.random.RandomState(123)

    theano_rng = RandomStreams(rng.randint(2 ** 30))

    da = dA(numpy_rng=rng, theano_rng=theano_rng, input=x,

            n_visible=28 * 28, n_hidden=500) # 创建dA对象时，并不需要数据x，只是给对象da中的一些网络结构参数赋值

    cost, updates = da.get_cost_updates(corruption_level=0.,

                                        learning_rate=learning_rate)

    train_da = theano.function([index], cost, updates=updates, #theano.function()为定义一个符号函数，这里的自变量为indexy

         givens={x: train_set_x[index * batch_size: (index + 1) * batch_size]}) #输出变量为cost

    start_time = time.clock()

    for epoch in xrange(training_epochs):

        c = []

        for batch_index in xrange(n_train_batches):

            c.append(train_da(batch_index))

        print 'Training epoch %d, cost ' % epoch, numpy.mean(c)

    end_time = time.clock()

    training_time = (end_time - start_time)

    print >> sys.stderr, ('The no corruption code for file ' +

                          os.path.split(__file__)[1] +

                          ' ran for %.2fm' % ((training_time) / 60.))

    image = PIL.Image.fromarray(

        tile_raster_images(X=da.W.get_value(borrow=True).T,

                           img_shape=(28, 28), tile_shape=(10, 10),

                           tile_spacing=(1, 1)))

    image.save('filters_corruption_0.png')



    # 使用了denoise时

    rng = numpy.random.RandomState(123)

    theano_rng = RandomStreams(rng.randint(2 ** 30))

    da = dA(numpy_rng=rng, theano_rng=theano_rng, input=x,

            n_visible=28 * 28, n_hidden=500)

    cost, updates = da.get_cost_updates(corruption_level=0.3,

                                        learning_rate=learning_rate) #将输入样本每个像素点以30%的概率被清0

    train_da = theano.function([index], cost, updates=updates,

         givens={x: train_set_x[index * batch_size:

                                  (index + 1) * batch_size]})

    start_time = time.clock()

    for epoch in xrange(training_epochs):

        c = []

        for batch_index in xrange(n_train_batches):

            c.append(train_da(batch_index))

        print 'Training epoch %d, cost ' % epoch, numpy.mean(c)

    end_time = time.clock()

    training_time = (end_time - start_time)

    print >> sys.stderr, ('The 30% corruption code for file ' +

                          os.path.split(__file__)[1] +

                          ' ran for %.2fm' % (training_time / 60.))

    image = PIL.Image.fromarray(tile_raster_images(

        X=da.W.get_value(borrow=True).T,

        img_shape=(28, 28), tile_shape=(10, 10),

        tile_spacing=(1, 1)))

    image.save('filters_corruption_30.png')

    os.chdir('../')



if __name__ == '__main__':

    test_dA()

　　其中与dAE相关的代码为：

def get_corrupted_input(self, input, corruption_level):

      return self.theano_rng.binomial(size=input.shape, n=1,p=1 - corruption_level,\

             dtype=theano.config.floatX) * input #binomial()函数为产生0，1的分布，这里是设置产生1的概率

　　参考资料：

　　Vincent, P., et al. (2008). Extracting and composing robust features with denoising autoencoders. Proceedings of the 25th international conference on Machine learning, ACM.

https://github.com/rasmusbergpalm/DeepLearnToolbox

http://deeplearning.net/tutorial/dA.html

Deep learning：四十一(Dropout简单理解)

Installing Theano

Easy Installation of an optimized Theano on Ubuntu

BART&BERT Ambition_LAO 深度学习
BART和BERT都是基于Transformer架构的预训练语言模型。模型架构：BERT(BidirectionalEncoderRepresentationsfromTransformers)主要是一个编码器（Encoder）模型，它使用了Transformer的编码器部分来处理输入的文本，并生成文本的表示。BERT特别擅长理解语言的上下文，因为它在预训练阶段使用了掩码语言模型（MLM）任务，即
python的request请求401_Python模拟HTTPS请求返回HTTP 401 unauthorized错误 weixin_39599372
Python模拟HTTPS请求返回HTTP401unauthorized错误开始是使用的httplib模块，代码如下：header={"Content-type":"application/json","Accept":"*/*"}params={‘source‘:‘en‘,‘target‘:‘es‘,‘text‘:match.group(1)}data=urllib.urlencode(para
python使用MD5 18.程序员哈希算法算法
一、要使用Python进行MD5加密，可以使用Python标准库中的hashlib模块。二、案例importhashlibstring="Hello,World!"#要进行加密的字符串hash_object=hashlib.md5(string.encode())#将字符串编码并进行MD5加密hash_hex=hash_object.hexdigest()#获取加密后的十六进制字符串print(h
使用ffmpeg将pcm格式音频转化为mp3格式音频布丁小站 ffmpeg pcm 音视频
voidAudioCode::ENcode(AVCodecContext*cdc_ctx,AVFrame*frame,AVPacket*pkt){intret=0;/*sendtheframeforencoding*/ret=avcodec_send_frame(cdc_ctx,frame);if(ret=0){ret=avcodec_receive_packet(cdc_ctx,pkt);if(
iOS使用SDWebview加载图片失败？ AnderQZ
今天调试遇到一个很无奈的问题，就是出现了image无法加载出来。最后才发现是图片使用了中文命名，真TM的坑！SDWebimage没办法识别中文，必须要encode才行！
vue axios跨域访问相关问题 | axios默认发送‘application/x-www-form-urlencoded‘格式数据 | Content-Type is not allowed b 就是爱吃肉ro #Vue &uni-app axios ajax cors跨域 vue x-www-form-url
文章目录概述报错1Content-TypeisnotallowedbyAccess-Control-Allow-Headersinpreflightrespon报错2返回状态码500好久没更博客了,最近一直搞框架搞项目,好多问题也都没有记录下来…好吧,那从今天起来,继续开始保持记录的好习惯,先写一下在axios上踩下了这么多坑.概述通过以下两个报错,来介绍解决使用axios来进行网络请求中的遇到的
python--排错--AttributeError: 'str' object has no attribute 'decode'，关于python3的字符串我不是庸医 python 排错记录
AttributeError:'str'objecthasnoattribute'decode'一般是因为str的类型本身不是bytes，所以不能解码两个概念:普通str：可理解的语义字节流str（bytes）（0101010101，可视化显示）两个语法Encode:把普通字符串转为机器可识别的bytesDecode:把bytes转为字符串两个差异Python3的str默认不是bytes，所以不能
VUE在线预览word、pdf、excel等文档菜鸟程序猿、 vue.js pdf 前端
http://www.pfile.com.cn/api/profile/onlinePreview?url=(需要在线查看的文档地址)vue代码window.open('http://www.pfile.com.cn/api/profile/onlinePreview?url='+encodeURIComponent(“需要在线查看的文档地址”));文档参考：http://www.pfile.co
【Tools】大模型中的BERT概念音乐学家方大刚工具 bert 人工智能深度学习
摇来摇去摇碎点点的金黄伸手牵来一片梦的霞光南方的小巷推开多情的门窗年轻和我们歌唱摇来摇去摇着温柔的阳光轻轻托起一件梦的衣裳古老的都市每天都改变模样方芳《摇太阳》BERT（BidirectionalEncoderRepresentationsfromTransformers）是一种基于Transformer的预训练语言模型，由Google于2018年发布。BERT的目标是通过大规模无监督预训练学习来
Transformer模型：WordEmbedding实现 Galaxy.404 Transformer transformer 深度学习人工智能 embedding
前言最近在学Transformer，学了理论的部分之后就开始学代码的实现，这里是跟着b站的up主的视频记的笔记，视频链接：19、Transformer模型Encoder原理精讲及其PyTorch逐行实现_哔哩哔哩_bilibili正文首先导入所需要的包：importtorchimportnumpyasnpimporttorch.nnasnnimporttorch.nn.functionalasF关
【算法】leetcode394. 字符串解码（辅助栈法）岚清子 leetcode python leetcode python 字符串辅助栈
问题来源leetcode394.字符串解码394.字符串解码给定一个经过编码的字符串，返回它解码后的字符串。编码规则为:k[encoded_string]，表示其中方括号内部的encoded_string正好重复k次。注意k保证为正整数。你可以认为输入字符串总是有效的；输入字符串中没有额外的空格，且输入的方括号总是符合格式要求的。此外，你可以认为原始数据不包含数字，所有的数字只表示重复的次数k，例
python怎么解码成字符串_python字符串怎么解码？ weixin_39619478 python怎么解码成字符串
python字符串解码的方法：python中可以使用decode()方法对字符串进行解码。python中可以使用encode()方法将字符串转换为bytes类型，此过程称为“编码”。decode()方法用于将bytes类型的二进制数据转换为str类型，这个过程也称为“解码”。decode()方法的语法格式如下：bytes.decode([encoding="utf-8"][,errors="str
加载pkl文件，Python报错AttributeError: Can‘t get attribute ‘DeepFM‘ on ＜module ‘__main__‘ from...＞ Zerol_Yan Python基础 python
背景模型同学发过来的pkl格式的模型，在系统中加载的时候，报错AttributeError:module'__main__'hasnoattribute'LabelEncoderExt'，尝试了很多种方式，最后终于解决了这个问题，记录一下，以后遇到类似的可以做参考。项目代码及结构app.pyfrominitimportappimportjsonfromflaskimportrequest@app.
auto encoder war3gu 深度学习
Deepauto-encoder与受限玻尔兹曼机有点像，都可以进行信息的压缩，都可以用作pre-trainning.区别在于受限玻尔兹曼机是无向图模型，而Deepauto-encoder是一种神经网络,中间特别窄的bottleneck的数据作为压缩的codeencoder与decoder的参数可以相互独立，也可以互为逆数字图片auto-encoder，越是deep的auto-encoder，压缩出
自动编码器 - Autoencoder hellozhxy 深度学习人工智能机器学习
文章目录一、自编码器（Autoencoder）简单模型介绍二、神经网络自编码模型三、神经网络自编码器三大特点四、自编码器（Autoencoder）搭建五、几种常见编码器1.堆栈自动编码器2.欠完备自编码器3.正则自编码器4.噪自编码器（denoisingautoencoder,DAE）参考链接一、自编码器（Autoencoder）简单模型介绍暂且不谈神经网络、深度学习等，仅仅是自编码器的话，其原理
Autoencoder chuange6363 人工智能 python
自编码器Autoencoder稀疏自编码器SparseAutoencoder降噪自编码器DenoisingAutoencoder堆叠自编码器StackedAutoencoder本博客是从梁斌博士的博客上面复制过来的，本人利用Tensorflow重新实现了博客中的代码深度学习有一个重要的概念叫autoencoder，这是个什么东西呢，本文通过一个例子来普及这个术语。简单来说autoencoder是一
python公众号文章_python采集微信公众号文章 Coming May python公众号文章
本文实例为大家分享了python采集微信公众号文章的具体代码，供大家参考，具体内容如下在python一个子目录里存2个文件，分别是：采集公众号文章.py和config.py。代码如下：1.采集公众号文章.pyfromurllib.parseimporturlencodeimportpymongoimportrequestsfromlxml.etreeimportXMLSyntaxErrorfrom
【python实用性】文件系统基本讲解及用法: “增删改查“ 黄小莫 python
文章目录一.增：创建文件二.删：删除文件三.改：修改文件四.查：查看文件系统一.增：创建文件创建脚本文件（例如:.txt、.js、.json、.py等）使用withopen(file=‘’,mode=‘w’,encode=‘’)方法进行mode=‘w’/mode=‘a’:表示在文件不存在的时候，会自动创建新文件encode：常用的格式是UTF-8格式importjsonwithopen('test
Python用PIL将PNG图像合成gif时如果背景为透明时图像出现重影的解决办法 orange_wrj python PIL
最近在用PIL合成PNG图像为GIF时，因为需要透明背景，所以就用putpixel的方法替换背景为透明，但是在合成GIF时，图像出现了重影，在网上查找了GIF的相关资料：GIF相关资料其中有对GIF帧数处理的说明，需要在GIF图像的header中设置disposal的处置方法然后我们可以查看PIL库中关于GIF的定义文件GifImagePlugin.pydisposal=int(im.encode
python MultipartEncoder request 报错 Required request part ‘file‘ is not present 只想做打工人学习 vue.js
pythonMultipartEncoderrequest报错Requiredrequestpart‘file’isnotpresent今天在处理一个python做post请求的小工具，是要post一个文件,由于’Content-Type’:‘multipart/form-data’,代码类似这个样子multipart_encoder=MultipartEncoder(fields={"file"
python的正则匹配 CharlieBrownn python
defFilterTranslate(source):source.encode()temp=sourcexx=u"([\s\u30a0-\u30ff\u3040-\u309f\u4e00-\u9fa5\u3000-\u303f\ufb00-\ufffd\u0030-\u0039\u0041-\u005a\u0061-\u007a]+)"#日文片假名日文片假名中文标点符号数字大写字母小写patte
ClickHouse 二进制特征值怎么转化为字符串树下水月 clickhouse
要将二进制特征值转化为字符串，可以使用以下方法：1.使用base64编码base64是一种将二进制数据编码为ASCII字符串的方法。在ClickHouse中，可以使用函数base64Encode()来将二进制特征值转化为base64编码的字符串。例如：SELECTbase64Encode(feature)FROMmy_table;2.使用hex编码hex是一种将二进制数据转化为十六进制字符串的方法
http请求特殊字符转码一阵可爱风
Java使用URLEncoder.encode和URLDecoder.decode编解码(utf-8)中文及特殊字符1、URLEncoder.encode和URLDecoder.decodeURL只能使用英文字母、阿拉伯数字和某些标点符号，不能使用其他文字和符号，即只有字母和数字[0-9a-zA-Z]、一些特殊符号$-_.+!*'()[不包括双引号]、以及某些保留字（空格转换为+），才可以不经过编
Transformer+目标检测，这一篇入门就够了 BIT可达鸭 ▶深度学习-计算机视觉 transformer 深度学习目标检测计算机视觉自然语言处理
VisionTransformerforObjectDetection本文作者：Encoder-Decoder简介：Encoder-Decoder的缺陷：Attention机制：Self-Attention机制：Multi-HeadAttention：Transformer结构：图像分类之ViT：图像分类之PyramidViT：目标检测之DETR：目标检测之DeformableDETR：本文作者：
java base64加密和解密勇敢的小提莫 java jvm spring
importjava.nio.charset.StandardCharsets;importjava.util.Base64;publicclassBase64Util{finalstaticBase64.Encoderencoder=Base64.getEncoder();finalstaticBase64.Decoderdecoder=Base64.getDecoder();publicsta
小程序web-view页面部分手机打开空白问题 jing_bao
初写小程序，记录下开发过程中遇到的部分手机打开web-view页面空白，以及web-view页面分享空白页的问题，以及解决方法。出现场景：当web-view加载的页面中存在中文字符时，会出现此问题。原因：部分ios手机打开web-view页面，并没有进行encodeURI编码；在使用encodeURI编码后，页面可打开，但进行微信小程序分享时，会再自行encode一次，导致部分ios解码不成功，分
解决UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: weixin_33928467 python 数据库
2019独角兽企业重金招聘Python工程师标准>>>字符串在Python内部的表示是unicode编码，因此，在做编码转换时，通常需要以unicode作为中间编码，即先将其他编码的字符串解码（decode）成unicode，再从unicode编码（encode）成另一种编码。Decode的作用是将其他编码的字符串转换成unicode编码，如str1.decode('gb2312')，表示将gb2
SpringCloud集成ELK echola_mendes ELK spring cloud elk java
1、添加依赖net.logstash.logbacklogstash-logback-encoder6.12、在logback-spring.xml中添加配置信息（logback-spring.xml在文末）192.168.2.203:4560............192.168.2.203:4560对应搭建的Logstash地址Logback日志打印由于SpringBoot项目在引用了sprn
【深入理解计算机系统】三：布尔逻辑与组合电路 Geeksongs javascript vue jquery java spring boot
4.1.BooleanExpressionsToday’sdigitalcircuitsarebuiltsothattheycanperformveryfastoperationsoverdatathatisencodedinbinary.TheunderlyingoperationsarepartofwhatisknownasBooleanAlgebra.Thisalgebraconsistso
python 加密解密 weixin_34194359 python 开发工具
1.使用base64s1=base64.encodestring('helloworld')s2=base64.decodestring(s1)prints1,s2结果aGVsbG8gd29ybGQ=helloworldBase64编码，64指A-Z、a-z、0-9、+和/这64个字符，还有“=”号不属于编码字符，而是填充字符。为什么发明这么个编码呢，这个编码的原理很简单，“破解”也很容易，原因是
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include

Deep learning：四十二(Denoise Autoencoder简单理解)

你可能感兴趣的:(encode)