hearthougan

人工神经网络

一、神经网络的模型：

图1 两层全连接神经网络模型

这个是一个带有两个全连接层的神经网络，神经网络，一般不把输入层算在层数之中。

1、神经元：

图2 神经元的数学模型

从单个神经元来看，每个神经元可以看做是一个感知机，可以用来做决策，从图中可以看出，根据输入的线性组合，经过函数f来预测，比如Sigmoid函数，当输出值大于0.5的时候可以判定为正类，当输出值小于0.5的时候，可以判定为负类。这像什么？逻辑回归！举个神经元的例子：

图3 神经元示例

2、激活函数

激活函数有很多种类，比如，线性函数、Sigmoid函数、tanh函数、ReLU函数等，本文只列举三个类型的激活函数：

图4 Sigmoid函数和tanh函数

Sigmoid函数和tanh函数，有一个共同的问题就是，当数据很大的时候，就是图中两个所指的方向，在反向传播的过程中，会导致梯度消失。神经元的激活值在0或者1附近的时候，梯度几乎为零，那么在反向传播的时候梯度就会被“杀死”。其实很好理解，在两个所指方向上，函数越来越趋于水平，因此在求导的时候，所得梯度为0或者很小---近似于0，这样在反向传播的时候，梯度就为零了（或者近似于0），因此梯度就消失了，权重就无法更新，因此这两个函数在神经网络中不在常用。但是相比较而言tanh比Sigmoid函数要更受欢迎，因为tanh的数据输出是中心化的。

图5 ReLU函数

ReLU的优缺点图中已经的说明，但是对于缺点，我的理解是：当有一个特别大的梯度经过的时候，权重会被更新为一个特别小的负数（比如负无穷），那么当再次经过该神经元的时候，该神经元的输入值为负数，那么ReLU输出值就是0了，但是依旧会有梯度来更新对应权重，但是更新的值不足以让该神经元的输入值为正（就好比一个负无穷加上一个整数N，它依旧是一个很小的数），那么这样就会导致该神经元的不可逆转的失活。

那么到此可以对神经网络有一个理解：可以认为神经网络定义了一个由一系列的函数组成的函数族，网络的权重就是函数中的参数，神经经网络可以近似任何函数。（这个是被证明了的）。

二、前向传播和反向传播：

前向传播很简单，如下一个例子：

图6 神经网络示例

蓝色数字代表对应权重和偏值的数值，我们的目标是让这神经网络输出值为0.5或者非常接近0.5.

计算隐藏层神经元h1的输入，0.15 * 0.05 + 0.2 * 0.1 + 0.35 = 0.38，h1的输出：f(0.38) = 0.59，其中f为Sigmoid函数，同理可以计算出神经元h2的输入和输出。于是有下图：

图7 前向传播示例

由于输出值为0.63，不是我们想要的0.5，最起码不太接近0.5，那么我们就要更新权重和偏值，训练神经网络的目的就是训练权重和偏值，他们使得网络输出我们想要的结果。那么如何来更新权重呢？采用反向传播的方法，反向传播其实很简单，说白一点就是一系列的链式求导，本文不准备讲理论推到，具体的理论推到请看：

http://blog.csdn.net/hearthougan/article/details/55812728

我也不建议只看理论推到，看懂了，不如找一个小例子实际推到一番来的透彻，本文只简单讲一下如何的反向传播，比如我们现在得到了损失，也有了损失函数，我们要更新w5、w6、和b3，要更新他们，就要分别求出它们的梯度，现以求w5的梯度来说明，如下图：

图8 反向传播示例

w5如果懂了，其他的也就是知道了。假设学习率为0.5，那么最后更新权重为：

三、在CIFAR10和MNIST数据集上的实验结果

为了试验神经网络的效果我在，CIFAR10和MNIST上各测试了一下，MNIST的准确率为97.2%，而CIFAR10只有52%，但是相比较SVM和Softmax，神经网络的正确率还是提高了很多，之所以在CIFAR10上的正确率不高，个人认为它的图片背景更加复杂，图片为三通道的，而MNIST的图片背景就比较简单而且是单通道的。

本实验总共采用了75次寻参，其中隐藏层神经元的个数有[50, 75, 100]三类，每一类寻参（学习率和正则项）过程中，第一层权重W1的样子，和对应的损失以及在训练集合验证集上的正确率，现以gif的形式呈现：

1、现展示CIFAR10：

图9 50个神经元对应的W1和50个神经元寻参时对应的损失和正确率

图10 75个神经元对应的W1和75个神经元寻参时对应的损失和正确率

图11 100个神经元对应的W1和100个神经元寻参时对应的损失和正确率

在CIFAR10数据集上整个寻参之后，得到的最优W1和对应的损失以及正确率如下：

图12 最优参数显示

在寻到最优参数之后，在测试集上的正确率为52%

MNIST数据集显示：

（Sorry）MNIST数据集的gif超过2M，无法上传，只贴一张最优参数的静态图图吧：

在测试集上的正确率97.2%

全连接代码：

# -*- coding: utf-8 -*-
"""
Created on Fri May 19 23:23:42 2017

@author: Abner
"""

import numpy as np
import matplotlib.pyplot as plt


class TwoLayerNet(object):
    """
    一个两层的全连接神经网络，输入层的神经元的个数为D，隐藏层的神经元的个数为：H，
    输出层神经元的个数为C,利用Softmax损失函数和L2正则项来训练神经网络，第一个
    全连接层的激活函数为ReLU
    
    网络的结构为：
    输入层 - 全连接层（第一个隐藏层） - ReLU - 全连接层（输出层） - Softmax
    
    第二全连接层是输出层，输出的结果就是每个类别的得分。
    """
    def __init__(self, input_size, hidden_size, output_size, std = 1e-4):
        """
        初始化模型：
        权重被初始化很小的随机值，偏值被初始化为0，权重和偏值存放在self.params中，
        params是一个字典结构：
        
        W1:第一个全连接层的权重，大小为：(D, H)
        b1:第一层的偏值，大小为：(H,)
        W2:第二个全连接层的权重，大下为：(H, C)
        b2:第二层的偏值，大小为：(C,)
        
        input_size:输入层的维数，D
        hidden_size:隐藏层神经元的个数，H
        output_size:输出层类别数，C
        
        """
        self.params = {}
        self.params['W1'] = std * np.random.rand(input_size, hidden_size)
        self.params['b1'] = np.zeros(hidden_size)
        self.params['W2'] = std * np.random.rand(hidden_size, output_size)
        self.params['b2'] = np.zeros(output_size)
    
    
    def loss(self, X, y = None, reg = 0.0):
        """
        计算两层全连接神经网络的损失和梯度。
        
        输入：
        X：数据的输入大小为(N, D)，每个X[i]是一个样本
        y: 训练样本标签，y[i]是X[i]对应的标签，参数y是可选择的，如果没有对y传参，
        那么该损失函数只返回得分；如果传参，那么loss就返回损失和梯度。
        reg:正则系数
        
        返回：
        如果y为空，返回一个大小为(N, C)的scores矩阵，其中scores[i, c]是样本X[i]是类别
        c时的得分。
        
        如果y不为空,那么就返回一个元组：
        -loss:每批训练样本的损失，数据损失和正则损失
        -grads：一个字典，存放的是权重（或者是偏值）和其对应的梯度
        
        """
    
        W1, b1 = self.params['W1'], self.params['b1']
        W2, b2 = self.params['W2'], self.params['b2']
        N, D = X.shape
        
        #计算前向传播
        scores = None
        
        f = lambda x : np.maximum(0, x)
        h1 = f(np.dot(X, W1) + b1)
        h2 = np.dot(h1, W2) + b2
        
        scores = h2
        
        if y is None:
            return scores
        
        loss = None
        shift_scores = scores - np.max(scores, axis = 1).reshape(-1, 1)
        softmax_output = np.exp(shift_scores)/np.sum(np.exp(shift_scores), axis = 1).reshape(-1, 1)
        loss = -np.sum(np.log(softmax_output[range(N), list(y)]))
        loss /= N
        loss += reg * 0.5 * (np.sum(W1 * W1) + np.sum(W2 * W2))
        
        #反向传播，计算梯度
        grads = {}
        """
        计算反向传播，对权重和偏值进行求导，然后存放在一个字典中 ，比如，grads['W1']
        应该存放W1的梯度，grads的梯度应该和W1的大小是相同的,grads['b1']与b1的大小
        是相同的。
        """
        #得分对应损失函数的梯度
        descores = softmax_output.copy()#N*C
        descores[range(N), list(y)] -= 1#N*C
        grads['W2'] = 1.0/N * h1.T.dot(descores) + reg * W2#H*C
        grads['b2'] = 1.0/N * np.sum(descores, axis = 0)#C*1
        
        dh1 = descores.dot(W2.T)#N*H
        dh1_ReLU = (X.dot(W1) + b1 > 0) * dh1#N*H
        grads['W1'] = 1.0/N * X.T.dot(dh1_ReLU) + reg * W1#D*H
        grads['b1'] = 1.0/N * np.sum(dh1_ReLU, axis = 0)#H*!
        
        return loss, grads
    
    def train(self, X, y, X_val, y_val, learning_rate = 1e-3,
              learning_rate_decay = 0.95, reg = 1e-5, num_iters = 100,
              batch_size = 200, verbose = False):
        """
        训练神经网络，利用随机梯度
        输入：
        X:(N,D)
        y:(N,)
        X_val:给定的验证数据集，(N_val, D)
        y_val:给定验证集的标签，(N_val,)
        learning_rate:最优化时候的步长
        learning_rate_decay:用于每个epoch学习率减少的标量值
        reg:正则强度
        num_iters:最优化时迭代的次数
        batch_size:每批样本的个数
        verbose:布尔值，如果为真，就打印最优化的过程
        """
        
        num_train = X.shape[0]
        iterations_per_epoch = max(num_train/batch_size, 1)
        
        #使用随机梯度（SGD）来最优化self.model中的参数
        loss_history = []
        train_acc_history = []
        val_acc_history = []
        
        for it in range(num_iters):
            X_batch = None
            y_batch = None
        
            """
            TODO:
            创建一个训练数据集和对应标签的随机minibatch，并把他们分别储存在X_batch和y_batch
            """
        
            idx = np.random.choice(num_train, batch_size, replace = True)
            X_batch = X[idx]
            y_batch = y[idx]
        
            #利用当前的minibatch来计算损失和梯度
            loss, grads = self.loss(X_batch, y = y_batch, reg = reg)
            loss_history.append(loss)
            
            """
            TODO:
                利用self.params中的梯度来更新网络中的参数
            """
            self.params['W1'] = self.params['W1'] - learning_rate*grads['W1']
            self.params['W2'] = self.params['W2'] - learning_rate*grads['W2']
            self.params['b1'] = self.params['b1'] - learning_rate*grads['b1']
            self.params['b2'] = self.params['b2'] - learning_rate*grads['b2']
            
            if verbose and it % 100 == 0:
                print 'iteratrion %d / %d: loss %f' % (it, num_iters, loss)
            
            #每个epoch检查训练、验证集上的准确率，以及缩减学习率
            if it % iterations_per_epoch == 0:
                #检验正确率
                train_acc = (self.predict(X_batch) == y_batch).mean()
                val_acc = (self.predict(X_val) == y_val).mean()
                train_acc_history.append(train_acc)
                val_acc_history.append(val_acc)
                
                #缩减学习率
                learning_rate *= learning_rate_decay
        return {
            'loss_history':loss_history,
            'train_acc_history':train_acc_history,
            'val_acc_history':val_acc_history,
        }
    def predict(self, X):
        """
        利用已经训练好权重的两层全连接神经网络训来预测数据的标签，对于每一数据我们预测
        C个类别的得分，然后把得分最高的标签定位数据的标签。
        
        输入：
        - X输入数据,N*D
        返回：
        - y_pred:给定数据集对应的预测标签
        """
        
        y_pred = None
        
        f = lambda x: np.maximum(0, x)
        h1 = f(np.dot(X, self.params['W1']) + self.params['b1'])
        h2 = np.dot(h1, self.params['W2']) + self.params['b2']
        scores = h2
        
        y_pred = np.argmax(scores, axis = 1)
        
        return y_pred

导入数据CIFAR10数据集：

# -*- coding: utf-8 -*-
"""
Created on Sun May  7 19:32:30 2017

@author: admin
"""
import numpy as np
import pickle
import os

def Load_CIFAR_Batch(filename):
    with open(filename, 'rb') as f:
        datadict = pickle.load(f)
        X = datadict['data']
        Y = datadict['labels']
        X = X.reshape(10000, 3, 32, 32).transpose(0, 2, 3, 1).astype('float')#1000*32*32*3
        Y = np.array(Y)
        return X, Y

def Load_CIFAR10(Root):
    xs = []
    ys = []
    
    for b in range(1,  6):
        f = os.path.join(Root, 'data_batch_%d'%(b, ))
        X, Y = Load_CIFAR_Batch(f)
        xs.append(X)
        ys.append(Y)
    Xtr = np.concatenate(xs)
    Ytr = np.concatenate(ys)
    
    del X, Y
    Xte, Yte = Load_CIFAR_Batch(os.path.join(Root, 'test_batch'))
    return Xtr, Ytr, Xte, Yte

导入MNIST数据集：

# -*- coding: utf-8 -*-
"""
Created on Sun May 21 16:58:49 2017

@author: Abner
"""

'''
    使用python解析二进制文件
'''
import numpy as np
import cPickle as pickle
import struct



def Load_MNIST(Data_dir,label_dir):
    """
    读取数据
    """
    binfile = open(Data_dir, 'rb') # 读取二进制文件
    buffers = binfile.read()

    head = struct.unpack_from('>IIII', buffers, 0) # 取前4个整数，返回一个元组

    offset = struct.calcsize('>IIII')  # 定位到data开始的位置
    imgNum = head[1]
    width = head[2]
    height = head[3]

    bits = imgNum * width * height  # data一共有60000*28*28个像素值
    bitsString = '>' + str(bits) + 'B'  # fmt格式：'>47040000B'

    imgs = struct.unpack_from(bitsString, buffers, offset) # 取data数据，返回一个元组

    binfile.close()
    imgs = np.reshape(imgs, [imgNum, width * height]) # reshape为[60000,784]型数组
    """"
    读取Label
    """
    binfile = open(label_dir, 'rb') # 读二进制文件
    buffers = binfile.read()

    head = struct.unpack_from('>II', buffers, 0) # 取label文件前2个整形数

    labelNum = head[1]
    offset = struct.calcsize('>II')  # 定位到label数据开始的位置

    numString = '>' + str(labelNum) + "B" # fmt格式：'>60000B'
    labels = struct.unpack_from(numString, buffers, offset) # 取label数据

    binfile.close()
    labels = np.reshape(labels, [labelNum]) # 转型为列表(一维数组)
    
    return imgs, labels
    
def Load_MNIST_Data():
    train_path_lable_dir = 'MNIST\\train-labels.idx1-ubyte'
    train_path_Data_dir = 'MNIST\\train-images.idx3-ubyte'
    test_path_Data_dir = 'MNIST\\t10k-images.idx3-ubyte'
    test_path_lable_dir = 'MNIST\\t10k-labels.idx1-ubyte'
    
    Xtr, ytr = Load_MNIST(train_path_Data_dir ,train_path_lable_dir)
    Xte, yte = Load_MNIST(test_path_Data_dir, test_path_lable_dir)
    
    return Xtr, ytr, Xte, yte

"""
if __name__ == "__main__":
    Xtr, ytr, Xte, yte = Load_MNIST_Data()

    print("Xtr: ", Xtr.shape)
    print("ytr: ", ytr.shape)

    print('----------我是分割线-----------')

    print("Xte: ", Xte.shape)
    print("yte: ", yte.shape)
"""

权重可视化：

# -*- coding: utf-8 -*-
"""
Created on Sun May 21 19:08:24 2017

@author: Abner
"""

from math import sqrt, ceil
import numpy as np

def visualize_grid(Xs, ubound=255.0, padding=1):
  """
  Reshape a 4D tensor of image data to a grid for easy visualization.

  Inputs:
  - Xs: Data of shape (N, H, W, C)
  - ubound: Output grid will have values scaled to the range [0, ubound]
  - padding: The number of blank pixels between elements of the grid
  """
  (N, H, W, C) = Xs.shape
  grid_size = int(ceil(sqrt(N)))
  grid_height = H * grid_size + padding * (grid_size - 1)
  grid_width = W * grid_size + padding * (grid_size - 1)
  grid = np.zeros((grid_height, grid_width, C))
  next_idx = 0
  y0, y1 = 0, H
  for y in xrange(grid_size):
    x0, x1 = 0, W
    for x in xrange(grid_size):
      if next_idx < N:
        img = Xs[next_idx]
        low, high = np.min(img), np.max(img)
        grid[y0:y1, x0:x1] = ubound * (img - low) / (high - low)
        # grid[y0:y1, x0:x1] = Xs[next_idx]
        next_idx += 1
      x0 += W + padding
      x1 += W + padding
    y0 += H + padding
    y1 += H + padding
  return grid

def visualize_grid1(Xs, ubound=255.0, padding=1):
  """
  Reshape a 4D tensor of image data to a grid for easy visualization.

  Inputs:
  - Xs: Data of shape (N, H, W)
  - ubound: Output grid will have values scaled to the range [0, ubound]
  - padding: The number of blank pixels between elements of the grid
  """
  (N, H, W) = Xs.shape
  grid_size = int(ceil(sqrt(N)))
  grid_height = H * grid_size + padding * (grid_size - 1)
  grid_width = W * grid_size + padding * (grid_size - 1)
  grid = np.zeros((grid_height, grid_width))
  next_idx = 0
  y0, y1 = 0, H
  for y in xrange(grid_size):
    x0, x1 = 0, W
    for x in xrange(grid_size):
      if next_idx < N:
        img = Xs[next_idx]
        low, high = np.min(img), np.max(img)
        grid[y0:y1, x0:x1] = ubound * (img - low) / (high - low)
        # grid[y0:y1, x0:x1] = Xs[next_idx]
        next_idx += 1
      x0 += W + padding
      x1 += W + padding
    y0 += H + padding
    y1 += H + padding
  return grid

def vis_grid(Xs):
  """ visualize a grid of images """
  (N, H, W, C) = Xs.shape
  A = int(ceil(sqrt(N)))
  G = np.ones((A*H+A, A*W+A, C), Xs.dtype)
  G *= np.min(Xs)
  n = 0
  for y in range(A):
    for x in range(A):
      if n < N:
        G[y*H+y:(y+1)*H+y, x*W+x:(x+1)*W+x, :] = Xs[n,:,:,:]
        n += 1
  # normalize to [0,1]
  maxg = G.max()
  ming = G.min()
  G = (G - ming)/(maxg-ming)
  return G
  
def vis_nn(rows):
  """ visualize array of arrays of images """
  N = len(rows)
  D = len(rows[0])
  H,W,C = rows[0][0].shape
  Xs = rows[0][0]
  G = np.ones((N*H+N, D*W+D, C), Xs.dtype)
  for y in range(N):
    for x in range(D):
      G[y*H+y:(y+1)*H+y, x*W+x:(x+1)*W+x, :] = rows[y][x]
  # normalize to [0,1]
  maxg = G.max()
  ming = G.min()
  G = (G - ming)/(maxg-ming)
  return G

全连接神经网络分类：

# -*- coding: utf-8 -*-
"""
Created on Sat May 20 10:55:11 2017

@author: Abner
"""

import numpy as np
import matplotlib.pyplot as plt
import matplotlib

matplotlib.use('Agg') 

from vis_uitls import visualize_grid
from vis_uitls import visualize_grid1
from LoadData import Load_CIFAR10
from Load_MNIST import Load_MNIST_Data
from Fullc_NN import TwoLayerNet

#matplotlib inline
plt.rcParams['figure.figsize'] = (10.0, 8.0) # set default size of plots
plt.rcParams['image.interpolation'] = 'nearest'
plt.rcParams['image.cmap'] = 'gray'

# for auto-reloading external modules
# see http://stackoverflow.com/questions/1907993/autoreload-of-modules-in-ipython
#%load_ext autoreload
#%autoreload 2

#读取MNIST数据集
##############################################################################
def get_MNIST_data(num_training=59000, num_validation=1000, num_test=1000):
    """
    Load the CIFAR-10 dataset from disk and perform preprocessing to prepare
    it for the two-layer neural net classifier. These are the same steps as
    we used for the SVM, but condensed to a single function.  
    """
    # Load the raw CIFAR-10 data
    X_train, y_train, X_test, y_test = Load_MNIST_Data()
    X_train = X_train.reshape(60000, 28, 28)
    X_test = X_test.reshape(10000, 28, 28)
    print "Before reshape Data:"
    print "X_train: ", X_train.shape
    print "y_train: ", y_train.shape
    print "X_test: ", X_test.shape
    print "y_test: ", y_test.shape
        
    # Subsample the data
    mask = range(num_training, num_training + num_validation)
    X_val = X_train[mask]
    y_val = y_train[mask]
    mask = range(num_training)
    X_train = X_train[mask]
    y_train = y_train[mask]
    mask = range(num_test)
    X_test = X_test[mask]
    y_test = y_test[mask]
    

    # Normalize the data: subtract the mean image
    mean_image = np.mean(X_train, axis=0)
    X_train = X_train - mean_image
    X_val = X_val - mean_image
    X_test = X_test - mean_image

    # Reshape data to rows
    X_train = X_train.reshape(num_training, -1)
    X_val = X_val.reshape(num_validation, -1)
    X_test = X_test.reshape(num_test, -1)


    return X_train, y_train, X_val, y_val, X_test, y_test
    
    ##########################################################################

'''
def get_CIFAR10_data(num_training=49000, num_validation=1000, num_test=1000):
    """
    Load the CIFAR-10 dataset from disk and perform preprocessing to prepare
    it for the two-layer neural net classifier. These are the same steps as
    we used for the SVM, but condensed to a single function.  
    """
    # Load the raw CIFAR-10 data
    cifar10_dir = 'cifar-10-batches-py'
    X_train, y_train, X_test, y_test = Load_CIFAR10(cifar10_dir)
    print "Before reshape Data:"
    print "X_train: ", X_train.shape
    print "y_train: ", y_train.shape
    print "X_test: ", X_test.shape
    print "y_test: ", y_test.shape
        
    # Subsample the data
    mask = range(num_training, num_training + num_validation)
    X_val = X_train[mask]
    y_val = y_train[mask]
    mask = range(num_training)
    X_train = X_train[mask]
    y_train = y_train[mask]
    mask = range(num_test)
    X_test = X_test[mask]
    y_test = y_test[mask]

    # Normalize the data: subtract the mean image
    mean_image = np.mean(X_train, axis=0)
    X_train -= mean_image
    X_val -= mean_image
    X_test -= mean_image

    # Reshape data to rows
    X_train = X_train.reshape(num_training, -1)
    X_val = X_val.reshape(num_validation, -1)
    X_test = X_test.reshape(num_test, -1)


    return X_train, y_train, X_val, y_val, X_test, y_test

'''
# Invoke the above function to get our data.
#X_train, y_train, X_val, y_val, X_test, y_test = get_CIFAR10_data()

#MNIST
X_train, y_train, X_val, y_val, X_test, y_test = get_MNIST_data()

print 'Train data shape: ', X_train.shape
print 'Train labels shape: ', y_train.shape
print 'Validation data shape: ', X_val.shape
print 'Validation labels shape: ', y_val.shape
print 'Test data shape: ', X_test.shape
print 'Test labels shape: ', y_test.shape


'''
##############################################################################
"""
不经过寻参，隐藏层设置神经元个数为50个
"""

#输入层神经元的个数是数据的维数，隐藏层神经元的个数为50个，输出层神经元的个数为10个
#input_size = 32 * 32 * 3
input_size = 28*28
hidden_size = 50
num_classes = 10
net = TwoLayerNet(input_size, hidden_size, num_classes)

# Train the network
stats = net.train(X_train, y_train, X_val, y_val,
            num_iters=1000, batch_size=200,
            learning_rate=1e-4, learning_rate_decay=0.95,
            reg=0.5, verbose=True)

# Predict on the validation set
val_acc = (net.predict(X_val) == y_val).mean()
print 'Validation accuracy: ', val_acc

plt.subplot(2, 1, 1)
plt.plot(stats['loss_history'])
plt.title('Loss history')
plt.xlabel('Iteration')
plt.ylabel('Loss')

plt.subplot(2, 1, 2)
train_acc, = plt.plot(stats['train_acc_history'], label='train')
val_acc, = plt.plot(stats['val_acc_history'], label='val')
plt.legend([train_acc, val_acc], ['Training Accuracy', 'Validation Accuracy'], loc='lower right')
plt.title('Classification accuracy history')
plt.xlabel('Epoch')
plt.ylabel('Clasification accuracy')
#plt.show()
plt.savefig('E:\\MNIST\\loss.jpg')

plt.close()

#def show_net_weights(net):
#  W1 = net.params['W1']
#  W1 = W1.reshape(32, 32, 3, -1).transpose(3, 0, 1, 2)
#  plt.imshow(visualize_grid(W1, padding=3).astype('uint8'))
#  plt.gca().axis('off')
##  plt.show()
#  plt.savefig('E:\\MNIST\\weight.jpg')

def show_net_weights(net):
  W1 = net.params['W1']
  W1 = W1.reshape(28, 28, -1).transpose(2, 0, 1)
  plt.imshow(visualize_grid1(W1, padding=1).astype('uint8'))
  plt.gca().axis('off')
#  plt.show()
  plt.savefig('E:\\MNIST\\weight.jpg')
show_net_weights(net)

##############################################################################
'''



# best_net = None # store the best model into this 

#################################################################################
# TODO: Tune hyperparameters using the validation set. Store your best trained  #
# model in best_net.                                                            #
#                                                                               #
# To help debug your network, it may help to use visualizations similar to the  #
# ones we used above; these visualizations will have significant qualitative    #
# differences from the ones we saw above for the poorly tuned network.          #
#                                                                               #
# Tweaking hyperparameters by hand can be fun, but you might find it useful to  #
# write code to sweep through possible combinations of hyperparameters          #
# automatically like we did on the previous exercises.                          #
#################################################################################

stats = {}
results = {}
best_val = -1
best_stats = None

#input_size = 32 * 32 * 3
input_size = 28*28
num_classes = 10

# hidden_sizes = (100 * np.random.rand(5)).round().astype(int)
# learning_rates = (5e-3 - 5e-5) * np.random.rand(5) + 5e-5
# regularization_strengths = np.random.rand(5)

# hidden_sizes = [50, 75, 100]
# learning_rates = [5e-4]
# regularization_strengths = [0.65, 0.75, 0.85]

# hidden_sizes = np.round(10 ** np.random.uniform(1.7,2.3,3)).astype(int)
#hidden_sizes = [100]

#CIFAR10
#def show_net_weights(net, k):
#  W1 = net.params['W1']
#  W1 = W1.reshape(32, 32, 3, -1).transpose(3, 0, 1, 2)
#  plt.imshow(visualize_grid(W1, padding=3).astype('uint8'))
#  plt.gca().axis('off')
#  plt.savefig('E:\\NN\\%d times_W.jpg' % k)
#  plt.show()

def show_net_weights(net, k):
  W1 = net.params['W1']
  W1 = W1.reshape(28, 28, -1).transpose(2, 0, 1)
  plt.imshow(visualize_grid1(W1, padding=1).astype('uint8'))
  plt.gca().axis('off')
  plt.savefig('E:\\MNIST\\%d times_W1.jpg' % k)


hidden_sizes = [50, 75, 100]
learning_rates = 10 ** np.random.uniform(-3.5,-2.5,5)
regularization_strengths = 10 ** np.random.uniform(-5,1,5)

k = 0
for hidden_size in hidden_sizes:
    
    for learning_rate in learning_rates:

        for regularization_strength in regularization_strengths:
            
            # Print hyperparameters
            print 'Size = %d, Learning rate = %e, Reg. Strength = %e' % (
                hidden_size, learning_rate, regularization_strength)

            # Initialize net
            net = TwoLayerNet(input_size, hidden_size, num_classes)

            # Training
            stats[hidden_size, learning_rate, regularization_strength] = \
                net.train(X_train, y_train, X_val, y_val,
                          num_iters=2000, batch_size=500,
                          learning_rate=learning_rate, learning_rate_decay=0.95,
                          reg=regularization_strength, verbose=True)

            # Testing
            y_train_pred = net.predict(X_train)
            y_val_pred = net.predict(X_val)

            # Evaluation
            train_num_correct = np.sum(y_train_pred == y_train)
            training_accuracy = float(train_num_correct) / X_train.shape[0]

            val_num_correct = np.sum(y_val_pred == y_val)
            validation_accuracy = float(val_num_correct) / X_val.shape[0]

            results[hidden_size, learning_rate, regularization_strength] = training_accuracy, validation_accuracy

            if validation_accuracy > best_val:
                best_val = validation_accuracy
                best_net = net
                best_stats = stats[hidden_size, learning_rate, regularization_strength]
                
            current_stats = stats[hidden_size, learning_rate, regularization_strength]
                
            # Plot the loss function and train / validation accuracies
            plt.subplot(2, 1, 1)
            plt.plot(current_stats['loss_history'])
            plt.title('Loss history')
            plt.xlabel('Iteration')
            plt.ylabel('Loss')
            
            plt.subplot(2, 1, 2)
            train_acc, = plt.plot(current_stats['train_acc_history'], label='train')
            val_acc, = plt.plot(current_stats['val_acc_history'], label='val')
            plt.legend([train_acc, val_acc], ['Training Accuracy', 'Validation Accuracy'], loc = 'lower right')
            plt.title('Classification accuracy history')
            plt.xlabel('Epoch')#寻参的时候，每次训练时，验证集和训练集的正确率
            plt.ylabel('Clasification accuracy')
#            plt.show()
            k += 1
            plt.savefig('E:\\MNIST\\%d times_Loss.jpg' % (k))
            # visualize the weights of the current network
            plt.close()
            print "第%d次寻参的权重" % k
            show_net_weights(net, k)

pass

# Print out results.
for hid_size, lr, reg in sorted(results):
    train_accuracy, val_accuracy = results[(hid_size, lr, reg)]
    print 'size %d lr %e reg %e train accuracy: %f val accuracy: %f' % (
                hid_size, lr, reg, train_accuracy, val_accuracy)
    
print 'best validation accuracy achieved during cross-validation: %f' % best_val

plt.close()
# Plot the loss function and train / validation accuracies
plt.subplot(2, 1, 1)
plt.plot(best_stats['loss_history'])
plt.title('Loss history')
plt.xlabel('Iteration')
plt.ylabel('Loss')

plt.subplot(2, 1, 2)
train_acc, = plt.plot(best_stats['train_acc_history'], label='train')
val_acc, = plt.plot(best_stats['val_acc_history'], label='val')
plt.legend([train_acc, val_acc], ['Training Accuracy', 'Validation Accuracy'], loc = 'lower right')
plt.title('Classification accuracy history')
plt.xlabel('Epoch')
plt.ylabel('Clasification accuracy')
#plt.show()
plt.savefig('E:\\MNIST\\Best_Loss.jpg')
plt.close()

# visualize the weights of the current network
print "最优时候的权重："
show_net_weights(best_net, 0)

pass
#################################################################################
#                               END OF YOUR CODE                                #
#################################################################################

#test_acc = (best_net.predict(X_test) == y_test).mean()
#print 'Test accuracy: ', test_acc


test_acc = (best_net.predict(X_test) == y_test).mean()
print 'Test accuracy: ', test_acc

你可能感兴趣的:(Machine,Learning,Deep,Learning)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
JavaScript 中，深拷贝（Deep Copy）和浅拷贝（Shallow Copy）跳房子的前端前端面试 javascript 开发语言 ecmascript
在JavaScript中，深拷贝（DeepCopy）和浅拷贝（ShallowCopy）是用于复制对象或数组的两种不同方法。了解它们的区别和应用场景对于避免潜在的bugs和高效地处理数据非常重要。以下是对深拷贝和浅拷贝的详细解释，包括它们的概念、用途、优缺点以及实现方式。1.浅拷贝（ShallowCopy）概念定义：浅拷贝是指创建一个新的对象或数组，其中包含了原对象或数组的基本数据类型的值和对引用数
深度 Qlearning：在直播推荐系统中的应用 AGI通用人工智能之禅程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
深度Q-learning：在直播推荐系统中的应用关键词：深度Q-learning,强化学习,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。面对海量的直播内容,用户很难快速找到自己感兴趣的内容。因此,个性化推荐系统在直播平台中扮演着越来越重要的角色。1.2研究现状目前,主流的个性化推荐算法包括协同过滤、基于内容的推荐等。这些方法在一定程度上缓
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
管理员权限的软件不能开机自启动的解决方法 ss_ctrl
这是几种解决方法：1.将启动参数写入到32位注册表里面去在64位系统下我们64位的程序访问此HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Run注册表路径，是可以正确访问的，32位程序访问此注册表路径时，默认会被系统自动映射到HKEY_LOCAL_MACHINE\SOFTWARE\WOW6432Node\Microsoft
golang学习笔记--MPG模型 xxzed golang #学习笔记学习笔记 golang
MPG模式：M（Machine）：操作系统的主线程P（Processor）：协程执行需要的资源（上下文context），可以看作一个局部的调度器，使go代码在一个线程上跑，他是实现从N：1到N：M映射的关键G（Goroutine）：协程，有自己的栈。包含指令指针（instructionpointer）和其它信息（正在等待的channel等等），用于调度。一个P下面可以有多个G1、当前程序有三个M,
【开发环境搭建】Macbook M1搭建Java开发环境 weixin_44329069 java 开发语言
JDK安装与配置下载并安装JDK：ARM64DMG安装包下载链接：JDK21forMac(ARM64)。双击下载的DMG文件，按照提示安装JDK。配置环境变量：打开终端，使用vim编辑.bash_profile文件：vim~/.bash_profile在文件中添加以下内容来设置JAVA_HOME：exportJAVA_HOME=/Library/Java/JavaVirtualMachines/j
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
ResNet的半监督和半弱监督模型 Valar_Morghulis
Billion-scalesemi-supervisedlearningforimageclassificationhttps://arxiv.org/pdf/1905.00546.pdfhttps://github.com/facebookresearch/semi-supervised-ImageNet1K-models/权重在timm中也有：https://hub.fastgit.org/r
联邦学习 Federated learning Google I/O‘19 笔记努力搬砖的星期五笔记联邦学习机器学习机器学习 tensorflow
FederatedLearning:MachineLearningonDecentralizeddatahttps://www.youtube.com/watch?v=89BGjQYA0uE文章目录FederatedLearning:MachineLearningonDecentralizeddata1.DecentralizeddataEdgedevicesGboard:mobilekeyboa
PCL 怎样可视化深度图像 LeonDL168 PCL 计算机视觉人工智能视觉检测图像处理算法
本小节讲解如何可视化深度图像的两种方法，在3D视窗中以点云形式进行可视化（深度图像来源于点云），另一种是，将深度值映射为颜色，从而以彩色图像方式可视化深度图像。代码首先，在PCL（PointCloudLearning）中国协助发行的书提供光盘的第7章例2文件夹中，打开名为range_image_visualization.cpp的代码文件，同文件夹下可以找到相关的测试点云文件room_scan1.
el-dialog高度设置夏之小星星前端 vue.js elementui css
el-dialog高度设置::v-deep.el-dialog{height:78vh;overflow:auto;}
elementuiPlus取消el-input的边框 qq_39016177 elementui
elementuiPlus取消el-input的边框1.通常取消边框的方法设置border为none2.还有其他类似边框的例如outlinebox-shadow这两个属性都是会产生边框效果3.el-input需要更改的话–如下需要修改box-shadow为空即可上代码:deep(.el-input__wrapper){align-items:center;background-color:#F7F
FISCO BCOS（十七）——— go SDK的使用林中有神君 #FISCO BCOS 2.8.0 golang 服务器 linux fisco bcos 区块链
1、创建一个工作目录root@wyg-virtual-machine:~/fisco#mkdirgoWorkSpace2、下载go-sdkroot@wyg-virtual-machine:~/fisco/
【双语新闻】AGI安全与对齐，DeepMind近期工作曲奇人工智能安全 agi 安全 llama 人工智能
我们想与AF社区分享我们最近的工作总结。以下是关于我们正在做什么，为什么会这么做以及我们认为它的意义所在的一些详细信息。我们希望这能帮助人们从我们的工作基础上继续发展，并了解他们的工作如何与我们相关联。byRohinShah,SebFarquhar,AncaDragan21stAug2024AIAlignmentForumWewantedtosharearecapofourrecentoutput
Git报错（一）fatal: Could not read from remote repository. librarycode
解决方案来自CSDN：https://blog.csdn.net/cxwtsh123/article/details/79194263?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-3.control&dist_request_id=&depth_1-utm_source=distr
VOC数据集转换为CoCo数据集（亲测有效）情书学长人工智能学习笔记图像处理
#VOC数据集格式VOC格式的数据集分为3部分，Annotations、ImageSets、JPEGImages。（一）Annotations：存放数据标注的xml文件，格式如下：CUMID_train0001.pngC:\Users\86182\Desktop\CUMID_train\0001.pngUnknown2040136830MachineUnspecified0011933491451
【Vesta发号器源码】PropertyMachineIdsProvider DeanChangDM
Vesta发号器源码解析——PropertyMachineIdsProvider属性配置文件持有Id的模式,没啥东西，比单个的多了一个获取下一个的方法封装实现上略有一点点区别privatelong[]machineIds;privateintcurrentIndex;publiclonggetNextMachineId(){returngetMachineId();}publiclonggetMa
Awesome TensorFlow weixin_30594001 人工智能移动开发大数据
AwesomeTensorFlowAcuratedlistofawesomeTensorFlowexperiments,libraries,andprojects.Inspiredbyawesome-machine-learning.WhatisTensorFlow?TensorFlowisanopensourcesoftwarelibraryfornumericalcomputationusin
【ShuQiHere】探索人工智能核心：机器学习的奥秘 ShuQiHere 人工智能机器学习
【ShuQiHere】什么是机器学习？机器学习（MachineLearning,ML）是人工智能（ArtificialIntelligence,AI）中最关键的组成部分之一。它使得计算机不仅能够处理数据，还能从数据中学习，从而做出预测和决策。无论是语音识别、自动驾驶还是推荐系统，背后都依赖于机器学习模型。机器学习与传统的编程不同，它不再依赖于人类编写的固定规则，而是通过数据自我改进模型，从而更灵活
综述论文“A Survey of Zero-Shot Learning: Settings, Methods, and Applications” 硅谷秋水机器学习机器学习神经网络深度学习
该零样本学习综述，发表于ACMTrans.Intell.Syst.Technol.10,2,Article13(January2019)摘要：大多数机器学习方法着重于对已经在训练中看到其类别的实例进行分类。实际上，许多应用程序需要对实例进行分类，而这些实例的类以前没有见过。零样本学习（Zero-ShotLearning）是一种强大而有前途的学习范例，其中训练实例涵盖的类别与想分类的类别是不相交的。
go-etcd实战小书go golang 实战演练 golang etcd 服务发现服务注册微服务
etcd简介etcdisastronglyconsistent,distributedkey-valuestorethatprovidesareliablewaytostoredatathatneedstobeaccessedbyadistributedsystemorclusterofmachines.Itgracefullyhandlesleaderelectionsduringnetwork
梯度提升机 (Gradient Boosting Machines, GBM) ALGORITHM LOL boosting 集成学习机器学习
梯度提升机(GradientBoostingMachines,GBM)通俗易懂算法梯度提升机（GradientBoostingMachines，GBM）是一种集成学习算法，主要用于回归和分类问题。GBM本质上是通过训练一系列简单的模型（通常是决策树），然后将这些模型组合起来，从而提高整体预测性能。基本步骤初始模型：首先，我们用一个简单的模型（如一个常数值）作为预测模型，记为F0(x)F_0(x)F
机器学习 VS 表示学习 VS 深度学习 Efred.D 人工智能机器学习深度学习人工智能
文章目录前言一、机器学习是什么?二、表示学习三、深度学习总结前言本文主要阐述机器学习,表示学习和深度学习的原理和区别.一、机器学习是什么?机器学习(machinelearning),是从有限的数据集中学习到一定的规律,再把学到的规律应用到一些相似的样本集中做预测.机器学习的历史可以追溯到20世纪40年代McCulloch提出的人工神经元网络,目前学界大致把机器学习分为传统机器学习和机器学习两个类别
端到端的自动驾驶论文与代码整理大别山伧父自动驾驶
LearningbyCheatinggithubcodearxivpaperconferenceonrobotlearning最新进展(May2021)Checkoutourlatestfollow-upwork:WorldonRails(2020)Checkoutoursubmissiontothe2020CARLAChallenge!pass
JVM 架构 : 运行时数据区 & 内存结构光剑书架上的书
JVM:JavaVirtualMachine架构JVMArchitectureRuntimeDataArea/MemoryStructureClassloaderClassloaderisasubsysteminJVM,whichisprimarilyresponasibleforloadingthejavaclasses,thereare3differentclassloaders:Bootst
Java实现的基于模板的网页结构化信息精准抽取组件：HtmlExtractor yangshangchuan 信息抽取 HtmlExtractor 精准抽取信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件，本身并不包含爬虫功能，但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtractor是为大规模分布式环境设计的，采用主从架构，主节点负责维护抽取规则，从节点向主节点请求抽取规则，当抽取规则发生变化，主节点主动通知从节点，从而能实现抽取规则变化之后的实时动态生效。如
java编程思想 -- 多态百合不是茶 java 多态详解
一: 向上转型和向下转型面向对象中的转型只会发生在有继承关系的子类和父类中（接口的实现也包括在这里）。父类：人子类：男人向上转型： Person p = new Man() ; //向上转型不需要强制类型转化向下转型： Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系 comsci dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长.... 首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义日志文件商人shang storm cluster logback
Storm中的日志级级别默认为INFO，并且，日志文件是根据worker号来进行区分的，这样，同一个log文件中的信息不一定是一个业务的，这样就会有以下两个需求出现： 1. 想要进行一些调试信息的输出 2. 调试信息或者业务日志信息想要输出到一些固定的文件中不要怕，不要烦恼，其实Storm已经提供了这样的支持，可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录 21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo 传递json对象数据，往往会出现http 415，400,500等错误，总结一下需要使用ajax提交json数据才行，ajax提交使用proxy，参数为jsonData，不能为params；另外，需要设置Content-type属性为json，代码如下：（由于使用了父类aaa
一些排错方法文强chu 方法
1、java.lang.IllegalStateException: Class invariant violation at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228) at o
Swing中文件恢复我觉得很难小桔子 swing
我那个草了！老大怎么回事，怎么做项目评估的？只会说相信你可以做的，试一下，有的是时间！用java开发一个图文处理工具，类似word，任意位置插入、拖动、删除图片以及文本等。文本框、流程图等，数据保存数据库，其余可保存pdf格式。ok,姐姐千辛万苦，
php 文件操作 aichenglong PHP 读取文件写入文件
1 写入文件 @$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab"); if(!$fp){ echo "open file error" ; exit; } $outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别 AILIKES 数据结构 mysql 算法
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现百合不是茶
抽象接口实现接口 //抽象类 ,方法 //定义一个公共抽象的类 ,并在类中定义一个抽象的方法体抽象的定义使用abstract abstract class A 定义一个抽象类例如： //定义一个基类 public abstract class A{ //抽象类不能用来实例化，只能用来继承 //
JS变量作用域实例 bijian1013 作用域
<script> var scope='hello'; function a(){ console.log(scope); //undefined var scope='world'; console.log(scope); //world console.log(b);
TDD实践（二） bijian1013 java TDD
实践题目：分解质因数 Step1：单元测试： package com.bijian.study.factor.test; import java.util.Arrays; import junit.framework.Assert; import org.junit.Before; import org.junit.Test; import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制 bit1129 mongodb
MongoDB称为分布式数据库，主要原因是1.基于副本集的数据备份， 2.基于切片的数据扩容。副本集解决数据的读写性能问题，切片解决了MongoDB的数据扩容问题。事实上，MongoDB提供了主从复制和副本复制两种备份方式，在MongoDB的主从复制和副本复制集群环境中，只有一台作为主服务器，另外一台或者多台服务器作为从服务器。本文介绍MongoDB的主从复制模式，需要指明
【HBase五】Java API操作HBase bit1129 hbase
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.ha
python调用zabbix api接口实时展示数据 ronin47
zabbix api接口来进行展示。经过思考之后，计划获取如下内容： 1、获得认证密钥 2、获取zabbix所有的主机组 3、获取单个组下的所有主机 4、获取某个主机下的所有监控项
jsp取得绝对路径 byalias 绝对路径
在JavaWeb开发中，常使用绝对路径的方式来引入JavaScript和CSS文件，这样可以避免因为目录变动导致引入文件找不到的情况，常用的做法如下：一、使用${pageContext.request.contextPath} 　　代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名，这样不管如何部署，所用路径都是正确的。
Java定时任务调度：用ExecutorService取代Timer bylijinnan java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由，我认为其中最重要的理由是：如果TimerTask抛出未检查的异常，Timer将会产生无法预料的行为。Timer线程并不捕获异常，所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下，Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时，已经被
SQL 优化原则 chicony sql
一、问题的提出　在应用系统开发初期，由于开发数据库数据比较少，对于查询SQL语句，复杂视图的的编写等体会不出SQL语句各种写法的性能优劣，但是如果将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据，劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍，可见对于一个系统
java 线程弹球小游戏 CrazyMizzz java 游戏
最近java学到线程，于是做了一个线程弹球的小游戏，不过还没完善这里是提纲 1.线程弹球游戏实现 1.实现界面需要使用哪些API类 JFrame JPanel JButton FlowLayout Graphics2D Thread Color ActionListener ActionEvent MouseListener Mouse
hadoop jps出现process information unavailable提示解决办法 daizj hadoop jps
hadoop jps出现process information unavailable提示解决办法 jps时出现如下信息： 3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现 dcj3sjt126com PHP
<?php class Image{ private $path; function __construct($path='./'){ $this->path=rtrim($path,'/').'/'; } //水印函数，参数：背景图，水印图，位置，前缀,TMD透明度 public function water($b,$l,$pos
IOS控件学习：UILabel常用属性与用法 dcj3sjt126com ios UILabel
参考网站： http://shijue.me/show_text/521c396a8ddf876566000007 http://www.tuicool.com/articles/zquENb http://blog.csdn.net/a451493485/article/details/9454695 http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架 eksliang java eclipse Web
建一个 JAVA 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=App [-Dversion=0.0.1-SNAPSHOT] [-Dpackaging=jar] 建一个 web 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=web-a
配置清单 gengzg 配置
1、修改grub启动的内核版本 vi /boot/grub/grub.conf 将default 0改为1 拷贝mt7601Usta.ko到/lib文件夹拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹拷贝wifiscan到bin文件夹，chmod 775 /bin/wifiscan 拷贝wifiget.sh到bin文件夹，chm
Windows端口被占用处理方法 huqiji windows
以下文章主要以80端口号为例，如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器，跨平台(html5, mobile)，flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 ！天梯梦 mobile
CKplayer，其全称为超酷flv播放器，它是一款用于网页上播放视频的软件，支持的格式有：http协议上的flv,f4v,mp4格式，同时支持rtmp视频流格式播放，此播放器的特点在于用户可以自己定义播放器的风格，诸如播放/暂停按钮，静音按钮，全屏按钮都是以外部图片接口形式调用，用户根据自己的需要制作出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了，
简单工厂设计模式 hm4123660 java 工厂设计模式简单工厂模式
简单工厂模式（Simple Factory Pattern）属于类的创新型模式，又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例，被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。
maven笔记 zhb8015 maven
跳过测试阶段： mvn package -DskipTests 临时性跳过测试代码的编译： mvn package -Dmaven.test.skip=true maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为，即跳过编译，又跳过测试。指定测试类 mvn test
非mapreduce生成Hfile，然后导入hbase当中 Stark_Summer map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase，让hbase的入库速度达到5w+/s，这可愁死了，4台个人电脑组成的集群，多线程入库调了好久，速度也才1w左右，都没有达到理想的那种速度，然后就想到了这种方式，但是网上多是用mapreduce来实现入库，而现在的需求是实时入库，不生成文件了，所以就只能自己用代码实现了，但是网上查了很多资料都没有查到，最后在一个网友的指引下，看了源码，最后找到了生成Hfile
jsp web tomcat 编码问题王新春 tomcat jsp pageEncode
今天配置jsp项目在tomcat上，windows上正常，而linux上显示乱码，最后定位原因为tomcat 的server.xml 文件的配置，添加 URIEncoding 属性： <Connector port="8080" protocol="HTTP/1.1" connectionTi