歌己

线性SVM分类器实战

1 概述

基础的理论知识参考线性SVM与Softmax分类器。

代码实现环境：python3

2 数据处理

2.1 加载数据集

将原始数据集放入“data/cifar10/”文件夹下。


      
      
      
      
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          ### 加载cifar10数据集
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          import os
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          import pickle
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          import random
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          import numpy as np
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          import matplotlib.pyplot as plt
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          def load_CIFAR_batch(filename):
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
              """
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           cifar-10数据集是分batch存储的，这是载入单个batch
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           @参数 filename: cifar文件名
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           @r返回值: X, Y: cifar batch中的 data 和 labels
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           """
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
              with open(filename,'rb') as f:
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  datadict=pickle.load(f,encoding='bytes')
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  X=datadict[b'data']
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  Y=datadict[b'labels']
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  X=X.reshape(10000, 3, 32, 32).transpose(0,2,3,1).astype("float")
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  Y=np.array(Y)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  return X, Y
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          def load_CIFAR10(ROOT):
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
              """
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           读取载入整个 CIFAR-10 数据集
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           @参数 ROOT: 根目录名
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           @return: X_train, Y_train: 训练集 data 和 labels
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           X_test, Y_test: 测试集 data 和 labels
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           """
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
              xs=[]
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
              ys=[]
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
              for b in range(1,6):
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  f=os.path.join(ROOT, "data_batch_%d" % (b, ))
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  X, Y=load_CIFAR_batch(f)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  xs.append(X)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  ys.append(Y)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
              X_train=np.concatenate(xs)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
              Y_train=np.concatenate(ys)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
              del X, Y
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
              X_test, Y_test=load_CIFAR_batch(os.path.join(ROOT, "test_batch"))
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
              return X_train, Y_train, X_test, Y_test
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          X_train, y_train, X_test, y_test = load_CIFAR10('data/cifar10/') 
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          print(X_train.shape)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          print(y_train.shape)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          print(X_test.shape)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          print( y_test.shape)

运行结果如下：


      
      
      
      
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          (50000, 32, 32, 3)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          (50000,)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          (10000, 32, 32, 3)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          (10000,)

2.2 划分数据集

将加载好的数据集划分为训练集，验证集，以及测试集。


      
      
      
      
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          ## 划分训练集，验证集，测试集
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          num_train = 49000
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          num_val = 1000
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          num_test = 1000
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          # Validation set
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          mask = range(num_train, num_train + num_val)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          X_val = X_train[mask]
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          y_val = y_train[mask]
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          # Train set
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          mask = range(num_train)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          X_train = X_train[mask]
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          y_train = y_train[mask]
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          # Test set
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          mask = range(num_test)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          X_test = X_test[mask]
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          y_test = y_test[mask]
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          print('Train data shape: ', X_train.shape)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          print('Train labels shape: ', y_train.shape)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          print('Validation data shape: ', X_val.shape)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          print('Validation labels shape ', y_val.shape)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          print('Test data shape: ', X_test.shape)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          print('Test labels shape: ', y_test.shape)

运行结果为：


      
      
      
      
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          Train data shape:  (49000, 3072)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          Validation data shape:  (1000, 3072)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          Test data shape:  (1000, 3072)

2.3 去均值归一化

将划分好的数据集归一化，即：所有划分好的数据集减去均值图像。


      
      
      
      
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          # Processing: subtract the mean images
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          mean_image = np.mean(X_train, axis=0)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          X_train -= mean_image
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          X_val -= mean_image
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          X_test -= mean_image
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          # append the bias dimension of ones (i.e. bias trick)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          X_train = np.hstack([X_train, np.ones((X_train.shape[0], 1))])#堆叠数组
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          X_val = np.hstack([X_val, np.ones((X_val.shape[0], 1))])
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          X_test = np.hstack([X_test, np.ones((X_test.shape[0], 1))])
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          print('Train data shape: ', X_train.shape)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          print('Validation data shape: ', X_val.shape)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          print('Test data shape: ', X_test.shape)

运行结果为：


      
      
      
      
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          Train data shape:  (49000, 3073)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          Validation data shape:  (1000, 3073)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          Test data shape:  (1000, 3073)

3 线性SVM分类器

3.1 定义线性SVM分类器

关键的是线性SVM的梯度推导过程。具体的可以看看这篇文章。


      
      
      
      
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          #Define a linear SVM classifier
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          class LinearSVM(object):
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
              """ A subclass that uses the Multiclass SVM loss function """
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
              def __init__(self):
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  self.W = None
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
              def loss_vectorized(self, X, y, reg):
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  """
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           Structured SVM loss function, naive implementation (with loops).
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           Inputs:
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           - X: A numpy array of shape (num_train, D) contain the training data
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           consisting of num_train samples each of dimension D
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           - y: A numpy array of shape (num_train,) contain the training labels,
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           where y[i] is the label of X[i]
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           - reg: (float) regularization strength
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           Outputs:
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           - loss: the loss value between predict value and ground truth
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           - dW: gradient of W
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           """
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                   # Initialize loss and dW
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  loss = 0.0
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  dW = np.zeros(self.W.shape)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  # Compute the loss
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  num_train = X.shape[0]
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  scores = np.dot(X, self.W)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  correct_score = scores[range(num_train), list(y)].reshape(-1, 1)    
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  margin = np.maximum(0, scores - correct_score + 1) # delta = 1
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  margin[range(num_train), list(y)] = 0  #分对的损失为0
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  loss = np.sum(margin) / num_train + 0.5 * reg * np.sum(self.W * self.W) #reg就是权重lamda
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  # Compute the dW
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  num_classes = self.W.shape[1]
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  mask = np.zeros((num_train, num_classes))
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  mask[margin > 0] = 1
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  mask[range(num_train), list(y)] = 0
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  mask[range(num_train), list(y)] = -np.sum(mask, axis=1)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  dW = np.dot(X.T, mask)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  dW = dW / num_train + reg * self.W
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  return loss, dW
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
              
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
              def train(self, X, y, learning_rate = 1e-3, reg = 1e-5, num_iters = 100, 
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           batch_size = 200, print_flag = False):
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  """
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           Train linear SVM classifier using SGD
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           Inputs:
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           - X: A numpy array of shape (num_train, D) contain the training data
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           consisting of num_train samples each of dimension D
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           - y: A numpy array of shape (num_train,) contain the training labels,
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           where y[i] is the label of X[i], y[i] = c, 0 <= c <= C
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           - learning rate: (float) learning rate for optimization
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           - reg: (float) regularization strength
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           - num_iters: (integer) numbers of steps to take when optimization
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           - batch_size: (integer) number of training examples to use at each step
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           - print_flag: (boolean) If true, print the progress during optimization
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           Outputs:
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           - loss_history: A list containing the loss at each training iteration
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           """
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  loss_history = []
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  num_train = X.shape[0]
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  dim = X.shape[1]
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  num_classes = np.max(y) + 1
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  # Initialize W
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  if self.W == None:
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                      self.W = 0.001 * np.random.randn(dim, num_classes)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  # iteration and optimization
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  for t in range(num_iters):
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                      idx_batch = np.random.choice(num_train, batch_size, replace=True)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                      X_batch = X[idx_batch]
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                      y_batch = y[idx_batch]
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                      loss, dW = self.loss_vectorized(X_batch, y_batch, reg)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                      loss_history.append(loss)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                      self.W += -learning_rate * dW
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                      
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                      if print_flag and t%100 == 0:
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                          print('iteration %d / %d: loss %f' % (t, num_iters, loss))
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  return loss_history
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
              
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
              def predict(self, X):
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  """
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           Use the trained weights of linear SVM to predict data labels
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           Inputs:
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           - X: A numpy array of shape (num_train, D) contain the training data
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           Outputs:
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           - y_pred: A numpy array, predicted labels for the data in X
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           """
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  y_pred = np.zeros(X.shape[0])
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  scores = np.dot(X, self.W)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  y_pred = np.argmax(scores, axis=1)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  return y_pred

3.2 无交叉验证

3.2.1 训练模型


      
      
      
      
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          ##Stochastic Gradient Descent
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          svm = LinearSVM()
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          loss_history = svm.train(X_train, y_train, learning_rate = 1e-7, reg = 2.5e4, num_iters = 2000, 
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                       batch_size = 200, print_flag = True)

运行结果如下：


      
      
      
      
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          iteration 0 / 2000: loss 407.076351
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          iteration 100 / 2000: loss 241.030820
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          iteration 200 / 2000: loss 147.135737
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          iteration 300 / 2000: loss 90.274781
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          iteration 400 / 2000: loss 56.509895
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          iteration 500 / 2000: loss 36.654007
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          iteration 600 / 2000: loss 23.732160
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          iteration 700 / 2000: loss 16.340341
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          iteration 800 / 2000: loss 11.538806
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          iteration 900 / 2000: loss 9.482515
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          iteration 1000 / 2000: loss 7.414343
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          iteration 1100 / 2000: loss 6.240377
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          iteration 1200 / 2000: loss 5.774960
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          iteration 1300 / 2000: loss 5.569365
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          iteration 1400 / 2000: loss 5.326023
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          iteration 1500 / 2000: loss 5.708757
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          iteration 1600 / 2000: loss 4.731255
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          iteration 1700 / 2000: loss 5.516500
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          iteration 1800 / 2000: loss 4.959480
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          iteration 1900 / 2000: loss 5.447249

3.2.2 预测


      
      
      
      
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          # Use svm to predict
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          # Training set
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          y_pred = svm.predict(X_train)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          num_correct = np.sum(y_pred == y_train)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          accuracy = np.mean(y_pred == y_train)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          print('Training correct %d/%d: The accuracy is %f' % (num_correct, X_train.shape[0], accuracy))
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          # Test set
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          y_pred = svm.predict(X_test)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          num_correct = np.sum(y_pred == y_test)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          accuracy = np.mean(y_pred == y_test)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          print('Test correct %d/%d: The accuracy is %f' % (num_correct, X_test.shape[0], accuracy))

运行结果如下：


      
      
      
      
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          Training correct 18799/49000: The accuracy is 0.383653
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          Test correct 386/1000: The accuracy is 0.386000

3.3 有交叉验证

3.3.1 训练模型


      
      
      
      
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          #Cross-validation
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          learning_rates = [1.4e-7, 1.5e-7, 1.6e-7]
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          regularization_strengths = [8000.0, 9000.0, 10000.0, 11000.0, 18000.0, 19000.0, 20000.0, 21000.0]
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          results = {}
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          best_lr = None
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          best_reg = None
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          best_val = -1   # The highest validation accuracy that we have seen so far.
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          best_svm = None # The LinearSVM object that achieved the highest validation rate.
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
           
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          for lr in learning_rates:
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
              for reg in regularization_strengths:
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  svm = LinearSVM()
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  loss_history = svm.train(X_train, y_train, learning_rate = lr, reg = reg, num_iters = 2000)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  y_train_pred = svm.predict(X_train)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  accuracy_train = np.mean(y_train_pred == y_train)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  y_val_pred = svm.predict(X_val)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  accuracy_val = np.mean(y_val_pred == y_val)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  if accuracy_val > best_val:
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                      best_lr = lr
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                      best_reg = reg
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                      best_val = accuracy_val
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                      best_svm = svm
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  results[(lr, reg)] = accuracy_train, accuracy_val
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                  print('lr: %e reg: %e train accuracy: %f val accuracy: %f' %
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                        (lr, reg, results[(lr, reg)][0], results[(lr, reg)][1]))
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          print('Best validation accuracy during cross-validation:\nlr = %e, reg = %e, best_val = %f' %
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
                (best_lr, best_reg, best_val))

3.3.2 预测


      
      
      
      
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          # Use the best svm to test
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          y_test_pred = best_svm.predict(X_test)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          num_correct = np.sum(y_test_pred == y_test)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          accuracy = np.mean(y_test_pred == y_test)
         
         
         
         
        
        
        
        
       
       
       
       
        
        
        
        
         
         
         
         
        
        
        
        
        
        
        
        
         
         
         
         
          
          
          
          print('Test correct %d/%d: The accuracy is %f' % (num_correct, X_test.shape[0], accuracy))

运行结果为：

Test correct 372/1000: The accuracy is 0.372000

转载于:https://www.cnblogs.com/Terrypython/p/10984227.html

你可能感兴趣的:(线性SVM分类器实战)

Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
4.C_数据结构_队列荣世蓥数据结构数据结构
概述什么是队列：队列是限定在两端进行插入操作和删除操作的线性表。具有先入先出(FIFO)的特点相关名词：队尾：写入数据的一段队头：读取数据的一段空队：队列中没有数据，队头指针=队尾指针满队：队列中存满了数据，队尾指针+1=队头指针循环队列1、基本内容循环队列是以数组形式构成的队列数据结构。循环队列的结构体如下：typedefintdata_t;//队列数据类型#defineN64//队列容量typ
springboot+vue项目实战一-创建SpringBoot简单项目苹果酱0567 面试题汇总与解析 spring boot 后端 java 中间件开发语言
这段时间抽空给女朋友搭建一个个人博客，想着记录一下建站的过程，就当做笔记吧。虽然复制zjblog只要一个小时就可以搞定一个网站，或者用cms系统，三四个小时就可以做出一个前后台都有的网站，而且想做成啥样也都行。但是就是要从新做，自己做的意义不一样，更何况，俺就是专门干这个的，嘿嘿嘿要做一个网站，而且从零开始，首先呢就是技术选型了，经过一番思量决定选择-SpringBoot做后端，前端使用Vue做一
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
GenVisR 基因组数据可视化实战(三) 11的雾
3.genCov画每个突变位点附件的coverage，跟igv有点相似。这个操作起来很复杂，但是图还是挺有用的。可以考虑。由于我的referencegenomebuild是hg38BiocManager::install(c("TxDb.Hsapiens.UCSC.hg38.knownGene","BSgenome.Hsapiens.UCSC.hg38"))library(TxDb.Hsapien
【树一线性代数】005入门 Owlet_woodBird 算法
Index本文稍后补全，推荐阅读：https://blog.csdn.net/weixin_60702024/article/details/141874376分析实现总结本文稍后补全，推荐阅读：https://blog.csdn.net/weixin_60702024/article/details/141874376已知非空二叉树T的结点值均为正整数，采用顺序存储方式保存，数据结构定义如下:t
python爬取微信小程序数据,python爬取小程序数据 2301_81900439 前端
大家好，小编来为大家解答以下问题，python爬取微信小程序数据，python爬取小程序数据，现在让我们一起来看看吧！Python爬虫系列之微信小程序实战基于Scrapy爬虫框架实现对微信小程序数据的爬取首先，你得需要安装抓包工具，这里推荐使用Charles，至于怎么使用后期有时间我会出一个事例最重要的步骤之一就是分析接口，理清楚每一个接口功能，然后连接起来形成接口串思路,再通过Spider的回调
HarmonyOS开发实战（ Beta5.0）搜索框热搜词自动切换让开，我要吃人了 OpenHarmony HarmonyOS 鸿蒙开发 harmonyos 华为鸿蒙移动开发鸿蒙系统前端开发语言
鸿蒙HarmonyOS开发往期必看：HarmonyOSNEXT应用开发性能实践总结最新版！“非常详细的”鸿蒙HarmonyOSNext应用开发学习路线！（从零基础入门到精通）介绍本示例介绍使用TextInput组件与Swiper组件实现搜索框内热搜词自动切换。效果图预览使用说明页面顶部搜索框内热搜词条自动切换，编辑搜索框时自动隐藏。实现思路使用TextInput实现搜索框TextInput({te
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（二十八）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
阿里巴巴商品搜索API返回值实战解析 weixin_43841111 api java 前端 javascript
在解析阿里巴巴中国站商品搜索API返回值并进行实战时，可以从以下几个方面入手：一、了解API返回值的结构基本信息返回值通常包含商品的标题、价格、库存、图片链接等基本信息。这些信息对于了解商品的概况非常重要。例如，商品标题可以让你快速了解商品的名称和特点，价格信息可以帮助你进行价格比较和成本核算。详细描述可能包括商品的详细描述、规格参数、使用方法等。这些信息对于深入了解商品的特性和功能非常有帮助。比
李笑来 6 你到底有没有资本+7什么是落后盛大米
6你到底有没有资本摘要不能够心平气和地被判上无期徒刑的资本，就别假装资本混迹江湖了。投资知识，经验，智慧，几乎只能从实战中获得————书上写的，牛人讲的，都跟你没关系，因为只有那些东西在你骨子里生根之后再发芽且不夭折而后还要等上很久才会茁壮甚至茂盛。。。。直接将年收入的10%-20%判死刑是最简单，最直接，最粗暴最有效的操作方式。投资，尤其是“好的投资”，一定是“舍我其谁”的活动。关于资本的思考，
基于JavaWeb开发的Java+SpringMvc+vue+element实现上海汽车博物馆平台网顺技术团队成品程序项目 java vue.js 汽车课程设计 spring boot
基于JavaWeb开发的Java+SpringMvc+vue+element实现上海汽车博物馆平台作者主页网顺技术团队欢迎点赞收藏⭐留言文末获取源码联系方式查看下方微信号获取联系方式承接各种定制系统精彩系列推荐精彩专栏推荐订阅不然下次找不到哟Java毕设项目精品实战案例《1000套》感兴趣的可以先收藏起来，还有大家在毕设选题，项目以及论文编写等相关问题都可以给我留言咨询，希望帮助更多的人文章目录基
跟剽悍一只猫学习收获之成为领域专家财务自由的社群运营人苏宝
001找到这个领域内权威的书籍。002按照书的脉络（章节目录）记录书中的重要内容（对自己认知系统造成冲击的，以前没有学过的，觉得有用的，暂时还不太理解的）记录下来。003读完第一遍以后，接着读第二遍。这一遍记录书里对你有用的方法论，并尝试依据这些方法论实战。004再读一遍，这一遍记录尝试梳理整个书的认知框架和内在逻辑。005之后，可以多朗读几遍全书。你会发现，你对这些知识的理解会越来越全面，越有深
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
BP神经网络的传递函数大胜归来19 MATLAB
BP网络一般都是用三层的，四层及以上的都比较少用；传输函数的选择，这个怎么说，假设你想预测的结果是几个固定值，如1,0等，满足某个条件输出1，不满足则0的话，首先想到的是hardlim函数，阈值型的，当然也可以考虑其他的；然后，假如网络是用来表达某种线性关系时，用purelin---线性传输函数；若是非线性关系的话，用别的非线性传递函数，多层网络时，每层不一定要用相同的传递函数，可以是三种配合，可
神经网络传递函数sigmoid,神经网络传递函数作用快乐的小荣荣神经网络机器学习深度学习人工智能
神经网络传递函数选取不同会有特别大差别嘛？只是最后一层，但前面层是非线性，那么可能存在区别不大的情况。线性函数f(a*input)=af(input),一般来说，input为向量，最简化情况下，可以假设input的各个维度，a1=a2=a3。。。意味着你线性层只是简单的对输入做了scale~而神经网络能起作用的原因，在于通过足够复杂的非线性函数，来模拟任何的分布。所以，神经网络必须要用非线性函数。
Python OpenCV图像处理：从基础到高级的全方位指南极客代码玩转Python 开发语言 python opencv 图像处理计算机视觉
目录第一部分：PythonOpenCV图像处理基础1.1OpenCV简介1.2PythonOpenCV安装1.3实战案例：图像显示与保存1.4注意事项第二部分：PythonOpenCV图像处理高级技巧2.1图像变换2.2图像增强2.3图像复原第三部分：PythonOpenCV图像处理实战项目3.1图像滤波3.2图像分割3.3图像特征提取第四部分：PythonOpenCV图像处理注意事项与优化策略4
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
增长黑客和最小可复制的内核爱思考的糖
五段-增长黑客的三大步骤生活就像逆水行舟，加入你不能加速，现实中最好的情况，你也就处在一种原地打转的状况。增长，就像一辆车里的加速器。围棋爱好者，水平一直没有进步的原因。是因为没有找到提高下棋水平的增长模式有三个办法可以提高：做死活题，练习做关键决策的能力；打谱，复盘经典案例；找AI陪练。增长黑客的三个实战步骤：第一步，假设：建立最小闭环。从笨办法开始，不怕犯错，代价并不高，你可以勇敢尝试。想知道
复盘赵建庄
行动后反思，AAR（AfterActionReview），是知识管理的一种工具，起源于美国陆军的作战方法，强调在每次行动后进行及时反思、总结和改进。《复盘》一书其实就是这种方法的具体应用，名字不同，然而实质相同。相比AAR这样的说法，复盘更简洁，容易被国人接受，而且，书中给出了非常详细的步骤，有较强的指导意义和实战性，AAR的六步法，说的比较简单，有人可以悟，结合实际业务演变出各种变化，大多数人可
题解 | #完全数计算#不知道为什么没超时的暴力解法 huaxinjiayou java
兄弟们，坚持就是胜利啊，找工作从去年秋招就开始找，到五月底才收到第一个offer星环的，然后六月初t咋六月了还有面试啊，有兄弟了解这个部门吗面完了家人们，纯纯kpi啊，上来就是一道题是打印多个字符串的华为接头人话术指南：欲投华为，必看此贴!引流华为招聘提前批【奖】这个夏天，和牛牛一起打卡刷题~Java面试实战项目25届本科找暑期实习的历程飞猪旅行运营岗面经百度视觉算法一面面经感谢牛友们，腾子pcg
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
【编译原理】方舟编译技术课程 — 词法分析 CSU_THU_SUT 编译原理编译器编译原理 llvm
打开目录阅读更佳参考视频：方舟·编译技术入门与实战以及西交冯博琴老师的相关视频编译的过程包括词法分析（分析程序符号）、语法分析（分析语法单位）、中间代码生成、代码优化和目标代码生成。一、编译过程各部分的任务（1）词法分析：输入源程序，扫描分解源程序字符串，识别五类符号，包括定义符、标识符、运算符、界符和常数，转为单词符号。（2）语法分析：在词法分析基础上，将单词符号转为语法单位（如短句、子句、句子
STM32 如何生成随机数千千道 STM32 stm32 单片机物联网
目录一、引言二、STM32随机数发生器概述三、工作原理1.噪声源2.线性反馈移位寄存器（LFSR）3.数据寄存器（RNG_DR）4.监控和检测电路：5.控制和状态寄存器6.生成流程四、使用方法1.使能随机数发生器2.读取随机数3.错误处理五、注意事项1.随机数的质量2.安全性3.性能考虑六、总结一、引言在嵌入式系统开发中，随机数的生成常常是一个重要的需求。无论是用于加密、模拟、游戏还是其他需要不确
python logging使用_Python实战之logging模块使用详解 weixin_39548832 python logging使用
用Python写代码的时候，在想看的地方写个printxx就能在控制台上显示打印信息，这样子就能知道它是什么了，但是当我需要看大量的地方或者在一个文件中查看的时候，这时候print就不大方便了，所以Python引入了logging模块来记录我想要的信息。print也可以输入日志，logging相对print来说更好控制输出在哪个地方，怎么输出及控制消息级别来过滤掉那些不需要的信息。1、日志级别im
Open Feign 实战笔记自强-X spring-cloud java spring 微服务 ribbon spring cloud
OpenFeign笔记概念声明式的web服务客户端。使用接口加注解的形式编程。它是对RestTemplate和ribbon做了进一步封装。Feign已经停更，OpenFeign是在Feign的基础上又做了进一步的封装。Feign：Feign是SpringCloud组件中的一个轻量级RESTful的HTTP服务客户端Feign内置了Ribbon，用来做客户端负载均衡，去调用服务注册中心的服务。Fei
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息