Extreme_Programmer

[cs231n]Assignment1_SVM 代码学习

部分资料来源于网络，仅做个人学习之用

Support Vector Machine

1. Download the CIFAR10 datasets, and load it

2. Preprocessing

3. Define a linear SVM classifier

4. Gradient Check

5. Validation and Test

总结

1. Download the CIFAR10 datasets, and load it

Setup code

Load the CIFAR10 dataset

Show some CIFAR10 images

以上三部分与Knn完全相同：https://blog.csdn.net/Pecony/article/details/104278415

Subsample the data for more efficient code execution

为了更有效地执行代码，对数据进行子采样

knn不具有显示的学习过程，svm分类器则不同，它通过训练学习参数W和 b，将其保存。训练完成，训练数据就可以丢弃，留下学习到的参数即可。之后一个测试图像可以简单地输入函数，并基于计算出的分类分值来进行分类。而参数的学习过程就是训练过程。

KNN与SVM区别：https://blog.csdn.net/Pecony/article/details/104293525

在机器学习中，还有一个必须要重视的问题，那就是过拟合，为了判断是否发生过拟合，我们从训练集中抽取一部分作为验证集，所以我们的数据集就分为了训练集、验证集和测试集

50000个训练集中49000作为训练集，1000作为验证集。测试集只选取10000个测试样本中的前1000个。

"""
我们这里除了训练集、验证集、测试集之外又从训练集中随机选择500个 样本作为development set，在最终的训练和预测之前，我们都使用这个小的数据集， 当然，直接使用完整的训练集也是可以的，不过就是花费的时间有点多。   
注意：这里需要先写验证集，再写训练集，否则会报错超出范围！！ 
"""
# Split the data into train, val, and test sets
num_train = 49000
num_val = 1000
num_test = 1000

# Validation set
mask = range(num_train, num_train + num_val)
X_val = X_train[mask]
y_val = y_train[mask]

# Train set
mask = range(num_train)
X_train = X_train[mask]
y_train = y_train[mask]

# Test set
mask = range(num_test)
X_test = X_test[mask]
y_test = y_test[mask]

print('Train data shape: ', X_train.shape)
print('Train labels shape: ', y_train.shape)
print('Validation data shape: ', X_val.shape)
print('Validation labels shape ', y_val.shape)
print('Test data shape: ', X_test.shape)
print('Test labels shape: ', y_test.shape)

2. Preprocessing

Reshape the images data into rows

将图像数据重新塑成行

# Preprocessing: reshape the images data into rows
X_train = np.reshape(X_train, (X_train.shape[0], -1))
X_val = np.reshape(X_val, (X_val.shape[0], -1))
X_test = np.reshape(X_test, (X_test.shape[0], -1))

print('Train data shape: ', X_train.shape)
print('Validation data shape: ', X_val.shape)
print('Test data shape: ', X_test.shape)

Subtract the mean images

在将我们的数据用于训练和预测之前，我们需要对数据进行归一化处理，这里是对每个特征减去平均值来中心化

中心化是减去均值，标准化是减去均值后除以标准差。

注意：这里减的均值，是训练集的均值，也就是说训练集、验证集、测试集都需要减去前述49000个训练集的均值。

归一化原因：在机器学习领域中，不同评价指标（即特征向量中的不同特征就是所述的不同评价指标）往往具有不同的量纲和量纲单位，这样的情况会影响到数据分析的结果，为了消除指标之间的量纲影响，需要进行数据标准化处理，以解决数据指标之间的可比性。原始数据经过数据标准化处理后，各指标处于同一数量级，适合进行综合对比评价。其中，最典型的就是数据的归一化处理。

归一化目的：使得预处理的数据被限定在一定的范围内（比如[0,1]或者[-1,1]），从而消除奇怪样本导致的不良影响

# Processing: subtract the mean images
mean_image = np.mean(X_train, axis=0)
plt.figure(figsize=(4,4))
plt.imshow(mean_image.reshape((32,32,3)).astype('uint8'))
plt.show()

X_train -= mean_image
X_val -= mean_image
X_test -= mean_image

Append the bias dimension of ones

附加1的偏差维度

由下图可知：权重矩阵其实是w和b的，因此我们需要对x增加一个维度。

# append the bias dimension of ones (i.e. bias trick)
X_train = np.hstack([X_train, np.ones((X_train.shape[0], 1))])
X_val = np.hstack([X_val, np.ones((X_val.shape[0], 1))])
X_test = np.hstack([X_test, np.ones((X_test.shape[0], 1))])
print('Train data shape: ', X_train.shape)
print('Validation data shape: ', X_val.shape)
print('Test data shape: ', X_test.shape)

# 数据处理完成

3. Define a linear SVM classifier

计算loss时利用两层循环进行，对于每一个训练集，利用其乘以W之后，得到其对每个类的得分score以及正确标签的得分correct_class_score, 然后内层循环对每个类，分别计算max(0, score-correct_class_score+1), loss值为输入的所有X的loss之和的均值，然后加上一个L2正则项以防止W过于复杂，即total_loss = avg_loss + lambda * sum(W*W), 后面是我们要实现求dW, 也即求梯度，

对该分类器的构建，主要涉及梯度和损失函数计算、训练和预测模型这两个方面
损失函数的计算的公式如下（这里是加入正则项之后的损失函数值，正则化惩罚可以带来很多良好的性质）：

梯度计算方法如下

（1）数值计算：

（2）微分分析计算：

class LinearSVM(object):
    """ A subclass that uses the Multiclass SVM loss function """
    def __init__(self):
        self.W = None
  """
以下两个函数的参数相同
        输入:
        - X:shape(num_train, D)的numpy数组，包含训练数据
        由每个维D的num_train样本组成
        - y:一个形状的numpy数组(num_train，)包含训练标签，
        其中y[i]是X[i]的标签
        -reg:float，正则化系数
        返回:
        -loss:预测值与真实值之间的损耗值
        - dW: W的梯度
        """
"""--------------（1）采用数值方式计算损失函数和梯度---------------------------"""

    def loss_naive(self, X, y, reg):
        
        # Initialize loss and dW
        loss = 0.0
        dW = np.zeros(self.W.shape)
        
        # Compute the loss and dW
        num_train = X.shape[0]
        num_classes = self.W.shape[1] 

        for i in range(num_train):
            scores = np.dot(X[i], self.W)
            for j in range(num_classes):
                if j == y[i]:
                    margin = 0  
# 当j=y[i]时，代表正确分类，由L=max(...)公式可知正确分类没有loss
                else:
                    margin = scores[j] - scores[y[i]] + 1   # 实现L = max(...) delta = 1 
                                                 # scores[y[i]]是计算正确分类的分数
                    if margin > 0:  
                        loss += margin
                        dW[:,j] += X[i].T
                        dW[:,y[i]] += -X[i].T
        # Divided by num_train
        loss /= num_train
        dW /= num_train
        
        # Add regularization
        loss += 0.5 * reg * np.sum(self.W * self.W)
        dW += reg * self.W
        
        return loss, dW

"""--------------（2）采用矩阵的方式计算损失函数和梯度---------------------------"""
    def loss_vectorized(self, X, y, reg):
        """
        Structured SVM loss function, naive implementation (with loops).
        Inputs:
        - X: A numpy array of shape (num_train, D) contain the training data
          consisting of num_train samples each of dimension D
        - y: A numpy array of shape (num_train,) contain the training labels,
          where y[i] is the label of X[i]
        - reg: (float) regularization strength
        Outputs:
        - loss: the loss value between predict value and ground truth
        - dW: gradient of W
        输入:
        - X: shape(num_train, D)的一个numpy阵列，包含训练数据
        由每个维D num_train的样本组成
        - y: shape(num_train,)的一个numpy阵列,包含训练标签,
          y[i]是X[i]的标签 
        - reg:(float)正则化的strength
        输出:
        - loss:损失价值之间的预测价值和地面真理
        dW:W的梯度
        """
        
         # Initialize loss and dW
        loss = 0.0
        dW = np.zeros(self.W.shape)
        
        # Compute the loss
        num_train = X.shape[0]
        scores = np.dot(X, self.W)
        correct_score = scores[range(num_train), list(y)].reshape(-1, 1)    # delta = -1
        margin = np.maximum(0, scores - correct_score + 1)
        margin[range(num_train), list(y)] = 0
        loss = np.sum(margin) / num_train + 0.5 * reg * np.sum(self.W * self.W)
        
        # Compute the dW
        num_classes = self.W.shape[1]
        mask = np.zeros((num_train, num_classes))
        mask[margin > 0] = 1
        mask[range(num_train), list(y)] = 0
        mask[range(num_train), list(y)] = -np.sum(mask, axis=1)
        dW = np.dot(X.T, mask)
        dW = dW / num_train + reg * self.W
        
        return loss, dW
    
    def train(self, X, y, learning_rate = 1e-3, reg = 1e-5, num_iters = 100, 
             batch_size = 200, print_flag = False):
        """
        Train linear SVM classifier 采用随机梯度下降法
        Inputs:
        - X: A numpy array of shape (num_train, D) contain the training data
          consisting of num_train samples each of dimension D
        - y: A numpy array of shape (num_train,) contain the training labels,
          where y[i] is the label of X[i], y[i] = c, 0 <= c <= C
        - learning rate: (float) learning rate for optimization
        - reg: (float) regularization strength
        - num_iters: 迭代次数(integer) numbers of steps to take when optimization
        - batch_size: 批尺寸(integer) number of training examples to use at each step
        - print_flag: 为True是显示中间迭代过程(boolean) If true, print the progress during optimization
        Outputs:
        - loss_history: 每次迭代的损失函数值 A list containing the loss at each training iteration
        """
        
        loss_history = []
        num_train = X.shape[0]
        dim = X.shape[1]
        num_classes = np.max(y) + 1
        
        # Initialize W
        if self.W == None:
            self.W = 0.001 * np.random.randn(dim, num_classes)
        
        # 迭代和优化
"""
后面是SGD，首先实现train函数，sample的方式也就是一般机器学习里的技巧，利用np.random.choice()生成index，
然后取X，y中的对应项，而更新W的方式更加简单，梯度下降，W = W - lr * dW, 代码如下：
"""
        for t in range(num_iters):
            idx_batch = np.random.choice(num_train, batch_size, replace=True)
            X_batch = X[idx_batch]
            y_batch = y[idx_batch]
            loss, dW = self.loss_vectorized(X_batch, y_batch, reg)
            loss_history.append(loss)
            self.W += -learning_rate * dW
            
            if print_flag and t%100 == 0:
                print('iteration %d / %d: loss %f' % (t, num_iters, loss))
        
        return loss_history
    
    def predict(self, X):
        """
        Use the trained weights of linear SVM to predict data labels
        Inputs:
        - X: A numpy array of shape (num_train, D) contain the training data
        Outputs:
        - y_pred: A numpy array, predicted labels for the data in X
        """
        
        y_pred = np.zeros(X.shape[0])
        scores = np.dot(X, self.W)
        y_pred = np.argmax(scores, axis=1)
        
        return y_pred

4. Gradient Check

Define loss function

def loss_naive1(X, y, W, reg):
    """
    Structured SVM loss function, naive implementation (with loops).
    Inputs:
    - X: A numpy array of shape (num_train, D) contain the training data
    consisting of num_train samples each of dimension D
    - y: A numpy array of shape (num_train,) contain the training labels,
    where y[i] is the label of X[i]
    - W: A numpy array of shape (D, C) contain the weights
    - reg: float, regularization strength
    Return:
    - loss: the loss value between predict value and ground truth
    - dW: gradient of W
    """
        
    # Initialize loss and dW
    loss = 0.0
    dW = np.zeros(W.shape)
        
    # Compute the loss and dW
    num_train = X.shape[0]
    num_classes = W.shape[1] 
    for i in range(num_train):
        scores = np.dot(X[i], W)
        for j in range(num_classes):
            if j == y[i]:
                margin = 0
            else:
                margin = scores[j] - scores[y[i]] + 1    # delta = 1
                if margin > 0:
                    loss += margin
                    dW[:,j] += X[i].T
                    dW[:,y[i]] += -X[i].T
    # Divided by num_train
    loss /= num_train
    dW /= num_train
        
    # Add regularization
    loss += 0.5 * reg * np.sum(W * W)
    dW += reg * W
    
    return loss, dW

def loss_vectorized1(X, y, W, reg):
    """
    Structured SVM loss function, naive implementation (with loops).
    Inputs:
    - X: A numpy array of shape (num_train, D) contain the training data
    consisting of num_train samples each of dimension D
    - y: A numpy array of shape (num_train,) contain the training labels,
    where y[i] is the label of X[i]
    - W: A numpy array of shape (D, C) contain the weights
    - reg: (float) regularization strength
    Outputs:
    - loss: the loss value between predict value and ground truth
    - dW: gradient of W
    """
        
    # Initialize loss and dW
    loss = 0.0
    dW = np.zeros(W.shape)
        
    # Compute the loss
    num_train = X.shape[0]
    scores = np.dot(X, W)
    correct_score = scores[range(num_train), list(y)].reshape(-1, 1)    # delta = -1
    margin = np.maximum(0, scores - correct_score + 1)
    margin[range(num_train), list(y)] = 0
    loss = np.sum(margin) / num_train + 0.5 * reg * np.sum(W * W)
        
    # Compute the dW
    num_classes = W.shape[1]
    mask = np.zeros((num_train, num_classes))
    mask[margin > 0] = 1
    mask[range(num_train), list(y)] = 0
    mask[range(num_train), list(y)] = -np.sum(mask, axis=1)
    dW = np.dot(X.T, mask)
    dW = dW / num_train + reg * W
        
    return loss, dW

Gradient check

用公式计算梯度速度很快，唯一不好的就是实现的时候容易出错。为了解决这个问题，在实际操作时常常将分析梯度法的结果和数值梯度法的结果作比较，以此来检查其实现的正确性，这个步骤叫做梯度检查，梯度检验公式如下：

h是一个很小的数字，在实践中近似为1e5

我们这里使用相对误差来比较数值梯度和解析梯度的差，这里放一张cs231n讲义对这里的解释。

以下代码是为了计算我们前面自己计算的梯度和采用数学方法计算的差别
cs231n提供的梯度检验程序：def grad_check_sparse

from gradient_check import grad_check_sparse
import time

# 生成一个随机的小数字SVM权矩阵
W = np.random.randn(3073, 10) * 0.0001

# Without regularization
loss, dW = loss_naive1(X_val, y_val, W, 0)
f = lambda W: loss_naive1(X_val, y_val, W, 0.0)[0]
grad_numerical = grad_check_sparse(f, W, dW)

# With regularization
loss, dW = loss_naive1(X_val, y_val, W, 5e1)
f = lambda W: loss_naive1(X_val, y_val, W, 5e1)[0]
grad_numerical = grad_check_sparse(f, W, dW)

loss_naive vs. loss_vectorized

比较两种计算方式

t_st = time.time()
loss_naive, dW_naive = loss_naive1(X_val, y_val, W, 0.00005)
t_ed = time.time()
print('Naive loss: %e computed in %f seconds.' % (loss_naive, t_ed - t_st))
t_st = time.time()
loss_vectorized, dW_vectorized = loss_vectorized1(X_val, y_val, W, 0.00005)
t_ed = time.time()
print('Vectorized loss: %e computed in %f seconds.' % (loss_vectorized, t_ed - t_st))

diff_loss = loss_naive - loss_vectorized
diff_dW = np.linalg.norm(dW_naive - dW_vectorized, ord='fro')
print('Difference of loss: %f' % diff_loss)
print('Difference of dW: %f' % diff_dW)

由上图可知，两种计算方式得到的损失函数值是相同的，而采用向量方法计算时间花费少很多，因此接下来将使用 svm_loss_vectorized （矩阵）方法计算损失函数和梯度。
既然两种方法计算得出的损失函数值是一样的，那么梯度应该也是一样的，也就不需要再对第二种方法进行梯度检验了，不过损失函数是一维的，而梯度是二维的，可以使用 np.linalg.norm 函数来计算范数，其余同上。
因此，确定了损失函数和梯度的计算方式。

Stochastic Gradient Descent

随机梯度下降法

现在已知采用向量方法计算损失函数和梯度效率最高，并且得到的梯度经验证误差很小，接下来我们将使用随机梯度下降法（SGD）来进行梯度更新，使得损失函数值最小。

svm = LinearSVM()
loss_history = svm.train(X_train, y_train, learning_rate = 1e-7, reg = 2.5e4, num_iters = 2000, 
             batch_size = 200, print_flag = True)

可视化损失函数的值：

# Plot the loss_history
plt.plot(loss_history)
plt.xlabel('Iteration number')
plt.ylabel('Loss value')
plt.show()

通过该图，我们看到损失函数值在越来越小，已经在发生收敛。

训练完成之后，将参数保存，我们接下来就可以使用这些参数进行预测，并计算准确率，代码如下

# Use svm to predict
# Training set
y_pred = svm.predict(X_train)
num_correct = np.sum(y_pred == y_train)
accuracy = np.mean(y_pred == y_train)
print('Training correct %d/%d: The accuracy is %f' % (num_correct, X_train.shape[0], accuracy))

# Test set
y_pred = svm.predict(X_test)
num_correct = np.sum(y_pred == y_test)
accuracy = np.mean(y_pred == y_test)
print('Test correct %d/%d: The accuracy is %f' % (num_correct, X_test.shape[0], accuracy))

5. Validation and Test

Cross-validation

学习速率和正则项是超参数

通过手动调整超参数，可以让模型收敛的更快。接下来通过交叉验证来选择较好的学习率和正则项系数。

从列举的学习率和正则项中选择验证集正确率最高的超参数，将参数保存到 best_svm 中，其中 results 存储的是形如 {(lr,reg): (train_accuracy,val_accuracy)} 的字典。

learning_rates = [1.4e-7, 1.5e-7, 1.6e-7]
regularization_strengths = [8000.0, 9000.0, 10000.0, 11000.0, 18000.0, 19000.0, 20000.0, 21000.0]

results = {}
best_lr = None
best_reg = None
best_val = -1   # The highest validation accuracy that we have seen so far.
best_svm = None # The LinearSVM object that achieved the highest validation rate.

for lr in learning_rates:
    for reg in regularization_strengths:
        svm = LinearSVM()
        loss_history = svm.train(X_train, y_train, learning_rate = lr, reg = reg, num_iters = 2000)
        y_train_pred = svm.predict(X_train)
        accuracy_train = np.mean(y_train_pred == y_train)
        y_val_pred = svm.predict(X_val)
        accuracy_val = np.mean(y_val_pred == y_val)
        if accuracy_val > best_val:
            best_lr = lr
            best_reg = reg
            best_val = accuracy_val
            best_svm = svm
        results[(lr, reg)] = accuracy_train, accuracy_val
        print('lr: %e reg: %e train accuracy: %f val accuracy: %f' %
              (lr, reg, results[(lr, reg)][0], results[(lr, reg)][1]))
print('Best validation accuracy during cross-validation:\nlr = %e, reg = %e, best_val = %f' %
      (best_lr, best_reg, best_val))

也可以将上述结果可视化，面积的大小代表正确率的大小

# Visualize the cross-validation results
import math

x_scatter = [math.log10(x[0]) for x in results]
y_scatter = [math.log10(x[1]) for x in results]

# Plot training accuracy
plt.figure(figsize=(10,10))
make_size = 100
colors = [results[x][0] for x in results]   # 使用面积来表示正确率的大小 
plt.subplot(2, 1, 1)
plt.scatter(x_scatter, y_scatter, make_size, c = colors)
plt.colorbar()
plt.xlabel('log learning rate')
plt.ylabel('log regularization strength')
plt.title('Training accuracy')

# Plot validation accuracy
colors = [results[x][1] for x in results]
plt.subplot(2, 1, 2)
plt.scatter(x_scatter, y_scatter, make_size, c = colors)
plt.colorbar()
plt.xlabel('log learning rate')
plt.ylabel('log regularization strength')
plt.title('Validation accuracy')
plt.show()

Test

使用刚刚保存的最好的模型来进行预测，并输出预测的准确率

# Use the best svm to test
y_test_pred = best_svm.predict(X_test)
num_correct = np.sum(y_test_pred == y_test)
accuracy = np.mean(y_test_pred == y_test)
print('Test correct %d/%d: The accuracy is %f' % (num_correct, X_test.shape[0], accuracy))

Visualize the weights for each class

通过可视化下权重，看看模型到底在学习什么东西。

W = best_svm.W[:-1, :]    # delete the bias 将偏置分离出来，也就是说，我们只可视化权重。
W = W.reshape(32, 32, 3, 10)
W_min, W_max = np.min(W), np.max(W)
classes = ['plane', 'car', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck']
for i in range(10):
    plt.subplot(2, 5, i+1)
    imgW = 255.0 * ((W[:, :, :, i].squeeze() - W_min) / (W_max - W_min))
    plt.imshow(imgW.astype('uint8'))
    plt.axis('off')
    plt.title(classes[i])
plt.show()

权重可视化的结果，比如car这一类，可以隐约看到汽车的轮廓，权重参数学习到了这些图像的特征。

总结

1. 完成一个使用向量方法计算svm损失函数；

2. 完成一个使用向量方法来分析梯度；

3. 使用数学方法来检查梯度

4. 用验证集来微调学习率和正则项；

5. 使用随机梯度下降法来优化损失函数；

6. 可视化最后学习到的权重

通过与AI代理结对编程在集成课程中促进AI辅助学习循环的方法神一样的老师论文阅读分享人工智能结对编程学习
本篇论文提出了一种新的方法论，利用人工智能（AI）技术的最新进展，为学生制定一个AI辅助的代码学习循环。这种方法在现有的学习过程中创新性地融入了结对编程，以增强学生的互动式学习体验。以下是论文的主要内容概述：摘要(Abstract)：提出了一种新方法，利用AI技术来辅助学生学习编程。方法包括将示例代码转化为脚手架代码作为练习，通过教师与AI的配对来实现。脚手架代码作为学生在硬件平台上迭代完成和调试
aarch64架构汇编速成 reL1fe 架构 arm
aarch64架构汇编速成，用于逆向aarch64代码学习资料：https://github.com/nzcv/note重要寄存器x0~x7：传递子程序的参数和返回值，一般x0保存返回值x29：帧指针寄存器（FP），用于连接栈帧，使用时必须保存。（类似8064架构下的ebp）x30：链接寄存器（LR），用于保存子程序的返回地址x31：堆栈指针寄存器（SP），用于指向每个函数的栈顶。重要指令ADD指
算算你活了多少天（代码学习）高小白在敲初学C语言学习算法数据结构
思路你现在活的天数=你当时出生时到出生那年（可能是闰年）年末的天数+出生那年的下一年到今年上一年的年末（中间这些是完整的年）+今年年初到今天的天数，由这三部分的天数组成。这里我们计算的时候也是将三个部分的天数分别去计算，在后面的变量中，我们用tian1，tian2，tian3分别表示这三部分的天数；思路实现一年有十二个月，除了二月份，每一个月的天数都固定（一三五七八十腊，三十一天永不差），而二月份
python学习笔记五（面向对象实战版）小满胜万全 Python学习学习笔记
传送门：python及pycharm安装配置_pycharm和python配置-CSDN博客Python学习笔记（一）-CSDN博客Python学习笔记（二）-CSDN博客Python学习笔记三（面向对象）-CSDN博客Python学习笔记四（面向对象）-CSDN博客前言：在前面两章，我们学习了python的基本概念和一些重要的知识点，由于这个部分非常重要，而代码学习之道最重要的就是自己要动手写代
【PRIVGUARD-privguard-artifact-main】代码学习（parser部分） LOST P 论文阅读学习论文阅读论文笔记
privguard-artifact-main：parser部分简述1.abstract_domain.py（1）简介实现PrivGuard中的抽象域功能。PrivGuard是一个旨在确保Python程序符合特定隐私策略的工具。代码中定义了两种类型的抽象域：闭区间格（ClosedIntervalL）和模式格（SchemaL）。闭区间格（ClosedIntervalL）：这部分代码定义了一个处理扩展
Vue.js前端框架技术学习心得体会 dzsszd 前端框架 vue.js 学习
Vue.js前端框架技术学习心得体会目录Vue.js前端框架技术学习心得体会一、Vue.js介绍1.易上手：2.响应式数据绑定：3.生态系统完善：4.组件化：二、Vue.js的优势三、总结四、代码1.app登陆页代码2.app侧边栏代码学习Vue.js是一次非常有价值的经历。在开始学习之前，我对前端开发有一定的了解，但Vue.js的出现让我对前端开发有了全新的认识。一、Vue.js介绍1.易上手：
Unity笔记：第三人称Starter Asset代码学习 Binarydog_Lee Unity 学习 unity
前言什么是ThirdPersonStarterAsset自己看了几篇文章和视频，写了个人物移动脚本，有很多瑕疵。这个时候研究一下优秀的代码总是好的，Unity官方有ThirdPersonStarterAsset可供研究，其官方商店页面是：StarterAssets-ThirdPerson|UpdatesinnewCharacterControllerpackage官方B站介绍视频是：Bilibil
通过写代码学习AWS DynamoDB （2）书香门第云计算 AWS 分布式系统设计学习 aws 云计算
简介在上一篇文章里，我们实现了DDB的基本API。上一篇文章请见《通过写代码学习AWSDynamoDB（1）》。在本文中，我们将进一步增强该DDB的模拟实现，给DDB加入Partition。Partition是Shard的一种。关于Shard的介绍可以参看这篇文章。我们简单介绍一下Shard和Parition的概念。然后我们会在DDB的实现中加上一个简单的Parition的实现。Shard介绍区别
通过写代码学习AWS DynamoDB（1）书香门第学习 aws 云计算
AWS的DynamoDB是一款非常受欢迎的Non-SQL数据库。DDB的实现应用了非常多的分布式系统的技术，例如SHARD，eventualconsistency，consistencyHash等。我们通过模拟一个简单的DDB的实现，可以更好的理解这些技术是如何工作的。在本文中我们首先用python实现DDB的最基本的API，包括table有关的API，和table本身的API。DDB作为Non-
机器学习入门之基础概念及线性回归 StarCoder_Yue 算法机器学习学习笔记机器学习线性回归正则化人工智能算法数学
任务目录什么是Machinelearning学习中心极限定理，学习正态分布，学习最大似然估计推导回归Lossfunction学习损失函数与凸函数之间的关系了解全局最优和局部最优学习导数，泰勒展开推导梯度下降公式写出梯度下降的代码学习L2-Norm，L1-Norm，L0-Norm推导正则化公式说明为什么用L1-Norm代替L0-Norm学习为什么只对w/Θ做限制，不对b做限制Question1：Wh
linux0.1x内核代码学习笔记-boot启动守护安静星空 linux内核代码学习笔记 gnu 操作系统 linux c语言架构
linux0.11上电时把启动盘第1扇区bootsect.s的代码拷贝到0x7c00位置处，这段代码自己把自己拷贝到0x90000这个位置然后开始执行，利用bios预先设置好的中断函数，把第2扇区setup程序拷贝到0x90200处，一共4个扇区。把第6扇区开始的240个扇区system代码读取到内存地址0x10000处共120KB，整个操作系统的代码已经读取到内存了，然后再确定根文件设备保存到r
测试工程师需要准备哪些知识我是一只蘑菇17 测试测试
零基础测试工程师的必备技能概述测试基础理论软件测试的分类研发管理模型测试流程测试方法（比较重要的测试方法）（用来设计测试用例）BUG的管理测试的应用总结概述本文会记录一些本人有关于测试工程师岗位的学习的整个过程和理解，如有错误或不足欢迎指正。下文会从测试基础理论，测试的工具学习，代码学习，自动化几个方向记录。测试，文档，编程能力软件测试工程师实际上是看预期结果和实际结果是否相符软件测试的发展历程证
cs231n_深度之眼第二次作业 Jie_Cheney
图像分类数据和label分别是什么？图像分类存在的问题与挑战？图像分类数据包括训练集测试集的数据，在有监督的问题中对于训练集数据来说是有label的，而测试集是等待我们去识别它的类别，不具有label。label就是分类标签，比如cifar10这个数据集，待分类的这10类数据我们可以写成1-10，或者0-9这就叫做label。图像分类存在的问题与挑战：光照，角度，形变，遮挡。使用python加载一
神经网络学习小记录36——Keras实现LSTM与LSTM参数量详解 Bubbliiiing 神经网络学习小记录 Keras LSTM 神经网络深度学习
神经网络学习小记录36——Keras实现LSTM学习前言什么是LSTM1、LSTM的结构2、LSTM独特的门结构3、LSTM参数量计算a、遗忘门b、输入门c、输出门d、全部参数量在Keras中实现LSTM实现代码学习前言我死了我死了我死了！什么是LSTM1、LSTM的结构我们可以看出，在n时刻，LSTM的输入有三个：当前时刻网络的输入值Xt；上一时刻LSTM的输出值ht-1；上一时刻的单元状态Ct
2021-06-07 Oxalis
工作：读懂若依管理后台的前端vue代码学习：中级会计实务，昨天完成了第四章无形资产的四个小节，作业还剩一半左右。今天学习第五章长期股权投资，1、长期股权投资的范围和初始计量2、长期股权投资的后续计量3、弄懂现值年金系数理财：支付宝的理财月报建议我有30%应该买债券基金，它推荐的债券基金收益看起来也很是可以，有14%-23%，最高的鹏华丰禄债券年化22.43%.我再仔细查了下，其实这么高的回报率不是
向量，矩阵和张量的导数 | 简单的数学橘子学AI
前段时间看过一些矩阵求导的教程，在看过的资料中，尤其喜欢斯坦福大学CS231n卷积神经网络课程中提到的Erik这篇文章。循着他的思路，可以逐步将复杂的求导过程简化、再简化，直到发现其中有规律的部分。话不多说，一起来看看吧。作者：ErikLearned-Miller翻译：橘子来源：橘子AI笔记（datawitch）本文旨在帮助您学习向量、矩阵和高阶张量（三维或三维以上的数组）的求导方法，以及如何求对
git将远程仓库代码拉下覆盖本地仓库 && git remote&& git push -u 用法 bfu_努力进大厂送外卖的Z git git
git将远程仓库代码拉下覆盖本地仓库记录，在最近代码学习过程中，自己手动改了一下代码，但是忘记修改了哪些，现在想恢复到和远程仓库代码一致。使用如下三条命令搞定：1.gitfetch--all//获取远程仓库所有代码到本地2.gitreset--hardorigin/master//强制将本地代码和远程仓库同步3.gitpull今天遇到的小问题：1、提交代码的时候，忘了把在本地测试时的东西删掉了，很
【Python】科研代码学习：一溢流眼泪【科研】python 学习
【Python】科研代码学习：一前言魔方方法`__dict__,__setattr__,__getattr__,__getattribute__``hasattr(obj,name)``super()`类型注解解包`unpacking`zip()函数前言搞科研，最重要的还是得看懂别人的源代码。这就意味着python不能太差看到比较有用的，或者不怎么看懂的代码，就搜索并学习，放在这里，供学习参考。最
0 代码自动化测试：RF 框架实现企业级 UI 自动化测试明月与玄武 Robotframework
前言现在大家去找工作，反馈回来的基本上自动化测试都是刚需！没有自动化测试技能，纯手工测试基本没有什么市场。但是很多人怕代码，觉得自动化测试就需要代码！代码学习起来很难！当然代码学习不难，只要有好的学习方法！不过对于目前很多不会代码的同学，我今天要给大家讲一个自动化测试框架，就是不会代码也能做的自动化测试：RobotFramework框架。可以作为公司要做自动化不会代码的临时和紧急情况的替代方案。解
Python学习笔记（水桶谜题代码学习）——应用*符号解包列表所有元素传递给函数用法诚外无物0106 学习笔记 python
原文：http://inventwithpython.com/bigbookpython/project81.html在这个小游戏中，有三个水桶，容量分别是3升、5升和8升，需要在其中一个水桶中收集正好四升水。规则是：1、桶只能被清空、完全装满或倒入另一个桶中。2、把A水桶中的水倒入B水桶，要么把B水桶倒满，要么A桶水量不足，水量不足则倒空例如，A桶8升满桶水，把A桶里面的水倒入空的3升的C桶，会
一种通过增强的面部边界实现精确面部表示的多级人脸超分辨率 qq_43314576 人工智能机器学习深度学习
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录摘要Abstract文献阅读：一种通过增强的面部边界实现精确面部表示的多级人脸超分辨率二、使用步骤1、研究背景2、方法提出3、相关方法3.1、FSR网络结构3.2、多阶段FSR网络结构4、实验工作5、方法比较LSTM代码学习2.1、什么是LSTM2.2、LSTM的处理过程2.3、LSTM代码分析总结摘要本周主要阅读了2020C
基于场景文字知识挖掘的细粒度图像识别算法 qq_43314576 算法深度学习人工智能
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录摘要Abstract文献阅读：基于场景文字知识挖掘的细粒度图像识别算法1、研究背景2、方法提出方法模块3、试验4、文章贡献二、RNN代码学习2.1、什么是RNN2.2、RNN的处理过程2.3、RNN简单代码实现总结摘要本周主要阅读了2022CVPR的文章，基于场景文字知识挖掘的细粒度图像识别算法，该论文提出了一种通过挖掘场景文
电商小程序01需求分析低代码布道师小程序需求分析
目录1电商用例分析2功能架构3原型开发3.1首页3.2店铺页面3.3配货单3.4配货单有货3.5我的应用3.6商品详情3.7订单确认3.8收货地址3.9店铺详情3.10店铺分类3.11商品分类总结低代码学习的时候最高效的方法就是带着问题去学习，一般可以先从电商小程序开始。为啥选择电商小程序呢，因为它贴近生活，有大量成熟的案例可供参考。就像我们在学习乐器的时候是照着谱子练习，而不是自己谱曲一样。要想
OCCT示例学习笔记3--Modeling项目 jean7155 Open CASCADE 学习 c++Open CASCADE
OCCT的版本是7.6.0.Modeling项目，代码学习记录。OCCT示例学习笔记3--Modeling项目1、点镜像2、轴镜像3、旋转效果4、缩放效果5、移动效果6、轴坐标位移效果7、移动效果8、各种基础模型显示9、各种元素的旋转建模10、pipe的建模11、thru的建模12、进化形状的建模13、锥形变换14、布尔运算15、截面运算16、平面的截面运算17、倒角运算18、复杂倒角的建模19、
【Linux】gcc中__builtin_expect的作用慕雪华年玩上Linux linux 运维服务器
本文首发于慕雪的寒舍引入代码学习的时候，遇到了__builtin_expect这个之前从来没有遇到过的东西，网上搜了一下，发现纯C语言实现的GCD（GrandCentralDispatch）中就有定义过这个宏#define_safe_cast_to_long(x)\({_Static_assert(sizeof(typeof(x))#includevoidfunction(boolflag){if
学习使用Flask模拟接口进行测试 bfu_努力进大厂送外卖的Z python 学习 flask python
前言学习使用一个新工具，首先找一段代码学习一下，基本掌握用法，然后再考虑每一部分是做什么的Flask的初始化app=Flask(__name__)：初始化，创建一个该类的实例，第一个参数是应用模块或者包的名称@app.route()的用法@app.route('/detect',methods=['POST'])：通过使用route()装饰器的方法定义一个路由地址，/detect是接口的uri，使
ORB-SLAM2代码学习1 rgdb_tum.cc Dziwu SLAM 学习计算机视觉人工智能
论文翻译参考1参考2rgdb_tum.cc的框架代码大致思路LoadImages()加载图像——判断rgb图是否存在——判断rgb图与depth图数量是否对应相同。ORB_SLAM2::SystemSLAM()初始化，创建SLAM系统，并初始化各个线程。遍历每一对RGB图和depth图【读取RGB图和depth图，读取时间戳（vTimestamps存储了时间戳，实际上就是存储了数据文件的每一幅图像
taskflow 源码阅读笔记-1 zhaoyqcsdn C++笔记 c++经验分享
之前写了一篇介绍Taskflow的短文：传送门Taskflow做那种有前后依赖关系的任务管理还是不错的，而且他的源码里运用了大量C++17的写法，觉得还是非常值得学习的，因此决定看一下他的源码，这里顺便写了一篇代码学习笔记。概述代码链接：https://github.com/taskflow/taskflow本文是commitid:b91df2c365c20fa4cb43951192f6939fb
2019-08-13 Day 2 安装与设置开发环境夜光巴比
因为绝望，放下我的傲慢发问指南学习记录记录代码学习历程记录错误——一个错误写一篇报错信息的截图Google的搜索的解决方案最终成功的解法安装相关软件排除网速影响后，顺利得很ORIDimage.png
Python代码学习之给图片添加文字或图片水印逃逸的卡路里 python python 学习计算机视觉
前言图片加水印有什么好处？在现今的数字化时代，网络上的图片泛滥，盗图现象也越来越严重。因此，在发布文章时，为了保护自己的原创作品版权，很多人选择使用水印来保护他们的图片。这样就能更好地做到：1.版权保护：在商业用途的照片中添加水印可以帮助保护作者的版权，防止他人未经授权使用照片。2.品牌推广：将商业品牌、商标或公司标志添加到照片中，可以帮助提高品牌知名度和曝光率。3.防止盗版：添加水印可以防止盗版
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源

[cs231n]Assignment1_SVM 代码学习

Support Vector Machine

1. Download the CIFAR10 datasets, and load it

Subsample the data for more efficient code execution

2. Preprocessing

Reshape the images data into rows

Subtract the mean images

Append the bias dimension of ones

3. Define a linear SVM classifier

4. Gradient Check

Define loss function

Gradient check

loss_naive vs. loss_vectorized

Stochastic Gradient Descent

5. Validation and Test

Cross-validation

Test

Visualize the weights for each class

总结

你可能感兴趣的:([cs231n]Assignment1_SVM 代码学习)