Cc1924

CS231n KNN笔记

文章目录

CS231n KNN笔记
- 1.参考课程笔记翻译
- 2.笔记内容摘录
- - 2.1.最近邻和K-近邻思想简述
  - 2.2准确率
  - 2.3.`xrange`和`range`
  - 2.4.计算距离
  - 2.5.超参数调优
- 3.作业笔记
- - 3.1.加载数据集
  - 3.2.jupyter cell模块自动重新加载
  - 3.3.展示数据集部分图片
  - 3.4.`range`细节问题
  - 3.5.`reshape`形状问题
  - 3.6.`def predict_labels(self, dists, k=1)`函数
  - - 3.6.1.排序函数`np.argsort()`
    - 3.6.2.python寻找列表中出现次数最多的元素
    - - 方法：np.argmax(np.bincount())
  - 3.7.三种计算距离的方式
  - - 3.7.1.二重loop
    - 3.7.2.一重loop
    - 3.7.3.无loop
  - 3.8.交叉验证
  - - 3.8.1.数组分割
    - 3.8.2.错误记录
    - 3.8.3.绘图操作
- 4.作业中的inline-questions深入理解（未必正确）
- - 4.1.Inline Question 1
  - 4.2.Inline Question 2
  - 4.3.Inline Question 3
- 5.注意事项
- - 5.1.变量命令不要重复

1.参考课程笔记翻译

KNN上 , KNN下

2.笔记内容摘录

2.1.最近邻和K-近邻思想简述

最近邻（Nearest Neighbor）是寻找与当前测试图像的像素差异最近的一张训练图像，并以找到的训练图像的类别作为测试图像的类别。这里的像素差异又被称为距离，关于这个距离的定义有很多种，也就是属于超参数。
K-近邻是寻找寻找与当前测试图像的像素差异最近的K张训练图像，并且以这些图像中类别数最多的那个分类作为测试图像的类别。这样就提高了可信度，减小异常数据点的干扰。但是也存在问题，就是可能K张图像中有两类或几类的图像数相等，这时候分类就存在灰色区域。

2.2准确率

Yte_predict = nn.predict(Xte_rows) # 输入测试集，得到预测的分类标签
print 'accuracy: %f' % ( np.mean(Yte_predict == Yte) )
# 1.Yte_predict == Yte 得到一个bool类型的数组，如果预测正确值为True,也就是1
# 2.np.mean求这个数组的平均值，也就是最后的准确率

2.3.`xrange`和`range`

简单说说range和xrange的区别

这是课程官方为了兼容Python2和python3的操作
只有在python2中才有xrange和range，python3中没有xrange，并且python3中的range和python2中的range有本质的区别。所以这儿说的range和xrange的区别是只针对python2的

不同点
- range : 在py2中，range得到的是一个列表,即
```
    x = range(0, 5)
    print(type(x))  # 打印x的类型，结果是list
    print(x) # 结果是[0,1,2,3,4]
```
- xrange ：在py2中，xrange得到的是一个生成器对象，即
```
    x = xrange(0, 5)
    print(type(x))  # 输出类型，结果为一个生成对象
    print(x)  # 输出x， 结果为xrange(0,5)
```
那么，python3中为什么没有了range了呢（额，这个怎么描述呢，是有range，但是这个range其实是py2中的xrange，而不是range），因为使用生成器可以节约内存。比如现在有个代码是for i in range(0, 10000)，如果还是使用py2中的range的话，那你就会得到一个0到9999的一个列表，这个将会占用你很大的空间，但是使用生成器的话，就会节省很大的资源。
共同点

它们的使用都是一样的，比如都可以用for循环遍历所有的值

2.4.计算距离

L1距离
```
""" X is N x D where each row is an example we wish to predict label for """
distances = np.sum(np.abs(self.Xtr - X[i,:]), axis = 1)
min_index = np.argmin(distances) 
Ypred[i] = self.ytr[min_index] 
```
- X是输入的测试集，每一行都是一张图片展开的行向量，np.abs(self.Xtr - X[i,:])就是计算第i张图片和所有测试集的距离，在减法运算过程中对测试机的第i行的行向量进行了广播，然后np.abs求绝对值。
- np.sum(xx, axis=1)是针对上面求得的L1距离，对每一行求和，得到的就是第i张图片和所有的训练集的L1距离。
- np.argmin(distances)寻找L1距离最小的训练集的索引，也就是和测试图片最相似的训练集图片。
- Ypred[i] = self.ytr[min_index]得到这个图片的分类标签。

L2距离

distances = np.sqrt(np.sum(np.square(self.Xtr - X[i,:]), axis = 1))

具体计算步骤同上。

关于L1距离和L2距离的区别

TODO

2.5.超参数调优

最后一步、且仅使用一次测试集
从训练集中分出一部分数据用做验证集，用来进行超参数调优
训练集数据不够时，验证集数据更少，这时候可以将训练集均分成积分，其中一份循环作为验证集。这被称为交叉验证。
对最优的超参数做记录。记录最优参数后，是否应该让使用最优参数的算法在完整的训练集上运行并再次训练呢？因为如果把验证集重新放回到训练集中（自然训练集的数据量就又变大了），有可能最优参数又会有所变化。在实践中，不要这样做。千万不要在最终的分类器中使用验证集数据，这样做会破坏对于最优参数的估计。直接使用测试集来测试用最优参数设置好的最优模型，得到测试集数据的分类准确率，并以此作为你的kNN分类器在该数据上的性能表现。

3.作业笔记

3.1.加载数据集

官方knn.ipynb程序第1段主要和google云有关，我们应该不能用。此外最重要的是下面这两句：

%cd drive/My\ Drive/$FOLDERNAME/cs231n/datasets/
!bash get_datasets.sh

也就是进入/cs231n/datasets/的目录下执行get_datasets.sh的脚本，进行数据集的下载。下载了数据集才能进行后面的工作。

3.2.jupyter cell模块自动重新加载

官方knn.ipynb程序第2段：

# Run some setup code for this notebook.
import random
import numpy as np
from cs231n.data_utils import load_CIFAR10
import matplotlib.pyplot as plt

# This is a bit of magic to make matplotlib figures appear inline in the notebook
# rather than in a new window.
%matplotlib inline   # 魔法工具，让matplotlib的画图显示在Jupyter中，不用新开窗口
plt.rcParams['figure.figsize'] = (10.0, 8.0)     # 显示图像的最大范围
plt.rcParams['image.interpolation'] = 'nearest'  # 差值方式，设置 interpolation style
plt.rcParams['image.cmap'] = 'gray' # 灰度空间

# Some more magic so that the notebook will reload external python modules;
# see http://stackoverflow.com/questions/1907993/autoreload-of-modules-in-ipython
%load_ext autoreload  # 魔法命令，开启模块自动重装入
%autoreload 2   # 魔法命令，每次自动重装非Import的模块

解释：

对于IPython版本3.1、4.x和5.x

%load_ext autoreload
%autoreload 2

然后，您的模块将默认自动重新加载。这是文档：

File:       ...my/python/path/lib/python2.7/site-packages/IPython/extensions/autoreload.py

Docstring:
``autoreload`` is an IPython extension that reloads modules
automatically before executing the line of code typed.

This makes for example the following workflow possible:

.. sourcecode:: ipython

   In [1]: %load_ext autoreload

   In [2]: %autoreload 2

   In [3]: from foo import some_function

   In [4]: some_function()
   Out[4]: 42

   In [5]: # open foo.py in an editor and change some_function to return 43

   In [6]: some_function()
   Out[6]: 43

The module was reloaded without reloading it explicitly, and the
object imported with ``from foo import ...`` was also updated.

简单来说，就是jupyter的cell中可能会有用户自己定义的外部类或函数，调试过程中这些外部程序可能会更改。使用了%load_ext autoreload的魔法命令后，每次执行cell是都会自动重新加载这些外部程序，从而保证每次执行的程序都是最新的。

而%autoreload 2命令所带的参数2，是指每次自动装入除了import之外的模块，因为Importd的官方库不会变，没必要每次重装。%autoreload的参数如下：

-无参：装入所有模块。
- 0 ：不执行 装入命令。
- 1 ：只装入所有 %aimport 要装模块
- 2 ：装入所有 %aimport 不包含的模块。

3.3.展示数据集部分图片

# Visualize some examples from the dataset.
# We show a few examples of training images from each class.
classes = ['plane', 'car', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck']
num_classes = len(classes)
samples_per_class = 7
for y, cls in enumerate(classes):  # y是类别的索引，cls是列表的值
    idxs = np.flatnonzero(y_train == y)   # np.flatnonzero得到数组中非零元素的索引，其实这里就是找出训练集标签中与上面的列表相同的元素索引
    idxs = np.random.choice(idxs, samples_per_class, replace=False)  # 在这些索引中随机选出7个索引
    for i, idx in enumerate(idxs):   # 这里的绘图是按列绘图，即每一类的7张图片排成一列
        plt_idx = i * num_classes + y + 1   # i是绘图的第几行，也就是当前类的7张图片中的第几张；y是列，也就是这是第几类的图片；+1是索引从1开始
        plt.subplot(samples_per_class, num_classes, plt_idx)  # 参数分别是 （行数，列数，序号），注意序号是从左向右数，到头换到下一行继续数
        plt.imshow(X_train[idx].astype('uint8'))  # 绘制图片，astype强制转化一下。经测试这句必须加，否则显示的图片不正常
        plt.axis('off')
        if i == 0:
            plt.title(cls)
plt.show()

3.4.`range`细节问题

mask = list(range(num_training)) ：生成0-5000的列表，注意这里range是生成一个生成器对象，需要list转化成列表。这和py2不同。

详见2.3.

TODO 锚点

3.5.`reshape`形状问题

python基础之numpy.reshape详解

简要：

默认参数下，是按照行优先的顺序读取。这其实并不严谨，行列的概念只对二维数组有效。更准确的说是按照最后一维的顺序来读。对于二维数组来说，最后一维就是行。
格式np.reshape(原数组, (a,b,c,....))其中后面的元组参数就是新reshape的数组的shape。注意参数可以为-1，代表只需要满足其他指定的维度的长度，而-1这个维度上的长度自动计算。

3.6.`def predict_labels(self, dists, k=1)`函数

def predict_labels(self, dists, k=1):
    """
    Given a matrix of distances between test points and training points,predict a 		label for each test point.

    Inputs:
    - dists: A numpy array of shape (num_test, num_train) where dists[i, j]
       gives the distance betwen the ith test point and the jth training point.

    Returns:
    - y: A numpy array of shape (num_test,) containing predicted labels for the
       test data, where y[i] is the predicted label for the test point X[i].
    """
    num_test = dists.shape[0]   # 测试集的数量
    y_pred = np.zeros(num_test)
    for i in range(num_test):
        # A list of length k storing the labels of the k nearest neighbors to
        # the ith test point.
        closest_y = []  # 存放K近邻得到的分类的标签
        closest_y = self.y_train[np.argsort(dists[i,:])[:k]]    # np.argsort从小到大排序，并返回排序的序号；[:k]则是K临近算法取前K个最近的数，切片操作

        y_pred[i] = np.argmax(np.bincount(closest_y))  # np.bincount得到列表中的0~最大元素的索引出现的次数，然后argmax求得最大次数，也就是出现次数最多的元素

    return y_pred

3.6.1.排序函数`np.argsort()`

【numpy】np.argsort()函数

也就是np.argsort()对数组从小到大排序，并返回排序后的数组元素在原数组中的索引。

3.6.2.python寻找列表中出现次数最多的元素

python查找数组中出现次数最多的元素

方法：np.argmax(np.bincount())

看一个例子

array = [0,1,2,2,3,4,4,4,5,6]
print(np.bincount(array))
print(np.argmax(np.bincount(array)))

#[1 1 2 1 3 1 1]
#4

这里用到了两个函数，np.argmax和np.bincount，第一个很常见，就是返回数组中最大值对应的下标，np.bincount可以通过上面的例子理解：首先找到数组最大值max，然后返回0～max的各个数字出现的次数，在上例中，0出现了1次，1出现了1次，2出现了2次…以此类推。

为什么这两个函数合起来可以找到出现次数最多的元素呢？因为np.bincount返回的数组中的下标对应的就是原数组的元素值，如上例中np.argmax找到np.bincount返回的数组中的最大值3（原数组中4出现了3次），其对应的下标4正是原数组中的元素4，如此就可以找到数组中出现次数最多的元素。

但是这种方法有一个缺陷，即bincount只能统计0~max出现的次数，所以这种方法仅适用于非负数组。

简单说，就是np.bincount将原先的数组的数据变成了该数据出现的次数，再用np.argmax找到这个最大的次数，对应的值就是原数组中出现次数最多的数据。

3.7.三种计算距离的方式

3.7.1.二重loop

二重循环是最简单、最容易理解的。也就是每次都计算第i张测试集和第j张训练集图片之间的距离，然后加入到距离数组中。

def compute_distances_two_loops(self, X):  
    num_test = X.shape[0]  # 测试集的数量
    num_train = self.X_train.shape[0]  # 训练集的数量
    dists = np.zeros((num_test, num_train))
    for i in range(num_test):
        for j in range(num_train):
            dists[i,j] = np.sqrt(np.sum(np.square(X[i,:]-self.X_train[j,:])))
    return dists

3.7.2.一重loop

一重循环也比较简单，每次计算第i张测试集和所有的测试集图片的距离，得到一个行向量，将其插入到dists数组的第i行即可。

def compute_distances_one_loop(self, X):
    num_test = X.shape[0]
    num_train = self.X_train.shape[0]
    dists = np.zeros((num_test, num_train))
    for i in range(num_test):
        dists[i, :] = np.sqrt(np.sum(np.square(X[i,:]-self.X_train),axis=1)).T
    return dists

3.7.3.无loop

无循环的方法要稍微复杂一点。因为每个像素点计算的距离都是L2距离，也就是(a-b)^2 ，拆开之后就是a^2+b^2-2ab。a²和b²直接使用python的乘法即可，因为是对元素进行操作；但是这样得到的是和源图像大小相等的数组，算最后的距离时还要sum求和。而a*b需要使用矩阵的乘法，但是得到的结果直接就是两张图片的所有像素的内积，不必再sum.

def compute_distances_no_loops(self, X):
    num_test = X.shape[0]
    num_train = self.X_train.shape[0]
    dists = np.zeros((num_test, num_train))
                                                                      #
    # HINT: Try to formulate the l2 distance using matrix multiplication    #
    #       and two broadcast sums.                                         #
    
    te_square = np.sum(np.square(X),axis=1)   # a^2，sum按行求和，得到num_test长度的向量
    tr_square = np.sum(np.square(self.X_train.T),axis=0)  # b.T^2，sum按列求和，得到num_train长度的向量
    tr_mul_te = np.dot(X,self.X_train.T) # a*b，直接得到内积

    dists = np.sqrt(np.reshape(te_square,(-1,1))+np.reshape(tr_square,(1, -1)) -2*tr_mul_te)  # 注意必须对a^2和b^2进行reshape成(num_test,1)和(1,num_train)的数组，才能进行广播相减的计算。

    return dists

3.8.交叉验证

3.8.1.数组分割

np.array_split(array, nums),即将原来的数组array分割成nums份，得到的是一个列表，列表中的元素都是一个数组array。注意这个函数不均等分割也不会报错，也就是最后分得的数组长度可能不一致，也不会报错，它主要的功能就是将原来的数组分成几份。
分割后的列表中有几个数组，此时可以用np.array()将这些数组合并成一个新的数组，新数组的第0维长度就是源列表的成员个数。
np.split() 与 np.array_split() 的区别

3.8.2.错误记录

num_folds = 5
k_choices = [1, 3, 5, 8, 10, 12, 15, 20, 50, 100]

X_train_folds = []
y_train_folds = []

# *****START OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****
X_train_folds = np.array_split(X_train, num_folds)   
y_train_folds = np.array_split(y_train, num_folds)
# *****END OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****

k_to_accuracies = {}

# *****START OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****
for k in k_choices:
    accuracy = []
    for i in range(num_folds):
        X_tr = np.array(X_train_folds[:i] + X_train_folds[i+1:]) # shape(4,1000,3072) 
        y_tr = np.array(y_train_folds[:i] + y_train_folds[i+1:]) # shape(4,1000,3072) 
        X_val = np.array(X_train_folds[i])  # shape(1000,3072) 
        y_val = np.array(y_train_folds[i])  # shape(1000,) 
        
        X_tr = np.reshape(X_tr,(X_tr.shape[0]*X_tr.shape[1],-1))  # 数据的展开，将每张图片都展开成行向量，shape[0]是np.split得到的，shape[1]是原来的数据的第0维，也就是图片的张数
        y_tr = np.reshape(y_tr,(y_tr.shape[0]*y_tr.shape[1],-1))  # 数据的展开    
        
#         X_val = np.reshape(X_val,(X_val.shape[0],-1))  # 数据的展开，这样得到的结果是一个二维的数组，只不过只有一行
#         y_val = np.reshape(y_val,(y_val.shape[0],-1))  # 数据的展开
#         print(y_val.shape)  

        num_val = X_val.shape[0]   # 验证集的数量    
        classifier.train(X_tr, y_tr)
        dists = classifier.compute_distances_no_loops(X_val)
        y_val_pred = classifier.predict_labels(dists, k=k)
        num_correct = np.sum(y_val_pred == y_val)
        accuracy.append(float(num_correct) / num_val)       
    k_to_accuracies[k] = accuracy        
# *****END OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****

# Print out the computed accuracies
for k in sorted(k_to_accuracies):   # 为什么要对字典进行排序？
    for accuracy in k_to_accuracies[k]:  # 访问字典的K键对应的值，也就是accuracy列表
        print('k = %d, accuracy = %f' % (k, accuracy))

上面的程序中遇到的两个错误：

ValueError: object too deep for desired array

将把closest_y转化为一维向量，即把y_pred[i]=np.argmax(np.bincount(closest_y))修改为y_pred[i]=np.argmax(np.bincount(closest_y.reshape(len(closest_y))))

还有另一种解决办法，参考博客：在做cs231n作业一的KNN时，总结并解决遇到的问题,knn,和,解决办法
算出来的正确率在100左右

问题就在上面的reshape的地方，错误的将无须reshape的数组也进行了reshape，也就是添加了注释的这段话：
```
# X_val = np.reshape(X_val,(X_val.shape[0],-1))  # 数据的展开，这样得到的结果是一个二维的数组，只不过只有一行
# y_val = np.reshape(y_val,(y_val.shape[0],-1))  # 数据的展开
# print(y_val.shape)  
```
其实np.split后得到的列表里的每一个数组都已经把每长图片展成行向量了，在前面的cell里读取数据的时候就进行了处理。而这里训练集的数据进行 reshape是因为要将(4, 1000, 3072)变成(4000,3072)。其中3072是一张图片的像素数，1000是一组有1000张图片。

如果进行了X_val = np.reshape(X_val,(X_val.shape[0],-1))，没有影响。但是如果进行了y_val = np.reshape(y_val,(y_val.shape[0],-1))，那么原来的向量会变成二维数组，即形状从shape(1000,)变成shape(1000,1)。这样最后再计算的时候就会出错。

Q：但是为什么会从26左右变成100左右？

3.8.3.绘图操作

# plot the raw observations
for k in k_choices:
    accuracies = k_to_accuracies[k]
    plt.scatter([k] * len(accuracies), accuracies)  # scatter绘制散点图，[k] * len(accuracies)就是将[k]复制len(accuracies)份，变成[k,k,k,k,k]
 
# plot the trend line with error bars that correspond to standard deviation  用与标准偏差相对应的误差线绘制趋势线
accuracies_mean = np.array([np.mean(v) for k,v in sorted(k_to_accuracies.items())])
accuracies_std = np.array([np.std(v) for k,v in sorted(k_to_accuracies.items())])
plt.errorbar(k_choices, accuracies_mean, yerr=accuracies_std)
plt.title('Cross-validation on k')
plt.xlabel('k')
plt.ylabel('Cross-validation accuracy')
plt.show()

plt.scatter绘制散点图
[k] * len(accuracies)就是将[k]复制len(accuracies)份，变成[k,k,k,k,k]。这里不是数值扩大len倍，而是复制多少份。
for k,v in sorted(k_to_accuracies.items())是访问一个排序好的字典迭代器，k得到键，v得到值，也就是一个列表，np.mean(v)计算平均值，np.std(v)计算标准差。这里可以看到，可以使用numpy计算列表的平均值
plt.errorbar函数解释

plt.errorbar()函数解析（最清晰的解释）

x,y: 数据点的位置坐标

xerr,yerr: 数据的误差范围

如下图所示，能看到y轴数据的大小，以及误差的范围，也就是标准差。

4.作业中的inline-questions深入理解（未必正确）

参考1：CS231n 2018作业1-KNN

参考2：

4.1.Inline Question 1

Notice the structured patterns in the distance matrix, where some rows or columns are visible brighter. (Note that with the default color scheme black indicates low distances while white indicates high distances.)
注意距离矩阵中的结构化图案，其中某些行或列的可见亮度更高。（请注意，使用默认的配色方案，黑色表示低距离，而白色表示高距离。）

What in the data is the cause behind the distinctly bright rows?
What causes the columns?

数据中哪些是明显亮行背后的原因？
是什么原因造成了列？

$\color{blue}{\textit Your Answer:}$

1.行高亮：对于测试集中的当前行所处的图片，在训练集中所有的图片都与其不太相似，距离较远。意味着这张图片在训练集中找不到与其比较小相似的图片，说明这张图片噪声比较大，可能是错误的数据。
2.列高亮：训练集中当前列所处的图片，与测试集中的所有图片都不太相似。说明训练集的这张图片不具有代表性。

4.2.Inline Question 2

We can also use other distance metrics such as L1 distance.
For pixel values $p_{ij}^{(k)}$ at location $(i, j)$ of some image $I_k$ ,

the mean $\mu$ across all pixels over all images is $\mu=\frac{1}{nhw}\sum_{k=1}^n\sum_{i=1}^{h}\sum_{j=1}^{w}p_{ij}^{(k)}$
And the pixel-wise mean $\mu_{ij}$ across all images is
$\mu_{ij}=\frac{1}{n}\sum_{k=1}^np_{ij}^{(k)}.$
The general standard deviation $\sigma$ and pixel-wise standard deviation $\sigma_{ij}$ is defined similarly.

Which of the following preprocessing steps will not change the performance of a Nearest Neighbor classifier that uses L1 distance? Select all that apply.

Subtracting the mean $\mu$ ( $\tilde{p}_{ij}^{(k)}=p_{ij}^{(k)}-\mu$ .)
Subtracting the per pixel mean $\mu_{ij}$ ( $\tilde{p}_{ij}^{(k)}=p_{ij}^{(k)}-\mu_{ij}$ .)
Subtracting the mean $\mu$ and dividing by the standard deviation $\sigma$ .
Subtracting the pixel-wise mean $\mu_{ij}$ and dividing by the pixel-wise standard deviation $\sigma_{ij}$ .
Rotating the coordinate axes of the data.

$\color{blue}{\textit Your Answer:}$

1.2.3.4.5

$\color{blue}{\textit Your Explanation:}$

1.对每张图片的所有像素都减去同一个值，L1距离显然不变
2.对每张图片的每个像素都减去同一个值，但是不同的像素点减去的值不一样，最后每个像素点的L1距离还是不变，总的L1距离也不变
3.对每张图片的所有像素减去同一个值，再除以标准差。乘除法会影响L1距离，但是并不影响L1距离的排序，故也不影响KNN的结果
4.解释同3
5.图片旋转后像素的对应位置不变，因此L1距离不变**？？？**不太理解这里旋转的意思

注意理解上面的定义： $\mu$ 是所有图片的所有像素的均值， $\mu_{ij}$ 是所有图片在 $(i, j)$ 像素点处的均值。方差的定义同理

4.3.Inline Question 3

Which of the following statements about $k$ -Nearest Neighbor ( $k$ -NN) are true in a classification setting, and for all $k$ ? Select all that apply.

The decision boundary of the k-NN classifier is linear.
The training error of a 1-NN will always be lower than or equal to that of 5-NN.
The test error of a 1-NN will always be lower than that of a 5-NN.
The time needed to classify a test example with the k-NN classifier grows with the size of the training set.
None of the above.

$\color{blue}{\textit Your Answer:}$

$\color{blue}{\textit Your Explanation:}$

KNN不是线性的，看他的边界就知道，是由很多折线构成，也就是说它是局部线性的。
这里的训练误差可以理解成将训练集记录下来之后，再拿出来部分训练集进行预测，得到的误差就是训练误差。很明显，此时每张测试图片都能在训练集中找到与其完全相同的，所以1-NN的训练误差是0。而5-NN的误差可能是0，比如5张图片分类都是相同的，要或大于0
测试集误差1-NN总比5-NN小，很明显不对。测试集看的是数据的泛化能力。从前面的测试也能看出来，K属于超参数，需要调优，无法理论分析出哪个K最好
数据量变大，显然。

5.注意事项

5.1.变量命令不要重复

在jupyter notebook中，每个cell中的变量都是通用的。比如从前到后的三个cell的顺序分别是A,B,C，A的cell中已经定义的变量，如果在B的cell中再次定义，会认为是赋值，这在无形中就增加了危险。因为如果后面C的cell打算用的是A的cell中的该变量，但是这个变量已经无意中由于重复定义导致值被更改了，就会出问题。

我就遇到了这个问题，在交叉评估中，我把验证集的个数还是定义成了num_test（其实是我从前面的cell中复制过来忘了改），实际应该定义成num_val，正常的话他们的值分别是num_test=500和num_val1000。这就导致最后我找到best_k测试准确率的时候只有14%左右，而正常在28%左右。

你可能感兴趣的:(CS231N)

Pytorch使用手册-计算机视觉迁移学习教程（专题十三）无声之钟 Pytorch入门到精通 pytorch 计算机视觉迁移学习
在本教程中，你将学习如何使用迁移学习训练一个卷积神经网络进行图像分类。更多关于迁移学习的内容可以参考CS231n课程笔记。引用课程笔记中的内容：实际上，很少有人从头开始训练一个完整的卷积网络（随机初始化），因为拥有足够大数据集的情况相对罕见。相反，通常会在非常大的数据集上（例如ImageNet，它包含120万张图片和1000个类别）预训练一个卷积网络，然后将该网络用于感兴趣任务的初始化或作为固定的
cs231n_深度之眼第二次作业 Jie_Cheney
图像分类数据和label分别是什么？图像分类存在的问题与挑战？图像分类数据包括训练集测试集的数据，在有监督的问题中对于训练集数据来说是有label的，而测试集是等待我们去识别它的类别，不具有label。label就是分类标签，比如cifar10这个数据集，待分类的这10类数据我们可以写成1-10，或者0-9这就叫做label。图像分类存在的问题与挑战：光照，角度，形变，遮挡。使用python加载一
向量，矩阵和张量的导数 | 简单的数学橘子学AI
前段时间看过一些矩阵求导的教程，在看过的资料中，尤其喜欢斯坦福大学CS231n卷积神经网络课程中提到的Erik这篇文章。循着他的思路，可以逐步将复杂的求导过程简化、再简化，直到发现其中有规律的部分。话不多说，一起来看看吧。作者：ErikLearned-Miller翻译：橘子来源：橘子AI笔记（datawitch）本文旨在帮助您学习向量、矩阵和高阶张量（三维或三维以上的数组）的求导方法，以及如何求对
cs231n assignment1——SVM 柠檬山楂荷叶茶 cs231n 支持向量机 python 机器学习
整体思路加载CIFAR-10数据集并展示部分数据数据图像归一化，减去均值（也可以再除以方差）svm_loss_naive和svm_loss_vectorized计算hinge损失，用拉格朗日法列hinge损失函数利用随机梯度下降法优化SVM在训练集和验证集计算准确率，保存最好的模型在测试集进行预测计算准确率加载展示划分数据集加载CIFAR-10数据集#LoadtherawCIFAR-10data.
（2023版）斯坦福CS231n学习笔记：DL与CV教程 (12) | 视觉模型可视化与可解释性（Visualizing and Understanding）女王の专属领地计算机视觉 #计算机视觉 #学习笔记
前言笔记专栏：斯坦福CS231N：面向视觉识别的卷积神经网络（23）课程链接：https://www.bilibili.com/video/BV1xV411R7i5CS231n:深度学习计算机视觉（2017）中文笔记：https://zhuxiaoxia.blog.csdn.net/article/details/801551662023最新课程PPT：https://download.csdn.
2019-02-25~~2019-03-03 第十周周末复盘仰望星空的小狗
一、任务清单1、刷leetcode题目（7道）2、听tensorflow，cs231n和cv课程3、技术文档输出4、恢复早起的作息二、反思1、自从年前工作非常忙，加上遇上一些郁闷的事情，导致年前到现在时间记录中断了很长一段时间。本周开始恢复时间记录，日打卡，周复盘。2、生活中不论谁，肯定会时不时遇上一些令人郁闷的事情，这些郁闷的事情很可能会打乱原本的生活节奏。但是，生活还有很长的路要走，不应该因为
训练神经网络(上)激活函数笔写落去深度学习神经网络人工智能深度学习
本文介绍几种激活函数,只作为个人笔记.观看视频为cs231n文章目录前言一、Sigmoid函数二、tanh函数三、ReLU函数四、LeakyReLU函数五、ELU函数六.在实际应用中寻找激活函数的做法总结前言激活函数是用来加入非线性因素的，提高神经网络对模型的表达能力，解决线性模型所不能解决的问题。一、Sigmoid函数这个函数大家应该熟悉在逻辑回归中曾用到这个sigmoid函数这个函数可以将负无
卷积神经网络 weixin_34283445 人工智能
https://zhuanlan.zhihu.com/p/27642620关于卷积神经网络的讲解，网上有很多精彩文章，且恐怕难以找到比斯坦福的CS231n还要全面的教程。所以这里对卷积神经网络的讲解主要是以不同的思考侧重展开，通过对卷积神经网络的分析，进一步理解神经网络变体中“因素共享”这一概念。注意：该文会跟其他的现有文章有很大的不同。读该文需要有本书前些章节作为预备知识，不然会有理解障碍。没看
CS231n 作业答案 tech0ne
CS231n三次大作业：#第一次作业##原始包下载：作业一完成包地址：作业一JupyterNotebook结果：KNNSVMSoftmaxTwolayernetFeatures第二次作业原始包下载：作业二完成包地址：作业二JupyterNotebook结果：FullyConnectedNetsBatchNormalizationDropoutConvolutionalNetworksTensorf
cs231n作业-assignment1 momentum_ AI python 机器学习 numpy
assignment1(cs231n)文章目录assignment1(cs231n)KNN基础计算distances方法一：双层循环计算distances方法二：单层循环计算distances方法三：无循环根据dists找到每个测试样本的种类KNN模型汇总交叉验证KNN基础计算distances方法一：双层循环dists矩阵是（num_test,num_train）500*5000defcompu
【深度学习理论】(1) 损失函数立Sir 深度学习理论机器学习人工智能神经网络深度学习损失函数
各位同学好，最近学习了CS231N斯坦福计算机视觉公开课，讲的太精彩了，和大家分享一下。已知一张图像属于各个类别的分数，我们希望图像属于正确分类的分数是最大的，那如何定量的去衡量呢，那就是损失函数的作用了。通过比较分数与真实标签的差距，构造损失函数，就可以定量的衡量模型的分类效果，进而进行后续的模型优化和评估。构造损失函数之后，我们的目标就是将损失函数的值最小化，使用梯度下降的方法求得损失函数对于
线性分类器--数据处理骆驼穿针眼计算机视觉与深度学习深度学习
数据集划分通常按照70%，20%，10%来分数据集数据处理斯坦福的线性分类器体验http://vision.stanford.edu/teaching/cs231n-demos/linear-classify/
【CS231n】－学习笔记-1-Intro to Computer Vision, historical context. Alice熹爱学习计算机视觉计算机视觉 CS231n DeepLearning PYTHON
Class:http://cs231n.stanford.eduSchedule:http://cs231n.stanford.edu/syllabus.htmlSlides:http://vision.stanford.edu/teaching/cs231n/slides/winter1516_lecture1.pdfVideo:https://www.youtube.com/watch?v=N
笔记00-杜克大学公开课,图像和视频处理:从火星到好莱坞木木爱吃糖醋鱼
笔记内容介绍》ImageandVideoProcessing:FromMarstoHollywoodwithaStopattheHospital算起来是2017年中的时候，因为要搞深度学习的东西，就自学了斯坦福cs231n的神经网络的课。Youtube上有至少两期的公开课视频。好像从李飞飞离职之后，截止到2017年春季，就没再继续了。现在想想哪门课的内容挺多挺繁杂的。虽然是本科的课，最后好像每个学
向量对向量求导，链式法则构建的乐趣向量对向量求导
这还算不得向量微积分里多么主干的内容，只是一个小技术，但是数学推导很多时候就会用到。http://cs231n.stanford.edu/vecDerivs.pdf这个文献是一个好文献。另优秀翻译：https://zhuanlan.zhihu.com/p/142668996链式法则注意：这里的乘法变成了innerproduct推导过程中比较关键的点：除了利用这文献所讲的分量慢慢推，还有一个要点，首
Win10上关于cs231n（2017）课后作业的环境配置 Diane小山
开始首先，这篇文章是针对那些想完成cs231n作业，但是觉得装linux双系统很麻烦的童鞋。cs231n作业的SetUp官方教程只针对了那些使用Unix(Ubuntu,Macos等)的人，对使用Windows的人十分不友好。安装anaconda百度一篇anaconda的安装教程，照着安装即可。这里需要提醒的有两点：国内的anaconda镜像能用的基本都挂了，所以还是老老实实去官方网站下载吧：）一定
CS231N assignment2 SVM weixin_30363509 数据结构与算法人工智能 python
CS231NAssignment2SupportVectorMachineBegin本文主要介绍CS231N系列课程的第一项作业，写一个SVM无监督学习训练模型。课程主页：网易云课堂CS231N系列课程语言：Python3.61线形分类器以图像为例，一幅图像像素为32*32*3代表长32宽32有3通道的衣服图像，将其变为1*3072的一个向量，即该图像的特征向量。我们如果需要训练1000幅图像，那
【AI】斯坦福CS231n课程练习（1）—— KNN和SVM分类李清焰 CS231n KNN SVM
文章目录一、前言1、CS231n是啥？2、本篇博客任务3、使用的数据集二、知识准备1、KNN是什么？2、SVM是什么？SVM的组成：三、实验——KNN和SVM分类1、KNN图片分类（重要步骤将在目录上体现）（1）在colab上切换目录，加载dataset（2）加载包、设置和外部模块（3）加载、初步处理数据（4）可视化打印一些图片看看我们的数据集长什么样（5）对测试、训练数据进行分组（6）创建KNN
深度学习系列之cs231n assignment1 KNN（二）明曦君深度学习 python 机器学习
写在前面：久经周折，终于能够将KNN系列给大家继续分享了，这次的内容来源于李飞飞教授团队的cs231n深度学习课程的作业1中的KNN研究，我会在全文我遇到困难的地方进行分享，以及一些想法。内容安排深度学习系列依托与cs231n的课程作业，因为只想练习编程，所以不对课程内容进行分享，仅针对编程内容进行分享。那么这一次的分享就是assignment1中K近邻分类器的使用，以及完成其中的四个问题，这四个
cs231n assignment2(3) 没天赋的学琴
assignment2的第三部分，是熟悉深度学习框架pytorch或者tensorflow，这里选择的是使用pytorch框架。该部分主要通过三个层次：Barebones、ModuleAPI、SequentialAPI，来了解pytorch。Barebones在该层次中，需要利用pytorch所提供的一些函数，不仅需要定义神经网络的结构，同时还需编写网络的前向传播以及模型的训练部分；而参数的梯度可
第三十三周学习笔记 luputo 学习笔记
第三十三周学习笔记CS231nDeepLearningSoftwareCPUvsGPUCPU:Fewercores,buteachcoreismuchfasterandmuchmorecapable;greatatsequentialtasksGPU:Morecores,buteachcoreismuchslowerand“dumber”;greatforparalleltasks（matrixm
CNN(卷积神经网络)、RNN(循环神经网络)、DNN，LSTM weixin_34174132 人工智能
http://cs231n.github.io/neural-networks-1https://arxiv.org/pdf/1603.07285.pdfhttps://adeshpande3.github.io/adeshpande3.github.io/A-Beginner's-Guide-To-Understanding-Convolutional-Neural-Networks/Appli
CNN笔记：通俗理解卷积神经网络 I_O_fly 神经网络 cnn 神经网络深度学习
通俗理解卷积神经网络（cs231n与5月dl班课程笔记）1前言2012年我在北京组织过8期machinelearning读书会，那时“机器学习”非常火，很多人都对其抱有巨大的热情。当我2013年再次来到北京时，有一个词似乎比“机器学习”更火，那就是“深度学习”。本博客内写过一些机器学习相关的文章，但上一篇技术文章“LDA主题模型”还是写于2014年11月份，毕竟自2015年开始创业做在线教育后，太
Knn算法与 Svm算法对比一个不知名的码农支持向量机算法机器学习
Knn算法与Svm算法对比这里首先借用一个博主所做的图表，讲的很有理有据(7条消息)[cs231n]KNN与SVM区别_Rookie’Program的博客-CSDN博客_knn和svm的区别这里我们来讲一下我对这两个算法的理解knn看起来就是比较简单的一个数学模型，就是划范围论，精细程度实际上可能没有svm好，并且测试量也不能大，数据一大，处理起来又很麻烦，预测效率也比较低。相反的svm和knn对
斯坦福大学CS520知识图谱系列课程学习笔记：第一讲什么是知识图谱 ngl567
随着知识图谱在人工智能各个领域的广泛使用，知识图谱受到越来越多AI研究人员的关注和学习，已经成为人工智能迈向认知系统的关键技术之一。之前，斯坦福大学的面向计算机视觉的CS231n和面向自然语言处理的CS224n成为了全球非常多AI研究人员的入门经典学习课程。因此，斯坦福大学于今年3月开设了一门专门面向知识图谱的系列课程CS520，官网课程页：https://web.stanford.edu/cla
北京邮电大学计算机视觉与深度学习鲁鹏计算机视觉概述课程手迹 qinyaoze 机器学习 CV手记计算机视觉人工智能深度学习
课程笔记计算机视觉=输入(认知神经科学-理论,运用方法&算法,硬件)+输出(机器人)课程：图像处理-CS131，图像结构-CS231a，图像理论-CS230/CS231nQ-象棋与人工智能的关系？IBM-深蓝，Google-AlphaGo>>机器赢得象棋胜利=强大的搜索算法目标：语义鸿沟，即建立图像像素核语义间的关系发展过程：系统出现-物种大繁荣>>理论研究-猫视觉神经>>积木世界>>MIT图像处
国外AI大牛推荐的10大最有帮助免费在线机器学习课程机器学习与系统
woman_ml.jpg本文编译自twitter用户chipro斯坦福在线自学课程《概率与统计》：该课程涉及概率统计的基本概念，涵盖机器学习4个基本方面：探索性数据分析，产生数据，概率和推理。MIT的《线性代数》：这是我见过的最好的线性代数课程，由传奇教授GilbertStrang（吉尔伯特斯特朗）教授。斯坦福的CS231N：用于视觉识别的卷积神经网络：平衡理论与实践。课堂笔记写得很好，解释了不同
CS231n学习笔记--计算机视觉历史回顾与介绍1 听城
CS231n简介首先我们来看看官方对这门课的介绍：计算机视觉在社会中已经逐渐普及，并广泛运用于搜索检索、图像理解、手机应用、地图导航、医疗制药、无人机和无人驾驶汽车等领域。而这些应用的核心技术就是图像分类、图像定位和图像探测等视觉识别任务。近期神经网络（也就是“深度学习”）方法上的进展极大地提升了这些代表当前发展水平的视觉识别系统的性能。本课程将深入讲解深度学习框架的细节问题，聚焦面向视觉识别任务
计算机视觉实战项目（图像分类+目标检测+目标跟踪+姿态识别+车道线识别+车牌识别）阿利同学计算机视觉分类目标检测
图像分类教程博客_传送门链接:链接在本教程中，您将学习如何使用迁移学习训练卷积神经网络以进行图像分类。您可以在cs231n上阅读有关迁移学习的更多信息。本文主要目的是教会你如何自己搭建分类模型，耐心看完，相信会有很大收获。废话不多说，直切主题…首先们要知道深度学习大都包含了下面几个方面：1.加载（处理）数据2.网络搭建3.损失函数（模型优化）4模型训练和保存把握好这些主要内容和流程，基本上对分类模
cs231n assignment2(2) 没天赋的学琴
assignment2的第二部分的内容，实现一个卷积神经网络。这一部分主要是实现卷积神经网络中的一些所需用到的layer类型：卷积层(convolution)和池化层(这里是实现max-pooling)。这部分的实现是不考虑其运行效率，而在真正的实现应用上，卷积神经网络的运行效率是一个很重要的问题。卷积层卷积层是由一个个过滤器(filter)，每个过滤器的尺寸为:，这里的的大小与输入的图像或act
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l

CS231n KNN笔记

CS231n KNN笔记

文章目录

1.参考课程笔记翻译

2.笔记内容摘录

2.1.最近邻和K-近邻思想简述

2.2准确率

2.3.xrange和range

2.4.计算距离

2.5.超参数调优

3.作业笔记

3.1.加载数据集

3.2.jupyter cell模块自动重新加载

3.3.展示数据集部分图片

3.4.range细节问题

3.5.reshape形状问题

3.6.def predict_labels(self, dists, k=1)函数

3.6.1.排序函数np.argsort()

3.6.2.python寻找列表中出现次数最多的元素

方法：np.argmax(np.bincount())

3.7.三种计算距离的方式

3.7.1.二重loop

3.7.2.一重loop

3.7.3.无loop

3.8.交叉验证

3.8.1.数组分割

3.8.2.错误记录

3.8.3.绘图操作

4.作业中的inline-questions深入理解（未必正确）

4.1.Inline Question 1

4.2.Inline Question 2

4.3.Inline Question 3

5.注意事项

5.1.变量命令不要重复

你可能感兴趣的:(CS231N)

2.3.`xrange`和`range`

3.4.`range`细节问题

3.5.`reshape`形状问题

3.6.`def predict_labels(self, dists, k=1)`函数

3.6.1.排序函数`np.argsort()`