一位以泪洗面的同学

Cs231n作业-Q1-1 K-Nearest Neighbor(kNN) exercise

Cs231n作业：Q1-1 k-Nearest Neighbor

k近邻算法

原理
步骤

Cs231n——Knn作业

训练阶段
测试阶段
交叉验证
小结

k近邻算法

k近邻算法是一种基本分类与回归方法。 k近邻算法的输入为实例的特征向量，对应于特征空间的点；输出为实例的类别，可以取多类。

原理

假设给定一个训练数据集，对新的输入实例，在训练数据集中找出与该实例最临近的k个实例，这k个实例的多数属于某个类，就把该输入实例分为这个类。

步骤

k近邻法分两个阶段：
1.训练阶段：
获取训练数据集，并进行存储。
2.测试阶段：
kNN分类器将每个测试图像与所有训练图像进行比较，计算出两者之间的距离。找出k张距离最近的训练图像。在这k张距离最近的训练图像中，选择标签类别占多数的类别，作为测试图像的类别。
3.k值的交叉验证：通过交叉验证获取k值。

Cs231n——Knn作业

训练阶段

这里的数据集用的是CIFAR-10

import random
import numpy as np
from cs231n.data_utils import load_CIFAR10
import matplotlib.pyplot as plt

# 加载CIFAR-10数据，数据路径为：'cs231n/datasets/cifar-10-batches-py'
cifar10_dir = 'cs231n/datasets/cifar-10-batches-py'
X_train, y_train, X_test, y_test = load_CIFAR10(cifar10_dir)

# 打印训练数据和测试数据的大小
print('Training data shape: ', X_train.shape)
print('Training labels shape: ', y_train.shape)
print('Test data shape: ', X_test.shape)
print('Test labels shape: ', y_test.shape)

通过训练数据和测试数据的大小可知：每张图片像素都是32 x 32 x 3，训练集有50000张，测试集有10000张。

输出：

Training data shape:  (50000, 32, 32, 3)
Training labels shape:  (50000,)
Test data shape:  (10000, 32, 32, 3)
Test labels shape:  (10000,)

这里展示来自每个类的一些图片例子：

classes = ['plane', 'car', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck']
num_classes = len(classes)
samples_per_class = 7
for y, cls in enumerate(classes):
	# y_train == y 返回一个和向量y_train等长的由T/F组成的矩阵
    idxs = np.flatnonzero(y_train == y)  # 调用函数，找出标签中y类的位置（输入一个矩阵，返回其中非零元素的位置）
    idxs = np.random.choice(idxs, samples_per_class, replace=False)  # 从idxs中随机抽7个不重复的位置，即对应的图片位置
    for i, idx in enumerate(idxs):
    	# 画出第一列的图所在位置的索引值，即1、11、21、31...
        plt_idx = i * num_classes + y + 1  # 索引值
        plt.subplot(samples_per_class, num_classes, plt_idx)  # 行数、列数、索引值
        plt.imshow(X_train[idx].astype('uint8'))  # 绘制图像
        plt.axis('off')  # 不显示坐标尺寸
        if i == 0:
            plt.title(cls)
plt.show()

输出：

为了更有效的执行代码，从训练集中选5000张作为训练实例，测试集中选500作为测试实例：

num_training = 5000
mask = list(range(num_training))
X_train = X_train[mask]
y_train = y_train[mask]

num_test = 500
mask = list(range(num_test))
X_test = X_test[mask]
y_test = y_test[mask]

将图片数据进行张量变形：

X_train = np.reshape(X_train, (X_train.shape[0], -1))
X_test = np.reshape(X_test, (X_test.shape[0], -1))
print(X_train.shape, X_test.shape)

输出：
以X_train.shape为例：第一维大小为X_train.shape[0]即变为5000 而第二维为-1表示列不知道多少，所以根据剩下纬度进行计算，即32x32x3=3027。所以最终形状为(5000,3272)

(5000, 3072) (500, 3072)

创建一个kNN分类器实例
注意：kNN只对训练数据进行存储，不做进一步处理

from cs231n.classifiers import KNearestNeighbor

# Create a kNN classifier instance. 
# Remember that training a kNN classifier is a noop: 
# the Classifier simply remembers the data and does no further processing 
classifier = KNearestNeighbor()
classifier.train(X_train, y_train)

测试阶段

现在我们用kNN分类器对测试数据进行分类。
回想一下，我们可以把这个过程分为两个步骤：

首先，我们必须计算所有测试示例和所有训练示例之间的距离。
在给定这些距离中，对于每个测试示例，我们找到与其距离最近的k个的训练示例，并标注它们的类别。

让我们从计算所有训练和测试示例之间的距离矩阵开始。例如，如果有 Ntr 训练示例和 Nte测试示例，这个阶段应该生成一个 Nte x Ntr 矩阵，其中每个元素 [i, j] 表示第i个测试样本到第j个训练样本之间的距离。

距离度量：采用欧式距离

首先，打开cs231n/classifier /k_nearest_neighbor.py并实现compute_distances_two_loops函数，该函数对所有(测试、训练)示例使用一个(非常低效的)双循环，并一次计算一个测试样本到所有训练样本的距离矩阵。

def compute_distances_two_loops(self, X):
        """
        Compute the distance between each test point in X and each training point
        in self.X_train using a nested loop over both the training data and the
        test data.

        Inputs:
        - X: A numpy array of shape (num_test, D) containing test data.

        Returns:
        - dists: A numpy array of shape (num_test, num_train) where dists[i, j]
          is the Euclidean distance between the ith test point and the jth training
          point.
        """
        num_test = X.shape[0]
        num_train = self.X_train.shape[0]
        dists = np.zeros((num_test, num_train))
        for i in range(num_test):
            for j in range(num_train):
                #####################################################################
                # TODO:                                                             #
                # Compute the l2 distance between the ith test point and the jth    #
                # training point, and store the result in dists[i, j]. You should   #
                # not use a loop over dimension, nor use np.linalg.norm().          #
                #####################################################################
                # *****START OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****

                dists[i,j] = np.sqrt(np.sum(np.square(X[i] - self.X_train[j])))

                # *****END OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****
        return dists

dists[i,j]：测试样本i到训练样本j的欧氏距离
np.square( X[i] - self.X_train[j] )：第i个测试样本 - 第j个训练样本后所得到的矩阵，再对矩阵中每个元素进行平方。（每一行所有元素代表该样本的特征，下标i表示第i个样本，X[i]即所在矩阵的行即第i个样本的所有特征）。 eg：[1, 2] - [2, 3] = [-1, -1]，再进行平方(square)得：[1, 1]
np.sum( np.square( X[i] - self.X_train[j] ) )：由于axis=none，对输入数组的所有元素全部加起来。eg:np.sum([1, 1]) = 2
np.sqrt( np.sum( np.square( X[i] - self.X_train[j] ) ) )：对得到的张量进行开平方根。eg：np.sqrt(np.sum([1, 1])) = 1.4142135623730951
dists[i,j] = np.sqrt( np.sum(np.square(X[i] - self.X_train[j])) )：即为测试样本i到训练样本j的欧氏距离公式。

得到一个(500, 5000)的dists矩阵。

然后，实现predict_labels方法：

def predict_labels(self, dists, k=1):
        """
        给定测试点和训练点之间的距离矩阵，预测每个测试点的类别

        Inputs:
        - dists: 一个(num_test, num_train)大小的numpy数组，
		         其中dists[i, j]表示第i个测试样本到第j个训练样本的距离

        Returns:
        - y: 一个(num_test,)大小的numpy数组，其中y[i]表示测试样本X[i]的预测结果.
        """
        num_test = dists.shape[0]
        y_pred = np.zeros(num_test)
        for i in range(num_test):
            # A list of length k storing the labels of the k nearest neighbors to
            # the ith test point.
            closest_y = []
            #########################################################################
            # TODO:                                                                 #
            # 利用距离矩阵求出第i个测试点的k个最近邻                                   #
            # 使用 self.y_train 查找这些最近邻对应的类别标签                          #
            # 将这些类别标签存储在 closest_y 中                                      #
            # 提示: 可尝试使用 numpy.argsort 方法.                                   #
            #########################################################################
            # *****START OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****

            points = np.argsort(dists[i])[:k]
            for point in points:
                closest_y.append(self.y_train[point])
            # *****END OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****
            #########################################################################
            # TODO:                                                                  #
            # 现在您已经找到k个最近邻的类别标签                                         #
            # 您需要在类别标签列表closest_y中找到最常见（多）的类别标签                  #
            # 将此类别标签存储在y_pred[i]中。如果有票数相同的类别，则选择编号小的类别     #
            #########################################################################
            # *****START OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****

            y_pred[i] = np.argmax(np.bincount(closest_y))

            # *****END OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****

        return y_pred

自己想的（第一部分）：

            # *****START OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****

            points = np.argsort(dists[i])[:k]
            for point in points:
                closest_y.append(self.y_train[point])
            # *****END OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****

其中numpy.argsort()：返回的是数组值从小到大的索引值。此处的索引值即为从小到大距离最近的训练样本。
np.argsort(dists[i])：返回的是距测试样本距离从小到大的索引值即训练样本。
np.argsort(dists[i])[:k]：表示取前k个，即k个最近邻的训练样本
然后通过for循环，将训练样本所对应的类别即self.y_train[point]，通过closest_y.append()存储在closest_y中。

别人答案（第一部分）：

#找到每一个测试图片中对应的5000张训练集图片，距离最近的前k个
closest_y = self.y_train[ np.argsort(dists[i])[:k] ]

第二部分：已找到k个最近领对应的类别标签，找到其中出现最多的那个类别标签

            # *****START OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****

            y_pred[i] = np.argmax(np.bincount(closest_y))

            # *****END OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****

np.bincount(closest_y)：统计closest_y中元素出现的次数。返回0-序列元素最大值的数组中，每个元素出现的次数。
np.argmax(np.bincount(closest_y))：沿给定轴返回最大的索引。即得到closest_y中出现次数最多的那个元素。（且如果有元素出现次数最多有相同的情况，则选择编号较小的那个元素）。
最后保存在y_ored[i]中，表示测试样本X[i]的预测类别（即预测结果）。

现在实现函数predict_labels并运行以下代码:
我们使用k = 1(这是最近邻1)

# Now implement the function predict_labels and run the code below:
# We use k = 1 (which is Nearest Neighbor).
y_test_pred = classifier.predict_labels(dists, k=1)

# Compute and print the fraction of correctly predicted examples
num_correct = np.sum(y_test_pred == y_test)
accuracy = float(num_correct) / num_test
print('Got %d / %d correct => accuracy: %f' % (num_correct, num_test, accuracy))

输出：
Got 137 / 500 correct => accuracy: 0.274000

您应该期望看到比k = 1时稍微好一点的性能。当k = 5时：

y_test_pred = classifier.predict_labels(dists, k=5)
num_correct = np.sum(y_test_pred == y_test)
accuracy = float(num_correct) / num_test
print('Got %d / %d correct => accuracy: %f' % (num_correct, num_test, accuracy))

输出：
Got 139 / 500 correct => accuracy: 0.278000

现在让我们使用部分向量化来加速距离矩阵的计算（提升距离计算的效率），只有一个循环，实现compute_distances_one_loop函数：

def compute_distances_one_loop(self, X):
        """
        Compute the distance between each test point in X and each training point
        in self.X_train using a single loop over the test data.

        Input / Output: Same as compute_distances_two_loops
        """
        num_test = X.shape[0]
        num_train = self.X_train.shape[0]
        dists = np.zeros((num_test, num_train))
        for i in range(num_test):
            #######################################################################
            # TODO:                                                               #
            # Compute the l2 distance between the ith test point and all training #
            # points, and store the result in dists[i, :].                        #
            # Do not use np.linalg.norm().                                        #
            #######################################################################
            # *****START OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****

            dists[i,:] = np.sqrt(np.sum(np.square(X[i] - self.X_train[:]), axis=1))

            # *****END OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****
        return dists

X[i]-self.X_train[:]：表示第i个测试样本与所有训练样本的差。
np.square(X[i] - self.X_train[:])：第i个测试样本与所有样本的差所得矩阵后再平方。
np.sum(np.square(X[i] - self.X_train[:]),axis=1)：按1轴进行求和，即横向求和。此处得到一向量：表示第i个测试样本对各个训练样本的特征值的差后在求平方和。——建议写个Demo模拟一下，就明白了TAT。
dists[i,:] =np.sqrt(np.sum(np.square(X[i] - self.X_train[:]), axis=1))，进行开根号，得到第i个测试样本到所有训练样本的欧氏距离。

在notebook中运行compute_distances_one_loop代码：

dists_one = classifier.compute_distances_one_loop(X_test)

为了确保我们的向量化实现是正确的，将运行结果与前面方法的结果进行对比。对比两个矩阵是否相等的方法有很多，比较简单的一种是使用Frobenius范数。Frobenius范数表示的是两个矩阵所有元素的差值的平方和的平方根。即将两个矩阵reshape成向量后，它们之间的欧式距离。

difference = np.linalg.norm(dists - dists_one, ord='fro')
print('One loop difference was: %f' % (difference, ))
if difference < 0.001:
    print('Good! The distance matrices are the same')
else:
    print('Uh-oh! The distance matrices are different')

输出：

One loop difference was: 0.000000
Good! The distance matrices are the same

现在在compute_distances_no_loops中实现完全向量化的版本：（这个是真的有点儿东西…OrZ…）
想法是利用平方差公式：
$X-Y)^2 = X^2-2XY+Y^2.$
使用矩阵乘法和两次广播加法，直接算出距离。

def compute_distances_no_loops(self, X):
        """
        Compute the distance between each test point in X and each training point
        in self.X_train using no explicit loops.

        Input / Output: Same as compute_distances_two_loops
        """
        num_test = X.shape[0]
        num_train = self.X_train.shape[0]
        dists = np.zeros((num_test, num_train))
        #########################################################################
        # TODO:                                                                 #
        # Compute the l2 distance between all test points and all training      #
        # points without using any explicit loops, and store the result in      #
        # dists.                                                                #
        #                                                                       #
        # You should implement this function using only basic array operations; #
        # in particular you should not use functions from scipy,                #
        # nor use np.linalg.norm().                                             #
        #                                                                       #
        # HINT: Try to formulate the l2 distance using matrix multiplication    #
        #       and two broadcast sums.                                         #
        #########################################################################
        # *****START OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****

        dists = np.multiply(np.dot(X,self.X_train.T),-2)
        sq1 = np.sum(np.square(X),axis=1,keepdims=True)
        sq2 = np.sum(np.square(self.X_train),axis=1)
        dists = np.add(dists,sq1)
        dists = np.add(dists,sq2)
        dists = np.sqrt(dists)

        # *****END OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****
        return dists

这地方我还没理解透彻，初略讲讲算了些啥：
np.multiply(np.dot(X,self.X_train.T),-2):计算出-2XY
np.sum(np.square(X),axis=1,keepdims=True):计算X²，然后以竖轴为基准，同行相加。通过keepdims=True保持其多维特性。
np.sum(np.square(self.X_train),axis=1)：计算Y²，然后以竖轴为基准，同行相加，不保持其多维特性。
最后计算出：x²+y²-2xy，再通过开平方根，得到测试样本到训练样本的欧氏距离。

在notebook中运行compute_distances_no_loops代码：

# Now implement the fully vectorized version inside compute_distances_no_loops
# and run the code
dists_two = classifier.compute_distances_no_loops(X_test)
# check that the distance matrix agrees with the one we computed before:
difference = np.linalg.norm(dists - dists_two, ord='fro')
print('No loop difference was: %f' % (difference, ))
if difference < 0.001:
    print('Good! The distance matrices are the same')
else:
    print('Uh-oh! The distance matrices are different')

输出：

No loop difference was: 0.000000
Good! The distance matrices are the same

对比一下三种方法的实现速度：
使用完全向量化的实现，您应该会看到明显更快的性能!
注意:这取决于你用的是什么机器，当你从两个循环到一个循环时，你可能看不到加速，甚至可能会放缓。

# Let's compare how fast the implementations are
def time_function(f, *args):
    """
    Call a function f with args and return the time (in seconds) that it took to execute.
    """
    import time
    tic = time.time()
    f(*args)
    toc = time.time()
    return toc - tic

two_loop_time = time_function(classifier.compute_distances_two_loops, X_test)
print('Two loop version took %f seconds' % two_loop_time)

one_loop_time = time_function(classifier.compute_distances_one_loop, X_test)
print('One loop version took %f seconds' % one_loop_time)

no_loop_time = time_function(classifier.compute_distances_no_loops, X_test)
print('No loop version took %f seconds' % no_loop_time)

# You should see significantly faster performance with the fully vectorized implementation!

# NOTE: depending on what machine you're using, 
# you might not see a speedup when you go from two loops to one loop, 
# and might even see a slow-down.

输出：
果然，我的机器使我从两个循环到一个循环时，没看到加速，甚至还放缓了。。

Two loop version took 38.191042 seconds
One loop version took 82.484406 seconds
No loop version took 1.039741 seconds

交叉验证

我们实现了k近邻分类器，但是我们任意设置了k = 5。现在，我们将通过交叉验证来确定这个超参数的最佳值。

num_folds = 5
k_choices = [1, 3, 5, 8, 10, 12, 15, 20, 50, 100]

X_train_folds = []
y_train_folds = []
################################################################################
# TODO:                                                                        #
# 将训练数据分成不同的折。分割后，训练样本和对应的样本标签                          #
# 被包含在数组X_train_folds和y_train_folds中，数组长度为折数num_folds             #
# 其中y_train_folds[i]是一个标签向量，表示X_train_folds[i]中所有的标签.           #
# 提示: 尝试使用numpy array_split函数.                                          #
################################################################################
# *****START OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****

X_train_folds = np.array_split(X_train, num_folds)
y_train_folds = np.array_split(y_train, num_folds)

# *****END OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****

# 将不同k值下的准确率保存在一个字典中。交叉验证后，k_to_accuracies[k]保存了一个长度为折数的list，值为k值下的准确率。
k_to_accuracies = {}


################################################################################
# TODO:                                                                        #
# 通过k折的交叉验证，找到最佳值k。对于每一个k值，执行kNN算法num_folds次             #
# 每一次执行中，只有一折为验证集，其他的为训练集                                   #
# 将不同k值在不同折上的验证结果保存在k_to_accuracies字典中                        #
################################################################################
# *****START OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****

classifier = KNearestNeighbor()
for i in k_choices:  # 对每一个K值执行
    accuracies = np.zeros(num_folds)  # 保存每折对应的准确率[0. 0. 0. 0. 0.]
    for fold in range(num_folds):  # 执行knn算法num_folds次
        temp_X = X_train_folds[:]
        temp_y = y_train_folds[:]
        X_validate_fold = temp_X.pop(fold)
        y_validate_fold = temp_y.pop(fold)
        
        temp_X = np.array([y for x in temp_X for y in x])
        temp_y = np.array([y for x in temp_y for y in x])
        
        classifier.train(temp_X,temp_y)
        
        y_test_pred = classifier.predict(X_validate_fold, k=i)
        num_correct = np.sum(y_test_pred == y_validate_fold)
        accuracy = num_correct / num_test
        accuracies[fold] = accuracy
    k_to_accuracies[i] = accuracies

# *****END OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****

# Print out the computed accuracies
for k in sorted(k_to_accuracies):
    for accuracy in k_to_accuracies[k]:
        print('k = %d, accuracy = %f' % (k, accuracy))

第一部分：将训练数据切分为不同的折。切分后，训练样本和对应的样本标签被包含在X_train_folds和y_train_folds之中。

np.array_split(X_train, num_folds):将X_train分为num_folds折。
np.array_split(y_train, num_folds):将y_train分为num_folds折。

# *****START OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****

X_train_folds = np.array_split(X_train, num_folds)
y_train_folds = np.array_split(y_train, num_folds)

# *****END OF YOUR CODE (DO NOT DELETE/MODIFY THIS

y_train_folds[i]得到的是一个向量，表示对应i折中的向量，即X_train_folds[i]中所有样本的标签。

第二部分：通过k折的交叉验证找出最佳k值。
对于每一个k值，均要执行kNN算法num_folds次，每一次执行，选择一折为验证集，其他的为训练集。最后将不同k值下不同折上的验证结果保存在k_to_accuracies字典中。

① 因为要对每一个k值进行算法，所以第一层循环即为foriin k_choices，在k_choices中选择每一个k值。
② 又因为对每一个k值，均要执行kNN算法num_folds次，所以第二层循环即为forfoldin range(num_folds)，表示执行num_fold次。
③ 复制所有折中的所有数据:temp_X = X_train_folds[:]和temp_y = y_train_folds[:]
④ 取当前次数fold的折为验证集，即X_validate_fold = temp_X.pop(fold)和y_validate_fold = temp_y.pop(fold)
⑤ 此时，所剩下的折数即为训练集，要所有剩下折的数据，合并为一折作为训练集。即temp_X = np.array([y for x in temp_X for y in x])和temp_y = np.array([y for x in temp_y for y in x])即( temp_X为多折数据，先通过for x in temp_X 获取对应的折，再通过 y for y in x 将每个折的数据，依次合并为一折)
⑥ 最后通过kNN分类器进行预测:
: 先进行classifier.train(temp_X,temp_y)进行数据存储
: 再传入验证集X_validate_fold以及此时的k值i。即是y_test_pred = classifier.predict(X_validate_fold, k=i)进行预测。
: 计算出预测的正确数量：np.sum(y_test_pred == y_validate_fold)
: 算出精确率：accuracy = num_coorect / num_test
: 存入accuracies[fold]中，表示不同折上的精确率accuracies[fold] = accuracy
⑦ 然后存储到k_to_accuracies[i]中，表示不同k值在不同折上的精确率。k_to_accuracies[i] = accuracies

# *****START OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****

classifier = KNearestNeighbor()
for i in k_choices:  # 对每一个K值执行
    accuracies = np.zeros(num_folds)  # 保存每折对应的准确率[0. 0. 0. 0. 0.]
    for fold in range(num_folds):  # 执行knn算法num_folds次
        temp_X = X_train_folds[:]
        temp_y = y_train_folds[:]
        X_validate_fold = temp_X.pop(fold)
        y_validate_fold = temp_y.pop(fold)
        
        temp_X = np.array([y for x in temp_X for y in x])
        temp_y = np.array([y for x in temp_y for y in x])
        
        classifier.train(temp_X,temp_y)
        
        y_test_pred = classifier.predict(X_validate_fold, k=i)
        num_correct = np.sum(y_test_pred == y_validate_fold)
        accuracy = num_correct / num_test
        accuracies[fold] = accuracy
    k_to_accuracies[i] = accuracies

# *****END OF YOUR CODE (DO NOT DELETE/MODIFY THIS LINE)*****

输出准确率：

# Print out the computed accuracies
for k in sorted(k_to_accuracies):
    for accuracy in k_to_accuracies[k]:
        print('k = %d, accuracy = %f' % (k, accuracy))

输出：

k = 1, accuracy = 0.526000
k = 1, accuracy = 0.514000
k = 1, accuracy = 0.528000
k = 1, accuracy = 0.556000
k = 1, accuracy = 0.532000
k = 3, accuracy = 0.478000
k = 3, accuracy = 0.498000
k = 3, accuracy = 0.480000
k = 3, accuracy = 0.532000
k = 3, accuracy = 0.508000
k = 5, accuracy = 0.496000
k = 5, accuracy = 0.532000
k = 5, accuracy = 0.560000
k = 5, accuracy = 0.584000
k = 5, accuracy = 0.560000
k = 8, accuracy = 0.524000
k = 8, accuracy = 0.564000
k = 8, accuracy = 0.546000
k = 8, accuracy = 0.580000
k = 8, accuracy = 0.546000
k = 10, accuracy = 0.530000
k = 10, accuracy = 0.592000
k = 10, accuracy = 0.552000
k = 10, accuracy = 0.568000
k = 10, accuracy = 0.560000
k = 12, accuracy = 0.520000
k = 12, accuracy = 0.590000
k = 12, accuracy = 0.558000
k = 12, accuracy = 0.566000
k = 12, accuracy = 0.560000
k = 15, accuracy = 0.504000
k = 15, accuracy = 0.578000
k = 15, accuracy = 0.556000
k = 15, accuracy = 0.564000
k = 15, accuracy = 0.548000
k = 20, accuracy = 0.540000
k = 20, accuracy = 0.558000
k = 20, accuracy = 0.558000
k = 20, accuracy = 0.564000
k = 20, accuracy = 0.570000
k = 50, accuracy = 0.542000
k = 50, accuracy = 0.576000
k = 50, accuracy = 0.556000
k = 50, accuracy = 0.538000
k = 50, accuracy = 0.532000
k = 100, accuracy = 0.512000
k = 100, accuracy = 0.540000
k = 100, accuracy = 0.526000
k = 100, accuracy = 0.512000
k = 100, accuracy = 0.526000

画图进行展示：

# plot the raw observations
for k in k_choices:
    accuracies = k_to_accuracies[k]
    plt.scatter([k] * len(accuracies), accuracies)

# plot the trend line with error bars that correspond to standard deviation
accuracies_mean = np.array([np.mean(v) for k,v in sorted(k_to_accuracies.items())])
accuracies_std = np.array([np.std(v) for k,v in sorted(k_to_accuracies.items())])
plt.errorbar(k_choices, accuracies_mean, yerr=accuracies_std)
plt.title('Cross-validation on k')
plt.xlabel('k')
plt.ylabel('Cross-validation accuracy')
plt.show()

输出：

根据交叉验证的结果，知道k=10时，为最优的k，然后在全量数据上进行实验，将得到超过28%的准确率。

# Based on the cross-validation results above, choose the best value for k,   
# retrain the classifier using all the training data, and test it on the test
# data. You should be able to get above 28% accuracy on the test data.
best_k = 10

classifier = KNearestNeighbor()
classifier.train(X_train, y_train)
y_test_pred = classifier.predict(X_test, k=best_k)

# Compute and display the accuracy
num_correct = np.sum(y_test_pred == y_test)
accuracy = float(num_correct) / num_test
print('Got %d / %d correct => accuracy: %f' % (num_correct, num_test, accuracy))

输出：

Got 141 / 500 correct => accuracy: 0.282000

小结

这第一个kNN的作业，感觉吃力TAT，特别在完全向量化的操作上（有点儿东西…）
尽量使用向量化进行计算，能提高计算效率
再接再厉…

你可能感兴趣的:(Cs231n作业)

11.网络编程的基础知识就很对网络 linux
11.网络编程的基础知识**1.OSI模型与TCP/IP模型****2.IP地址分类****3.Socket编程****4.TCP三次握手与四次挥手****5.常用网络测试工具****6.练习与作业****7.总结**1.OSI模型与TCP/IP模型OSI模型（开放系统互联模型）：7层结构：应用层：为网络用户提供各种服务（如HTTP、FTP）。表示层：数据加密解密、压缩解压缩。会话层：管理进程会话
5.进程基本概念就很对 java 服务器 linux
5.进程基本概念**1.进程的基本概念****2.进程与程序的区别****3.进程的状态****4.进程调度****5.进程相关命令****6.进程创建与管理****7.进程的应用场景****8.练习与作业****9.进程的地址空间****10.进程的分类****11.进程的并发与并行****12.总结**1.进程的基本概念进程：进程是程序执行的过程，操作系统会为其分配内存资源和CPU调度。PCB
后端登录校验(一）——会话技术 develop_lost 服务器运维
一、登录校验1.什么是登录校验登录校验是服务器端对浏览器端（就是客户端）发送的请求进行校验。校验用户的登录情况，如果用户已经登录，则允许进行用户需要的业务操作，反之则禁止用户操作业务操作，并返回给用户一个错误的提示，让客户端跳转到的登录页面，进行登录操作。2.如何进行登录校验-先认清http协议：http协议是无状态协议，无状态是客户端的每一次请求都是独立的，这次的请求不会携带上一次的数据，服务器
精密校平机：工业制造的精度之源玛哈特-小易制造精密矫平机科技
在现代工业制造的精密领域，精密校平机已成为确保材料平整度和产品精度的关键设备。它广泛应用于汽车制造、电子设备、航空航天、医疗设备等多个行业，为提高产品质量和生产效率发挥着不可或缺的作用。工作原理与技术优势精密校平机采用先进的多辊矫平技术，结合高精度的压力调节系统，能够自动适应不同材质、厚度的板材，确保每一次校平作业都精准无误。其工作原理是通过机械设备对材料施加一定的力，使材料在弹塑性弯曲条件下，通
软件工程课程作业 cfjybgkmf 软件工程课程作业软件工程
一、什么是DevOps?DevOps中的Dev指的是Development（开发），Ops指的是Operations（运维）DevOps包含了三个部分：开发、测试和运维，是一组过程、方法与系统的统称，用于促进开发、技术运营和质量保障部门之间的沟通、协作与整合。DevOps是为了填补开发端和运维端之间的信息鸿沟，改善团队之间的协作关系；突出重视软件开发人员和运维人员的沟通合作，通过自动化流程来使得软
flink作业访问zk出现acl报错问题分析 spring208208 大数据组件线上问题分析 flink zookeeper 大数据
#问题现象向yarn集群提交flink作业的时候会出现zkacl的异常经确认：1.zk相关acl密码没有更改过2.重新部署客户端配置后提交任务同样报错3.修改flink的zk目录，重启后可以正常运行任务(在zk重新生了新的znode节点)#问题分析1.首先确认是否是权限的问题，即程序中zk用户没有权限操作zk上的flink节点目录确认集群上zookeeper的flink的acl权限，确认为flin
不用再当“技术宅“！这个AI神器让我5分钟变身人工智能达人阳光永恒736 AI工具人工智能 deepseek 一键包本地部署 AI资源
最近我在朋友圈刷到好多朋友都在玩AI画图、AI写诗，看得我心痒痒。可每次想自己试试，打开教程就被满屏的代码吓退——"Python环境配置"、"CUDA驱动安装"这些词比数学作业还让人头疼。直到我发现了一个叫DeepSeek本地部署一键包的神器，我的AI探索之旅终于变得像搭乐高一样简单！夸克网盘分享一、原来AI离我们这么近上周三放学路上，我看见隔壁班的小美用AI给自己照片生成古风造型，这让我突然意识
cippe2025北京石油展，遨游通讯将携多款防爆手机亮相! AORO_BEIDOU 智能手机信息与通信人工智能安全网络
在石油石化等危险作业场景，安全是生命线，智能化是未来发展的核心引擎。2025年3月26-28日，遨游通讯将携九重防爆标准及防爆手机、防爆对讲机、防爆平板等防爆智能终端，强势登陆第二十五届中国国际石油石化技术装备展览会（cippe）！诚邀您莅临E1馆E1159展位，共同见证安全与智能深度融合的革新力量！一、核心产品遨游通讯依托九重防爆标准，打造覆盖石油、石化全场景的防爆智能终端，为危险作业场景提供“
python arm64_PyTorch-aarch64 人类0663号 python arm64
PyTorch源码编译步骤：1、源码编译环境：操作系统：debian9.12交换空间：1GPython版本：3.5硬件：CPU：RK3399(aarch64)内存：4G2、下载依赖包：下载pytorch及其依赖包时，默认从github上下载，如果网络不好、容易断开时，可在gitee上找到对应包克隆链接，然后修改对应配置文件，进行下载。需要细致耐心。3、编译主要参数：设置最大作业数：exportMA
基于python+django的旅游信息网站-旅游景点门票管理系统源码+运行步骤冷琴1996 Python系统设计 python django 旅游
该系统是基于python+django开发的旅游景点门票管理系统。是给师弟做的课程作业。大家学习过程中，遇到问题可以在github咨询作者。学习过程问题可以留言哦演示地址前台地址：http://travel.gitapp.cn后台地址：http://travel.gitapp.cn/admin后台管理帐号：用户名：admin123密码：admin123源码地址https://github.com/
基于python+django+mysql的小区物业管理系统源码+运行步骤冷琴1996 Python系统设计 python 开发语言
该系统是基于python+django开发的小区物业管理系统。适用场景：大学生、课程作业、毕业设计。学习过程中，如遇问题可以在github给作者留言。主要功能有：业主管理、报修管理、停车管理、资产管理、小区管理、用户管理、日志管理、系统信息。源码学习技术。演示地址http://wuye.gitapp.cn/admin后台管理帐号：用户名：admin123密码：admin123源码地址https:/
自主移动机器人模型制作竹森科技-杨波 Tecnomatix plant simulation Plant Simulation沉思录 java 前端服务器
AGV搭载机械手的复合型机器人，主要用于将物流按要求输送至指定工位，可用于加工工件的抓取、组装、搬运、装卸等作业。此外，复合机器人也可快速布局于工厂、仓储分拣、自动化货物超市等诸多场景，为物料的自动搬运、物品的上下料，以及物料的分拣提供自动化、柔性化的作业支持，使厂内可以实现真正的无人搬运。现有的产品多是AGV+UR机械臂，在plant里面怎么去处理这个呢，接下来我们就针对这个问题进一步展开说明。
基于python+django的家教预约网站-家教信息管理系统源码+运行步骤冷琴1996 Python系统设计 python django 开发语言
该系统是基于python+django开发的家教预约网站。是给师妹做的课程作业。大家在学习过程中，遇到问题可以在github给作者留言。共同学习进步哦效果演示前台地址：http://jiajiao.gitapp.cn后台地址：http://jiajiao.gitapp.cn/admin后台管理帐号：用户名：admin123密码：admin123源码地址https://github.com/geee
优化Apache Spark性能之JVM参数配置指南 weixin_30777913 jvm spark 大数据开发语言性能优化
ApacheSpark运行在JVM之上，JVM的垃圾回收（GC）、内存管理以及堆外内存使用情况，会直接对Spark任务的执行效率产生影响。因此，合理配置JVM参数是优化Spark性能的关键步骤，以下将详细介绍优化策略和配置建议。通过以下优化方法，可以显著减少GC停顿时间、提升内存利用率，进而提高Spark作业吞吐量和数据处理效率。同时，要根据具体的工作负载和集群配置进行调整，并定期监控Spark应
《算法笔记》9.2小节——数据结构专题(2)-＞二叉树的遍历问题 A: 复原二叉树（同问题 C: 二叉树遍历）圣保罗的大教堂《算法笔记》算法
题目描述小明在做数据结构的作业，其中一题是给你一棵二叉树的前序遍历和中序遍历结果，要求你写出这棵二叉树的后序遍历结果。输入输入包含多组测试数据。每组输入包含两个字符串，分别表示二叉树的前序遍历和中序遍历结果。每个字符串由不重复的大写字母组成。输出对于每组输入，输出对应的二叉树的后续遍历结果。样例输入DBACEGFABCDEFGBCADCBAD样例输出ACBFGEDCDAB分析：不建树直接找的方法。
园林无线灌溉控制系统组成与功能北京聚英翱翔电子有限公司物联网监控系统工业物联网物联网人工智能大数据
随着信息技术的飞速发展和全球水资源日益紧张，无线灌溉控制系统作为一种高效、智能的灌溉方式，在园林行业中得到了广泛的应用。该系统基于物联网技术传感器技术、无线通信技术等，通过远程监控和自动控制，实现了对园林灌溉的精准管理和优化。园林无线灌溉控制解决方案，集成改造原有灌溉系统中的阀门、控制器等部件，配合监测园林环境信息的采集器，利用LORA无线网络进行通讯，经智慧农业云平台调控执行灌溉作业，实现远程手
水肥一体化智能灌溉系统北京聚英翱翔电子有限公司监控系统智慧农业物联网
农作物生长茂盛，收成好，与水肥有很大的关系，是保障农作物生长的必要元素。对于大面积栽培农作物，种植瓜果蔬菜的地区，很适合使用水肥一体化智能灌溉系统，远程管理水肥灌溉作业，帮助用户更快解决水肥浇灌的问题。水肥一体化智能灌溉的优势体现在节水、节肥、节人力，同时还能提升水肥资源利用率，适用于设施农业栽培，果园栽培，棉花栽培等大田经济作物栽培使用。对于附近有水库，水井，蓄水池等固定水源的农田环境，也能联动
blender渲染有波纹光圈怎么解决 Renderbus瑞云渲染农场渲染知识瑞云新闻 blender 渲染农场动画云渲染云渲染效果图云渲染 3d云渲染农场
在使用Blender进行三维渲染作业时，偶尔会遇到渲染图像中出现波纹光圈的问题，这种情况的出现会影响渲染效果的质量，导致最终产品效果图无法达到理想的状态，那么此类危机出现时，该如何解决呢？一起来简单看看吧。出现波纹光圈原因常见的诱因包括光照设置不当、色彩位深不足、抗锯齿问题以及渲染分辨率设置不当。针对这些问题，逐一排查并进行针对性的优化调整是根本的解决方案。接下来，我们将探索一些有效的修正策略，帮
第十四届蓝桥杯省赛C++C组——子矩阵（蓝桥杯篇章完结撒花） Dawn_破晓蓝桥杯一个月速成日志蓝桥杯 c++c语言
本来想写的速成日志也没写多少，cb国二，最后一题树形DP调了一小时发现h数组没置-1，最后无果，如果没马虎可能有国一水平了，正儿八经准备用了两个月，因为要考研，每天只学2-3小时的算法，一共刷了300多道题吧，由于之前选过ACM（实验课因为周六去，懒得去还给我挂了）和算法分析课，所以还是有点基础的，如果算上一年前刷的题总共加起来也就400多道题吧。说一下历程吧，一年前的题都是老师布置的作业，迫不得
《炫动漫》杂志社炫动漫杂志社炫动漫编辑部2024年第1期目录 QQ296078736 python
理论新知探究中职班主任德育能力提升策略(1)叶荣琳基于核心素养下以问题为驱动的高中数学教学评一体化的课堂教学探究(4)鹿园园农村初中英语作业设计与批阅方式的创新使用(7)侯成英新课改背景下初中物理教学方法创新策略探究(10)李传荣“双减”背景下构建初中数学高效课堂的策略(13)陈苏婷精神医学本科生参加心理剧团体课程的教学效果研究(16)查莉珺;王语含;陈虹;屈远;胡华提质增效：《机械识图》高职复习
HTML音频、视频--课后作业实践 Heetun html5
浅学了web一段时间，用浅显的知识做了一个小小的实践，各位大佬们多多包涵，指正。主要知识重现：标记语法：src:设置媒体文件的路径width、height:设置媒体文件的宽度、高度autostart:逻辑值，true为自动播放；false为不自动播放loop:逻辑值，true自动循环播放；false不循环播放2.CSS的内部样式表选择器1{属性1：属性值1；属性2：属性值2；......}选择器2
现在的AI，到底是背答案的高手，还是真正的会思考沐凡资源人工智能
你的孩子用AI写作业，你以为他在抄答案，但AI可能连自己都不知道答案是怎么来的。最近朋友圈被小学生用DeepSeek秒杀作业的新闻给刷屏了。家长们一方面惊叹，“这玩意儿比家教还靠谱呢”，另一方面又焦虑，“孩子会不会被AI养废啦”。这让我也产生了一个疑问：现在的AI究竟是背答案的复读机呢，还是真会推理的最强大脑？于是我搜索了很多资料来了解这件事。毕竟这事儿可不单单跟作业有关系——它对未来的AI起着决
深入探索 PyTorch 在语音识别中的应用 Zoro｜ PyTorch Deep Learning 机器学习 pytorch 语音识别人工智能
深入探索PyTorch在语音识别中的应用在本篇博客中，我将分享如何使用PyTorch进行语音识别任务，重点围绕环境配置、数据预处理、特征提取、模型设计以及模型比较展开。本文基于最近一次机器学习作业（HW2）的任务内容，任务目标是对语音信号进行逐帧音素预测，从而完成多类别分类任务。一、介绍任务背景任务目标：利用深度神经网络对语音信号进行逐帧音素预测。音素定义：音素是语音中能够区分单词的最小语音单位。
Springboot乐动健身房管理系统6xl64计算机毕业设计-课程设计-期末作业-毕设程序代做含宇网络 spring boot java 后端
Springboot乐动健身房管理系统6xl64计算机毕业设计-课程设计-期末作业-毕设程序代做【免费赠送源码】Springboot乐动健身房管理系统6xl64计算机毕业设计-课程设计-期末作业-毕设程序代做本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、
（PTA）数据结构（作业）6、队列 MapleInori 数据结构数据结构算法 c++
栈是后进先出的线性表（LastInFirstOut，LIFO），插入和删除的操作都在栈顶进行。队列是先进先出的线性表（FirstInFirstOut，FIFO），插入在队尾进行，删除在队头进行。循环队列的两种区别队满和队空的方式，1）少用一个元素，即当队列空间大小为m时，有m-1个元素就默认时队满。队空的条件：Q.front==Q.rear队满的条件：(Q.rear+1)%m==Q.front2）
又叕最后的作业hhhhhhhhhh MapleInori 编程题目算法 c++
目录题目A:城堡题目B:山洞寻宝图题目C:迷宫题目D:n皇后题目E:最大装载问题题目F:跳马问题（2点）题目G:布线问题题目A:城堡题目描述某城堡被分割成m×n（m≤50，n≤50）个方块，每个方块的四面可能有墙，“#”代表有墙，没有墙分割的方块连在一起组成一个房间，城堡外围一圈都是墙。如果1、2、4和8分别对应左墙、上墙、右墙和下墙，则可以用方块周围每个墙对应的数字之和来描述该方块四面墙的情况，
5大陷阱+实战：C#日志分析，从‘日志迷宫’到‘监控神殿’的逆袭全攻略！墨瑾轩 C#乐园 c#网络开发语言
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣你的日志还在‘打哑谜’吗？“错误日志像‘天书’读不懂？监控告警像‘哑巴’不发声？”——别慌！今天用C#日志分析，让你的系统像“福尔摩斯”一样精准破案，从实时监控到根因定位，从此告别“黑盒运维”！权威背书：日志分析≠‘抄作业’！“90%的故障因‘日志解析缺失’导
wsl2中配置docker weixin_42172114 docker 容器运维
DOCKER的配置还是太麻烦了，想再探索一个方法，实现核心算法和接口的更理想的解耦方式。缺少的不是一劳永逸的到处迁移而是保持核心算法的清洁、整洁、简洁，作为一个完整的包，在不同环境下去部署。即使一些基本的部署动作必不可少，就把这些部署动作搞清楚。配置好以后，尝试跟一下这个作业docker的入门使用—太详细了需要wsl2?wsl--set-default-version2转换为wsl2wsl-l-v
DeepSeek使用教程 rider189 杂谈 java 职场和发展学习方法创业创新开发语言健康医疗媒体
一、教育行业：个性化学习与智能辅导机会点：智能作业批改：教师上传学生作业，DeepSeek自动识别答案并生成批改报告，节省80%人工时间。虚拟导师：学生输入数学题或编程问题，模型实时生成分步解析，支持追问互动，解决“卡壳”难题。个性化学习路径：根据学生测试结果，自动推荐课程和习题，提升学习效率30%以上。教程亮点：登录DeepSeek官网，进入“问答系统”模块，输入学科问题即可获取答案。上传学生作
高项：2016年3月7日作业（第1章、第2章） weixin_34384681
高项：2016年3月7日作业（第1章、第2章）第1章信息化基础知识1.1.1信息1、信息的概念存在两个基本的层次，即本体论层次和认识论层次。2、事件的本体论：就是事物的运动状态和状态变化方式的自我表述。3、主体关于某个事物的认识论信息，就是主体对于该事物的运动状态以及状态变化方式的具体描述，包含对于它的“状态和方式”的形式、含义和价值的描述。1.1.3国家信息化体系要素1、国家信息化体系包括：（信
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h