Zamirquito

cs231n-assignment1的笔记

在看完cs231n前面几章的内容后，准备做一下assignment1，然后怕之后忘记，所以写博文记录一下......

由于我是个low逼程序员，平时能用Windows就绝不用linux，所以在这次作业时使用虚拟机完成了作业，装好ubuntu16.04之后，配好环境，使用jupyter notebook查看相应的要求

Q1: k-Nearest Neighbor classifier

由于我对matplotlib并不是特别的熟悉，这里面学到的第一个点就是画图像的预览图，plt.imshow(a)中a的格式要求是width*height*depth,数据类型是无符号整型(uint8),代码如下：

classes = ['plane', 'car', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck']
num_classes = len(classes)
samples_per_class = 7  # 每种类型采7个样
for y, cls in enumerate(classes): #enumerate(list)会返回index以及value
    idxs = np.flatnonzero(y_train == y)  # 取出与y标签相同的数据的索引，numpy中的flatnonzero就是取出非零的索引
    idxs = np.random.choice(idxs, samples_per_class, replace=False)  # 从中取样（7个）
        for i, idx in enumerate(idxs):
            plt_idx = i * num_classes + y + 1
            plt.subplot(samples_per_class, num_classes, plt_idx) # 参数1代表行数、参数2代表列数、参数3代表第几个图，之所以每次都需要输入第1、2个参数，这两个参数是可变的
            plt.imshow(X_train[idx].astype('uint8')) # 在上一条指令指定好绘制区域后，进行特定图像显示
            plt.axis('off')
            if i == 0:
		plt.title(cls) # 仅在第一个图上面显示title
plt.show()

然后就开始实现cs231n/classifiers/k_nearest_neighbor.py中的compute_distances_two_loops函数，其实也就是一行代码dists[i, j] = np.sqrt(np.sum((X[i]-self.X_train[j])**2))

这里的知识点是计算两个vector的L2距离，所以可以简单粗暴的直接求解。

然后画出dist的分布图之后有一个问题，问白横线和白竖线分别是怎么造成的，白横线代表某一个测试样本与训练样本的距离都比较大，白竖线表示某个训练样本与测试样本的距离较大

然后要实现predict_labels

首先利用距离矩阵dists找出k个与测试样本i最近的训练样本的label，利用np.argsort可以找出dists中最小的k个值的index，然后利用index取出对应的label即可得到closest_y

closest_y = self.y_train[np.argsort(dists[i])[0:k]]

在得到closest_y之后，找到k近邻中label出现次数最多的label返回，利用np.bincount(y)可以统计y中元素出现的次数，并且返回出现次数，bincount的返回值a的每一项对应一个值出现次数，例如a[0]代表的是y中0出现次数，a[1]代表y中1出现次数......然后利用argmax求出出现次数最多的元素，返回即可：

y_pred[i] = np.argmax(np.bincount(closest_y))

之后是实现一层循环求解以及不用循环求解，这里其实也就是矩阵的操作

一层循环中循环次数为测试样例的个数，所以在循环体中要实现vector和matrix的距离求解，与上面的方法是相似的

不用循环的方法则有一点trick，首先将L2距离公式展开，然后分别求平方项以及叉积。

dists[i, :] = np.sqrt(np.sum(((self.X_train - X[i])**2), axis = 1))

dists += np.sum(self.X_train**2, axis=1).reshape(1, num_train) # 这里其实利用了broadcast
dists += np.sum(X**2, axis=1).reshape(num_test, 1)
dists -= 2 * np.dot(X, self.X_train.T) # np.dot(a,b)可以对两个矩阵求乘积，要求a的第二维与b的第一维长度一致
dists = np.sqrt(dists)

后面是交叉验证部分，也就是抽出一部分数据作为测试集，一部分为验证集，其余为训练集，采用的是5折交叉验证法，首先将训练数据进行划分，按照作业提示，使用np.array_split将数据划分为5块，如下：

y_train_ = y_train.reshape(-1, 1)
X_train_folds = np.array_split(X_train, num_folds)
y_train_folds = np.array_split(y_train, num_folds)

然后先对k_to_accuracies赋初始值[]，利用两层循环进行交叉验证，外层循环为folds数，内层循环为不同的k值，这里比较简单，仅写出解决的代码

for k_ in k_choices:
    k_to_accuracies.setdefault(k_, [])
for i in range(num_folds):
    classifier = KNearestNeighbor()
    X_val_train = np.vstack(X_train_folds[0:i] + X_train_folds[i+1:])
    y_val_train = np.vstack(y_train_folds[0:i] + y_train_folds[i+1:])
    y_val_train = y_val_train[:,0]
    classifier.train(X_val_train, y_val_train)
    for k_ in k_choices:
        y_val_pred = classifier.predict(X_train_folds[i], k=k_)
        num_correct = np.sum(y_val_pred == y_train_folds[i][:,0])
        accuracy = float(num_correct) / len(y_val_pred)
        k_to_accuracies[k_] = k_to_accuracies[k_] + [accuracy]

Q2: Training a Support Vector Machine

前3步与前面knn的步骤差不多，然后第四步开始将数据分为训练集、验证集和测试集，50000个训练集中49000作为训练集，1000作为验证集。测试集只选取10000个测试样本中的前1000个。

然后从这49000个训练集中选取出500个开发集，用于调参，使用的函数为:np.random.choice(num_training, num_dev, replace=False)

第六步中求了这49000个训练集的均值并且显示，然后第七步中对所有数据进行了中心化（中心化是减去均值，标准化是减去均值后除以标准差，这个与统计学概念类似），对训练集、验证集、开发集以及测试集均减去前述49000个训练集的均值。

然后在每一条数据记录后面加上1，以便于只关注W，而不用关注b(也即是f(x, W) = Wx + b，x=(x1, x2, x3...xn)将x增加1，即x=(x1, x2, x3...xn, 1)，然后f(x, W) = Wx, 其中W的最后一项即原式中的b，这个在cs229中有讲过)

后面正式开始svm分类器

svm_loss_naive

在linear_svm.py中第一种实现方式是比较naive的方式，计算loss时利用两层循环进行，对于每一个训练集，利用其乘以W之后，得到其对每个类的得分score以及正确标签的得分correct_class_score, 然后内层循环对每个类，分别计算max(0, score-correct_class_score+1), loss值为输入的所有X的loss之和的均值，然后加上一个L2正则项以防止W过于复杂，即total_loss = avg_loss + lambda * sum(W*W), 后面是我们要实现求dW, 也即求梯度，后面的代码会进行检查，比较numerical和analytic两种方式的差别，而我们要实现的就是analytical方式

根据cs231n的notes点击打开链接, Loss function对w的偏导，公式如下所示：

由于wyi在每一个max(0, wj * xi - wyi * xi + delta)中都出现了，所以求dW时每次都要加上对wyi的偏导，即在原代码中内层循环加上：

dW[:, j] += X[i].T
dW[:, y[i]] -= X[i].T

后面的偏导就看loss的变化，所以svm_loss_naive函数最后实现如下所示：

def svm_loss_naive(W, X, y, reg):
  """
  Structured SVM loss function, naive implementation (with loops).

  Inputs have dimension D, there are C classes, and we operate on minibatches
  of N examples.

  Inputs:
  - W: A numpy array of shape (D, C) containing weights.
  - X: A numpy array of shape (N, D) containing a minibatch of data.
  - y: A numpy array of shape (N,) containing training labels; y[i] = c means
    that X[i] has label c, where 0 <= c < C.
  - reg: (float) regularization strength

  Returns a tuple of:
  - loss as single float
  - gradient with respect to weights W; an array of same shape as W
  """
  dW = np.zeros(W.shape) # initialize the gradient as zero

  # compute the loss and the gradient
  num_classes = W.shape[1]
  num_train = X.shape[0]
  loss = 0.0
  for i in xrange(num_train):
    scores = X[i].dot(W)
    correct_class_score = scores[y[i]]
    for j in xrange(num_classes):
      if j == y[i]:
        continue
      margin = scores[j] - correct_class_score + 1 # note delta = 1
      if margin > 0:
        loss += margin
        dW[:, j] += X[i].T
        dW[:, y[i]] -= X[i].T # 在loss公式的每一项中均出现,所以每次都要加上这一项

      # Right now the loss is a sum over all training examples, but we want it
  # to be an average instead so we divide by num_train.
  loss /= num_train
  dW /= num_train
  # Add regularization to the loss.
  loss += reg * np.sum(W * W)
  dW += 2 * reg * W

  #############################################################################
  # TODO:                                                                     #
  # Compute the gradient of the loss function and store it dW.                #
  # Rather that first computing the loss and then computing the derivative,   #
  # it may be simpler to compute the derivative at the same time that the     #
  # loss is being computed. As a result you may need to modify some of the    #
  # code above to compute the gradient.                                       #
  #############################################################################


  return loss, dW

Inline Question1问的是什么时候两种梯度计算方式结果不同，很简单，对于分段函数，一般边界点的导数是不同的

接下来是使用vector操作实现loss和dW的计算，首先是loss，这个比较简单，利用矩阵的基础知识就可以写出相应代码：

num_train = X.shape[0]
y_f = np.dot(X, W)
y_c = y_f[range(num_train), list(y)].reshape(-1, 1)
margins = np.maximum(y_f - y_c + 1, 0)# shape [N, C]
margins[range(num_train), list(y)] = 0
loss = np.sum(margins) / num_train + reg * np.sum(W * W)

其实也就是循环实现方式的向量化

然后是实现dW的计算，根据上面循环方式的实现可知，对于一个sample而言，在margin[i]大于0时 (00)就加上1，然后在y[i]列减去1，然后直接用data.T乘以mask，就能得到dW的值，根据前面得到的margins，其大于0的部分便是结果，所以mask定义为margins>0的部分为1，然后对于每个y[i]列（即每个样本的真实标记），将mask每行的和的负数赋值给sample真实标记所在位置，其余步骤与loss处理一致，代码如下所示：

mask = margins
mask[margins > 0] = 1
mask[range(num_train), list(y)] = -np.sum(mask, axis=1)

dW = (X.T).dot(mask)
dW = dW/num_train + 2 * reg * W

后面是SGD，首先实现train函数，sample的方式也就是一般机器学习里的技巧，利用np.random.choice()生成index，然后取X，y中的对应项，而更新W的方式更加简单，梯度下降，W = W - lr * dW, 代码如下：

index = np.random.choice(range(X.shape[0]), batch_size, replace=True)
X_batch = X[index]
y_batch = y[index]

self.W -= learning_rate * grad

接下来是实现预测函数predict，这个较简单，一行代码搞定：

y_pred = np.argmax(X.dot(self.W), axis=1)

接下来是实现寻找最优超参的过程：

for reg in regularization_strengths:
    for lr in learning_rates:
        svm = LinearSVM()
        loss_hist = svm.train(X_train, y_train, lr, reg, num_iters=1500)
        y_train_pred = svm.predict(X_train)
        train_accuracy = np.mean(y_train == y_train_pred)
        y_val_pred = svm.predict(X_val)
        val_accuracy = np.mean(y_val == y_val_pred)
        if val_accuracy > best_val:
            best_val = val_accuracy
            best_svm = svm
        results[(lr, reg)] = train_accuracy, val_accuracy

Q3: Implement a Softmax classifier

实现softmax, 首先是naive方式，即for循环实现，根据notes点击打开链接中的提示，计算exp的值有时候会变得十分之大。例如exp(500)之类的值，所以一般利用减去最大值使得其余的值均小于0，此时exp(x)的值仅在(0, 1]之间，证明公式如下所示：

一般利用计算

而求dW则就是简单的求导法则了，自己用笔推算了一下，如下：

再与之前一样，加上正则项，完成，所以softmax_loss_naive函数的具体实现如下：

num_train = X.shape[0]
num_classes = W.shape[1]
for i in range(num_train):
  scores = X[i].dot(W)
  adjust_scores = scores - np.max(scores)
  loss_t = -np.log(np.exp(adjust_scores[y[i]]) / np.sum(np.exp(adjust_scores)))
  loss += loss_t
  for j in range(num_classes):
    prob = np.exp(adjust_scores[j]) / np.sum(np.exp(adjust_scores))
    if j == y[i]:
      dW[:, j] += (-1 + prob) * X[i]
    else:
      dW[:, j] += prob * X[i]

loss = loss / num_train
dW = dW / num_train
loss += reg * np.sum(W * W)
dW += 2 * reg * W

然后测试中为何要使loss接近-log(0.1)，这是因为我们的W是随机生成的，所以其对于每个class得到的结果在概率上应该差距不大，总class为10，则其正确的概率就是0.1

接下来是实现向量化的softmax，对于loss的求解较简单不再赘述，dW的求解与前述的求导是一致的，与Q2中的mask类似，根据前面naive的实现方式可知，在j==y[i]时需要-1,so 代码如下：

num_train = X.shape[0]
scores = X.dot(W)
adjust_scores = np.exp(scores - np.max(scores, axis=1).reshape(-1, 1))
sum_scores = np.sum(adjust_scores, axis=1).reshape(-1, 1)
class_prob = adjust_scores / sum_scores  # shape [N, C]
prob = class_prob[range(num_train), list(y)]
total_loss = -np.log(prob)
loss = np.sum(total_loss) / num_train + reg * np.sum(W * W)

class_prob[range(num_train), list(y)] -= 1
dW = (X.T).dot(class_prob)
dW = dW / num_train + 2 * reg * W

其中class_prob计算了所有的exp(fj)/sum(exp(f))......

接下来又是寻找最优超参的过程，与Q2的类似，不再说明。。。

for lr in learning_rates:
  for reg in regularization_strengths:
    softmax = Softmax()
    softmax.train(X_train, y_train, lr, reg, num_iters=3000)
    y_train_pred = softmax.predict(X_train)
    train_accuracy = np.mean(y_train == y_train_pred)
    y_val_pred = softmax.predict(X_val)
    val_accuracy = np.mean(y_val == y_val_pred)
    if val_accuracy > best_val:
      best_val = val_accuracy
      best_softmax = softmax
    results[(lr, reg)] = train_accuracy, val_accuracy

后面有一个可视化W的方法，虽然不是作业，但比较有意思，对于W，其shape是D * C，其中D是与输入X(图片)有关，C是类别数，然后对于W中的元素，归一化之后乘以255，得到相应的像素值，代码如下（来自cs231n-assignment1-softmax.ipynb）：

# Visualize the learned weights for each class
w = best_softmax.W[:-1, :]  # strip out the bias
print(w.shape)
w = w.reshape(32, 32, 3, 10)

w_min, w_max = np.min(w), np.max(w)

classes = ['plane', 'car', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck']
for i in range(10):
  plt.subplot(2, 5, i + 1)

  # Rescale the weights to be between 0 and 255
  wimg = 255.0 * (w[:, :, :, i].squeeze() - w_min) / (w_max - w_min)
  plt.imshow(wimg.astype('uint8'))
  plt.axis('off')
  plt.title(classes[i])

Q4: Two-Layer Neural Network

这里要实现两层神经网络，首先是loss函数中的scores的计算，根据lecture4的slides可以得知，多层神经网络的score函数如下所示：

根据公式写出scores的计算表达式：

h1 = np.maximum(0, (X.dot(W1) + b1))
scores = h1.dot(W2) + b2

然后实现loss, 前向传播过程，同时也需要加入正则项（题中使用L2正则项）,loss函数为Softmax classifier loss

adjust_scores = np.exp(scores - np.max(scores, axis=1).reshape(-1, 1)) # [N, C]
sum_scores = np.sum(adjust_scores, axis=1).reshape(-1, 1) # [N, 1]
class_prob = adjust_scores / sum_scores   # [N, C]
prob = class_prob[range(N), list(y)]  # [N, 1]
total_loss = -np.log(prob)  # [N, 1]
loss = np.sum(total_loss) / N + reg * (np.sum(W1 * W1) + np.sum(W2 * W2))

接下来是求gradients, 这个看起来无从下手，其实与之前Q3 的softmax是类似的，但我做Q3时还没看过Lecture4和5，所以直接推导公式，感觉很抽象不容易理解，看了lecture4点击打开链接的后向传播求梯度后就简单很多了。

求dW2和db2较简单，与之前softmax一致：

dscores = class_prob
dscores[range(N), list(y)] -= 1
dscores /= N
grads['W2'] = (h1.T).dot(dscores)
grads['b2'] = np.sum(dscores, axis=0)

根据scores = h1.dot(W2) + b2可知，dh1 = dscores.dot(W2.T)，由此可知：

dh1 = dscores.dot(W2.T)
dh1_raw = dh1 * (h1>0)
grads['W1'] = X.T.dot(dh1_raw) + 2 * reg * W1
grads['b1'] = np.sum(dh1_raw, axis=0)

接下来写train函数，第一部分与之前的一致，也就是随机采样：

index = np.random.choice(num_train, batch_size, replace=True)
X_batch = X[index]
y_batch = y[index]

更新参数：

self.params['W2'] -= learning_rate * grads['W2']
self.params['b2'] -= learning_rate * grads['b2']
self.params['W1'] -= learning_rate * grads['W1']
self.params['b1'] -= learning_rate * grads['b1']

最后是predict函数：

W1, b1 = self.params['W1'], self.params['b1']
W2, b2 = self.params['W2'], self.params['b2']
h1 = np.maximum(0, (X.dot(W1) + b1))
scores = h1.dot(W2) + b2
y_pred = np.argmax(scores, axis=1)

在debug the training中演示了如何debug,主要通过做出loss的图以及分类准确率，比较有意思的是将W1的图做出来了，可以发现W1中模糊可见一些汽车的影子，说明分类效果并不好：

接下来是寻找最优参数的过程：

best_val_acc = 0
best_lr = 0
best_hs = 0
best_reg = 0

learning_rates_base = 0.001
learning_rates_step = 0.0001
hidden_size_base = 60
hidden_size_step = 10
reg_base = 0.25
reg_step = 0.25

for hs_count in range(5):
    for lr_count in range(5):
        for reg_count in range(5):
            hs = hidden_size_base + hs_count * hidden_size_step
            lr = learning_rates_base + lr_count * learning_rates_step
            reg = reg_base + reg_count * reg_step
            net = TwoLayerNet(input_size, hs, num_classes)
            results = net.train(X_train, y_train, X_val, y_val,
                                num_iters=2000, batch_size=200,
                                learning_rate=lr, learning_rate_decay=0.95,
                                reg=reg, verbose=False)
            val_acc = np.mean(net.predict(X_val) == y_val)
            print("hs:%d, lr:%f, reg:%f, val accuracy:%f"%(hs, lr, reg, val_acc))
            if val_acc > best_val_acc:
                best_val_acc = val_acc
                best_net = net
                best_hs = hs
                best_lr = lr
                best_reg = reg
print("best model is:")
print("hs:%d, lr:%f, reg:%f, val accuracy:%f"%(best_hs, best_lr, best_reg, best_val_acc))

这个区间可以自己设置，我在hs = 100, lr = 0.0014, reg = 0.25时取到最优结果，验证集准确率为52.9%。w1的图如下所示：

Q5: Higher Level Representations: Image Features

前面的作业是让神经网络训练寻找特征，但是通过对前面W1进行查看，发现其寻找到的特征并不是很理想，而这个作业则是通过改进特征提取过程来改进效果。

首先来看看features.py中的各个函数

extract_features函数就是应用各个feature functions, 然后组合而成新的特征向量，其中每个feature function应该返回一个一维向量，然后多个feature functions返回值组合形成新的特征向量。

rgb2gray就是将rgb图值转换为灰度图，这里直接使用公式：Gray = R*0.299 + G*0.587 + B*0.114

hog_feature则是提取方向梯度直方图

color_histogram_hsv利用hsv颜色模式计算颜色直方图

然后运行Extract Features中的代码时发现会提示错误：

slice indices must be integers or None or have an __index__ method

问题定位在features.py的121行，发现应该是python2和python3对除法的操作不一致所致，而slice操作需要的是一个整数，由于作业使用的环境应该是python2，而我使用的是python3，所以将该行代码改为整除的形式：

orientation_histogram[:,:,i] = uniform_filter(temp_mag, size=(cx, cy))[cx//2::cx, cy//2::cy].T

然后就正常了，接下来利用抽取的feature训练SVM分类，这个过程与之前的寻找最优参数的过程类似

for rs in regularization_strengths:
    for lr in learning_rates:
        svm = LinearSVM()
        svm.train(X_train_feats, y_train, lr, rs, num_iters=3000)
        y_train_pred = svm.predict(X_train_feats)
        train_accuracy = np.mean(y_train == y_train_pred)
        y_val_pred = svm.predict(X_val_feats)
        val_accuracy = np.mean(y_val == y_val_pred)
        if val_accuracy > best_val:
            best_val = val_accuracy
            best_svm = svm           
        results[(lr,rs)] = train_accuracy, val_accuracy

神经网络的与上类似，主要是调参过程，然而并没有找到合适的参数。。。

best_val_acc = 0
best_lr = 0
best_hs = 0
best_reg = 0

learning_rates_base = 0.01
learning_rates_step = 0.01
reg_base = 0.25
reg_step = 0.25

for lr_count in range(5):
    for reg_count in range(5):
        lr = learning_rates_base + lr_count * learning_rates_step
        reg = reg_base + reg_count * reg_step
        net = TwoLayerNet(input_dim, hidden_dim, num_classes)
        result = net.train(X_train_feats, y_train, X_val_feats, y_val,
                           num_iters=2000, batch_size=200,
                           learning_rate=lr, learning_rate_decay=0.95,
                           reg=reg, verbose=False)
        val_acc = np.mean(net.predict(X_val_feats) == y_val)
        print("hs:%d, lr:%f, reg:%f, val accuracy:%f"%(hs, lr, reg, val_acc))
        if val_acc > best_val_acc:
            best_val_acc = val_acc
            best_net = net
            best_lr = lr
            best_reg = reg
print("best model is:")
print("hs:%d, lr:%f, reg:%f, val accuracy:%f"%(best_hs, best_lr, best_reg, best_val_acc))

Q6: Cool Bonus: Do something extra!

待填坑......

你可能感兴趣的:(python,numpy,deep,learning,cs231n,python,deep,learning,cs231n,cv)

conda install 和 pip install 的区别不知江月待何人.. 深度学习
condainstall和pipinstall是两个常用的包安装命令，但它们在很多方面存在差异。1.所属管理系统不同1.1condainstallcondainstall是Anaconda和Miniconda发行版自带的包管理工具conda的安装命令。conda是一个跨平台的开源包管理系统和环境管理系统，它不仅可以管理Python包，还能管理其他语言（如R、C++等）的包。conda更侧重于数据科
蓝桥杯备赛计划 laitywgx 蓝桥杯职场和发展
1-2小时的蓝桥杯PythonB组冲刺日程表（持续1个月，聚焦高频考点）：第一周：核心算法突破Day1（周一）学习重点：动态规划（01背包问题）学习资源：AcWing《蓝桥杯辅导课》第8讲（背包问题模板）代码模板速记：#一维01背包模板n,V=map(int,input().split())dp=[0]*(V+1)for_inrange(n):w,v=map(int,input().split()
Sklearn.model_selection.GridSearchCV kakak_ Machine Learning
sklearn.model_selection.GridSearchCV具体在scikit-learn中，主要是使用网格搜索，即GridSearchCV类。estimator:即调整的模型param_grid：即要调参的参数列表，以dict呈现。cv:S折交叉验证的折数，即将训练集分成多少份来进行交叉验证。默认是3,。如果样本较多的话，可以适度增大cv的值。scoring:评价标准。获取最好的模型
【机器学习】机器学习四大分类藓类少女机器学习机器学习分类人工智能
机器学习的方法主要可以分为四大类，根据学习方式和数据标注情况进行分类：1.监督学习（SupervisedLearning）特点：有标注数据（即训练数据有明确的输入(X)和输出(Y)）。学习目标是找到一个映射(f(X)\approxY)。适用于分类和回归问题。主要算法：分类（Classification）：逻辑回归（LogisticRegression）支持向量机（SVM）朴素贝叶斯（NaïveBa
Conda常用命令汇总（持续更新中） X-future426 conda linux 运维
原文章：安装和使用Miniconda来管理Python环境-CSDN博客一、Miniconda的使用Miniconda没有GUI界面，只能通过conda命令对Python环境和软件包进行管理，所以这里主要介绍一下conda的常用命令。1.Conda相关(1)查询conda版本conda--version(2)更新conda版本condaupdateconda2.环境管理(1)查询已创建的虚拟环境c
大模型学习终极指南：从新手到专家的必经之路，全网最详尽解析，你敢挑战吗？大模型入门教程学习人工智能 AI 大模型大模型学习大模型教程 AI大模型
随着人工智能技术的飞速发展，大模型（Large-ScaleModels）已经成为推动自然语言处理（NLP）、计算机视觉（CV）等领域进步的关键因素。本文将为您详细介绍从零开始学习大模型直至成为专家的全过程，包括所需掌握的知识点、学习资源以及实践建议等。无论您是初学者还是有一定基础的专业人士，都能从中获得有价值的指导。一、基础知识准备在开始学习大模型之前，需要先掌握一些基础知识，这些知识将为后续的学
Python 爬虫实战：从知乎盐选专栏，爬取优质内容付费数据西攻城狮北 python 爬虫开发语言实战案例知乎
目录一、前言二、准备篇2.1确定目标2.2工具与库2.3法律与道德声明三、实战篇3.1分析知乎盐选专栏页面3.2模拟登录3.3获取文章列表3.4爬取更多文章数据3.5数据存储四、分析篇4.1数据清洗4.2热门文章分析4.3收藏数分析4.4评论数分析五、总结与展望六、注意事项一、前言知乎盐选专栏作为知乎平台上的优质内容付费板块，汇聚了众多创作者的高质量文章。了解这些文章的付费数据，如点赞数、收藏数、
机器学习——KNN超参数练习AI两年半机器学习人工智能深度学习
sklearn.model_selection.GridSearchCV是scikit-learn中用于超参数调优的核心工具，通过结合交叉验证和网格搜索实现模型参数的自动化优化。以下是详细介绍：一、功能概述GridSearchCV在指定参数网格上穷举所有可能的超参数组合，通过交叉验证评估每组参数的性能，最终选择最优参数组合。其核心价值在于：自动化调参：替代手动参数调试，提升效率3。交叉验证支持：通
Python 常用函数全解析，轻松提升编码效率 jiajia651304 python 开发语言 windows
Python常用函数全解析，轻松提升编码效率Python常用函数全解析，轻松提升编码效率1.基础内置函数1.1`print()`与`input()`1.2`len()`、`type()`与`isinstance()`2.数学与数值处理函数2.1`abs()`、`round()`与`pow()`2.2`divmod()`与`max()/min()`3.序列与迭代相关函数3.1`range()`与`e
编程内容简述！恶霸不委屈开发语言青少年编程汇编 java python
编程是指通过计算机语言来开发软件、程序和应用的过程，通常通过编写一系列的指令，来让计算机完成特定的任务。编程可以涉及多个领域和技术，以下是一些主要的编程内容：1.编程语言编程语言是程序员与计算机进行沟通的桥梁，不同的编程语言适用于不同的任务。常见的编程语言有：Python：简单易学，适用于数据分析、人工智能、网页开发等。JavaScript：网页开发中不可或缺的语言，用于动态网页和前端开发。Jav
新手如何使用 Milvus 巴依老爷coder 数据库 milvus 向量数据库数据库
一文带你入门Milvus：详细指南新手如何使用Milvus：详细指南一、Milvus简介主要特点应用领域二、安装Milvus安装DockerCompose基于DockerCompose安装Milvus服务端安装attu-可视化界面工具三、快速入门安装PythonSDK连接数据库方式1方式2（方式1的封装）数据库操作核心概念集合操作数据操作插入数据精准查询数据-get条件查询数据-query查询数据
nginx-部署Python网站项目 skyQAQLinux python linux nginx 服务器
一、部署Python网站项目实验要求配置Nginx使其可以将动态访问转交给uWSGI安装Python工具及依赖1)拷贝软件到proxy主机[root@server1~]#scp-r/linux-soft/s2/wk/python/192.168.99.5:/root2)安装python依赖软件[root@proxy~]#yum-yinstallgccmakepython3python3-devel
【图像去噪】论文精读：CVPR 2025 | DnLUT: Ultra-Efficient Color Image Denoising via Channel-Aware Lookup Tables 十小大图像去噪深度学习计算机视觉人工智能图像处理论文阅读论文笔记
请先看【专栏介绍文章】：【图像去噪（ImageDenoising）】关于【图像去噪】专栏的相关说明，包含适配人群、专栏简介、专栏亮点、阅读方法、定价理由、品质承诺、关于更新、去噪概述、文章目录、资料汇总、问题汇总（更新中）文章目录前言Abstract1.Introduction2.Relatedworks2.1.ColorImagedenoising2.2.ReplacingCNNwithLUT3
Python 3.6.8 64位独立安装程序霍娴果Myrtle
Python3.6.864位独立安装程序【下载地址】Python3.6.864位独立安装程序Python3.6.864位独立安装程序欢迎使用Python3.6.64位版安装包！本资源专门针对需要在64位操作系统上进行Python环境搭建的用户项目地址:https://gitcode.com/open-source-toolkit/98d19欢迎使用Python3.6.64位版安装包！本资源专门针对
Python 3.6.8 安装包下载何盼思Kit
Python3.6.8安装包下载【下载地址】Python3.6.8安装包下载Python3.6.8安装包下载本仓库提供适用于Windows操作系统的Python3.6.8安装包，支持x86和x64架构项目地址:https://gitcode.com/open-source-toolkit/d9647本仓库提供适用于Windows操作系统的Python3.6.8安装包，支持x86和x64架构。Pyt
国产模型能否挑战 GPT-4？一文拆解 DeepSeek-V3 架构与实战应用 AI筑梦师人工智能学习框架架构深度学习 python agi 人工智能 tensorflow
✳️一、引言✅1.1DeepSeek-V3发布背景与定位随着大模型技术的快速演进，从GPT-3到GPT-4，全球在通用人工智能方向取得了长足进展。但与此同时，开源社区始终缺乏一个真正兼顾性能、效率、中文能力和实用性的高质量大模型。DeepSeek-V3的推出正是在这个背景下的一次关键突破。DeepSeek-V3是由中国团队DeepSeek开发的第三代大语言模型，它具备以下几个核心特性：开源可商用：
Python匿名函数Lambda，不止是省略函数名这么简单橙色小博 python的学习之旅 python 开发语言
目录1.前言2.Lambda函数的基本用法3.关于Lambda函数的应用3.1与map函数结合3.2lambda与if-else语句3.3多参数lambda3.4嵌套lambda3.5字典与lambda（也是我本人最喜欢的用法）3.6lambda其他用法4.总结：Lambda的编程哲学1.前言在Python的广阔天地里，Lambda函数宛如一颗璀璨的明珠，以其简洁优雅的姿态，为代码增添了一份独特的
AtCoder备赛冲刺必刷题（C++） | 洛谷 AT_abc396_a Triple Four 热爱编程的通信人 c++算法开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】洛谷：AT_abc396_a[ABC396A]
python 捕获异常 weixin_30730151 python 数据库
异常：由于代码的逻辑或者语法错误导致的程序中断。在学习Python的过程当中，大家一定要区分清楚异常和布尔值False布尔值的False只是一个值，通常代表的是一个条件的不成立，常用于逻辑判断比如：1num=22print(num>3)3ifnum>3:4print("num>3")异常指的是由于代码的逻辑或者语法错误导致的程序中断比如：1num=222+"2"了解了上面的逻辑之后，我们来看看大家
DeepSeek多语言AI高效应用实践智能计算研究中心其他
内容概要在人工智能技术快速迭代的背景下，DeepSeek系列模型凭借混合专家架构（MoE）与670亿参数规模，在多语言处理、视觉语言理解及复杂任务生成领域实现了突破性进展。本文系统性拆解其技术架构设计逻辑，聚焦论文写作、代码生成、SEO关键词拓展三大核心场景，分析模型在高生成质量、低使用成本维度的差异化优势。技术维度DeepSeekProver传统单模态模型多语言支持97种语言动态切换单一语种优化
python爬虫Redis数据库 Æther_9 Python爬虫零基础入门数据库 python 爬虫
Redis数据库Redis简介Redis是完全开源免费的，遵守BSD协议，是一个高性能的key-value数据库。Redis与其他key-value缓存产品有以下三个特点：Redis支持数据的持久化，可以将内存中的数据保存在磁盘中，重启的时候可以再次加载进行使用。Redis不仅仅支持简单的key-value类型的数据，同时还提供list，set，zset，hash等数据结构的存储。redis：半持
python sympy的安装与使用范哥来了 python 开发语言
为了安装和使用sympy，您可以按照以下步骤进行操作：安装SymPy首先，您需要确保已经安装了Python。接着，可以通过pip来安装sympy。打开命令行工具（如终端或命令提示符），然后输入以下命令来安装sympy：pipinstallsympy如果您使用的是特定的Python环境，请确保激活该环境后再执行上述安装命令。使用SymPy安装完成后，您就可以在Python项目中导入并使用sympy了
DeepSeek R1 本地部署指南 (3) - 更换本地部署模型 Windows/macOS 通用 Eric Woo X 人工智能 AI DeepSeek macos windows deepseek ai
0.准备完成Windows或macOS安装：DeepSeekR1本地部署指南(1)-Windows本地部署-CSDN博客DeepSeekR1本地部署指南(2)-macOS本地部署-CSDN博客以下内容Windows和macOS命令执行相同：Windows管理员启动：命令提示符CMDmacOS启动：Terminal1.查看已安装模型ollamalist如图，已安装1.5b版本：ollamarunde
facefusion AI换脸软件的本地部署过程记录 kfrealme 人工智能
tags:AI驾驭facefusion我的环境Win10+N卡安装步骤安装Python3.10方案手动安装Python官网下载安装包安装PythonReleasesforWindows|Python.org我的蓝奏云分享https://www.lanzoub.com/i9La81s1o5gb密码:h17b命令行安装1以管理员身份打开「命令提示符」2删除Microsoft官方源wingetsourc
Python中手动实现进制转换棉猴 Python 进制转换十进制二进制十六进制八进制
在《Python中进制转换》中提到可以使用bin()、oct()、int()和hex()等函数编程实现数字间的进制转换。除了编程实现进制转换外，还可以通过手动实现。1手动实现二进制数转换为十进制可以通过“填空法”手动将二进制数转换为十进制数，例如将二进制数“0b1101”转换为十进制数的方法如图1所示。“填空法”可以归纳为四个步骤：首先“画空格”，接下来“写次方”，然后“填数字”，最后“列算式”。
Python中的进制转换棉猴 #Python数据类型 Python 进制转化二进制八进制十六进制 bin oct
常用的进制有二进制、八进制、十进制和十六进制。1四种进制简介最常用的十进制基本原理是“逢十进一”，因此十进制包括的数字是“0-9”;同理，二进制的基本原理是“逢二进一”，包含的数字是“0-1”;八进制是“逢八进一”，包含的数字是“0-7”；十六进制是“逢十六进一”，包含的数字是“0-15”，其中用“A、B、C、D、E、F”分别表示“10-15”这五个数。2四种进制数的表示对于一个数字“11”,可能
小菜鸟的Python笔记001：将Word文档中数据汇总到Excel表格蜉蝣2805 小菜鸟的Python笔记 python 数据分析
将Word文档中数据汇总到Excel表格前言一、应用场景二、程序思路及准备工作思路如下：准备工作：三、程序代码1、主程序2、获取Word文档列表3、提取文档内数据4、导入到Excel表格四、遇到的问题1、错误AttributeError:word.Application.Quit2、word文档中复选框的识别总结前言我并非一个专业的程序员，只是一个普通的编程爱好者、一只小菜鸟。得益于网络上各路大神
31天Python入门——第9天:再学函数安然无虞 Python手把手教程 python 开发语言后端 pyqt
你好，我是安然无虞。文章目录再学函数1.变量在函数中的作用域2.函数的参数传递.补充学习:不定长参数*args和**kwargs3.值传递和引用传递补充学习:把函数作为参数传递4.匿名函数5.python中内置的常用函数zip()map()filter()all()any()6.函数练习再学函数1.变量在函数中的作用域变量的作用域是指变量的作用范围.局部变量:在函数体或局部范围内声明的变量称为局部
Scrapy 入门教程 zru_9602 爬虫 scrapy
Scrapy入门教程Scrapy是一个用于爬取网站数据的Python框架，功能强大且易于扩展。本文将介绍Scrapy的基本概念、安装方法、使用示例，并展示如何编写一个基本的爬虫。1.什么是Scrapy？Scrapy是一个开源的、用于爬取网站数据的框架，主要特点包括：高效、异步的爬取机制强大的XPath和CSS选择器解析能力内置中间件，支持代理、去重等功能易于扩展，适用于各种爬虫需求2.安装Scra
python批量替换word内容_python win32com 库批量替换word文件内容 weixin_39657300
前言win32com模块主要为Python提供调用windows底层组件对word、Excel、PPT等进行操作的功能，只能在Windows环境下使用，并且需要安装office相关软件才行(WPS也行)。实例代码下方代码实现批量替换当前路径下word文档的指定文本内容。importwin32com.clientimportosimporttimedefupdate_replace(file):wo
异常的核心类Throwable 无量 java 源码异常处理 exception
java异常的核心是Throwable，其他的如Error和Exception都是继承的这个类里面有个核心参数是detailMessage，记录异常信息，getMessage核心方法，获取这个参数的值，我们可以自己定义自己的异常类，去继承这个Exception就可以了，方法基本上，用父类的构造方法就OK，所以这么看异常是不是很easy package com.natsu;
mongoDB 游标（cursor）实现分页迭代开窍的石头 mongodb
上篇中我们讲了mongoDB 中的查询函数，现在我们讲mongo中如何做分页查询如何声明一个游标 var mycursor = db.user.find({_id:{$lte:5}}); 迭代显示游标数
MySQL数据库INNODB 表损坏修复处理过程 0624chenhong tomcat mysql
最近mysql数据库经常死掉，用命令net stop mysql命令也无法停掉，关闭Tomcat的时候，出现Waiting for N instance(s) to be deallocated 信息。查了下，大概就是程序没有对数据库连接释放，导致Connection泄露了。因为用的是开元集成的平台，内部程序也不可能一下子给改掉的，就验证一下咯。启动Tomcat,用户登录系统，用netstat -
剖析如何与设计人员沟通不懂事的小屁孩工作
最近做图烦死了，不停的改图，改图……。烦，倒不是因为改，而是反反复复的改，人都会死。很多需求人员不知该如何与设计人员沟通，不明白如何使设计人员知道他所要的效果，结果只能是沟通变成了扯淡，改图变成了应付。那应该如何与设计人员沟通呢？我认为设计人员与需求人员先天就存在语言障碍。对一个合格的设计人员来说，整天玩的都是点、线、面、配色，哪种构图看起来协调；哪种配色看起来合理心里跟明镜似的，
qq空间刷评论工具换个号韩国红果果 JavaScript
var a=document.getElementsByClassName('textinput'); var b=[]; for(var m=0;m<a.length;m++){ if(a[m].getAttribute('placeholder')!=null) b.push(a[m]) } var l
S2SH整合之session 灵静志远 spring AOP struts session
错误信息： Caused by: org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'cartService': Scope 'session' is not active for the current thread; consider defining a scoped
xmp标签 a-john 标签
今天在处理数据的显示上遇到一个问题： var html = '<li><div class="pl-nr"><span class="user-name">' + user + '</span>' + text + '</div></li>'; ulComme
Ajax的常用技巧（2）---实现Web页面中的级联菜单 aijuans Ajax
在网络上显示数据，往往只显示数据中的一部分信息，如文章标题，产品名称等。如果浏览器要查看所有信息，只需点击相关链接即可。在web技术中，可以采用级联菜单完成上述操作。根据用户的选择，动态展开，并显示出对应选项子菜单的内容。在传统的web实现方式中，一般是在页面初始化时动态获取到服务端数据库中对应的所有子菜单中的信息，放置到页面中对应的位置，然后再结合CSS层叠样式表动态控制对应子菜单的显示或者隐
天-安-门，好高 atongyeye 情感
我是85后，北漂一族，之前房租1100，因为租房合同到期，再续，房租就要涨150。最近网上新闻，地铁也要涨价。算了一下，涨价之后，每次坐地铁由原来2块变成6块。仅坐地铁费用，一个月就要涨200。内心苦痛。晚上躺在床上一个人想了很久，很久。我生在农
android 动画百合不是茶 android 透明度平移缩放旋转
android的动画有两种 tween动画和Frame动画 tween动画;,透明度,缩放,旋转,平移效果 Animation 动画 AlphaAnimation 渐变透明度 RotateAnimation 画面旋转 ScaleAnimation 渐变尺寸缩放 TranslateAnimation 位置移动 Animation
查看本机网络信息的cmd脚本 bijian1013 cmd
@echo 您的用户名是：%USERDOMAIN%\%username%>"%userprofile%\网络参数.txt" @echo 您的机器名是：%COMPUTERNAME%>>"%userprofile%\网络参数.txt" @echo ___________________>>"%userprofile%\
plsql 清除登录过的用户征客丶 plsql
tools---preferences----logon history---history 把你想要删除的删除 -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一起进步。 email ： binary_spac
【Pig一】Pig入门 bit1129 pig
Pig安装 1.下载pig wget http://mirror.bit.edu.cn/apache/pig/pig-0.14.0/pig-0.14.0.tar.gz 2. 解压配置环境变量如果Pig使用Map/Reduce模式，那么需要在环境变量中，配置HADOOP_HOME环境变量 expor
Java 线程同步几种方式 BlueSkator volatile synchronized ThredLocal ReenTranLock Concurrent
为何要使用同步？ java允许多线程并发控制，当多个线程同时操作一个可共享的资源变量时（如数据的增删改查），将会导致数据不准确，相互之间产生冲突，因此加入同步锁以避免在该线程没有完成操作之前，被其他线程的调用，从而保证了该变量的唯一性和准确性。 1.同步方法&
StringUtils判断字符串是否为空的方法（转帖） BreakingBad null StringUtils “”
转帖地址：http://www.cnblogs.com/shangxiaofei/p/4313111.html public static boolean isEmpty(String str) 　　判断某字符串是否为空，为空的标准是 str== null 或 str.length()== 0
编程之美-分层遍历二叉树 bylijinnan java 数据结构算法编程之美
import java.util.ArrayList; import java.util.LinkedList; import java.util.List; public class LevelTraverseBinaryTree { /** * 编程之美分层遍历二叉树 * 之前已经用队列实现过二叉树的层次遍历，但这次要求输出换行，因此要
jquery取值和ajax提交复习记录 chengxuyuancsdn jquery取值 ajax提交
// 取值 // alert($("input[name='username']").val()); // alert($("input[name='password']").val()); // alert($("input[name='sex']:checked").val()); // alert($("
推荐国产工作流引擎嵌入式公式语法解析器-IK Expression comsci java 应用服务器工作 Excel 嵌入式
这个开源软件包是国内的一位高手自行研制开发的，正如他所说的一样，我觉得它可以使一个工作流引擎上一个台阶。。。。。。欢迎大家使用，并提出意见和建议。。。 ----------转帖--------------------------------------------------- IK Expression是一个开源的（OpenSource），可扩展的（Extensible），基于java语言
关于系统中使用多个PropertyPlaceholderConfigurer的配置及PropertyOverrideConfigurer daizj spring
1、PropertyPlaceholderConfigurer Spring中PropertyPlaceholderConfigurer这个类，它是用来解析Java Properties属性文件值，并提供在spring配置期间替换使用属性值。接下来让我们逐渐的深入其配置。基本的使用方法是：(1) <bean id="propertyConfigurerForWZ&q
二叉树:二叉搜索树 dieslrae 二叉树
所谓二叉树,就是一个节点最多只能有两个子节点,而二叉搜索树就是一个经典并简单的二叉树.规则是一个节点的左子节点一定比自己小,右子节点一定大于等于自己(当然也可以反过来).在树基本平衡的时候插入,搜索和删除速度都很快,时间复杂度为O(logN).但是,如果插入的是有序的数据,那效率就会变成O(N),在这个时候,树其实变成了一个链表. tree代码:
C语言字符串函数大全 dcj3sjt126com c function
C语言字符串函数大全函数名: stpcpy 功能: 拷贝一个字符串到另一个用法: char *stpcpy(char *destin, char *source); 程序例: #include <stdio.h> #include <string.h> int main
友盟统计页面技巧 dcj3sjt126com 技巧
在基类调用就可以了, 基类ViewController示例代码 -(void)viewWillAppear:(BOOL)animated { [super viewWillAppear:animated]; [MobClick beginLogPageView:[NSString stringWithFormat:@"%@",self.class]];
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法 flyvszhb java jdk
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法本机已经安装了jdk1.7，而比较早期的项目需要依赖jdk1.6，于是同时在本机安装了jdk1.6和jdk1.7. 安装jdk1.6前，执行java -version得到 C:\Users\liuxiang2>java -version java version "1.7.0_21&quo
Java在创建子类对象的同时会不会创建父类对象 happyqing java 创建子类对象父类对象
1.在thingking in java 的第四版第六章中明确的说了，子类对象中封装了父类对象， 2."When you create an object of the derived class, it contains within it a subobject of the base class. This subobject is the sam
跟我学spring3 目录贴及电子书下载 jinnianshilongnian spring
一、《跟我学spring3》电子书下载地址：《跟我学spring3》（1-7 和 8-13） http://jinnianshilongnian.iteye.com/blog/pdf 跟我学spring3系列 word原版下载二、源代码下载最新依
第12章 Ajax（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BI and EIM 4.0 at a glance blueoxygen BO
http://www.sap.com/corporate-en/press.epx?PressID=14787 有机会研究下EIM家族的两个新产品~~~~ New features of the 4.0 releases of BI and EIM solutions include: Real-time in-memory computing –
Java线程中yield与join方法的区别 tomcat_oracle java
长期以来，多线程问题颇为受到面试官的青睐。虽然我个人认为我们当中很少有人能真正获得机会开发复杂的多线程应用(在过去的七年中，我得到了一个机会)，但是理解多线程对增加你的信心很有用。之前，我讨论了一个wait()和sleep()方法区别的问题，这一次，我将会讨论join()和yield()方法的区别。坦白的说，实际上我并没有用过其中任何一个方法，所以，如果你感觉有不恰当的地方，请提出讨论。 &nb
android Manifest.xml选项阿尔萨斯 Manifest
结构继承关系 public final class Manifest extends Objectjava.lang.Objectandroid.Manifest 内部类 class Manifest.permission权限 class Manifest.permission_group权限组构造函数 public Manifest () 详细 androi
Oracle实现类split函数的方 zhaoshijie oracle
关键字：Oracle实现类split函数的方项目里需要保存结构数据，批量传到后他进行保存，为了减小数据量，子集拼装的格式，使用存储过程进行保存。保存的过程中需要对数据解析。但是oracle没有Java中split类似的函数。从网上找了一个，也补全了一下。 CREATE OR REPLACE TYPE t_split_100 IS TABLE OF VARCHAR2(100); cr