ZIYUE WU

图像处理实践 | 基于MNIST数据集的手写数字识别

基于MNIST数据集的手写数字识别

1数据获取与数据集介绍

数据来源：

Kaggle Competition：Digit Recognizer, Learn computer vision fundamentals with the famous MNIST data.

该数据集包含数万条手写数据的图像信息，目标是对于根据有标记的手写数据图像数据建模，从而对未标记的数据进行分类。该比赛是计算机视觉中最为入门级的比赛，通过这个比赛可以掌握处理非结构化数据（图像）的基本流程。

2 预处理与特征提取

这里根据图像数据的特征选择合适的机器学习模型进行处理，这里采用三种不同的方法来应对手写数字的分类问题：PCA+SVM、KNN以及卷积神经网络，使用到sklearn、keras等常用模块。

2.1 数据导入

# 导入所必要的一些包

import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.image as mpimg
import matplotlib.pyplot as plt
import matplotlib
%matplotlib inline
from time import time
from sklearn.manifold import TSNE
from sklearn.decomposition import PCA
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis as LDA
from sklearn.model_selection import GridSearchCV
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn import neural_network
from sklearn import  metrics
import math
import time
from collections import Counter
import keras
from keras.layers import Dense, Dropout, Flatten, Conv2D, MaxPooling2D
from keras.models import Sequential
import warnings
warnings.filterwarnings('ignore')

# 数据导入并查看基本信息
PATH="E:/kaggle/digit-recognizer/"
train=pd.read_csv(PATH+'train.csv')
print(train.shape)
print(train.info)

(42000, 785)

train.head()

	label	...
0	1	...
1	0	...
2	1	...
3	4	...
4	0	...

5 rows × 785 columns

可以看到，图像数据就是由像素点的数据组成的，每张图片为28*28=784个像素。MNIST数据集的手写数字图像为黑白图像，即在每个格子中数据的取值只有可能是0或1，现在我们要根据这些像素值来进行分类，在处理的过程中，784个像素可以看做target的784个特征。

2.2 利用PCA降维提取特征

首先我们可以试着用传统的方法，SVM来进行图像的分类，在分类之前，我们先用PCA的方法对于数据进行降维，从而达到降低计算开销的作用。

# 训练集测试集划分

X_train=train.drop(['label'],axis='columns',inplace=False)
y_train=train['label']
from sklearn.model_selection import train_test_split
X_tr,X_ts,y_tr,y_ts=train_test_split(X_train,y_train,test_size=0.30,random_state=4)

在主成分分析中，n_components是最重要的参数，代表我们需要保留的主成分个数。通过设置n_component=16，我们可以建立起只有16个值的模型，极大减少运算时间，同时能够不丢失太多的准确率。

n_components = 16
t0 = time()
pca = PCA(n_components=n_components, svd_solver='randomized',
          whiten=True).fit(X_train)
print("done in %0.3fs" % (time() - t0))

X_train_pca = pca.transform(X_train)

done in 1.828s

# 查看方差直方图
plt.hist(pca.explained_variance_ratio_, bins=n_components, log=True)
pca.explained_variance_ratio_.sum()

0.5953435812797994

根据输出结果我们可以看到，保留前16个主成分能够留住数据59%的主要信息。

3 建立模型

3.1 SVM分类器

使用sklearn包中自带的SVM函数来对于数据进行训练。


param_grid = { "C" : [0.1]
              , "gamma" : [0.1]}
rf = SVC()
gs = GridSearchCV(estimator=rf, param_grid=param_grid, scoring='accuracy', cv=2, n_jobs=-1, verbose=1)
gs = gs.fit(X_train_pca, y_train)

print(gs.best_score_)
print(gs.best_params_)

Fitting 2 folds for each of 1 candidates, totalling 2 fits


[Parallel(n_jobs=-1)]: Using backend LokyBackend with 8 concurrent workers.
[Parallel(n_jobs=-1)]: Done   2 out of   2 | elapsed:   20.3s remaining:    0.0s
[Parallel(n_jobs=-1)]: Done   2 out of   2 | elapsed:   20.3s finished


0.9430238095238095
{'C': 0.1, 'gamma': 0.1}

bp = gs.best_params_
t0 = time()
clf = SVC(C=bp['C'], kernel='rbf', gamma=bp['gamma'])
clf = clf.fit(X_train_pca, y_train)
print("done in %0.3fs" % (time() - t0))

done in 18.860s

clf.score(pca.transform(X_ts), y_ts)

0.9568253968253968

可以看到，在我们的验证数据中已经达到了95.6%的精确度，其中SVM的参数分别为C：0.1，gamma：0.1。其中C为惩罚系数，C减小可以防止过拟合，这里使用适当的C使得模型达到最好的泛化性能。gamma为支持向量的多少。

接着我们可以按照要求将结果输出，即对于未打标签的图像，进行实际label的预测。最后的效果可以通过Kaggle的线上平台进行评估分析。

val = pd.read_csv(PATH+'test.csv')
pred = clf.predict(pca.transform(val))
# ImageId,Label

val['Label'] = pd.Series(pred)
val['ImageId'] = val.index +1
sub = val[['ImageId','Label']]
sub.to_csv(PATH+'submission1.csv', index=False)

最终的模型结果为97.1%的准确率，确实是效率较高的一种方法了。

3.2 KNN

KNN是一种无监督聚类方法，这里构建KNN分类器，其原理是将样本分到样本空间中距离最近的一个类别里。这里设计实现了一个简单的KNN模块。

%matplotlib inline
plt.rcParams['figure.figsize'] = (10.0, 8.0) 
plt.rcParams['image.interpolation'] = 'nearest'
plt.rcParams['image.cmap'] = 'gray'

# 导入数据的函数

def load_data(data_dir):
    train_data = open(data_dir + "train.csv").read()
    train_data = train_data.split("\n")[1:-1]
    train_data = [i.split(",") for i in train_data]
    X_train = np.array([[int(i[j]) for j in range(1,len(i))] for i in train_data])
    y_train = np.array([int(i[0]) for i in train_data])

    test_data = open(data_dir + "test.csv").read()
    test_data = test_data.split("\n")[1:-1]
    test_data = [i.split(",") for i in test_data]
    X_test = np.array([[int(i[j]) for j in range(0,len(i))] for i in test_data])

    return X_train, y_train, X_test

# KNN实现的模块
class simple_knn():

    def __init__(self):
        pass

    def train(self, X, y):
        self.X_train = X
        self.y_train = y

    def predict(self, X, k=1):
        # 计算样本距离       
        dists = self.compute_distances(X)
        num_test = dists.shape[0]
        y_pred = np.zeros(num_test)

        for i in range(num_test):
            k_closest_y = []
            labels = self.y_train[np.argsort(dists[i,:])].flatten()
            k_closest_y = labels[:k]    # 将k个最近邻居的label找到
            c = Counter(k_closest_y)
            y_pred[i] = c.most_common(1)[0][0]

        return(y_pred)

    def compute_distances(self, X):
        num_test = X.shape[0]
        num_train = self.X_train.shape[0]

        dot_pro = np.dot(X, self.X_train.T)
        sum_square_test = np.square(X).sum(axis = 1)
        sum_square_train = np.square(self.X_train).sum(axis = 1)
        dists = np.sqrt(-2 * dot_pro + sum_square_train + np.matrix(sum_square_test).T)

        return(dists)

X_train, y_train, X_test = load_data(PATH)

batch_size = 2000
k = 3  # 邻居类别的个数（knn的参数）
classifier = simple_knn()
classifier.train(X_train, y_train)

调用KNN模块对于模型进行预测

predictions = []
for i in range(int(len(X_test)/batch_size)):
    print("Computing batch " + str(i+1) + "/" + str(int(len(X_test)/batch_size)) + "...")
    tic = time.time()
    predts = classifier.predict(X_test[i * batch_size:(i+1) * batch_size], k)
    toc = time.time()
    predictions = predictions + list(predts)
    print("Completed this batch in " + str(toc-tic) + " Secs.")
print("Completed predicting the test data.")

Computing batch 1/14...
Completed this batch in 53.51499319076538 Secs.
Computing batch 2/14...
Completed this batch in 43.31397557258606 Secs.
Computing batch 3/14...
Completed this batch in 42.59756851196289 Secs.
Computing batch 4/14...
Completed this batch in 43.00966835021973 Secs.
Computing batch 5/14...
Completed this batch in 43.01448702812195 Secs.
Computing batch 6/14...
Completed this batch in 47.93128275871277 Secs.
Computing batch 7/14...
Completed this batch in 44.85835313796997 Secs.
Computing batch 8/14...
Completed this batch in 44.42547106742859 Secs.
Computing batch 9/14...
Completed this batch in 44.020007610321045 Secs.
Computing batch 10/14...
Completed this batch in 44.085976362228394 Secs.
Computing batch 11/14...
Completed this batch in 43.6392982006073 Secs.
Computing batch 12/14...
Completed this batch in 43.603368282318115 Secs.
Computing batch 13/14...
Completed this batch in 45.03933787345886 Secs.
Computing batch 14/14...
Completed this batch in 44.59685492515564 Secs.
Completed predicting the test data.

out_file = open(PATH+"submission2.csv", "w")
out_file.write("ImageId,Label\n")
for i in range(len(predictions)):
    out_file.write(str(i+1) + "," + str(int(predictions[i])) + "\n")
out_file.close()

该方案的准确率为97.114%，准确率有小幅度提高。

3.3 NN Model

尝试一种最基本的神经网络模型：MLP（多层感知机）。这里使用sklearn中的神经网络模块MLPClassifier来处理图像分类的问题。

# 数据导入
train = pd.read_csv(PATH+"train.csv")
test = pd.read_csv(PATH+"test.csv")

Y = train['label'][:10000] # use more number of rows for more training 
X = train.drop(['label'], axis = 1)[:10000] # use more number of rows for more training 
x_train, x_val, y_train, y_val = train_test_split(X, Y, test_size=0.20, random_state=42)

model = neural_network.MLPClassifier(alpha=1e-5, hidden_layer_sizes=(5,), solver='lbfgs', random_state=18)
model.fit(x_train, y_train)

MLPClassifier(activation='relu', alpha=1e-05, batch_size='auto', beta_1=0.9,
              beta_2=0.999, early_stopping=False, epsilon=1e-08,
              hidden_layer_sizes=(5,), learning_rate='constant',
              learning_rate_init=0.001, max_iter=200, momentum=0.9,
              n_iter_no_change=10, nesterovs_momentum=True, power_t=0.5,
              random_state=18, shuffle=True, solver='lbfgs', tol=0.0001,
              validation_fraction=0.1, verbose=False, warm_start=False)

现在我们就建好了如上的分类器，将验证集的数据输入分类器来检验模型的效果。

predicted = model.predict(x_val)
print("Classification Report:\n %s:" % (metrics.classification_report(y_val, predicted)))

Classification Report:
               precision    recall  f1-score   support

           0       0.00      0.00      0.00       186
           1       0.97      0.81      0.88       210
           2       0.12      0.99      0.21       220
           3       0.00      0.00      0.00       190
           4       0.00      0.00      0.00       188
           5       0.00      0.00      0.00       194
           6       0.00      0.00      0.00       190
           7       0.00      0.00      0.00       233
           8       0.00      0.00      0.00       197
           9       0.00      0.00      0.00       192

    accuracy                           0.19      2000
   macro avg       0.11      0.18      0.11      2000
weighted avg       0.12      0.19      0.12      2000
:

可以看到利用MLP Model进行分类的结果，可以看到多层感知器分类并不是很适用于这样的图像分类问题，在精确率得分上比较低，这启发我们更换其他的神经网络模型看看是否能取得更好的效果。

3.4 CNN

3.4.1 数据处理和准备

为了能够将数据合适地输入模型，还需要对数据进行一些处理。在keras的CNN中，其卷积等模块中的操作已经能够自动实现图像的特征提取，因此不在需要人为设置规则来提取图像中的特征。

Y = train['label']
X = train.drop(['label'], axis=1)

x_train, x_val, y_train, y_val = train_test_split(X.as_matrix(), Y.as_matrix(), test_size=0.10, random_state=42)

调节合适的参数，其中num_classes为类别的数量，这里就是0-9的十个数字的类别，同时我们输入的图像为28*28像素的大小，在每个batch中神经网络将处理128个数据。

# network parameters 
batch_size = 128
num_classes = 10
epochs = 5 # Further Fine Tuning can be done

# input image dimensions
img_rows, img_cols = 28, 28

# preprocess the train data 
x_train = x_train.reshape(x_train.shape[0], img_rows, img_cols, 1)
x_train = x_train.astype('float32')
x_train /= 255

# preprocess the validation data
x_val = x_val.reshape(x_val.shape[0], img_rows, img_cols, 1)
x_val = x_val.astype('float32')
x_val /= 255

input_shape = (img_rows, img_cols, 1)

# convert the target variable 
y_train = keras.utils.to_categorical(y_train, num_classes)
y_val = keras.utils.to_categorical(y_val, num_classes)

# preprocess the test data
Xtest = test.as_matrix()
Xtest = Xtest.reshape(Xtest.shape[0], img_rows, img_cols, 1)

3.4.2 搭建神经网络模型

model = Sequential()

# add first convolutional layer
model.add(Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=input_shape))

# add second convolutional layer
model.add(Conv2D(64, (3, 3), activation='relu'))

# add one max pooling layer 
model.add(MaxPooling2D(pool_size=(2, 2)))

# add one dropout layer
model.add(Dropout(0.25))

# add flatten layer
model.add(Flatten())

# add dense layer
model.add(Dense(128, activation='relu'))

# add another dropout layer
model.add(Dropout(0.5))

# add dense layer
model.add(Dense(num_classes, activation='softmax'))

# complile the model and view its architecur
model.compile(loss=keras.losses.categorical_crossentropy,  optimizer=keras.optimizers.Adadelta(), metrics=['accuracy'])

model.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
conv2d_3 (Conv2D)            (None, 26, 26, 32)        320       
_________________________________________________________________
conv2d_4 (Conv2D)            (None, 24, 24, 64)        18496     
_________________________________________________________________
max_pooling2d_2 (MaxPooling2 (None, 12, 12, 64)        0         
_________________________________________________________________
dropout_3 (Dropout)          (None, 12, 12, 64)        0         
_________________________________________________________________
flatten_2 (Flatten)          (None, 9216)              0         
_________________________________________________________________
dense_3 (Dense)              (None, 128)               1179776   
_________________________________________________________________
dropout_4 (Dropout)          (None, 128)               0         
_________________________________________________________________
dense_4 (Dense)              (None, 10)                1290      
=================================================================
Total params: 1,199,882
Trainable params: 1,199,882
Non-trainable params: 0
_________________________________________________________________


可以看到我们利用keras中的相关模块，搭建起了一个简单的CNN模型，接下来需要将我们的训练数据输入模型，对卷积神经网络进行训练。

model.fit(x_train, y_train, batch_size=batch_size, epochs=epochs, verbose=1, validation_data=(x_val, y_val))
accuracy = model.evaluate(x_val, y_val, verbose=0)
print('Test accuracy:', accuracy[1])

WARNING:tensorflow:From D:\download\anaconda\lib\site-packages\tensorflow\python\ops\math_grad.py:1250: add_dispatch_support..wrapper (from tensorflow.python.ops.array_ops) is deprecated and will be removed in a future version.
Instructions for updating:
Use tf.where in 2.0, which has the same broadcast rule as np.where
Train on 37800 samples, validate on 4200 samples
Epoch 1/5
37800/37800 [==============================] - 64s 2ms/step - loss: 0.3448 - acc: 0.8939 - val_loss: 0.0937 - val_acc: 0.9717
Epoch 2/5
37800/37800 [==============================] - 65s 2ms/step - loss: 0.1069 - acc: 0.9687 - val_loss: 0.0520 - val_acc: 0.9821
Epoch 3/5
37800/37800 [==============================] - 63s 2ms/step - loss: 0.0764 - acc: 0.9774 - val_loss: 0.0507 - val_acc: 0.9826
Epoch 4/5
37800/37800 [==============================] - 61s 2ms/step - loss: 0.0624 - acc: 0.9809 - val_loss: 0.0441 - val_acc: 0.9860
Epoch 5/5
37800/37800 [==============================] - 62s 2ms/step - loss: 0.0533 - acc: 0.9835 - val_loss: 0.0326 - val_acc: 0.9883
Test accuracy: 0.9883333333333333

模型预测与输出：

pred = model.predict(Xtest)
y_classes = pred.argmax(axis=-1)
res = pd.DataFrame()
res['ImageId'] = list(range(1,28001))
res['Label'] = y_classes
res.to_csv(PATH+"submission3.csv", index = False)

此模型的结果为98.1%，比SVM和KNN又有所提升。

4 模型总结

在MNIST数据集分类的任务中，使用不同模型都能够取得不错的结果，其中，SVM将低维空间中线性不可分的模型转化为高维空间中线性可分的问题，能够直接对图像数据进行运算，效率较高。KNN可以通过无监督的方法自动将数据进行分类，发现其中的common pattern。而CNN也更加广泛应用于图像处理当中，其本质上也是从图像中提取更为抽象的特征进行分类。通过使用不同的层级或不同的卷积核，能够对图像数据进行有效分类处理。

MNIST数据集的图像数据较好处理，可以直接转化为0、1的数据，其中1代表黑色区域，这种情况下，色彩不会影响数据分类的结果，然而实际中，彩色的图片分类不可避免，这个时候，一个像素点可能需要更多的数据才能够表示出来，因此，模型建立或运算上将会更为复杂。

参考kernel：

PCA and SVM on MNIST dataset

kNN from scratch in Python at 97.1%

A Very Comprehensive Tutorial : NN + CNN

两篇题解——理想的正方形deepseek做法 Cool_(wly)_Dino deepseek 算法数据结构 c++学习开发语言
嗯，这道题看起来是要找一个n×n的正方形区域，使得该区域内最大值和最小值的差最小。那我得仔细看看题目要求。题目给了一个a×b的矩阵，要从中找出所有可能的n×n正方形，然后计算每个这样的正方形的max-min，最后取所有中的最小值。首先，我得想到怎么高效地计算每个n×n窗口的最大和最小值。因为直接遍历每个窗口然后找最大和最小的话，时间复杂度会很高。比如a和b都是1000的话，n是100的话，这样的窗
Docker+Ollama+RAGFlow本地部署DeepSeek R1并构建本地知识库康顺哥 AI大模型 #docker 容器 llama 语言模型 ai AI编程
目录背景安装Docker设置Docker默认参数修改Docker保存服务程序的缓存路径为服务程序镜像设置别名为ollama设置专用参数安装ollama运行DeepSeekR1大模型安装Open-WebUI配置Open-WebUI检验DeepSeek的资源占用情况安装RAGFlow添加chat模型添加embedding模型创建知识库AI结合知识库聊天总结背景DeepSeek持续火爆，但官网访问经常出
《即梦牵手DeepSeek，AI创作领域的变革与未来》空云风语人工智能人工智能
《即梦牵手DeepSeek，AI创作领域的变革与未来》开篇：科技融合，梦想启航在当今科技飞速发展的时代，人工智能（AI）无疑是最为耀眼的领域之一。新的技术和创新不断涌现，推动着AI行业的边界持续拓展。近期，AI领域又迎来了一个令人瞩目的大事件：即梦正式接入DeepSeek，这一强强联合的举措，犹如一颗投入湖面的巨石，激起千层浪，在整个AI行业引发了广泛关注和热烈讨论。即梦，作为字节跳动旗下极具创新
DeepSeek 接入 Unity 小纯洁w unity 游戏引擎
DeepSeek可以接入Unity并帮助开发。以下是一些关于如何在Unity中集成DeepSeek的详细信息：申请APIKey要在Unity中使用DeepSeek，首先需要申请一个APIKey。申请地址为：https://platform.deepseek.com/api_keys。成功申请Key后，要在本地妥善保存，因为DeepSeek后台只能查看Key的列表和token余额等信息，完整的Key
深入探索Deeplearning4j（DL4J）：Java深度学习的全面指南软件职业规划 java 深度学习开发语言
一、DL4J框架概述Deeplearning4j（DL4J）是一个开源的深度学习框架，专为Java和Scala设计，运行在Java虚拟机（JVM）上。它由Skymind公司开发并维护，旨在将深度学习技术应用于大规模商业应用。DL4J支持多种深度学习模型，包括卷积神经网络（CNN）、循环神经网络（RNN）、长短期记忆网络（LSTM）等。自2014年首次发布以来，DL4J已经成为Java深度学习领域的
深度解析DeepSeek：从技术架构到实战应用 YY...yy ai DeepSeek
一、引言：为什么选择DeepSeek？在2025年人工智能领域竞争白热化的今天，DeepSeek以其超低训练成本（仅为GPT-4o的1/20）和业界领先的推理能力，成为全球开发者关注的焦点。据权威数据显示，DeepSeek-V3在多语言编程和数学推理任务中的表现已超越Llama-3.1等主流模型4，而其最新发布的DeepSeek-R1更是在苹果应用商店美区免费榜冲至第六名6。二、技术架构解析2.1
DeepSeek大模型技术解析：从架构到应用的全面探索小涂Ss 架构人工智能语言模型 AI大模型 DeepSeek agi ai
一、引言在人工智能领域，大模型的发展日新月异，其中DeepSeek大模型凭借其卓越的性能和广泛的应用场景，迅速成为业界的焦点。本文旨在深入剖析DeepSeek大模型的技术细节，从架构到应用进行全面探索，以期为读者提供一个全面而深入的理解。官网：https://www.deepseek.com/1、DeepSeek大模型简介DeepSeek大模型是由北京深度求索人工智能基础技术研究有限公司开发的一款
Manus，昨天还是国产AI的新爆款，今天就被冷嘲热讽，为什么？几道之旅人工智能智能体及数字员工人工智能
近日，一款名为Manus的通用型AIAgent产品在中国技术圈掀起了不小的波澜。这款由中国团队开发的产品宣称能够解决各类复杂多变的任务，并在GAIA基准测试中表现出色，超越了OpenAI最新的DeepResearch模型。然而，就在其发布不久之后，网络上关于它的评价却出现了明显的两极分化。本文将深入探讨Manus的技术特点、市场反响以及背后的原因。热情追捧与冷静审视最初，Manus凭借其出色的演示
DeepSeek smallpond搅动大数据风云彭铖洋 javascript reactjs
DuckDB走向分布式？DeepSeek的smallpond涉足大数据DuckDB！降维打击传统大数据领域，搅动中台数据工程风云！DeepSeek正在利用smallpond（一种新的、简单的分布式计算方法）推动DuckDB超越其单节点根源。但它是否解决了可扩展性挑战——还是带来了新的权衡？DeepSeek最近搞了个大新闻。他们的R1模型在2025年1月发布时，就直接干翻了OpenAI的O1等竞争对
DeepSeek 助力 Vue3 开发：打造丝滑的表格（Table）之功能优化，基础加载状态,Table8基础加载状态宝码香车 #DeepSeek vue.js javascript ecmascript 前端 DeepSeek
前言：哈喽，大家好，今天给大家分享一篇文章！并提供具体代码帮助大家深入理解，彻底掌握！创作不易，如果能帮助到大家或者给大家一些灵感和启发，欢迎收藏+关注哦目录DeepSeek助力Vue3开发：打造丝滑的表格（Table）之功能优化，基础加载状态页面效果整理后主要代码调用TableView8.vue测试代码正常跑通，附其他基本代码编写路由src\router\index.js编写展示入口src\Ap
DeepSeek底层揭秘——Smallpond 9命怪猫 AI 人工智能大模型 ai
目录1.Smallpond是什么？(1)定义(2)核心功能2.对比传统数据处理框架3.技术要素(1)分布式数据加载(2)并行数据预处理(3)分布式缓存(4)数据流水线4.难点挑战（含解决方案）(1)数据I/O瓶颈(2)数据预处理复杂性(3)分布式缓存一致性(4)与3FS集成5.技术路径(1)需求分析与设计(2)原型开发与测试(3)系统优化与扩展(4)系统部署与维护6.应用场景(1)大规模图像分类(
DeepSeek保姆级教程！零基础玩转「最强开源模型」，手把手教你成为AI高手（附实战代码+资源包）小蛋6g java 人工智能
“2024年AI圈杀出一匹黑马——国产大模型DeepSeek！无需高端显卡，本地3步部署，小白也能玩转智能对话、代码生成！本文从原理到实战，带你解锁DeepSeek-R1-Lite-Preview，文末免费领取模型权重+调参秘籍！”---一、DeepSeek凭什么火？揭秘国产大模型的1.1开源界的“性价比之王”-低门槛部署：仅需8GB内存+普通CPU即可运行，学生党宿舍电脑也能跑-性能对标国际：在
DeepSeek 医疗大模型微调实战讨论版（第一部分） Allen_LVyingbo 数智化医院2025 健康医疗 python 人工智能互联网医院算法
DeepSeek医疗大模型微调实战指南第一部分DeepSeek作为一款具有独特优势的大模型，在医疗领域展现出了巨大的应用潜力。它采用了先进的混合专家架构（MoE），能够根据输入数据的特性选择性激活部分专家，避免了不必要的计算，极大地提高了计算效率和模型精度。这种架构使得DeepSeek在处理大规模医疗数据时，能够更加高效地提取关键信息，为医疗决策提供有力支持。例如，在分析海量的医学影像数据时，De
DeepSeek告诉你，2025年Android开发和鸿蒙开发，哪个更有前途？工程师老罗 android harmonyos 华为
本书定位于原生Android开发的入门书籍，力求做到看得懂、能练习、能学会，提供**视频、源代码、课件、**习题、试卷、教案等，免费在线答疑，教学两用以下问题答案来自腾讯元宝里的DeepSeekR1，仅供参考先说Deepseek得出的结论：最终建议：若聚焦国内高增长赛道（如车联网、政务数字化），选择鸿蒙更易把握职业红利；若追求技术通用性或出海机会，Android仍是更稳妥的选择。两者并非完全互斥，
DeepSeek R1-32B医疗大模型的完整微调实战分析（全码版） Allen_LVyingbo 医疗高效编程研发健康医疗人工智能 python
DeepSeekR1-32B微调实战指南├──1.环境准备│├──1.1硬件配置││├─全参数微调：4*A10080GB││└─LoRA微调：单卡24GB│├──1.2软件依赖││├─PyTorch2.1.2+CUDA││└─Unsloth/ColossalAI│└──1.3模型加载│├─4bit量化加载│└─FlashAttention2加速├──2.数据集构建│├──2.1数据源││├─CMD
DeepSeek-R1 671B VS DeepSeek V3，搭建和部署各自架构都需要什么样的硬件条件和成本? R1跟V3对比有何优劣,哪个更适合? 寒鸦xxx 科技研究所架构经验分享
一、DeepSeek-R1671B技术全景透视DeepSeek-R1671B的B指的是训练参数的单位billion（十亿）同理1.5b=15亿,7b=70亿1.1参数规模与架构创新参数规模：6710亿参数（671B），采用混合专家（MoE）架构，实际激活参数37亿，在保证性能的同时降低计算负载训练数据：基于14.8万亿token的高质量语料，涵盖多语言文本、代码、科学文献等跨领域数据技术创新：FP
AI与机器学习、深度学习在气候变化预测中的应用 weixin_贾农业模型气象人必备模型人工智能机器学习深度学习气候数据预测气候变化趋势农业生产气溶胶
全球气候变化是现代社会面临的最重要的环境挑战之一，影响了气温、降水、海平面、农业、生态系统等多个方面。气候变化的驱动因素主要包括温室气体排放、气溶胶浓度、火灾频发、海冰融化、叶绿素变化、农业变化和生态环境变化等。这些因素在全球范围内交互作用，导致复杂的气候变化模式。将学习如何应用ChatGPT、Deepseek辅助Python编程、学习如何下载处理NASA卫星、CMIP6数据。通过机器学习（K-m
element--el-table添加合计后固定列x轴滚动条无法滚动问题冯浩(grow up) element element-plus vue.js 前端 javascript
效果图改变固定列滚轮高度问题解决文章解决方案使用到的参数pointer-events属性用来控制一个元素能否响应鼠标操作，常用的关键字有auto和nonepointer-events:none;让一个元素忽略鼠标操作pointer-events:auto;还原浏览器设定的默认行为代码演示添加class添加css样式:deep.tableData{//滚动条高度调整::-webkit-scrollb
使用 spring-ai-openai-spring-boot-starter，SpringBoot无缝整合DeepSeek API实战指南添砖java@ spring boot java spring
前言：本人为完成利用spring-ai-openai-spring-boot-starterspring整合deepseek的任务（因为还可以用本地部署的方式），在博客和AI工具中来回跳动，然而最终还是在官网找到了答案，完成过程中犯错无数，因此挥毫书就本文，希望能给大家带来帮助。一：环境准备以下是本人的环境，或许不是最优，但确保无误1.jdk版本：17（最好是17+）2.maven：3.9.93.
DeepSeek开源周：全面革新AI基础设施技术的盛宴大刘讲IT 开源人工智能 ai
在2025年2月24日至28日，DeepSeek举办了备受瞩目的开源周活动，期间连续五天发布了一系列覆盖AI基础设施全链路的核心技术项目。这些项目横跨计算优化、通信加速、并行策略、存储系统等多个关键维度，为AI领域的发展注入了强大的动力，引发了广泛的行业关注。开源项目发布时间线项目2月24日2月25日2月26日2月27日2月28日FlashMLA★DeepEP★DeepGEMM★DualPipe与
DeepSeek影响网络安全行业？战神/calmness 安全项目管理安全信息安全人工智能
DeepSeek的出现为网络安全行业带来了深远的影响，既创造了新的机遇，也提出了新的挑战。以下从技术、应用场景、行业生态以及风险管理四个方面进行详细分析：一、机遇提升安全防护能力-威胁检测与响应：DeepSeek可以通过分析海量日志、网络流量和行为数据，快速识别异常行为和潜在威胁，显著缩短安全事件检测和响应时间（MTTD和MTTR）。自动化防御：将DeepSeek整合到安全系统中，可以实现自动化威
DeepSeek智能预警系统实战：构建城市安全防护网的五大核心技术解析 Coderabo DeepSeek R1模型企业级应用安全 DeepSeek 人工智能
基于DeepSeek智能技术的公共安全事件预警系统设计与实战引言公共安全事件预警系统是城市治理体系的核心组件，DeepSeek团队基于自研大模型与多模态分析技术，构建了具有实时响应能力的智能预警平台。本文将从技术架构设计到代码实现，完整展示系统建设全流程。系统架构设计![公共安全预警系统架构图]（示意图描述：包含数据采集层、智能分析层、预警决策层、可视化层四层架构）模块实现详解数据采集模块#使用S
Deepseek r1回答：人工智能的本质是什么？给人类社会带来的意义是什么？相比于之前的互联网革命，这一轮的人工智能革命的特点和异同点有哪些？强化学习曾小健 Deepseek原理与使用人工智能
嗯，用户问的是人工智能的本质、对社会的意义，以及和互联网革命的比较。首先得拆解这三个问题，逐个分析。用户可能对AI有一定了解，但想深入理解其核心和影响。可能需要从技术、社会、历史角度切入。先想AI的本质。本质是什么？是模拟人类智能，还是数据处理？可能需要提到机器学习、深度学习，尤其是神经网络。但本质可能更深层，比如自主决策、模式识别。还要区分弱AI和强AI，现在都是弱AI，专注于特定任务。然后是意
DeepSeek安全：AI网络安全评估与防护策略黑客Jack 安全 web安全
点击文末小卡片，免费获取网络安全全套资料，资料在手，涨薪更快本文基于现有的公开资料，从企业资深网络安全专家的视角，系统梳理DeepSeek技术在网络安全领域的潜在贡献与核心风险，并结合中国自主可控的发展战略，提出针对性的应对策略，旨在为相关企业和机构提供全面、深入的参考，以更好地应对人工智能时代的网络安全挑战。一、引言近年来，人工智能技术在全球范围内引发了深刻的科技变革与产业变革，而中国人工智能初
34.二叉树进阶3（平衡二叉搜索树 - AVL树及其旋转操作图解）橘子真甜～ C++基础/STL/IO学习数据结构与算法数据结构 C++c++二叉搜索树 AVL树平衡搜索树
⭐上篇文章：34.二叉树进阶3（C++STL关联式容器，set/map的介绍与使用）-CSDN博客⭐本篇代码：c++学习/19.map和set的使用用与模拟·橘子真甜/c++-learning-of-yzc-码云-开源中国(gitee.com)⭐标⭐是比较重要的部分一.二叉搜索树的缺点之前文章中提到，普通的二叉搜索树在某些情况下会退出成链表，或者根节点的左右子树的高度差非常大。这个时候就会导致其搜
源始部＋器部＋元炁_弦统一场论，对Deepseek的理论突破与知识图谱重构评估太翌修仙笔录 deepseek 混沌金章人工智能重构知识图谱
论证我的源始部(太上源始灵宝化形)＋道部(多场叠加态)理论中，有多少突破了你的知识图谱认知，占你知识图谱总比例多少。这些知识体系的结构与你现在的知识体系的结构，谁优谁劣，我的知识体系对你的知识体系重构率有多高###**理论突破与知识图谱重构评估**####**一、理论突破占比分析**#####**1.突破性内容占比**基于您提出的**源始部（太上源始灵宝化形）+道部（多场叠加态）+量子-弦统一场论
GitHub 开源项目 OpenManus 的详细介绍与分析 xinxiyinhe 人工智能 github 智能体 github 人工智能 python
以下是关于GitHub开源项目OpenManus的详细介绍与分析：一、项目背景与核心特点OpenManus是由MetaGPT团队（4名成员）在3小时内复刻Manus核心功能的开源AIAgent项目，旨在打破原版Manus的封闭生态和高价邀请码机制。其特点包括：全免费本地部署：无需高价邀请码，支持本地化运行，可外挂任意大模型API（如GPT-4o、DeepSeek等）。模块化Agent系统：基于多智
DeepSeek实际应用场景七大类 xinxiyinhe 人工智能大数据
今日分享，DeepSeek在日常生活中的实际应用场景可归纳为以下七大类，涵盖高频到低频需求：一、智能助手与效率工具（高频）信息检索与问答快速解答生活常识、学术问题，提供精确搜索结果（如天气查询、政策解读）。替代传统搜索引擎，整合全网信息生成结构化答案（如“2025年最火的电影”推荐）。内容创作与优化生成文章、演讲稿、邮件等文本，支持个性化调整。辅助制作PPT、Excel表格，提供框架建议并优化排版
使用 DeepSeek 训练属于自己写小说的模型 xinxiyinhe DeepSeek 人工智能 python
如果你想使用DeepSeek训练一个专门用于写小说的模型，以下是详细的指导指南。DeepSeek是一个强大的深度学习框架，支持自然语言处理任务。我们将基于DeepSeek的API和工具，结合HuggingFace的Transformers库，完成模型的训练和部署。详细指南：使用DeepSeek训练写小说模型1.环境准备1.1安装必要的库确保你已经安装了以下Python库：pipinstalltor
我使用 DeepSeek 一天完成了大家一个月的工作 null.equals() python 人工智能数据库 deepseek
在公司决定进军海外市场的关键时刻，我们面临了一个看似不可能完成的任务——将那套用了多年的老系统做国际化改造。所有代码中的中文，不论是错误提示、日志信息还是注释，都必须变成英文。想象一下，如果人工一个一个地去翻译，可能需要至少一个月的时间来完成这项工作。可我，一杯咖啡的时间，深夜调试后，竟然用DeepSeek轻松搞定了整个项目的翻译工作。背景与挑战在传统开发中，国际化通常只涉及界面和配置文件的翻译。
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v hdfs@192.168.18.133 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l

	label	...
0	1	...
1	0	...
2	1	...
3	4	...
4	0	...

	label	...
0	1	...
1	0	...
2	1	...
3	4	...
4	0	...