尘心平

深度学习——CNN实现MNIST手写数字的识别

活动地址：CSDN21天学习挑战赛

知识点介绍

MNIST

介绍

下载

数据的简单处理

CNN神经网络

CNN的作用

CNN的主要特征

CNN的神经网络结构

CNN的相关参数

MNIST识别的网络结构

CNN识别MNIST程序

前期准备

导入库

设置采用电脑GPU训练

导入数据

数据归一化

调整数据格式

构建CNN网络模型

激活函数

编译CNN网络模型

优化器

损失函数

metrics

代码

训练CNN网络

预测

源码

知识点介绍

MNIST

介绍

MNIST是机器学习的入门数据集，全称是 Mixed National Institute of Standards and Technology database ，来自美国国家标准与技术研究所，是NIST（National Institute of Standards and Technology）的缩小版

训练集（training set）由来自 250 个不同人手写的数字构成，其中 50% 是高中学生，50% 来自人口普查局（the Census Bureau）的工作人员，数量为60000

测试集（test set）也是同样比例的手写数字数据，数量为10000

总共有70000个数据

下载

MNIST数据集可以在 MNIST官网 中下载,也可以之间通过keras库导入(后面采用的是这种)

具体有4个压缩包，如下：

下载解压后放入工作目录即可

keras库导入
from keras import datasets
# 导入数据集
(train_images, train_labels), (test_images, test_labels) = datasets.mnist.load_data()  # datasets内部集成了MNIST数据集

数据的简单处理

MNIST数据集共有70000张图片，图片的规格均是28*28，所以一张图片的像素值为784

故以传统神经网络来看, 可以设置二维数组[70000][784]，而每张图片每个像素点值介于 0~1 之间,即数组元素值在0~1之间

CNN神经网络

K同学啊的神经网络程序流程

而卷积神经网络CNN则对上图的神经网络进行了优化，解决了传统神经网络参数过多导致的难以处理、效率低、过拟合的问题

CNN的作用

卷积神经网络CNN可以处理大多数的计算机视觉问题

1.可以用来完成检测任务：检测图像中有什么

2.可以完成检索和分类任务

分类则是获取图像信息的类别，检索则是根据某图像获取相似的图像

3.可以实现超分辨率重构，提高图像的清晰度

4.可以实现OCR、无人驾驶、人脸识别等高新技术

CNN的主要特征

传统神经网络是将图像转换成向量处理，每个像素点值在 0~1 内变化

而CNN不再将图像按向量处理，而是输入即是三维数据（其中h、w为图像的长、宽，c为图像的通道数，rgb图像有r、g、b三个通道，每个通道都要单独处理）

CNN由于是进行三维数据的处理，所以一般用GPU（图像处理器）更快

CNN的神经网络结构

输入层：图像数据输入到训练网络中

卷积层：根据所规定的卷积核大小和卷积步长分割每个通道的数据，根据每个通道当前特有的权重值，按内积计算分割的每部分的特征值，最后将各个通道相对应的分割部分所得到的特征值相加，再加上偏置参数，即可得到当前卷积的特征图 “特征提取”

输入为，（实际输入数据是,这里由于边缘效应，进行了+pad 1的边缘填充，变成了），卷积核为，卷积步长为2，卷积核个数为2。

我们先来看第一个特征图的计算(卷积核是W0)，第二个特征图也是如此(卷积核是W1)：

池化层：池化就是特征值的取舍，一般是根据最大池化法对特征图进行压缩 “特征压缩”

一般是采用最大池化法进行计算：具体思想是取每块中最大的特征值作为最后的特征值
  4*4      -->   2*2 
1 2 5 7          6 9
3 6 9 5          4 6 
4 2 3 5
1 4 3 6
// 每4个中取最大，左上，左下，右上，右下
全连接层：对得到的多个特征图进行转换，映射到样本标记空间 “特征分类”

输出层：输出训练结果

数据输入—>特征提取—>特征压缩—>特征分类—>结果输出

CNN的相关参数

卷积步长（滑动窗口步长）：指的是卷积核在通道数据上每次移动多少个单位数据

步长越小，得到的结果越精确，但训练效率也越低

一般图像处理，步长选1 ; 文本处理,步长一般不是1

卷积核尺寸 : 指的是通道数据每多少个计算一个特征值

卷积核尺寸越小,得到的结果越精确,但训练效率也越低

一般取 $3\times 3$

边缘填充 :

当卷积层计算特征值是每次移动会有部分数据重复使用,这样的话越在边缘的参与计算的次数越少,而越中间的计算的次数越多,为了尽量减少图像数据计算次数的相差,我们可以在外部加若干层不影响计算结果的0,这样则图像的真实数据参与特征值的计算次数就相差会很小

一般是边缘填充取1,即外加一层0

卷积核数

卷积核数即最后的特征图数

特征图宽高计算

其中是输入图像的宽高, 是卷积核的宽高,是边缘填充数,d是步长

参数数量计算

卷积层的参数数量为: 所有的矩阵参数+ 偏置参数

例如的卷积核有10个,则有10个偏置参数共

760个

神经网络层数

神经网络层数是指有需要参数运算的层,比如卷积层和全连接层,

池化层不在计算范围内

MNIST识别的网络结构

K同学啊所采用的网络结构:

该网络结构是3层的神经网络,一次卷积后根一次池化,共有两次卷积池化

输入层输入的是,只有一个通道

(因为图像边缘信息不重要这里并没有进行边缘填充)

第一次卷积,卷积核共32个,卷积核的规格是 ,步长为1

第一次池化,采用每4个数据进行一次最大池化,即宽高压缩到原来的0.5倍,步长为2

第二次卷积,卷积核为64个,规格不变,步长不变

计算方法同上

第二次池化,池化规格不变

relu层:Relu是一个激活函数,卷积层完执行该函数,作用:去除卷积结果中的负值,保留正值不变

Flatten层,将特征图展成向量,全连接层进行特征分类,再输出结果

CNN识别MNIST程序

前期准备

导入库

import tensorflow as tf
from keras import datasets, layers, models  # 这里keras版本是2.8.0
import matplotlib.pyplot as plt

设置采用电脑GPU训练


# 设置采用GPU训练程序
gpus = tf.config.list_physical_devices("GPU")  # 获取电脑GPU列表
if gpus:  # gpus不为空
    gpu0 = gpus[0]  # 选取GPU列表中的第一个
    tf.config.experimental.set_memory_growth(gpu0, True)  # 设置GPU显卡按需使用
    tf.config.set_visible_devices([gpu0], "GPU")  # 设置GPU可见的设备清单，默认是都可见，这里只设置了gpu0可见

导入数据

# 导入数据集
(train_images, train_labels), (test_images, test_labels) = datasets.mnist.load_data()  
# datasets内部集成了MNIST数据集

数据归一化

归一化和标准化

        归一化与标准化是数据集数据缩放的两种形式,可以起到的作用如下

1. 使不同的量纲处于同一数量级,减小方差大的数据的影响,模型更加准确

2. 相比大数,较小的数使得数据运算处理更加容易,提高算法的效率

        归一化: 采用下列公式,使用最大值和最小值,将数据集的数据缩放到 [0,1] 中

根据公式,图像若采用归一化,rgb最大值为255,最小值为0,故即为

        标准化: 可以采用下列公式,使用均值和标准差,将数据压缩到一个小的特定区间中



公式不唯一
from mpmath.identification import transforms

transforms.Normalize(mean = (0.485, 0.456, 0.406), std = (0.229, 0.224, 0.225)) 
# 这三个通道的mean std需要自己计算
代码
# 归一化
# 将像素的值标准化至0到1的区间内,rgb像素值 0~255 0为黑 1为白
train_images, test_images = train_images / 255.0, test_images / 255.0

调整数据格式

根据数据集大小选择数据格式(个数,宽,高,通道数)
# 根据数据集大小调整数据到我们需要的格式
print(train_images.size)  # 47040000
print(test_images.size)  # 7840000
train_images = train_images.reshape((60000, 28, 28, 1))
test_images = test_images.reshape((10000, 28, 28, 1))
这里的47040000和7840000并不支持我们构建三通道

构建CNN网络模型

利用models包内的Sequential方法建立顺序模型

这里选择了三层神经网络:2层卷积池化 1层Flatten 1层全连接然后输出

# 构建CNN网络模型
model = models.Sequential([  # 采用Sequential 顺序模型
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    # 卷积层1，卷积核个数32，卷积核3*3*1 relu激活去除负值保留正值，输入是28*28*1
    layers.MaxPooling2D((2, 2)),  # 池化层1，2*2采样

    layers.Conv2D(64, (3, 3), activation='relu'),
    # 卷积层2，卷积核64个，卷积核3*3，relu激活去除负值保留正值
    layers.MaxPooling2D((2, 2)),  # 池化层2，2*2采样
    
    layers.Flatten(),  # Flatten层，连接卷积层与全连接层
    layers.Dense(64, activation='relu'),  # 全连接层，64张特征图，特征进一步提取
    layers.Dense(10)  # 输出层，输出预期结果
])
# 打印网络结构
model.summary()

网络结构如下:

CNN网络结构

激活函数

激活函数可以实现数据的非线性变换,使得神经网络可以实现应用到更多的非线性模型中

为什么要使用激活函数

常用的激活函数:

Sigmoid函数

优点：非常适合用作输出层，并且比较容易求导。

缺点：计算机求解时相对比较耗时，对于规模比较大的深度网络，会较大地增加训练时间。

Softmax函数

Relu函数

Relu函数目前使用最为频繁

Tanh函数

相似于Sigmoid,减少了迭代次数,但幂运算问题仍存在,仍有耗时问题

编译CNN网络模型

采用models包内的compile函数进行编译

编译需要设置优化器,损失函数以及metrics

优化器

优化器是对参数的优化,指的是更新神经网络模型参数所使用的算法

常用的优化器有以下几种:

BDG 批量梯度下降

优点：可以得到全局最优解；易于并行实现；迭代次数比较少。
缺点：数据集较大时,训练很慢

SGD 随机梯度下降

优点：训练速度快；
缺点：准确度下降，并不是全局最优；不易于并行实现。从迭代次数来看，SGD迭代次数较多，在解空间的搜索过程看起来很盲目。

MBGD 小批量梯度下降

优点：收敛更稳定，另一方面可以充分地利用深度学习库中高度优化的矩阵操作来进行更有效的梯度计算。
缺点：关于学习率的选择，如果太小，收敛速度就会变慢，如果太大，损失函数就会在极小值处不停的震荡甚至偏离。

Momentum 动量算法

Nesterov动量

是对Momentum的改进,提高了灵敏度,但人工设置的学习率非常生硬

Adam

优点:Adam在很多情况下算作默认工作性能比较优秀的优化器

缺点:可能会不收敛,错过全局最优解

一般用adam,效果不好再找其他优化器

损失函数

损失函数是一种衡量损失和错误程度的函数,损失越小,模型越好

MSE 均方差
MAE 平均绝对误差
MAPE 相对百分误差
MSLE 对MSE加一层对数的优化
KLD = KL散度从预测值概率分布Q到真值概率分布P的信息增益,用以度量两个分布的差异。
cosine 预测值与真实标签的余弦距离平均值的相反数。
binary_crossentropy 对数损失，logloss
categorical_crossentropy 多类的对数损失
sparse_categorical_crossentrop：和 categorical_crossentropy一样，但接受稀疏标签

metrics

在深度学习中，性能指标(Metrics)是衡量一个模型好坏的关键，通过衡量模型输出y_predict 和 y_true之间的某种"距离"得出的。

keras提供了六个性能指标函数

accuracy

binary_accuracy

categorical_accuracy

sparse_categorical_accuracy

top_k_categorical_accuracy

sparse_top_k_categorical_accuracy

代码

# 编译
model.compile(optimizer='adam',  # 优化器
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),  # 设置损失函数 from_logits: 为True时，会将y_pred转化为概率
              metrics=['accuracy'])

采用adam优化器, sparse_categorical_crossentrop损失函数,metrics采用accuracy

训练CNN网络

history = model.fit(train_images, train_labels, epochs=10,
                    validation_data=(test_images, test_labels))
# validation_data关键字传参为测试集数据
# epochs为训练轮数,这里是10轮
epochs为训练轮数,在梯度下降的模型训练的过程中，神经网络逐渐从不拟合状态到优化拟合状态，达到最优状态之后会进入过拟合状态。因此epoch并非越大越好，一般是指在50到200之间。数据越多样，相应epoch就越大。

预测

1.绘制测试集图片(取前20张),判断预测是否正确

# 绘制测试集图片
plt.figure(figsize=(20, 10))  # 这里只看20张，实际上并不需要可视化图片这一步骤
for i in range(20):
    plt.subplot(5, 10, i + 1)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    plt.imshow(test_images[i], cmap=plt.cm.binary)
    plt.xlabel(test_labels[i])
plt.show()

为什么要使用激活函数

2.预测

# 预测
pre = model.predict(test_images)  # 对所有测试图片进行预测
for x in range(5):
    print(pre[x]) #输出预测的0-9的每个的得分情况,越正越可能,越负越不可能

得分情况越正越可能,越负越不可能

分析得分得前五张图片预测为 7 2 1 0 4

也可以直接得到预测结果

修改预测代码如下:

# 预测
pre = model.predict(test_images)  # 对所有测试图片进行预测
for x in range(5):
    print(pre[x])
for x in range(5):
    print(np.array(pre[x]).argmax()) #得到最大值的索引

预测结果:

源码

import numpy as np
import tensorflow as tf
from keras import datasets, layers, models  # 这里keras版本是2.8.0
import matplotlib.pyplot as plt

# 设置采用GPU训练程序
gpus = tf.config.list_physical_devices("GPU")  # 获取电脑GPU列表
if gpus:  # gpus不为空
    gpu0 = gpus[0]  # 选取GPU列表中的第一个
    tf.config.experimental.set_memory_growth(gpu0, True)  # 设置GPU显卡按需使用
    tf.config.set_visible_devices([gpu0], "GPU")  # 设置GPU可见的设备清单，默认是都可见，这里只设置了gpu0可见

# 导入数据集
(train_images, train_labels), (test_images, test_labels) = datasets.mnist.load_data()  # datasets内部集成了MNIST数据集，

# 归一化
# 将像素的值标准化至0到1的区间内,rgb像素值 0~255 0为黑 1为白
train_images, test_images = train_images / 255.0, test_images / 255.0

# 根据数据集大小调整数据到我们需要的格式
print(train_images.size)  # 47040000
print(test_images.size)  # 7840000
train_images = train_images.reshape((60000, 28, 28, 1))
test_images = test_images.reshape((10000, 28, 28, 1))

# 构建CNN网络模型
model = models.Sequential([  # 采用Sequential 顺序模型
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    # 卷积层1，卷积核个数32，卷积核3*3*1 relu激活去除负值保留正值，输入是28*28*1
    layers.MaxPooling2D((2, 2)),  # 池化层1，2*2采样

    layers.Conv2D(64, (3, 3), activation='relu'),
    # 卷积层2，卷积核64个，卷积核3*3，relu激活去除负值保留正值
    layers.MaxPooling2D((2, 2)),  # 池化层2，2*2采样

    layers.Flatten(),  # Flatten层，连接卷积层与全连接层
    layers.Dense(64, activation='relu'),  # 全连接层，64张特征图，特征进一步提取
    layers.Dense(10)  # 输出层，输出预期结果
])
# 打印网络结构
model.summary()

# 编译
model.compile(optimizer='adam',  # 优化器
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              # 设置损失函数from_logits: 为True时，会将y_pred转化为概率
              metrics=['accuracy'])

# 训练
# epochs为训练轮数
history = model.fit(train_images, train_labels, epochs=10,
                    validation_data=(test_images, test_labels))
print(history)
# 绘制测试集图片
plt.figure(figsize=(20, 10))  # 这里只看20张，实际上并不需要可视化图片这一步骤
for i in range(20):
    plt.subplot(5, 10, i + 1)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    plt.imshow(test_images[i], cmap=plt.cm.binary)
    plt.xlabel(test_labels[i])
plt.show()

# 预测
pre = model.predict(test_images)  # 对所有测试图片进行预测
for x in range(5):
    print(pre[x])
for x in range(5):
    print(np.array(pre[x]).argmax())

Python 进程间的通信：原理剖析与项目实战女码农的重启 java 进程通信 python
在Python编程中，当涉及多进程编程时，进程间的通信（Inter-ProcessCommunication，简称IPC）是一个重要的课题。多个进程在运行过程中，常常需要交换数据、传递状态或协同工作，这就离不开进程间通信机制。本文将深入讲解Python进程间通信的原理，并结合实际项目案例，展示其在项目中的具体使用方法。一、Python进程间通信原理操作系统为进程提供了多种通信机制，Python在标
K近邻算法【python】【sklearn】 weixin_44985842 python 近邻算法 sklearn
0定义K近邻算法（K-NearestNeighbors,KNN）是一种基于实例的监督学习算法，主要用于分类和回归任务。其核心思想是：在特征空间中，对于待预测的样本，找到与其距离最近的k个已知样本（“邻居”），根据这k个邻居的类别（分类任务）或属性值（回归任务）来决定该样本的预测结果，，常用欧氏距离公式：对于两个n维样本点xi=(xi1,xi2,...,xin)x_i=(x_{i1},x_{i2},
python学智能算法（二十五）|SVM-拉格朗日乘数法理解
引言前序学习进程中，已经对最佳超平面的求解有了一定认识。刚好在此梳理一下:函数距离首先有函数距离F，也可以称为函数间隔F：F=min⁡i=1...myi(w⋅xi+b)F=\min_{i=1...m}y_{i}(w\cdotx_{i}+b)F=i=1...mminyi(w⋅xi+b)几何距离然后有几何距离δ，也可以称为几何间隔δ：δ=min⁡i=1...myi(w∥w∥⋅xi+b∥w∥)\delt
python爬虫运行_Python爬虫杂记 - python运行js weixin_39727402 python爬虫运行
execjs使用有了selenium+ChromeHeadless加载页面为什么还要用execjs来运行js？selenium+ChromeHeadless必然是爬虫的一大利器，可是缺点依然存在，性能问题不可忽视。但这构不成舍弃它而不用的理由。我认为舍弃包括ChromeHeadless、PhantomJS在内的无头浏览器的原因主要有以下几点：1.页面结构改变、弹窗(一些网站的页面结构经常无规则改变
python3 pyv8 linux,Python3.5安装PyV8 左瑶 python3 pyv8 linux
Python3.5安装PyV8时，报错，PyV8版本：PyV8-0.5。错误如下：C:UsersAdministratorAppDataLocalProgramsPythonPython35Libsite-packages>pipinstallPyV8CollectingPyV8Usingcachedhttps://files.pythonhosted.or...683f439e7bdd67f95
python 安装PyV8 和 lxml
近来在玩python爬虫，需要使用PyV8模块和lxml模块。但是执行pipinstallxx或者easy_installxx指令都会提示一些错误。这些错误有些是提示pip版本过低或者缺少vc++9.0环境，再或者一些头文件无法引用等等。我也懒得找错误解决方法。就直接下载Pyv8模块的安装包和lxml的安装包。Pyv8的安装包链接：1.针对win32+python2.7的安装包PyV8-1.0-p
力扣25.7.15每日一题——有效单词一个OI蒟蒻 LeetCode leetcode 算法职场和发展
Description应该都能看懂吧……Solution一道简单的模拟题。按照题意枚举字符串，判断元/辅音；判断合法即可。也不知道今天的题为什么怎么淼Code（C++、Python3）C++classSolution{public:boolisValid(stringword){if(word.size()bool:iflen(word)<3:returnFalsee=f=Falseforcinw
OpenCV 入门指南 —— 从环境搭建到图像处理 m0_74751715 opencv 图像处理人工智能 python
文章目录前言一、什么是OpenCV？二、环境准备与安装1.Python虚拟环境2.安装OpenCV3.验证安装三、读取与显示图像四、常见图像处理操作1.色彩空间转换2.图像平滑（模糊）3.边缘检测（Canny算法）4.在图像上绘制图形与文字五、视频与摄像头操作六、推荐学习路线七、参考资料前言在计算机视觉领域，OpenCV（OpenSourceComputerVisionLibrary）凭借其开源、
Python机器学习教程
Python机器学习教程(MachineLearningwithPythonTutorial)PDFVersionQuickGuideResourcesJobSearchDiscussionPDF版本快速指南资源资源求职讨论区MachineLearning(ML)isbasicallythatfieldofcomputersciencewiththehelpofwhichcomputersyste
Python PyV8: 在Python中运行JavaScript的利器莱财一哥
本文还有配套的精品资源，点击获取简介：PythonPyV8是一个在Python环境中执行JavaScript代码的库，基于Google的V8JavaScript引擎，实现Python与JavaScript之间的互操作性。本文将详细讨论PyV8的安装方法，包括通过pip安装和自行编译安装特定版本的步骤，以及如何在Python程序中使用PyV8执行JavaScript代码。1.PythonPyV8库介
Pycharm开发Djnago项目部署详细教程（2021更新） af9f873c915c
项目部署：这里用的是非常干净的ubuntu16.04系统环境，没有使用任何云服务器，原因是因为不同的云服务器环境都不一样。我们就从零开始来完成部署。在开发机上的准备工作：确认项目没有bug。用pipfreeze>requirements.txt将当前环境的包导出到requirements.txt文件中，方便部署的时候安装。把dysms_python文件准备好。因为短信验证码的这个包必须通过将项目上
医疗AI与融合数据库的整合：挑战、架构与未来展望（上） Loving_enjoy 计算机学科论文创新点机器学习 facebook 课程设计经验分享
在医疗AI爆发式增长的今天，单一数据库已无法满足多模态医疗数据的处理需求。本文将揭秘医疗融合数据库的核心架构，通过真实代码示例展示如何破解医疗数据整合的世纪难题。###一、医疗数据的"四维挑战"####1.多模态数据洪流```python#典型患者数据组成patient_data={"时序数据":"ECG/EEG波形(1000Hz采样)","影像数据":"CT/MRI(单次扫描2GB+)","文本
PyQt5学习笔记，带例子源码
一、很程序员，都喜欢开发windows桌面应用系统，基于python3开发，效率高二、PyQt5开发的桌面应用系统是可以跨平台的，可以在Mac上、Window上、Linux桌面系统上运行，以下为学习笔记及总级三、源码下载登录后复制1、QDateTimeEdit日期输入框setCalendarPopup弹出日期选择框setDisplayFormat("yyyy-MM-ddHH:mm:ss")设置展示
DataWhale 二月组队学习-深入浅出pytorch-Task04 －273.15K DataWhale组队学习学习 pytorch 人工智能
一、自定义损失函数1.损失函数的作用与自定义意义在深度学习中，损失函数（LossFunction）用于衡量模型预测结果与真实标签之间的差异，是模型优化的目标。PyTorch内置了多种常用损失函数（如交叉熵损失nn.CrossEntropyLoss、均方误差nn.MSELoss等）。但在实际任务中，可能需要针对特定问题设计自定义损失函数，例如：处理类别不平衡问题（如加权交叉熵）实现特殊业务需求（如对
Python爬虫实战：高效提取与解析JSON格式数据 Python爬虫项目 python 爬虫宽度优先数据库 json 深度优先开发语言
1.JSON数据爬取概述在当今互联网时代，JSON(JavaScriptObjectNotation)已成为最流行的数据交换格式之一。相比传统的HTML页面，JSON格式数据具有结构清晰、体积小、解析方便等优势，使得它成为API接口的首选数据格式。1.1为什么选择JSON数据爬取数据结构化：JSON数据本身就是结构化的，不需要像HTML那样进行复杂的解析传输高效：JSON通常比HTML体积小，传输
手绘电路图的节点和端点检测一个简化版的算法实现框架 zhangfeng1133 算法
于论文描述，我将提供一个简化版的算法实现框架，用于手绘电路图的节点和端点检测，并整合生成电路原理图。以下代码结合了YOLOv5目标检测和传统图像处理技术，符合论文中提到的98.2%mAP和92%节点识别准确率的关键指标。核心算法实现（Python+OpenCV+YOLOv5）importcv2importnumpyasnpimporttorchfromyolov5importYOLOv5#需要安装
大模型核心概念 | 嵌入模型（Embedding）、向量模型（Vector Model）
一、核心概念解析1.1嵌入模型（Embedding）作为AI领域的核心基础技术，嵌入模型通过将非结构化数据映射为低维稠密向量，实现语义特征的深度捕捉：文本嵌入：如将语句转换为1536维向量，使"机器学习"与"深度学习"的向量余弦相似度达0.92跨模态嵌入：支持图像与文本的联合向量空间映射，如CLIP模型实现文图互搜1.2向量模型（VectorModel）作为嵌入技术的下游应用体系，主要包含两大方向
Python实现神经网络算法指南代码编织匠人 python 神经网络算法
Python实现神经网络算法指南神经网络是一种模拟人脑神经元结构进行信息处理的机器学习算法。在深度学习领域中，神经网络是最为强大的算法之一。Python作为一门简单易学的编程语言，也成为了许多人选择实现神经网络算法的首选语言。在本篇文章中，我们将通过Python代码来实现神经网络算法。导入必要的库为了实现神经网络算法，我们需要导入一些必要的Python库，包括numpy和matplotlib。其中
使用LangChain构建多代理系统实现复杂任务自动化 LCG元工具 langchain 自动化运维
目录一、系统架构设计模块说明：二、核心工作流程（双流程图对比）横向对比：单代理vs多代理纵向核心流程三、企业级实现方案1.Python核心代码（LangChain0.1.8+）2.TypeScript前端集成代码四、性能对比测试五、生产级部署方案安全审计要点：高可用部署拓扑：六、技术前瞻性分析附录：完整技术图谱摘要：本文深度解析如何基于LangChain框架构建企业级多代理系统，通过模块化架构设计
时序数据库选型避坑全攻略：IoTDB性能与成本双杀的秘密！ LCG元数据库时序数据库 iotdb java
文章目录一、架构设计深度解析1.1IoTDB架构图谱1.2核心流程对比二、企业级实战代码2.1Python数据写入示例2.2TypeScript客户端实现2.3集群配置YAML三、性能对比分析四、生产部署方案4.1安全加固配置4.2安全策略实施五、技术前瞻分析5.1云原生演进路径5.2新型存储引擎预测六、技术图谱附录一、架构设计深度解析1.1IoTDB架构图谱数据写入协议适配层内存表管理持久化引擎
大规模图计算引擎的分区与通信优化：负载均衡与网络延迟的解决方案 LCG元系统服务架构负载均衡网络运维
目录一、系统架构设计与核心流程1.1原创架构图解析1.2双流程对比分析二、分区策略优化实践2.1动态权重分区算法实现（Python）三、通信优化机制实现3.1基于RDMA的通信层实现（TypeScript）四、性能对比与调优4.1分区策略基准测试五、生产级部署方案5.1Kubernetes部署配置（YAML）5.2安全审计配置六、技术前瞻与演进附录：完整技术图谱一、系统架构设计与核心流程1.1原创
用Python实现神经网络(四)
使用多层神经网络我们展示如何用TensorFlow构建多层神经网络###低出生率数据LowBirthratedata:#Columns Variable Abbreviation#---------------------------------------------------------------------#Lo
基于DTLC-AEC与DTLN的轻量级实时语音增强系统设计与实现神经网络15044 仿真模型神经网络机器学习图像处理 cnn 人工智能机器人
基于DTLC-AEC与DTLN的轻量级实时语音增强系统设计与实现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。1.引言在当今的互联网通信时代，实时语音通信已成为人们日常生活中不可或缺的一部分。然而，语音通信质量常常受到回声、背景噪声等因素的严重影响。为了解决这些问题，我们需要高效的语音增强技术。本文将详细介绍如何将DTLC-AEC（深度学习回声消
自平衡摩托车控制系统设计：Python实现方案神经网络15044 仿真模型算法机器学习 python 开发语言
自平衡摩托车控制系统设计：Python实现方案摘要本文针对5CCE2MCT机电一体化补考项目要求，提出了一种基于Python的自平衡摩托车控制系统完整实现方案。该系统结合PID控制、状态空间方法和数字信号处理技术，实现了稳定的平衡与运动控制。我们从数学模型建立到硬件测试进行了完整展示，提供了可替代MATLAB/Simulink方案的可行解决方案。该实现方案在保持与参考Arduino工程套件相当性能
python基础语法9，用os库实现系统操作并用sys库实现文件操作（简单易上手的python语法教学） AI 嗯啦 python 开发语言
一、os库os.system()是Pythonos库中用于执行操作系统命令的重要方法，它允许在Python程序中直接调用系统shell命令（如Linux的bash命令或Windows的cmd命令）。基本语法importosos.system(command)command：要执行的系统命令字符串（与在终端/命令提示符中输入的命令格式一致）返回值：命令执行的退出状态码（0表示成功，非0表示执行出错）
Python教程：你一定要知道的26个Python魔术方法（快记下来）旦莫 Python进阶 python 开发语言
Python中的魔术方法是指以双下划线__开头和结尾的特殊方法，也被称为特殊方法或魔术方法。这些方法在类中具有特殊的用途，它们可以让你自定义类的行为，使得你的对象可以像内置类型一样工作。这些方法由解释器调用，而不是你直接调用它们。例如，当你使用+运算符时，实际上是调用了对象的__add__方法。这些方法允许你重载运算符、改变对象的构造和初始化行为、自定义属性访问等等。使用魔术方法可以使你的代码更具
快捷删除python中pip安装的所有外部库 m0_74366096 python pip 开发语言
windows环境首先，列出所有安装的第三方库并导出到一个文件：pipfreeze>requirements.txt然后，批量卸载这些库：pipuninstall-y-rrequirements.txt最后，用del命令删除requirements.txt文件：delrequirements.txt这样就能在Windows系统上完成卸载并清理文件的操作。
Python与Java互操作性的桌面应用开发 master_chenchengg python python Python python开发 IT
Python与Java互操作性的桌面应用开发跨语言协作的魅力：Python遇上Java为什么选择Python和Java进行桌面应用开发？两种语言的优势互补：Python的简洁与Java的强大实际案例分享：当Python遇见Java，会发生什么奇妙的化学反应？搭建桥梁：Jython与JPype介绍Jython：用Python编写Java程序安装与配置：轻松几步让你上手调用Java类库：如何在Pyth
Python常见的魔术方法和魔术属性景天科技苑 python轻松入门基础语法到高阶实战教学 python 开发语言魔术方法魔术属性
文章目录魔术方法1、`__new__`魔术方法(1)基本使用(2)`__new__`触发时机要快于`__init__`(3)`__new__`的参数要和`__init__`参数一一对应。参数个数一致就行(4)`__new__`和`__init__`之间的注意点2、单态模式:同一个类,无论实例化多少次,都有且只有一个对象3、`__del__`魔术方法(析构方法)(1)基本语法(2)模拟文件操作4、`
Docker 基本操作 dufufd other
https://zhuanlan.zhihu.com/p/23599229Docker是什么？Docker是一个虚拟环境容器，可以将你的开发环境、代码、配置文件等一并打包到这个容器中，并发布和应用到任意平台中。比如，你在本地用Python开发网站后台，开发测试完成后，就可以将Python3及其依赖包、Flask及其各种插件、Mysql、Nginx等打包到一个容器中，然后部署到任意你想部署到的环境。
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl

深度学习——CNN实现MNIST手写数字的识别

知识点介绍

MNIST

介绍

下载

数据的简单处理

CNN神经网络

CNN的作用

CNN的主要特征

CNN的神经网络结构

CNN的相关参数

MNIST识别的网络结构

CNN识别MNIST程序

前期准备

导入库

设置采用电脑GPU训练

导入数据

数据归一化

调整数据格式

构建CNN网络模型

激活函数

编译CNN网络模型

优化器

损失函数

metrics

代码

训练CNN网络

预测

源码

你可能感兴趣的:(#,深度学习,python,深度学习,tensorflow,图像处理,神经网络)