Uniqe

【机器学习基础】卷积神经网络（CNN）基础

最近几天陆续补充了一些“线性回归”部分内容，这节继续机器学习基础部分，这节主要对CNN的基础进行整理，仅限于基础原理的了解，更复杂的内容和实践放在以后再进行总结。

卷积神经网络的基本原理

　　前面对全连接神经网络和深度学习进行了简要的介绍，这一节主要对卷积神经网络的基本原理进行学习和总结。

　　所谓卷积，就是通过一种数学变换的方式来对特征进行提取，通常用于图片识别中。

　　既然全连接的神经网络可以用于图片识别，那么为什么还要用卷积神经网络呢？

0.使用卷积神经网络的理由

（1）首先来看下面一张图片：

　　在这个图片当中，鸟嘴是一个很明显的特征，当我们做图像识别时，当识别到有“鸟嘴”这样的特征时，可以具有很高的确定性认为图片是一个鸟类。

　　那么，在提取特征的过程中，有时就没有必要去看完整张图片，只需要一小部分就能识别出一定具有代表的特征。

　　因此，使用卷积就可以使某一个特定的神经元（在这里，这个神经元可能就是用来识别“鸟嘴”的）仅仅处理带有该特征的部分图片就可以了，而不必去看整张图片。

　　那么这样就会使得这个神经元具有更少的参数（因为不用再跟图片的每一维输入都连接起来）。

（2）再来看下面一组图片：

上面两张图片都是鸟类，而不同的是，两只鸟的“鸟嘴”的位置不同，但在普通的神经网络中，需要有两个神经元，一个去识别左上角的“鸟嘴”，另一个去识别中间的“鸟嘴”：

　　但其实这两个“鸟嘴”的形状是一样的，这样相当于上面两个神经元是在做同一件事情。

　　而在卷积神经网络中，这两个神经元可以共用一套参数，用来做同一件事情。

（3）对样本进行子采样，往往不会影响图片的识别。

　　如下面一张图：

　　假设把一张图片当做一个矩阵的话，取矩阵的奇数行和奇数列，可看做是对图片的一种缩放，而这种缩放往往不会影响识别效果。

　　卷积神经网络中就可以对图片进行缩放，是图片变小，从而减少模型的参数。

1.卷积神经网络的基本结构

　　卷积神经网络的基本结构如图所示：

　　从右到左，输入一张图片→卷积层→max pooling（池化层）→卷积层→max pooling（池化层）→......→展开→全连接神经网络→输出。

　　中间的卷积层和池化层可以重复多次。后面会一一介绍每一层是如何工作的。

　　对于第0部分的三个功能：

　　（1）某个神经元只需侦测某一部分的图片，来识别某种特征这个工作是在卷积层内完成的。

　　（2）具有相同功能的神经元共用一套参数，这个工作也是在卷积层内完成的。

　　（3）通过缩小图片，来减少模型的参数，这个工作是在池化层中完成的。

　　稍后会解释上面三个部分是如何进行的。

1.1.卷积层的工作原理

　　假设有一张6*6的黑白图片，如图所示：

　　首先图片经过卷积层，卷积层有一组filter，每个filter用来抓取图片中的某一种特征，如图所示：

　　假设filter是3*3的矩阵，每个filter有9个参数，而这些参数就是通过训练学习得到的，这里假设我们已经学习得到了上面一组参数的值。

　　因此也就说明了问题（1）中，每一个filter只侦测图片中的很小一部分数据。

　　那么每个filter是如何去抓取特征的呢？也就是（1）中使某一个神经元只侦测一部分图片就能提取某一种特征的问题。

　　首先看filter1，filter大小为3*3，那么相当于这个filter1依次从左到右去覆盖整张图片，然后与覆盖区域做内积，如图所示：

　　首先从左上角开始，覆盖图片左上角3*3的区域，计算结果得到3，然后向右移动，这里移动的步长称之为stride，当stride为1时，即一次移动一格，为2时，一次移动两格，如图所示：

　　移动之后再次用图片被覆盖的区域与filter做内积，得到第二个值：

　　依次进行移动和计算，当移到最右边尽头时，则从下一行开始继续移动，最终得到如图所示矩阵：

　　通过观察这个filter1可以看出，filter1的对角矩阵全为1，其他为-1，那么对于图片中对角为1的部分，与filter1做内积后的值就会很大（例子中等于3），其他的则会很小。

　　因此filter1是一种用于侦测对角都为1的图片这种属性，在图片中可以看到，坐上角和右下角都具有这种特征。

　　所以这也就说明了（2）中的问题，一个filter的一组参数，可以侦测到图片中两个位置的相同属性。

　　接下来是第二个filter，filter2，那么filter2与图片的计算方式一模一样，如图所示：

　　其他的filter也是如此，依次计算，然后把每个filter处理结果放在一起，如图所示：

　　那么相当于一个红色方框现在是由2个值来描述的，最终得到的是2个4*4的图片，称之为“feature map”。

　　上面是对于一张黑白的图片进行一次卷积（convolution）的过程，那么对于彩色的图片是怎样处理的呢？

　　彩色图片通常是由“RGB”组成，分别表示红色、绿色和蓝色，那么就相当于有三个部分的组成，如图所示：

　　这三个层称之为“通道”（channel），那么利用卷积处理这种图片时，filter也应该是三层，即3*3*3的，是带有深度的，长下面这个样子：

　　相当于每个filter具有27个参数。

卷积与全连接网络的关系

　　其实卷积就是一种特殊形式的全连接网络，还是假设是上面那张6*6的图片，如下是全连接的网络结构：

　　把图片进行拉直展开，但在卷积中，这个网络有些连接的地方被切断了，只有一部分输入与神经元相连接。下面进行解释：

　　正如上面的卷积过程，如下是其中的一步，如图所示：

　　那么这个步骤我们可以想象成是这样子的：

　　左边把图片的36个数值拉直，然后，对于filter1所覆盖的区域为左上角，那么元素对应的位置为1、2、3、7、8、9、13、14、15。

　　然后这9个数值，依次经过各自的weight相乘再相加，得到第一个值3，这里的weight就是对应的filter中各个位置的值，图中weight线的颜色与filter中圆圈颜色一一对应。

　　到这里就很清楚的看出卷积与全连接之间的关系，相当于简化了全连接神经网络，从而使得参数量更少。

　　然后filter开始向右移动一格（stride=1，上面计算过程的第二个方框，元素依次为2、3、4、8、9、10、14、15、16）,与filter做inner product，得到结果-1，对应到全连接网络中如图所示：

　　依旧是每个元素的weight与输入输出连接，颜色对应的filter圆圈与weight的颜色一致。

　　从上面的图可以看出，两个神经元（3和-1）都是通过filter1作为weight与输入进行连接的，也就是说，这两个神经元是共用同一组参数，这样，在上面减少参数的基础上，使得模型的参数更少了。

　　上述过程就是卷积层的工作过程，主要用于图片中特征的抓取，完成第0节内容的前两个。

1.2池化层的工作原理

　　池化层的作用上面说了，就是为了图片的缩放，那么池化层是如何进行缩放的呢？

　　其实池化层的原理很简单，这里以max-pooling为例，经过卷积层之后的图片变为4*4大小的图片，有2个filter，也就是两张4*4的图片：

　　池化就是将上面得到的数据进行分组，如图所示：

　　如图示中的分组方法，这种分组方法可以是任意的，也可以三个一组等等，然后取每个组中的最大值：

　　那么原来4*4的图片经过maxpooling之后就缩小为2*2的图片了，当然这里也不一定非要取最大值，也可以取平均，或者又取平均又取最大值等。

　　那么上面的过程总结一下就可以用如下图进行概括：

　　这就是池化层的工作原理，比较简单。

1.3Flatten和全连接层

　　接下来就来到了flatten和全连接层了，flatten的作用就是把上面得到的两个2*2的image拉直展开，然后再丢进全连接网络中计算就可以了，这个跟前面全连接神经网络的方法一样，如图所示：

　　这里就不再详细赘述了。那么整个网络就是利用梯度下降的方法进行训练的，所有的参数被一起学习得到。

2.使用Keras对CNN的简单实现

　　这里还是使用keras对CNN的建模过程进行一个简单的实现，首先先来看一下keras分别添加卷积层和池化层的过程：

　　如图中所示，首先要导入Convolution2D（后来这个接口会改成Conv2D）和Maxpooling2D。

　　然后与之前神经网络中一样，不过是把“Dense”换成了上面两个方法，其中Convolution2D中，25表示filter的数量，3,3表示filter的尺寸，input_shape为输入图片的大小，28*28为图片大小，1表示黑白图片，3则表示彩图“RGB”；

　　Maxpooling2D中只有分组的形状，即2*2大小的。

　　接下来就是根据设计的网络的形状，重复上面两个步骤，完成卷积和池化。如图所示：

　　图中黑色的方框为代码的实现内容，在keras1.0和2.0中可能有些差异；

　　黄色的框中是输入和输出的尺寸大小，可以看到，输入为28*28的图片，经过25个3*3的filter组成的第一个卷积层之后，变成了25*26*26的尺寸；

　　然后经过第一个2*2的池化层，缩小后的输出尺寸大小为25*13*13；

　　然后经过第二个由50个3*3的filter之后，输出变为50*11*11；

　　之后经过第二个2*2的池化层后，缩小后的输出尺寸变为50*5*5（这里由于输入为基数，最后一格就忽略掉了）。

　　而在卷积层中，filter的参数数量是在变化的，在第一个卷积层的参数为3*3=9个，这个比较好理解；

　　而在第二个卷积层中，参数就变成了225个，这是因为上一层的输出为25*13*13大小的图片，这时是带有channel的（就相当于一开始输入为RGB时，通道数为3）当使用3*3的filter进行处理时，需要带有深度25，因此每个filter的参数数量为25*3*3=225。

　　然后就是经过Faltten和fully-connection了，这个与之前的神经网络一致：

　　然后就可以对模型进行训练了。这里要注意的是，这里的输入跟全连接有所不同，要把输入图片数据转化为（28,28,1）的格式。完整代码如下：

from sklearn.datasets import fetch_openml
from sklearn.preprocessing import OneHotEncoder
from sklearn.model_selection import train_test_split
import numpy as np
from keras import Sequential
from keras.layers import Dense
from keras.layers import Activation
from keras.layers import Convolution2D, MaxPooling2D, Flatten

data_x, data_y = fetch_openml('mnist_784', version=1, return_X_y=True)

x = []
for i in range(len(data_x)):
    tmp = data_x.iloc[i, :].tolist()
    tmp = np.array(tmp).reshape((28, 28, 1))
    x.append(tmp)
x = np.array(x)

one_hot = OneHotEncoder()
data_y = one_hot.fit_transform(np.array(data_y).reshape(data_y.shape[0], 1)).toarray()
train_x, test_x, train_y, test_y = train_test_split(x, data_y)

model2 = Sequential()

model2.add(Convolution2D(25, 3, 3, input_shape=(28, 28, 1)))

model2.add(MaxPooling2D((2, 2)))

model2.add(Convolution2D(50, 3, 3))

model2.add(MaxPooling2D((2, 2)))

model2.add(Flatten())
model2.add(Dense(units=100))
model2.add(Activation('relu'))
model2.add(Dense(units=10))

model2.add(Activation('softmax'))

model2.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

model2.fit(train_x, train_y, batch_size=300, epochs=20)

最后的输出如下：

3.CNN都学到了啥？

　　通过CNN的原理我们大致知道，CNN的卷积是不断提取特征的过程，池化是对图片的缩放，那么究竟CNN学习到了什么呢？如下面一张图：

　　给机器一张图片，那么对人来说，这张图片是一双鞋，而对机器来说，它可能认为是是美洲狮，因为图中的鞋标有一只美洲狮。

　　因此，我们想要知道CNN究竟学习到了啥，下面介绍几种方法来查看CNN都在侦测什么特征的方法。

3.1 直接查看filter

　　前面我们说到，filter就是为了抓取某一种特征的，那么我们是不是可以看一下这些filter分别都是侦测什么样的特征的。

　　根据CNN的原理，随着网络越来越靠近输出层，那么这一层所学习到的东西就越来越抽象，不太容易观察。因此，我们选取第一个卷积层的filters来看一下。

　　对于一个训练好的模型，将第一个卷积层的filters单独拿出来，并画出来，如图所示：

　　上面一共96个filter，每个filter的大小为11*11，从filter我们可以看出，上面几排的filter主要是侦测形状特征的，下面几排的filter主要是侦测色彩特征的。

　　我们也可以通过单独看一个filter，然后把图片依次输入的CNN中，看哪些图片经过这个filter后的输出（Activate）最大，如下图所示：

　　白色的框表示filter，这里白色的框看着很大，主要是因为这个filter比较靠后，也就是它所看到的是前面经过缩小后的输入，因此框就会变得很大。

　　第一排的图片中的框是一个filter1，可以看到，这个filter对于脸部的侦测比较强；

　　第二排的框是另一个filter2，可以看到filter2侦测的主要是洞状排列的特征；

　　第三排的filter3则是侦测红色的特征；

　　以此类推...

3.2 特征的可视化

　　这种方法是查看特征的，也就是说使用反卷积、反池化的方法，来可视化输入图像的激活特征。

　　还用原理部分那个CNN结构的例子，如下图左边的结构：

　　在第二个卷积层中，假设第k个filter，它与输入作用以后得到的结果如上图中右侧，每一个元素aij，然后把aij相加，即为ak，即：

　　那么现在我们想要通过输入x使得ak最大，也就是找一张图片x，使得ak的输出最大，即：

这里就要利用gradient ascent的方法去找这个最大值了，即求：

　　就相当于原先经过卷积、池化过程，现在要将x当做未知量，反过来求反池化、反卷积去求解出一个使得ak最大的x（注意这里x并不是真正的图片了，相当于是通过反池化和反卷积所得到的的带有一些特征的图像）；

　　具体原因就在于反池化和反卷积的求解过程，无法还原为原先的图片，这里暂不过多介绍如何反池化和反卷积的原理，后续再补充。

　　那么经过上面的步骤，还原得到的x的结果如图所示：

　　一共50个filter，这里取前12个，每个图片的意思代表1个filter所还原得到的图片x，也就是说，比如第一张图片，将其作为input丢进上面那个网络后，其输出与第一个filter作用后得到的ak最大。

　　仔细观察一下上面的图，还是有一定的规律可循的。

　　同时我们也可以去查看fully-connection部分的神经元，原理跟上面一样，不过再求解释时又多了一层反向传播的过程，如图：

　　当然也可以去拿输出层的神经元，比如识别结果为0，输出层在第0维值就很大，然后一样根据上面的原理得到的结果如图：

　　会发现得到的结果什么也看不到，但是当把某张图片再次输入进网络之后，得到的确实是对应的结果。

　　这也就说明了深度学习很容易被欺骗，但从侧面也反映出了，深度学习确实学习到了某些特征，并非仅仅简单“记住”数据，也说明深度学习的“玄学”性，难以解释。

　　当然，在上面的求解过程中，我们可以适当加一些限制，比如正则化：

　　那么得到的结果如图：

　　发现结果稍微清晰了一些，有些能够看到一些笔画。

　　那么正则化的目的是在保证y越大越高的同时，也要使得xij（图片中的每一个pixel）越小越好，也就是说对于图片显示（白色的是笔画，黑色的是空白）时，尽可能使空白减少，能连的连起来。所以效果会好些。

3.3 微分

　　对于一张图片的识别，我们可以计算类别y对图像像素pixel的微分的值：

　　通过改变像素xij，来看这个像素对识别的影响是否重要，也就是说，当xij稍微做一下改变，对识别的结果影响有多大，用这样的方法可以得到如下的结果：

　　白色区域表示对识别影响较为重要的pixel，可以大概看到一些形状。那这样做有什么意义呢？

　　有时当我们从网上爬取图片进行建模后，发现对马的识别率很高，但对其他的识别一般，这是因为可能关于“马”的图片都包含“horse”字样的标签，机器真正识别到的是“horse”的标签，而并非知道马长什么样子。

　　同样的道理，我们可以通过盖住图片的一部分，去看看盖住的部分结果的影响有多大，比如：

　　图中灰色的区域是被盖住的，不断移动灰色的区域，看对结果的影响有多大，那么可以获取到下面一样的热力图：

　　图中颜色越浅表示对辨识的结果影响越大，越不能辨别出是什么，可以看到，第一张当盖住狗的脸的时候，很难分辨出狗；

　　第二张图片当盖住轮胎部分的时候，就很难辨别出轮胎；

　　第三张图片当盖住狗的身子的部分，就很难辨别出狗了。

　　更多有关CNN可视化的内容，可搜索一些有关博客进行学习：https://blog.csdn.net/xys430381_1/article/details/90413169

4.关于CNN一些有趣的应用

　　根据上面的理论，我们可以通过修改某个filter的参数，去还原出一张另类的图片，比较有趣的应用有deep dream和风格迁移，如下图（图片来源于网络）：

这里就暂时不具体介绍原理了，后面会找一些开源的项目去玩。

参考资料：台大李宏毅《机器学习-卷积神经网络》

上面是对CNN进行的一个初步的介绍，后面会对深度学习部分进行系统的学习和整理，这里主要是对原理有个初步的认识，因此很多都是概念性的东西，后续会进一步添加补充。

Docker技术学习指南：从入门到实践小码快撩 docker 容器运维
引言Docker是一款开源的应用容器引擎，起源于2013年，基于Go语言开发，并遵循Apache2.0协议进行开源发布。它的出现是为了解决软件交付过程中的“环境一致性”问题，通过将应用及其依赖打包成可移植、轻量级的容器（Container），确保应用在任何地方运行都能得到一致的行为和性能。一、Docker基础概念与安装：Docker基础概念1.镜像（Image）镜像是Docker容器的构建块，它是
docker 基础命令使用(ubuntu) 自学AI的鲨鱼儿 #LLM 部署 docker 容器 ubuntu
docker状态查询dockerpsdockerps-adocker--versiondockerinfodocker--helpdockerrun--helpdockerps--help...docker操作镜像命令dockerimagesdockerrmi镜像id/镜像名docker操作容器命令dockerpsdockerps-adockerrun命令#端口映射-p参数#左边80是宿主机,右边
vue基础七（Less）今天晚上一定要早睡 vue vue.js css css3
Less安装注释导入变量（Variables）混合（Mixins）嵌套（Nesting）运算转义（Escaping）函数（Functions）命名空间和访问符映射作用域sass,less和stylussass变量的表示变量的赋值缩进的问题if条件判断的问题都支持嵌套Less（LeanerStyleSheets的缩写）是一门向后兼容的CSS扩展语言。安装将less安装为开发依赖npmiless--s
云原生后端周盛欢后端
一、什么是云原生后端？先来说说“云原生”这个词。想象一下，你有个小摊位，每次进货、出货都要自己搬来搬去，特别麻烦。但如果把摊位搬到一个现代化的商场里，商场帮你搞定水电、物流、安保，你只需要专心卖货就行。云原生就是这样的“现代化商场”，它把服务器、存储、网络这些复杂的基础设施都打包好，让你的程序（也就是你的“货物”）能轻松运行。“后端”呢，就是我们看不见的程序部分，比如处理用户数据、保存信息、做复杂
设计模式 - 代理模式菜鸟小码设计模式设计模式代理模式
首先，欢迎各位来到我的博客！本文深入理解设计模式原理、应用技巧、强调实战操作，提供代码示例和解决方案，适合有一定编程基础并希望提升设计能力的开发者，帮助读者快速掌握并灵活运用设计模式。如有需要请大家订阅我的专栏【设计模式】哟！我会定期更新相关系列的文章文章目录引言一、代理模式的基本概念二、代理模式的实现1.定义Subject接口2.实现RealSubject3.实现Proxy4.客户端代码三、代理
JAVA基础知识总结（2025速通）三剑走偏锋o.O java 开发语言
文章目录前言final关键字1、修饰属性或者局部变量【掌握】2、方法【掌握】3、类【掌握】4、应用场景【理解】1、常量2、修饰属性3、修饰局部变量4、修饰方法5、修饰类Object类详解1、常用方法【掌握】2、了解的方法【了解】3、学习反射之后要掌握的方法【了解】4、学习线程之后要掌握的方法【了解】字符串处理类1、java.lang.String类的使用【掌握】2、正则表达式【了解】3、Strin
JS(1-69) 小箌 javascript 开发语言学习
01_JS介绍1.1JS是什么1.JavaScript（是什么？)是一种运行在客户端（浏览器）的编程语言，实现人机交互效果。2.作用（做什么？)网页特效（监听用户的一些行为让网页作出对应的反馈)表单验证（针对表单数据的合法性进行判断）数据交互（获取后台的数据，渲染到前端服务端编程（node.js)3.JavaScript的组成（有什么？)ECMAScript:规定了js基础语法核心知识。口比如：变
后量子密码学：量子安全新防线量子信使量子计算密码学信息与通信深度学习安全算法机器学习
目录背景主要算法介绍基于格的密码学格的概念格密码学中的难题加密和解密过程基于多变量多项式的密码学多变量多项式基础多变量多项式密码学中的难题加密和签名过程基于编码的密码学纠错码简介编码密码学中的难题加密和解密过程安全性分析传统密码学算法在量子计算环境下的安全性RSA算法的破解风险椭圆曲线密码算法的脆弱性后量子密码学算法的安全性评估基于格的密码学算法基于多变量多项式的密码学算法基于编码的密码学算法后量
Ubuntu系统的基础操作与使用指南小村学长毕业设计 ubuntu linux 运维
Ubuntu系统的基础操作与使用指南Ubuntu，作为一款开源、免费且广受欢迎的操作系统，以其稳定的性能、丰富的软件资源和友好的用户界面，成为了众多开发者、学生以及日常用户的首选。本文旨在详细介绍Ubuntu系统的基础操作和使用方法，帮助初学者快速上手并高效利用这一强大的操作系统。一、安装Ubuntu1.准备工作在安装Ubuntu之前，你需要准备一张Ubuntu安装盘（如USB启动盘）或直接从官方
iOS 中使用 FFmpeg 的高级功能 - 滤镜（Filters）陈皮话梅糖@ FFmpeg音视频高阶技术讲解 ios ffmpeg
FFmpeg提供了强大的滤镜功能，可以对音视频进行各种处理，例如裁剪、缩放、添加水印、调整颜色、添加特效等。1.FFmpeg滤镜基础知识1.1什么是滤镜（Filters）？滤镜是FFmpeg提供的一种功能，用于对音视频流进行处理。滤镜链（FilterChain）是多个滤镜的组合，按顺序对输入流进行处理。滤镜图（FilterGraph）是一个复杂的滤镜链，可以包含多个输入和输出。1.2常见的滤镜滤镜
Join字段类型超容易上手的好吧(Elasticsearch) 籽麟网络 elasticsearch 大数据搜索引擎
最近因为工作原因吗，比较忙，然后个人也比较懒，输出又慢下来了，后面会慢慢恢复的，定期保证周更吧，并且保证质量输出。阅读本文需要一定的Elasticsearch基础哦，本文深度有，但是不深概述Elasticsearch中Join数据类型的字段相信大家也都用过，也就是口中常谈的父子文档。在Elasticsearch中Join不能跨索引和分片，所以保存文档信息时要保证父子文档使用相同的路由参数来保证父文
成功撒花特效吉吉安 css特效撒花特效撒花动画成功特效前端前端开发
基础效果：前端安装并引入canvas-confetti包如有问题请使用满血版DeepSeek/国内直连GPT/Claude解答1.安装npminstall--savecanvas-confetti2.在前端代码中引用importconfettifrom'canvas-confetti';2.在前端代码中使用把下面这个直接放到你的函数里面，调用即可，调用时机由自己控制，比如成功状态或者其他时机con
【Python爬虫(15)】从0到1：Python爬虫实战攻克电商网站动态数据堡垒奔跑吧邓邓子 Python爬虫 python 爬虫开发语言电商网站动态数据
【Python爬虫】专栏简介：本专栏是Python爬虫领域的集大成之作，共100章节。从Python基础语法、爬虫入门知识讲起，深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑，覆盖网页、图片、音频等各类数据爬取，还涉及数据处理与分析。无论是新手小白还是进阶开发者，都能从中汲取知识，助力掌握爬虫核心技能，开拓技术视野。目录一、引言二、准备工作2.1环境搭建2.2目标电商网站分析三、攻克登
DeepSeek模型实战：从理论到应用的深度探索 CodeJourney. 人工智能算法数据库
一、引言在人工智能快速发展的当下，大型语言模型已成为自然语言处理领域的核心力量。DeepSeek模型作为其中的佼佼者，凭借其先进的架构和强大的性能，吸引了众多开发者和研究人员的关注。本文将深入探讨DeepSeek模型的技术原理，并通过实际案例展示其在不同场景下的应用，为读者提供从理论到实践的全面指导。二、DeepSeek模型技术剖析（一）架构基础DeepSeek模型基于Transformer架构构
网络安全：从攻击到防御的全景解析一ge科研小菜鸡运维网络
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注1.引言在互联网高度发达的今天，网络安全已成为影响社会稳定、国家安全和企业发展的关键因素。无论是个人用户的数据隐私，还是企业的商业机密，亦或是国家关键基础设施（如电网、金融系统、医疗网络），都面临着网络攻击的潜在威胁。近年来，网络攻击的方式越来越多样化，攻击规模越来越大，防御技术也在不断升级。本文将从攻击者的视角出发，分析网络攻击的主要手段，并探
网站SEO:百度快排是如何实现的百度百科蝌蚪团百度搜索引擎
快排这个东西从17年开始大面积兴起，后面随着按天计费的兴起，刚开始是要有基础排名，后面没有基础排名的也能7-21天上词了，逐渐大部分行业都靠刷了。快排技术应该是一种“擦边”性技术，不属于百度官方认可的SEO技术。百度快排=快速收录+快速排名（提权）收录就不用说了，这是基本功。主要说提权!快排提权因素有：title点击量访问停留时长访客ip质量外链流量为什么小说一类的网站权重特别高呢，就是点击量和停
字节跳动后端或大数据基础知识面试题及参考答案（2万字长文）大模型大数据攻城狮大数据大厂面试数据结构算法 leetcode
目录Redis的数据类型Redis数据类型的底层数据结构三次握手、四次挥手Redis持久化机制购物车为什么用Redis存，是永久存储吗MySQL的InnoDB索引数据结构哪些SQL的关键字会让索引失效队列、栈、数组、链表有什么不同讲讲爬虫的构成爬虫抓到的数据不清洗吗？不去重吗？对爬虫的更多了解Linux进程间通信机制进程和线程的区别线程私有的数据讲一下堆排序，每次调整的时间复杂度？堆排序是稳定的吗
Trae 项目常见问题解决方案强和毓Hadley
Trae项目常见问题解决方案trae:postbox:MinimalisticFetchbasedHTTPclient项目地址:https://gitcode.com/gh_mirrors/tr/trae项目基础介绍Trae是一个基于FetchAPI的极简HTTP客户端，旨在提供一个简单、轻量级的HTTP请求工具。该项目的主要编程语言是TypeScript和JavaScript。Trae的设计理念
Janino 不思进取了？Java 动态编译的新神器 Liquor v1.3.10 发布组合缺一 Solon Java Framework java 开发语言 solon liquor 动态编译器
Liquor是一个开源的轻量级Java动态编译器（零依赖，40KB），基于javac构建，可在运行时编译Java（支持java8到java23语法）字符串代码片段、类、方法等。源码地址：https://gitee.com/noear/liquor基础编译特性：可以单个类编译可以多个类同时编译可以增量编译增值特性：java表达式引擎java脚本引擎（支持java8到java23语法）本次更新添加Sc
PostgreSQL认证指南 leegong23111 postgresql 数据库
PostgreSQL作为一款强大的开源关系型数据库，深受开发者和企业的青睐。获得PostgreSQL专家认证，不仅能提升个人在数据库领域的专业能力，还能为职业发展增添有力筹码。下面为大家详细介绍PostgreSQL专家认证的学习路径。一、深入理解基础知识·数据类型与存储：PostgreSQL支持多种数据类型，如常见的整数、浮点数、字符串，还有特殊的几何类型、JSON类型等。深入了解每种数据类型的存
信息技术导论第二章物联网技术笔记新世紀渾水摸魚戰士信息技术导论笔记信息与通信
第二章物联网技术2.1物联网概述2.1.1物联网的基本概念物联网的定义是：通过射频识别（RFID）装置、红外感应器、全球定位系统、激光扫描器等信息传感设备，按约定的协议，把任何物品与互联网相连接，进行信息交换和通信，以实现智能化识别、定位、跟踪、监控和管理的一种网络。当每个而不是每种物品能够被唯一标识后，利用识别、通信和计算等技术，在互联网基础上，构建的连接各种物品的网络，就是人们常说的物联网。物
Java面试宝典：说下Spring Bean的生命周期？熊文豪 Java面试宝典 java 面试 spring Spring Bean Bean Bean的生命周期
Java面试宝典专栏范围：JAVA基础，面向对象编程（OOP），异常处理，集合框架，JavaI/O，多线程编程，设计模式，网络编程，框架和工具等全方位面试题详解每日更新Java面试宝典专栏：Java面试宝典感兴趣的可以先收藏起来，大家在遇到JAVA面试题等相关问题都可以给我留言咨询，希望帮助更多的人回答重点实例化：Spring容器根据配置文件或注解实例化Bean对象。属性注入：Spring将依赖（
Express 项目基础设施搭建 yqcoder javascript 开发语言 ecmascript
搭建一个基本的Express项目基础设施，涵盖项目初始化、依赖安装、目录结构设计、基本路由与中间件设置等步骤。1.初始化项目首先要创建一个新的项目目录，接着在该目录下初始化`package.json`文件，此文件用于管理项目的依赖和脚本。#创建项目目录mkdirexpress-project#进入项目目录cdexpress-project#初始化package.json文件npminit-y2.安
Debian/Ubuntu云服务器配置最速实践笔记[1] 打磨怪最速实践 linux debian ubuntu 腾讯云
在腾讯云购买了一台轻量云服务器跑几个机器人用,一篇基础配置的实践笔记系统是Debian11,理论上Ubuntu等衍生版本基本可以无修改地参考添加普通用户安装Docker安装Node.js安装miniconda安装JupyterNotebook及后台启动Q&A参考资料先关机;重置密码(设定root密码);开机添加用户//先切换到rootsuroot//添加一个普通用户sudoadduser//确定该
深度解析HTTP/HTTPS协议：从原理到实践和舒貌 http https 网络协议网络信息与通信服务器 windows
深入浅出HTTP/HTTPS协议：从原理到实践前言在当今互联网世界中，HTTP和HTTPS协议如同空气般存在于每个网页请求的背后。作为开发者或技术爱好者，理解这些基础协议至关重要。本文将用六大板块，配合原理示意图和实操案例，带你系统掌握HTTP/HTTPS的核心知识。目录网络协议基础：HTTP与HTTPS概述HTTP的工作原理与报文解析HTTPS的加密机制与SSL/TLSHTTP与HTTPS的对比
Java初学者：Java - 从新手到高效掌握的重点与难点 ProgramHan java 学习开发语言
很多人都想学习Java，但是又无从下手，难道Java只能到培训机构去花钱学吗？结合本人的经验，我认为不需要去培训机构花钱学也可以学习Java。首先，我们的需求很明确，是关于学习方法和如何将所学应用到工作中。可能我们希望文章详细且有实际指导意义，帮助他们高效学习Java。接下来，我得考虑文章的结构。通常，学习指南会包括基础知识、重点难点、实践应用等部分，这样我们可以有条理地进行学习。然后，如何将学习
SFT（监督微调）和RLHF（基于人类反馈的强化学习）的区别钟小宇 LLM 人工智能语言模型
SFT（监督微调）和RLHF（基于人类反馈的强化学习）的区别STF（SupervisedFine-Tuning）和RLHF（ReinforcementLearningfromHumanFeedback）是两种不同的模型训练方法，分别用于不同的阶段和目的。以下是它们的主要区别：1.方法概述STF（监督微调）：定义：STF是指在已经预训练好的模型基础上，使用标注好的数据进一步训练模型，使其在特定任务上
Redis：深入理解阻塞列表弹出与消息发布订阅机制_brpop原理高级工程师2024 2024年程序员学习 redis bootstrap 数据库
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新Linux运维全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶
HarmonyOS Next 端侧部署基础之 HiAI Foundation Kit harmonyos
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）中端侧部署涉及的HiAIFoundationKit技术细节，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。一、HiAIFoundationKit简介与功能概述在HarmonyOSNext的端侧部署中，HiAI
TCP协议：深入理解如何收集主机信息小宇python 网络安全 tcp/ip 网络网络协议
TCP协议：深入理解如何收集主机信息在网络安全领域，信息收集是渗透测试和漏洞评估的首要步骤。TCP协议，作为互联网上应用最广泛的传输层协议之一，为我们提供了丰富的信息收集手段。本文将深入探讨如何利用TCP协议收集主机信息，包括基本的TCP扫描技术、半开放扫描以及如何使用这些信息进行进一步的安全分析。TCP协议基础在开始之前，了解TCP协议的基础知识是必要的。TCP（TransmissionCont
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源