Vic·Tory

卷积神经网络识别CIFAR10图像集

1、基本概念

卷积神经网络(Convolutional Neural Networks, CNN)是机器视觉中应用最为广泛的算法，主要用于图像分类、识别，其识别率比肉眼更高。对于全连接神经网络而言，当输入特征值、中间隐藏层数量增加时，会造成参数的总数明显增多，从而导致运算速度极具下降以及过拟合的问题。因此需要使用更为合理的模型来减少参数的个数，即卷积神经网络。

过拟合问题是指当网络参数过多时，模型就会记住样本的特征值，从而在样本的预测上表现得很好，但是在测试数据上却表现得不好。

CNN的结构如上图所示，它由多层神经网络组成，除了输入、输出层之外，中间由多对卷积层与降采样层，每层由多个二维平面组成，每个平面又包括多个独立神经元。卷积层的目的是降低噪音、增强原信号特征以便于采集数据。降采样层是降低网格训练的参数数量。再经过若干次卷积、降采样后，经过全连接层、softmax层的处理再进行输出。

卷积操作实质上是矩阵加权求和的过程，例如左上图所示，将深蓝色3×3矩阵内的数值分别与红色的权值相乘再求和，得到的值12填入绿色矩阵的第一个位置，然后将矩阵窗口向右滑动一格，重复上面操作，得到绿色矩阵第二个值，以此类推填满绿色矩阵，这个过程就是卷积。红色的权值称为卷积核，得到的绿色结果图称为特征图。

从卷积的过程可以看出，每个输出特征只与其中的3×3输入特征有关，而不是像全连接一样连接每个输入，这个特性叫做局部连接。在卷积过程中，卷积核并没有发生变化，整张图共享一个3×3的权值，这叫做权值共享。由于以上两个特性，使得卷积神经网络的参数量大大下降。

0填充：从上面的卷积过程可以看出，原来5×5的图像经过卷积后变成了3×3，损失掉了很多图像信息。为了弥补损失，可以在图像外围用0填充一层信息，并从外围开始卷积，如下面左图所示，这样得到的图像就不会有大小损失。

多通道卷积：卷积的目的是对目标图片的特征进行人为提取，忽略其他特点，提取主要特点。例如用一个纵向的卷积核与图片运算，得到的图像会显示出明显的纵向线条，而忽略了其它横向的信息。为了使特征提取更充分，可以添加多个卷积核以提取不同的特征，即多通道卷积。例如上图中分别对一幅图的RGB三个通道用不同卷积核进行卷积操作，将得到的结果再每个位置相加得到特征图。卷积结束后也可以对特征图加偏置，例如给原图加橘色偏置，使图片整体偏橘色。

降采样是通过减少矩阵的长和宽来降低参数的数量，例如一个12×12的网格，将其3×3的区域映射为1个网格，那么原来的12×12就被压缩为为4×4的网格了。降采样也叫池化操作（Pooling），最常用的是池化操作：计算图像一个区域上的某个特定特征的平均值或最大值的聚合操作叫做池化（pooling）。均值池化：对池化区域内的像素点取均值，这种方法得到的特征数据对背景信息更敏感。最大池化：对池化区域内所有像素点取最大值，这种方法得到的特征对纹理特征信息更加敏感。

步长（stride）表示卷积核在图片上移动的格数。通过步长的变换，可以得到不同尺寸的卷积输出结果，例如步长为2时，得到的就是2×2的结果。可以看到通过步长大于1的卷积操作也能达到降低参数维的目的，因此降采样层并不是必须的。

卷积输出大小=(输入大小-卷积核+padding)/stride+1

Tensor FLow中定义了许多卷积函数，放在在tensorflow/python/ops下的nn_impl.py和nn_ops.py文件中。例如二维卷积函数tf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None, name=None)

input：需要做卷积的输入数据。这是一个4维的张量（[batch, in_height, in_width, in_channels]）其中bath为每批样本个数，in_height、 in_width为图像长和宽，channels为图片通道数。要求类型为float32或float64其中之一。
filter：卷积核。[filter_height, filter_width, in_channels, out_channels]前两个为长和宽，后两个为输入输出的通道数。
strides：图像每一维的步长，是一个一维向量，长度为4
padding：是否采用0填充边缘。当值为"SAME"时，表示边缘填充，适用于全尺寸操作；当为"VALID"时，表示边缘不填充。
use_cudnn_on_gpu：bool类型，是否使用cudnn加速
name：该操作的名称
返回值：返回一个tensor，即特征图

Tensor FLow中的池化函数定义在tensorflow/python/ops下的nn.py和gen_nn_ops.py文件中，其中最大池化：tf.nn.max_pool() 平均池化：tf.nn.avg_pool(value, ksize, strides, padding, name=None）

value：需要池化的输入。一般池化层接在卷积层后面，所以输入通常是conv2d所输出的feature map，依然是4维的张量（[batch, height, width, channels]）。
ksize：池化窗口的大小，由于一般不在batch和channel上做池化，所以ksize一般是[1,height, width,1]，
strides：图像每一维的步长，是一个一维向量，长度为4
padding：是否0填充边缘
name：该操作的名称
返回值：返回一个tensor

2、CIFAR-10图像识别

2.1、加载数据集

CIFAR-10是一个用于识别普适物体的小型数据集，它包含了10个类别的彩色RGB图片。其中包含五个批次的训练集数据，每批内含一万张32×32图片，还有一万张测试集图片。其介绍网址：https://www.cs.toronto.edu/~kriz/cifar.html

首先通过python代码从网上下载并解压cifar数据到指定文件夹，然后定义函数load_batch加载一批测试训练集数据，然后通过load_data()调用load_batch()读取所有批次的数据并拼接在一起，然后返回训练集和测试集数据。

其中测试数据有五个数据集，每个数据集有一万张32×32的RGB三通道数据，这些数据以一维的形式存储。所以当通过load_batch()读入数据后利用reshape()函数将其化为为(10000,3,32,32)的四维数组，之后再利用transpose()函数调整为(10000,32,32,3)的四维数据。

import urllib
import os
import tarfile
import numpy as np
import pickle as pk

#下载、解压CIFAR数据集
url='https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz'
file_path='D:/Temp/MachineLearning/data/cifar-10-python.tar.gz'
#如果目标文件不存在，则从指定url下载该文件
if not os.path.isfile(file_path):      
    urllib.request.urlretrieve(url,file_path)
#如果目录下不存在文件，则解压
if not os.path.exists('D:/Temp/MachineLearning/data/cifar-10-batches-py'):     
    tfile=tarfile.open('D:/Temp/MachineLearning/data/cifar-10-python.tar.gz','r:gz')
    tfile.extractall('D:/Temp/MachineLearning/data/')
    
#载入数据
def load_batch(file):                                            #读取一个批次的数据
    with open(file,'rb') as f:
        data_dict=pk.load(f,encoding='bytes')
        images=data_dict[b'data']
        labels=data_dict[b'labels']
        
        #将一维图片数据调整为四维数组
        images=images.reshape(10000,3,32,32)
        #将(10000,3,32,32)调整参数数组维度为(10000,32,32,3)
        images=images.transpose(0,2,3,1)                         
        
        labels=np.array(labels)
        
        return images,labels
    
def load_data(data_dir):
    images_train=[]
    labels_train=[]
    for i in range(5):
        file=os.path.join(data_dir,'data_batch_%d'%(i+1))
        print('加载文件：',file)
        #按批次读取训练集数据并拼接到图像和标签列表后，直到读入所有批次数据
        images_batch,labels_batch=load_batch(file)            
        images_train.append(images_batch)
        labels_train.append(labels_batch)
        #将多个批次的数组统一为一个数组
        Xtrain=np.concatenate(images_train)
        Ytrain=np.concatenate(labels_train)
        del images_batch,labels_batch
    
    #加载测试集图像和标签
    Xtest,Ytest=load_batch(os.path.join(data_dir,'test_batch'))
    
    return Xtrain,Ytrain,Xtest,Ytest

data_dir='D:/Temp/MachineLearning/data/cifar-10-batches-py/'
Xtrain,Ytrain,Xtest,Ytest=load_data(data_dir)


#通过函数显示具体图片及其对应标签
%matplotlib inline
import matplotlib.pyplot as plt

#定义标签对应的类别
label_dict={0:'airplane',1:'automobile',2:'bird',3:'cat',4:'deer',
            5:'dog',6:'frog',7:'horse',8:'ship',9:'trunk'}

#定义图片显示函数，从index开始显示num个图片，images为图像资源，labels为标签，prediction为预测值
def show_img(images,labels,prediction,index,num=10):
    #获取整张图片资源并设置大小
    figure=plt.gcf()
    figure.set_size_inches(12,6)
    
    for i in range(num):
        #绘制每个子图图像
        sub_img=plt.subplot(2,5,i+1)
        sub_img.imshow(images[index],cmap='binary')
        #显示子图标题，序号+标签，如果有预测，也显示
        title=str(i)+':'+label_dict[labels[index]]
        if len(prediction)>0:
            title+='vs'+label_dict[labels[index]]           
        sub_img.set_title(title,fontsize=10)
        index+=1
    plt.show()
    
show_img(Xtrain,Ytrain,[],10)

2.2、数据预处理

训练集由五万个32×32个像素点组成，每个像素点包含三个数字分别代表RGB三个色彩通道，其值介于0~255之间，因此首先需要将数据标准化，即将每个色彩值除以255，化为0~1之间的值。

接着需要把数据的标签值化为独热编码。预处理如下：

#数据预处理
Xtrain=Xtrain.astype('float32')/255.0                                 #数字标准化
Xtest=Xtest.astype('float32')/255.0

from sklearn.preprocessing import OneHotEncoder                       #独热编码
encoder=OneHotEncoder(sparse=False)
one_format=[[0],[1],[2],[3],[4],[5],[6],[7],[8],[9]]
encoder.fit(one_format)

Ytrain=Ytrain.reshape(-1,1)     #数组化为一维包含一个元素的二维数组，-1代表二维的数量自适应
Ytrain=encoder.transform(Ytrain)
Ytest=Ytest.reshape(-1,1)
Ytest=encoder.transform(Ytest)
print(Ytest[0])

输出Ytest[0]的OneHot编码为：[0. 0. 0. 1. 0. 0. 0. 0. 0. 0.]

2.3、定义网络结构

卷积网络输入层输入的是32×32的3通道数据，通过第一个卷积层输出32×32个32通道的数据。通过采用多个卷积核进行不同角度的卷积操作，使得通道数量增加，但不改变图像的大小（32×32）。接着进行第一个池化层，池化不改变通道数，而是缩减图片大小，输出16×16的32通道数据。

同理经过第二个卷积层，输出16×16的64通道数据，之后再经过第二个池化层，输出8×8的64通道数据。

将第二个池化层的输出数据输入全连接层，对应4096个一维向量（8×8×64=4096），在该层定义128个神经元。之后将数据输出到输出层，输出层有10个神经元，对应输出10类图片。

#共享函数定义
import tensorflow as tf
#根据不同的shape生成权值变量，并利用截断正态分布随机赋初值
def weight(shape):
    return tf.Variable(tf.truncated_normal(shape,stddev=0.1))
#根据不同shape生成初始值为0.1的偏置值
def bias(shape):
    return tf.Variable(tf.constant(0.1,shape=shape),name='b')

#定义卷积层操作，参数分别为：输入x，W
def convolute(x,W):
    return tf.nn.conv2d(x,W,strides=[1,1,1,1],padding='SAME')     #步长为1，0填充

#定义最大池化函数，步长为2
def max_pool(in_images):
    return tf.nn.max_pool(in_images,ksize=[1,2,2,1],strides=[1,2,2,1],padding='SAME')

x=tf.placeholder('float',shape=[None,32,32,3])
y=tf.placeholder('float',shape=[None,10])
 
#第一个卷积层，卷积核3×3，输入通道3，输出32
with tf.name_scope('conv1'):
    W1=weight([3,3,3,32])
    b1=bias([32])
    c1=tf.nn.relu(convolute(x,W1)+b1)
#第一池化层
p1=max_pool(c1)
#第二卷积层，卷积核3×3，输入通道32，输出64
with tf.name_scope('conv2'):
    W2=weight([3,3,32,64])
    b2=bias([64])
    c2=tf.nn.relu(convolute(p1,W2)+b2)
#第二池化层
p2=max_pool(c2)

#全连接层
w3=weight([4096,128])
b3=bias([128])
fcl=tf.reshape(p2,[-1,4096])        #将第二个池化层的输出重构为4096个一维向量
h=tf.nn.relu(tf.matmul(fcl,w3)+b3)
drop_res=tf.nn.dropout(h,keep_prob=0.8)   #防止过拟合，随机丢掉一部分神经元

#输出层
w4=weight([128,10])
b4=bias([10])
pred=tf.nn.softmax(tf.matmul(drop_res,w4)+b4)

2.4、训练模型

与普通的模型训练相同，首先需要定义模型的损失函数、优化器、准确率，其次对训练的超参数进行设置。在每一轮训练中，分批次读入数据进行训练，在每轮训练结束后求出损失与准确率并打印。

值得注意的是在使用卷积函数进行训练时十分消耗cpu资源，有可能一次无法训练完成很多轮数据，此时可以进行断点续训，即将训练前几轮的数据tf.train.Saver保存到ckpt_dir目录下，下次开始训练前先读取检查点文件到session，然后继续训练。

#定义损失函数、优化器、准确率
loss_function=tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=pred,labels=y))
optimizer=tf.train.AdamOptimizer(learning_rate=0.0001).minimize(loss_function)
correct_prediction=tf.equal(tf.argmax(pred,1),tf.argmax(y,1))
accuracy=tf.reduce_mean(tf.cast(correct_prediction,tf.float32))
#设置超参数
train_epochs=25
batch_size=50
total_batch=int(len(Xtrain)/batch_size)
epoch=tf.Variable(0,name='epoch',trainable=False)           #用于保存断点训练轮数的变量
epoch_list=[];accuracy_list=[];loss_list=[];                #用于暂存数据的列表

ss=tf.Session()
ss.run(tf.global_variables_initializer())

#断点续训
ckpt_dir='D:/Temp/MachineLearning/ModelSaving/CIFAR_10/'
if not os.path.exists(ckpt_dir):
    os.makedirs(ckpt_dir)
#保存节点时过滤Adam有关变量
vl = [v for v in tf.global_variables() if "Adam" not in v.name]
saver=tf.train.Saver(var_list=vl)
tf.reset_default_graph()                                    #重置计算图与节点
#读取最新的检查点文件到session
ckpt=tf.train.latest_checkpoint(ckpt_dir)
if ckpt!=None:
    saver.restore(ss,ckpt)
    
start=ss.run(epoch)                                         #读取当前的训练轮数epoch
print('开始第%d轮训练'%(start+1))

#手动定义批数据返回函数
def get_batch(number,batch_size):
    return Xtrain[number*batch_size:(number+1)*batch_size],\
            Ytrain[number*batch_size:(number+1)*batch_size]
#开始多轮训练
for ep in range(start,train_epochs):
    for i in range(total_batch):
        bx,by=get_batch(i,batch_size)
        ss.run(optimizer,feed_dict={x:bx,y:by})
        
    loss,acc=ss.run([loss_function,accuracy],feed_dict={x:bx,y:by})
    epoch_list.append(ep+1)
    loss_list.append(loss)
    accuracy_list.append(acc)    
    print('第%2d轮训练，损失=%.6f，准确率=%f'%(ss.run(epoch)+1,loss,acc))
    
    #保存检查点
    saver.save(ss,ckpt_dir+'CIFAR10_cnn_model.ckpt',global_step=ep+1)
    ss.run(epoch.assign(ep+1))
    
ss.close()

在断点续训时会遇到报错：Key Variable/Adam not found in checkpoint，这是由于Adam优化器的参数在不同轮次变量保存出现无法读取，可以在保存变量时过滤掉Adam相关变量。

遇到的第二个报错为：Key Variable_4 not found in checkpoint，可以在读取检查点之前通过tf.reset_default_graph()重置计算图与节点。

程序的运行结果如下，先进行了三轮训练，停止之后从第四轮开始继续训练：

There was a problem confirming the ssl certificate: [SSL:CERTIFICATE_ VERIFY_ FAILED]certificate解决方案爱编程的喵喵 Python基础课程 python pip SSL certificate 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了Therewasaproblemco
（新春特辑）腾讯开源MimicMotion整合包，最强图片生成跳舞视频的动作视频模型，动作丝滑没有破绽 struggle2025 人工智能计算机视觉机器学习 AI作画腾讯云AI代码助手
一、项目介绍：（文末提供下载）腾讯图片生成跳舞视频的项目MimicMotion，高质量人类动作视频生成与置信感姿势。亮点：丰富的细节，良好的时间平滑性，以及长视频长度。效果同时支持面部特征和唇形同步，不止可以搞跳舞视频，也可以做数字人。本文信息图片均来源于GitHub开源地址：https://github.com/Tencent/MimicMotion二、效果展示三、概述近年来，生成式人工智能在图
DeepSeek--通向通用人工智能的深度探索者油泼辣子多加专业名词解释人工智能
一、词源与全称“DeepSeek"由"Deep”（深度）与"Seek"（探索）组合而成，中文译名为"深度求索"。其全称为"深度求索人工智能基础技术研究有限公司"，英文对应"DeepSeekArtificialIntelligenceResearchInstitute"。这一命名体现了企业对深度学习技术与未知领域持续探索的双重追求。二、发展历程初创期（2023）公司成立于中国杭州，创始团队汇聚了来自
git clone出现fatal: unable to access Failed to connect to github.com port 443: Timed out解决方案爱编程的喵喵 Python基础课程 git github timeout port 443 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了gitclone出现fatal:un
flask+layui学生信息管理系统元宇宙中的程序员 flask layui python
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、pandas是什么？二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。一、数据库建模1、创建数据模型classStudentORM(db.Model):stu_id=d
Github趋势榜的新年冠军，竟是用AI玩数独 beyondma AI与最新技术演进 AI MINST Github
今天笔者无意中打开Github发现了这个目前趋势榜霸榜的项目是是一个利用AI玩数独的项目AI_Sudoku（Github发址：https://github.com/neeru1207/AI_Sudoku）笔者体验了一下感觉还是比较有意思的，AI_Sudoku本质上就是使用图像识别的方式来完成MINST数字识别，然后再使用dancinglinksx算法解出数独问题，对于初学者来说既能解决AI的入门问
AI智能制造软件有什么用处雪叶雨林行业资讯 AI 人工智能制造
随着信息技术与制造业的深度融合，人工智能（AI）逐渐成为提升制造效率和灵活性的重要工具。AI智能制造软件通过集成数据分析、机器学习和自动化流程，为企业提供了优化生产、降低成本和提高质量的新途径。生产过程优化实时监控与反馈AI智能制造软件能够实时收集生产线上的各类数据，如温度、压力、速度等参数，并通过机器学习算法进行分析处理。一旦检测到异常情况，系统会立即发出警报并提供改进建议，帮助企业快速响应问题
ModuleNotFoundError: No module named ‘pywin32_bootstrap‘解决方案爱编程的喵喵 Python基础课程 python ModuleNotFound win32_bootstap 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了ModuleNotFoundErro
人脸识别的经典深度学习方法明初啥都能学会深度学习人工智能
人脸识别的经典深度学习方法引言1.卷积神经网络（CNN）1.1LeNet1.2AlexNet1.3VGGNet1.4ResNet2.人脸检测2.1Viola-Jones算法2.2基于深度学习的人脸检测3.人脸特征提取3.1主成分分析（PCA）3.2人脸对齐3.2.1基于特征点的对齐3.2.2基于深度学习的对齐4.人脸识别模型4.1传统机器学习方法4.2基于深度学习的方法5.公式解读5.1卷积运算5
人物传记之新月篇暮雨哀尘人物传记篇哈希算法算法 c语言 python pycharm vscode windows
相关故事链接（及时更新）：Python的那些事第四篇：编程中的智慧之光控制结构-CSDN博客目录1.C语言程序：增强版加密与解密工具2.Python程序：增强版加密与解密工具功能对比表格详细功能解释人物传记简介新月，25世纪的杰出女性，以其在编程、人工智能和军事战略领域的卓越成就而闻名。她不仅是一位才华横溢的科学家，还是一位深受尊敬的军事领袖。新月的故事是关于智慧、勇气和创新精神的传奇。早年生活新
MicroAI™将人工智能培训引入RENESAS MCU sinat_41698914 人工智能 mcu big data
在端点部署的人工智能技术将加快资产密集型行业的上市时间达拉斯--(美国商业资讯)--边缘原生人工智能(AI)和机器学习(ML)产品领域的先驱MicroAITM今天宣布，公司已将其MicroAIAtomML™技术与RenesasRA微控制器(MCU)产品线进行整合。与全球微控制器领导者Renesas合作将机器学习引入MCU，并借助MicroAI直接在嵌入式环境中训练机器学习模型的能力——这在业界尚属
基于深度学习的遥感目标检测系统：UI界面、R-CNN模型与数据集准备 2025年数学建模美赛 R-CNN检测系统人工智能深度学习 r语言 cnn python ui 目标检测
一、引言遥感图像中的目标检测在很多领域，如环境监测、土地利用、城市规划、农业资源监测等方面有着广泛应用。遥感图像具有高分辨率和丰富的空间信息，但同时也带来了目标检测中的许多挑战，特别是在目标尺度变化、遮挡和复杂背景的情况下。因此，采用深度学习技术，尤其是卷积神经网络（CNN）和区域卷积神经网络（R-CNN），在遥感图像目标检测中取得了显著的成果。本文将详细介绍基于深度学习的遥感目标检测系统，使用R
DeepSeek R1：中国AI黑马的崛起与挑战码事漫谈 AI 人工智能
文章目录技术突破：从零开始的推理能力进化DeepSeekR1-Zero：纯RL训练的“自我觉醒”DeepSeekR1：冷启动与多阶段训练的平衡之道实验验证：推理能力的全方位跃升基准测试：超越顶尖闭源模型蒸馏技术：小模型的逆袭行业启示：AGI之路的新范式纯RL训练的价值与挑战蒸馏技术的普惠意义开源生态的推动力未来展望：从推理到通用智能结语在人工智能领域，大型语言模型（LLMs）正以迅猛之势重塑我们的
第76期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能网络安全
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.关于使用大语言模型
从简单到深刻的认知发展 AI架构设计之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
认知发展，人工智能，深度学习，神经网络，机器学习，自然语言处理，计算机视觉1.背景介绍认知发展是人类从简单到复杂的思维方式演进的过程，它涉及感知、记忆、语言、推理和决策等多个方面。随着人工智能技术的飞速发展，我们开始尝试用计算机模拟人类的认知能力，构建能够学习、理解和解决复杂问题的智能系统。从早期的符号逻辑到如今的深度学习，人工智能的发展经历了多个阶段。早期的人工智能研究主要集中在规则和逻辑推理上
2025年1月27日人工智能与科技新闻：DeepSeek震撼全球科技市场海棠AI实验室 AI 瞭望塔人工智能科技
中国AI初创公司DeepSeek震撼全球科技市场DeepSeekR1模型的突破性发展在科技迅猛发展的时代，中国人工智能初创公司DeepSeek推出的R1模型，以其卓越的技术能力，在全球AI领域掀起一场变革。这不仅是技术层面的突破，更对全球科技市场产生深远影响。技术创新与突破全新语言处理架构：提升AI理解和生成能力超越传统模型的认知能力：实现更精准的自然语言推理多模态交互：支持文本、图像、语音等多维
第84期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能 gpt AIGC
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.利用数据流路径对大
新型人工智能“黑帽”工具：GhostGPT带来的威胁与挑战 FreeBuf- 资讯人工智能
生成式人工智能的发展既带来了有益的生产力转型机会，也提供了被恶意利用的机会。最近，AbnormalSecurity的研究人员发现了一个专门为网络犯罪创建的无审查AI聊天机器人——GhostGPT，是人工智能用于非法活动的新前沿，可以被用于网络钓鱼计划、恶意软件开发和漏洞利用开发。GhostGPT的主要特点快速处理：使攻击者能够快速生成恶意内容。无日志政策：声称不记录用户活动，吸引那些寻求匿名的人。
大数据和智能数据应用架构系列教程之：大数据与人工智能 AI天才研究院 AI实战大数据AI人工智能 Python实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术1.背景介绍概述“大数据”是指海量、高维、多样化的数据集合。随着人类对数据处理和管理的需求越来越复杂，越来越依赖机器学习、人工智能等新兴技术。在过去的一段时间里，越来越多的人开始关注到“大数据”这一颗龙头。如今，“大数据”已经成为一个新的名词，它既包含了大量的数据，也带来了巨大的价值。因此，研究、开发、应用“大数据”技术也逐渐成为各行各业的专业人才需求。在这个快速发展的
深度神经网络（DNN）详解古龙飞扬 dnn 人工智能神经网络
深度神经网络（DNN，DeepNeuralNetwork）是人工智能领域中的一种重要模型，它通过模拟人脑神经网络的结构和工作原理，实现了对复杂数据的处理和决策。以下是对深度神经网络（DNN）的超详细解析：一、DNN的基本概念DNN是一种具有多个隐藏层的神经网络模型，其核心在于其深度，即包含多个隐藏层。这些隐藏层通过非线性变换，使得模型能够捕捉到数据中的复杂关系和模式。DNN通常由输入层、隐藏层和输
探索GigaChat与LangChain的完美结合：深度解析与实战指南 asdfujhgy langchain easyui 前端 python
探索GigaChat与LangChain的完美结合：深度解析与实战指南引言在人工智能的领域中，语言模型和嵌入技术正逐步改变我们与数据交互的方式。GigaChat作为一种创新的AI嵌入服务，结合LangChain可以提供强大的文本嵌入功能，促进自然语言处理任务的完成。本篇文章将带你深入了解如何结合GigaChat与LangChain进行文本嵌入，并提供实用的代码示例与解决方案。主要内容GigaCha
人工智能学习框架：深入解析与实战指南一ge科研小菜鸡人工智能人工智能
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注引言随着人工智能（AI）技术的飞速发展，深度学习、强化学习和自然语言处理等领域的应用愈加广泛。掌握人工智能学习框架（如TensorFlow、PyTorch、Keras等）已成为开发智能系统、研究前沿技术的必备技能。本指南将全面介绍人工智能主流学习框架的特点、安装方法、核心功能，以及通过实践案例展示如何使用这些框架进行AI模型开发、训练与优化。1.
【前沿聚焦】机器学习的未来版图：从自动化到隐私保护的技术突破网罗开发人工智能 AI 大模型机器学习人工智能
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
AI人工智能深度学习算法：搭建可拓展的深度学习模型架构 AI天才研究院大数据AI人工智能 AI大模型企业级应用开发实战大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
AI人工智能深度学习算法：搭建可拓展的深度学习模型架构作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，深度学习作为其主要驱动力之一，已经在各个领域取得了显著的成果。然而，随着模型规模的不断扩大，如何高效地搭建、训练和部署深度学习模型，成为一个亟待解决的问题。传统的单机训练方式在计算资源有限的情况
LeetCode - #195 Swift 实现打印文件中的第十行网罗开发 Swift vue.js leetcode swift
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
# 第一章：认识chatgpt 出门喝奶茶 chatgpt chatgpt
chatgpt发展背景详细介绍一、基础理论背景人工智能和自然语言处理的兴起早期理论:20世纪中期，人工智能（AI）初见端倪，目标是模拟人类智能。自然语言处理作为AI的重要分支，致力于让机器理解和生成人类语言。关键里程碑:1980年代的统计方法和2000年代的神经网络技术，使NLP实现了从规则驱动到数据驱动的转变。神经网络与深度学习2010年代，深度学习的兴起极大推动了NLP的发展。基于大规模语料库
影视制作的未来：云渲染+虚拟制作+AI生成技术 LhcyyVSO AIGC 云渲染影视动画人工智能 3d 云渲染渲染农场 AI AICG 虚拟制作
在计算机技术和人工智能技术飞速发展的2024年，影视制作正在经历一场前所未有的变革。云渲染、虚拟制作和AI生成等新影视制作技术的结合，正在重新定义数字内容的创作流程，为影视产业带来了全新的可能性和机遇。这些前沿技术不仅提高了制作效率，还打开了无限的创作空间，有望引领未来的影视制作走向新的高峰。云渲染：加速创意实现影视的后期特效制作阶段需要大量的计算机参与渲染。传统的渲染过程耗时长且成本高，而云渲染
打造你的聊天助手：使用C#、OpenAI和Spectre.Console创建控制台ChatGPT客户端墨夶 C#学习资料1 c#chatgpt 开发语言
打造你的聊天助手：使用C#、OpenAI和Spectre.Console创建控制台ChatGPT客户端在这个人工智能飞速发展的时代，ChatGPT以其卓越的对话能力和智能回答在聊天领域引起了革命。你是否想过将这种能力融入到你的控制台应用中，让命令行界面也能拥有智能对话的体验？本文将带你一步步使用C#、OpenAI的API和Spectre.Console库，创建一个功能强大的控制台ChatGPT客户
软件测试中的AI-为什么它在软件自动化测试中很重要？测试界霄霄软件测试人工智能功能测试自动化测试软件测试程序人生职场和发展
通俗地说，人工智能（AI）是计算机科学的一个领域，它专注于使机器“智能化”。所谓智能，就是使系统能够像人类一样学习和做出决策。因此，人工智能机器将能够学习如何在特定情况下做出反应，然后根据其学习情况在未来场景中做出决策。人工智能（AI）在大多数领域的应用仍处于早期阶段，想要完美运行还需要很长时间。今天的人工智能（AI）技术可以帮助我们完成许多不需要复杂思考的重复性日常任务。接下来，让我们讨论软件测
在计算机上本地运行 Deepseek R1 itmanll linux
DownloadOllamaonLinuxDownloadOllamaonWindowsDownloadOllamaonmacOSDeepseekR1是一个强大的人工智能模型，在科技界掀起了波澜。它是一个开源语言模型，可以与GPT-4等大玩家展开竞争。但更重要的是，与其他一些模型不同，您可以在自己的计算机上本地运行DeepseekR1。linux步骤第1步：下载Ollama并安装curl-fsSL
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理