edward_zcl

Matlab2017中的CNN

转载自：https://blog.csdn.net/u014096352/article/details/72854077，写的还算不错。最近在倒腾Matconvnet工具包，正好看见新版Matlab的神经网络工具了，一并学习了，两者很相似。这里是matlab2017a，昨天去学校网上看，貌似matlab2018也出来了哈哈，真是日新月异。关于Matlab，CUDA，VS编译器，以及GPU配置可以查看我的上一篇博文。

1.前言

最近需要用到卷积神经网络(CNN)，在还没完全掌握cuda+caffe+TensorFlow+python这一套传统的深度学习的流程的时候，想到了matlab，自己查了一下documentation,还真的有深度学习的相关函数。所以给自己提个醒，在需要用到某个成熟的技术时先查一下matlab的帮助文档，这样会减少很多时间成本。记得机器学习的大牛Andrew NG.说过在硅谷好多人都是先用matlab/octava先实现自己的想法，再转化成其他语言。

2.配置需求

要像用matlab实现deep learning，需要更新到2017a版本。GPU加速的话，需要安装cuda8.0, 自己GPU 的compute capacity 要3.0 以上。

3. 可以完成的任务

我们看一下matlab的新加的深度学习功能可以完成哪些任务

1. 获取别人训练好的CNN网络
2. 迁移学习(transfer learning and fine-tune)
3. 解决分类问题(classifiy problem)
4. 解决回归问题(regression problem)
5. 物体检测(object detection)
6. 提取学习到的特征

3.1 获取别人训练好的网络

matlab2017中，可以用别人训练好的现成的网络，也可以输入caffe中的网络。目前已知的可以用的网络包括用于分类的：Alexnet, vgg16, vgg19。已经用于物体检测的，RCNN, FastRCNN, Faster RCNN。由于最近一直研究的是分类和回归问题，物体检测的CNN在过后补全。这里只举一个分类的例子。
Alexnet作为2012年ImageNet的冠军，它的提出确实影响到了CV的研究热点，人们惊奇的发现深度网络的描述能力居然这么强，虽然背后的数学原理一直没能得到完美的解决，但不妨碍它强大的能力，我们看看她在matlab中是如何做分类的。首先贴出代码：

clear;clc;close all;
%获取alexnet
net = alexnet;  
%读照片选物体
I= imread('peppers.png'); 
[cropedim, rect2]=imcrop(I);
cropedim=imresize(cropedim,[227 227]);
figure,imshow(cropedim);
% 用AlexNet分类 
label = classify(net, cropedim); 
% 显示结果
figure; 
imshow(I); 
rectangle('position',rect2,'EdgeColor','r','LineWidth',2);
text(10,20,char(label),'Color','white','FontSize',20);

用matlab自带的照片测试一下分类的准确率，得到的结果如下

bell pepper是甜椒的意思，我们发现效果还是不错的，感兴趣的同学可以多找几张测试图片试一下。用

net.Layers

命令可以看Alnexnet的网络结构，得到以下

这是一个25层的网络，每一层都对应着详细的说明。值得关注的是有5个卷积层(convolution layer)和三个全连接层(full connection layer)。其他的vgg16和vgg19是相同的道理，不过要看清楚网络的输入，使用vgg19时，需要改变上边代码中的两行

net = vgg19;
cropedim=imresize(cropedim,[224 224]);

剩下的部分是一样的。当然也可以从caffe中导入自己训练好的网络，自己还没有完全掌握caffe,熟悉这部分的同学可以自己实现一下。

3.2 迁移学习(transfer learning and fine-tune)

所谓迁移学习(transfer learning)就是微调(fine-tune)别人训练好的网络中的某些参数，使得它更适合自己的数据集。迁移学习使用的情况是:几百到几千个训练样本，想快速训练网络。网络的训练过程就是刚开始为各个参数赋予随机的值，采用数值的方法(一般是梯度下降法)求让cost function 达到最小值的各个参数的取值，这些参数主要产生于各个层之间连接时候的权值。Cost function是标定好的数据与通过网络计算出的数据的差的累加。Cost function越小说明网络的性能越好。我们看看matlab中是如何用现有的网络做迁移学习的，我们举一个手写体识别的例子，其中matlab自己提供了训练集和测试集。先贴出代码：

%% transfer learning
%读取训练集和测试集
digitDatasetPath = fullfile(matlabroot,'toolbox','nnet','nndemos', ...
    'nndatasets','DigitDataset');
digitData = imageDatastore(digitDatasetPath, ...
    'IncludeSubfolders',true,'LabelSource','foldernames');
[trainDigitData,testDigitData] = splitEachLabel(digitData,0.5,'randomize');
%显示前20个训练照片
numImages = numel(trainDigitData.Files);
idx = randperm(numImages,20);
for i = 1:20
    subplot(4,5,i)

    I = readimage(trainDigitData, idx(i));

    imshow(I)
end
% 获取matlab自己训练好的网络
load(fullfile(matlabroot,'examples','nnet','LettersClassificationNet.mat'))
% 改变输出层的类别个数
layersTransfer = net.Layers(1:end-3);
% 显示新的类别个数
numClasses =  numel(categories(trainDigitData.Labels));
% 把最后三层替换成新的类别
layers = [...
    layersTransfer
    fullyConnectedLayer(numClasses,'WeightLearnRateFactor',20,'BiasLearnRateFactor',20)
    softmaxLayer
    classificationLayer];
optionsTransfer = trainingOptions('sgdm',...
    'MaxEpochs',5,...
    'InitialLearnRate',0.0001,...
    'ExecutionEnvironment','cpu');
% 训练网络
netTransfer = trainNetwork(trainDigitData,layers,optionsTransfer);
% 显示测试准确率
YPred = classify(netTransfer,testDigitData);
YTest = testDigitData.Labels;
accuracy = sum(YPred==YTest)/numel(YTest);
% 显示测试结果
idx = 501:500:5000;
figure
for i = 1:numel(idx)
    subplot(3,3,i)

    I = readimage(testDigitData, idx(i));
    label = char(YTest(idx(i)));

    imshow(I)
    title(label)
end

代码的前边的部分是读取matlab中自带的数据集和测试集，把它保存成imageDatastore格式，这种格式只需要提供图片的路径信息而不用把图片全部读入内存中，因此非常适合大规模的数据集。中间部分是修改训练好的网络中的最后三层，原网络用来识别手写的字母和数字有36类，而现在的任务只需要识别手写体数字，所以把它们改成10类，在训练时使用0.0001的学习率，共计算5轮，用cpu做训练。代码的最后部分是测试新训练好的网络，因为transfer learn是在现有的网络基础上做参数的微调，所以训练速度很快，我们看一下训练效果。

由于是在cpu上做的训练，而且是transfer learning 所以训练的过程很快，我们发现重新训练好的网络能达到很高的准确率。我们再看gpu上的训练

由于参数的初始化是随机的，因此得到的结果也是随机的，不过可以看出gpu上做训练明显要快很多！GPU的第一轮计算慢是因为数据要重新初始化为gpu矩阵。最后放一张效果图：

我们发现识别的效果还是不错的。

3.3 分类问题(classification problem)

CNN之所以能引起广泛关注，就是在于它最初在图像分类方面取得很大的成功，后来人们发现对于其他的分类问题，CNN也有很好的性能。上边讲的迁移学习解决的也是一种分类问题，接下来的叙述也就建立在上文的基础上。
我们这里要解决的分类问题，就是训练自己的分类网络。之前的迁移学习已经说明，所谓训练就是为每层网络之间寻找使得cost function最小的权值，这些权值刚开始是按照某种分布随机初始化的，我们用数值的方法求cost function的最小值。一般来说，我们用神经网络建立的是一个非常复杂的模型，我们往往能难找到这个模型的最小值，但可以找到它的极小值(局部最小值)，这些极小值已经很接近我们要找到最小值。
要训练自己的网络，我们要先建立自己的网络，并设置一定的训练参数。我们看一下matlabs是如何完成的。
在matlab中用来建立网络的语句如下：

layers = [ ...
    imageInputLayer([imsize imsize 1])
    convolution2dLayer(5,150)
    reluLayer
    crossChannelNormalizationLayer(5,'Alpha',0.00005,'Beta',0.75,'K',1)  %Norm layer1        
    convolution2dLayer(3,300,'Stride',1,'BiasLearnRateFactor',2)         %Cov2 layer
    reluLayer
    fullyConnectedLayer(1)
    softmaxLayer
    classificationLayer];

直接用数组建立网络，这个例子是建立一个9层的分类网络，包括输入层，卷积层1，激活函数层1，标准化层，卷积层2，激活函数层2，全连接层，去最大值层，分类层。至于如何选择适合自己的网络结构，我目前还没有搞太清楚，不过，可以现在别人的网络基础上做修改。
用来设定修改参数的语句如下：

options = trainingOptions('sgdm', ...
    'MaxEpochs',15, ...
    'InitialLearnRate',1e-4, ...
    'MiniBatchSize',256,...
    'ExecutionEnvironment','gpu');
    'OutputFcn',functions);

这些参数是CNN网络的基本参数，MaxEpoch是计算的轮数，它的值越大越容易收敛，InitialLearRate是学习率，太大模型可能不会收敛，太小则收敛的太慢。MiniBatchSize是每次处理的数据的个数，ExcutionEnviroment是训练网络的环境，可以在CPU(‘cpu’)上做，也可在GPU(‘gpu’)上做，可以并行(‘paralle’)，默认的情况是先测试gpu，如果不可用在测试gpu。在matlab上用gpu训练网络时需要cuda8.0, 显卡计算能力为3.0。这些参数可以用指令gpuDevice来查看。OutputFcn是可以在训练过程中调用的某些函数。比如：它可以用来画cost function值的变化。如何像可视化训练表格（上文输出的那些）某些数据可以调用相应的函数，我在回归问题时会再说明。
设定好网络结构和训练参数后，可以用

net = trainNetwork(trainData,layers,options);

来训练自己的网络，训练数据可以是ImageDatastore类型，可以是4-D数组，四个维度分别是长度，宽度，通道数，第几个图片。因为4-D数组是一次性装入到内存中的，如果数据量太大时慎用，小心内存不足。同样，我们举一个完整的例子，也是利用matlab自带的数据集去分类手写体。代码如下：

%读取数据集并保存成imageDatastore形式
digitDatasetPath = fullfile(matlabroot,'toolbox','nnet','nndemos',...
    'nndatasets','DigitDataset');
digitData = imageDatastore(digitDatasetPath,...
        'IncludeSubfolders',true,'LabelSource','foldernames');
%随机显示二十个训练集中的图片
figure;
perm = randperm(10000,20);
for i = 1:20
    subplot(4,5,i);
    imshow(digitData.Files{perm(i)});
end
%把数据集划分成训练集和测试集
trainingNumFiles = 750;
rng(1) % For reproducibility
[trainDigitData,testDigitData] = splitEachLabel(digitData,...
                trainingNumFiles,'randomize');
%建立自己的网络
layers = [imageInputLayer([28 28 1]);
          convolution2dLayer(5,20);
          reluLayer();
          maxPooling2dLayer(2,'Stride',2);
          fullyConnectedLayer(10);
          softmaxLayer();
          classificationLayer()];
%设定训练参数
options = trainingOptions('sgdm','MaxEpochs',20,...
    'InitialLearnRate',0.0001);
%训练网络
convnet = trainNetwork(trainDigitData,layers,options);
%测试网络
YTest = classify(convnet,testDigitData);
TTest = testDigitData.Labels;
accuracy = sum(YTest == TTest)/numel(TTest);
disp(accuracy);

我自己的训练结果如下：

自己是在gpu上做的，所以时间较短，最后得到分类准确率发现还不错。

3.4 回归问题(regression problem)

回归问题与分类问题的处理方式相同，我们仍然需要训练集和测试集。在网路结构上有些不同，最后一次必须是Regression layer, 而倒数第二次必须是卷积层。回归问题的网络中的参数与分类问题是一样的，这里不再详细说明，我们直接分析一个例子，看一下matlab是如何做分类的。这个问题同时看一下function参数的作用。这次要解决的问题是，图片中的字母到底旋转了多少度。数据集同样来自matlab代码如下：

%读取数据集
[trainImages,~,trainAngles] = digitTrain4DArrayData;
%显示任意二十个结果
numTrainImages = size(trainImages,4);

figure
idx = randperm(numTrainImages,20);
for i = 1:numel(idx)
    subplot(4,5,i)

    imshow(trainImages(:,:,:,idx(i)))
    drawnow
end
%建立回归网络
layers = [ ...
    imageInputLayer([28 28 1])
    convolution2dLayer(12,25)
    reluLayer
    fullyConnectedLayer(1)
    regressionLayer];
%设置训练参数
functions={...
                @plotTrainingRMSE,...
                @(info)stopTrainingAtThreshold(info,0)};
options = trainingOptions('sgdm', ...
    'MaxEpochs',20, ...
    'InitialLearnRate',1e-3, ...
    'MiniBatchSize',128,...
    'ExecutionEnvironment','gpu',...
    'OutputFcn',functions);
%训练网络
net = trainNetwork(trainImages,trainAngles,layers,options);
%测试网络
[testImages,~,testAngles] = digitTest4DArrayData;
predictedTestAngles = predict(net,testImages);
%查看拟合误差
predictionError = testAngles - predictedTestAngles;
thr = 10;
numCorrect = sum(abs(predictionError) < thr);
numTestImages = size(testImages,4);
accuracy = numCorrect/numTestImages;
disp('accuracy');
disp(accuracy);
squares = predictionError.^2;
rmse = sqrt(mean(squares));
disp('the rmse');
disp(rmse);
%train function
function plotTrainingRMSE(info)

persistent plotObj

if info.State == "start"
    figure;
    plotObj = animatedline;
    xlabel("Iteration")
    ylabel("Training RMSE")
elseif info.State == "iteration"
    addpoints(plotObj,info.Iteration,double(info.TrainingRMSE))
    drawnow limitrate nocallbacks
end

end

function stop = stopTrainingAtThreshold(info,thr)

stop = false;
if info.State ~= "iteration"
    return
end

persistent TrainingRMSE

% Append accuracy for this iteration
T= info.TrainingRMSE;

% Evaluate mean of iteration accuracy and remove oldest entry

 stop = T

 
  得到的回归结果如下： 
  
   
    
   
  
 我们在训练过程中调用两个函数，plotTrainingRMSE是用来画cost function是如何变化的，(info)stopTrainingAtThreshold(info,0)是设置训练提前结束的条件的，可以根据表中的某些参数让训练在一定条件下停下来。最后，我们看一下cost function 的变换规律，如下： 
  
 
   
    
   
   
  目前为止，我们用cnn解决了最基本的分类问题和回归问题，此外，还介绍了如何建立网络和设定参数，后边将补充检测部分。 
  3.3 检测问题(Detection problem) 
  同样用matlab自带数据集做车辆检测，关于检测的网络有RCNN, Fast RCNN, Faster RCNN, 他们大同小异，差距在于速度的快慢，我们只测试Faster RCNN 
 1) 读取数据 
  data = load('fasterRCNNVehicleTrainingData.mat');
   
   
   
   
    
    
    
    1
   
   
   
    
  data是个结构体类型的数据，主要是用来四个属性分别是detector, layers, result, vehicleTraining. 
 其中，detector, layers, reault是提前训练好的检测子，网络和测试结果，我们用vehicleTraining重新训练CNN网络，用layers来设计网络结构 
 2) 抽取用于训练的图像 
  trainingData = data.vehicleTrainingData;
trainingData.imageFilename=fullfile(toolboxdir('vision'),'visiondata',...
trainingData.imageFilename);

   
   
   
    
  抽取出的trainingData是table格式的，matlab训练网络RCNN网络只能用table格式。 
  3) 读取网络结构 
  layers=data.layers;
   
   
   
    
  该网络是个11层的网络，训练时我们可以设计自己的网络结构，也可以在这个网络的基础上做训练。 
  4) 设置训练选项 
  options = trainingOptions('sgdm', ...
    'InitialLearnRate',1e-6,...
    'MaxEpochs',1,...
    'ExecutionEnvironment','gpu',...
    'CheckpointPath',tempdir);

   
   
   
    
  这里设置的是初始学习率为 1e-6, 迭代1轮，用GPU做训练，在训练时会把checkpoint的结果存下来。 
  5) 训练网络 
  detector = trainFasterRCNNObjectDetector(trainingData,layers,options);
   
   
   
    
  用trainingData做训练数据，训练layers网络，在训练过程中选择option中的训练参数，同样用了GPU做训练，其中的一步如下： 
  
   
    
   
   
  6) 结果检测 
  img=imread('highway.png');
[bbox,score,label]=detect(detector,img);
detectedImg=insertShape(img,'Rectangle',bbox);
figure,imshow(detectedImg);

   
   
   
   
    
    
    
    >
   
   
   
    
  从Matlab自身图库中选择hightway这张照片，用刚才训练出的网络监测里边的车辆，其中bbox是监测出的包围盒的坐标，这个可以用来返回。 
 这结果显示如下： 
   
   
    
   
   
  据说新版的matlab已经有自己独立的全新神经网络工具箱(相较于之前比较老的那些工具函数。。)了。完整功能好像是需要单独收费的。。
 参考matlab 运行 AlexNet：
 https://blog.csdn.net/hftytf/article/details/86631840

【精华推荐】AI大模型学习必逛的十大顶级网站大模型入门学习人工智能学习大模型入门 llama 大模型教程大模型学习大模型
随着人工智能技术的快速发展，AI大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。对于希望深入学习AI大模型的开发者和研究者来说，找到合适的学习资源至关重要。本文将为大家推荐十大必备网站，帮助你更好地理解和应用AI大模型。1.CourseraCoursera是一个在线学习平台，提供各类AI和机器学习课程，包括斯坦福大学的机器学习课程和深度学习专项课程。通过视频讲解
Milvus 数据批量导入实战：Python代码解析修破立生 Milvus milvus python 人工智能
1引言在处理大规模数据的存储和检索时，向量数据库逐渐成为一种热门的解决方案。Milvus作为一款高性能的向量数据库，在人工智能、机器学习等领域有着广泛的应用。本文将介绍如何使用Python代码将数据批量导入到Milvus数据库中，通过实际的代码示例来帮助大家理解导入过程和相关的技术要点。2代码功能概述我们的代码主要实现了从本地文件读取数据，并将其批量导入到Milvus数据库的功能。代码涉及到命令行
基于RK3588的AI摄像头应用解决方案浙江启扬智能科技有限公司 linux ARM 嵌入式开发嵌入式硬件
随着人工智能（AI）技术的快速发展，越来越多的视频监控系统开始直接在摄像头上部署AI分析，视频监控从早期的图像记录发展到如今具备AI运算能力和算法，可进行目标识别、行为分析以及事件反馈，实现从被动记录到主动预警的转变。目前有三种算力部署方式：AI分析部署在云端、AI分析部署在边缘、AI分析部署在摄像头，也就是我们常说的云，边，端。但越来越多的摄像头本身就集成了AI分析能力，这一趋势的出现存在多方面
AI江湖风云：GPT-4.5与Grok-3的巅峰对决广拓科技人工智能
在科技飞速发展的今天，人工智能领域的竞争可谓是一场没有硝烟的战争。各大科技巨头和新兴企业纷纷投入大量资源，力求在这个充满无限可能的领域中抢占先机。就在前不久，AI界发生了一件大事，OpenAI的明星产品GPT-4.5竟然被马斯克旗下xAI公司的Grok-3反超，这个消息犹如一颗重磅炸弹，瞬间在科技圈掀起了惊涛骇浪。大家纷纷猜测，这背后究竟隐藏着怎样的故事？Grok-3究竟凭什么能够后来居上，实现对
OLMo 7B：推动自然语言处理领域的技术革新单皎娥
OLMo7B：推动自然语言处理领域的技术革新OLMo-7B项目地址:https://gitcode.com/hf_mirrors/ai-gitcode/OLMo-7B引言随着人工智能技术的飞速发展，自然语言处理（NLP）领域取得了显著的进步。然而，在实际应用中，NLP技术仍然面临着诸多挑战，如语境理解、信息抽取、情感分析等。为了解决这些问题，艾伦人工智能研究所（AI2）推出了OLMo系列模型，其中
探索未来文本的无限可能：OLMo 开源语言模型深度解析钟洁祺
探索未来文本的无限可能：OLMo开源语言模型深度解析OLMoModeling,training,eval,andinferencecodeforOLMo项目地址:https://gitcode.com/gh_mirrors/ol/OLMo在人工智能的浩瀚领域中，一个崭新的星体正在升起——OLMo：OpenLanguageModel。由AI2（艾伦人工智能研究所）的科学家们精心打造，OLMo不仅仅是
手写数字识别项目：从原理到实践北屿升：微信新浪微博 facebook 微信公众平台百度
在当今数字化时代，手写数字识别作为模式识别和人工智能领域的重要应用，有着广泛的用途，如邮政信封上的邮编识别、银行支票上的数字处理等。本文将详细介绍手写数字识别项目的相关内容，包括原理、数据集、实现步骤和应用前景。一、手写数字识别原理手写数字识别主要依赖于模式识别和机器学习技术。其基本原理是将手写数字的图像转换为计算机能够处理的数字信号，然后通过特征提取和分类算法来判断该数字的具体值。常用的特征提取
Dolma:开源大规模语言模型预训练数据集与工具包 2401_87458718 语言模型人工智能自然语言处理
Dolma:开源大规模语言模型预训练数据集与工具包Dolma是由Allen人工智能研究所(AI2)开发的一个开源项目,旨在为大规模语言模型的预训练提供高质量的数据集和强大的数据处理工具。Dolma包含两个主要组成部分:Dolma数据集和Dolma工具包。Dolma数据集Dolma数据集是一个包含3万亿个token的开放数据集,涵盖了多样化的内容来源,包括网页内容、学术出版物、代码、书籍和百科全书材
BP神经网络计算过程：从数学原理到实践优化 Acd_713 BP神经网络神经网络人工智能深度学习
引言：神经网络的时代意义与BP算法地位在深度学习重构人工智能边界的今天（Goodfellowetal.,2016），误差反向传播（Backpropagation，BP）算法作为神经网络训练的基石，其数学优雅性和工程实用性完美统一。本文将深入剖析BP神经网络的计算本质，揭示其如何在非线性空间中构建认知通道。第1章神经网络拓扑结构的数学建模1.1生物神经元到M-P模型的抽象跃迁McCulloch-Pi
成为LLM大师的必读书籍：这几本大模型书籍，详细到让你一篇文章就收藏足够 AGI大模型老王产品经理大模型教程学习大模型人工智能 LLM 大模型书籍
以下是几本关于大模型和人工智能领域的经典书籍，它们各自具有独特的特点和适用人群：《深度学习》（DeepLearning）作者：伊恩·古德费洛（IanGoodfellow）、约书亚·本吉奥（YoshuaBengio）、亚伦·库维尔（AaronCourville）简介：《深度学习》是深度学习领域的经典之作，全面介绍了深度学习的基础知识、主要模型及其应用。书中详细讲解了神经网络、卷积神经网络、循环神经网
深度学习模型未来可能会在这些领域取得突破性进展 xinxiyinhe 人工智能深度学习人工智能深度学习模型深度学习
深度学习模型作为人工智能的核心技术之一，未来有望在多个领域取得突破性进展。以下是一些可能的方向：1.通用人工智能（AGI）目标：开发具有通用智能的模型，能够像人类一样处理多种任务。潜在突破：更强的推理和抽象能力，解决复杂问题。结合多模态数据（文本、图像、声音等）实现更全面的理解。自我学习和适应能力，减少对大量标注数据的依赖。2.医疗与生命科学目标：提升疾病诊断、药物研发和个性化治疗的水平。潜在突破
深度学习进阶：TensorFlow实战指南 ELSON麦香包
本文还有配套的精品资源，点击获取简介：《TensorFlow实战Google深度学习框架》详细指导读者学习TensorFlow，涵盖基础概念、数据流图、API使用、张量和变量操作，深度学习基础如CNN和RNN，以及自定义层和优化算法。书中还提供使用TensorFlow构建和训练深度学习模型的实例，包括AlexNet、VGG、ResNet以及LSTM和GRU，并通过图像分类和文本情感分析等实战案例，
TensorFlow.js - 使用 CNN(卷积神经网络) 识别手写数字宁静_致远_ 前端开发 javascript tensorflow cnn
目录index.htmldata.jsscript.js备注参考文献index.htmlTensorFlow.jsTutorialdata.js/***@license*Copyright2018GoogleLLC.AllRightsReserved.*LicensedundertheApacheLicense,Version2.0(the"License");*youmaynotusethisf
AI学习预备知识-数据操作（3）广播机制羞涩的小吉他人工智能学习
AI学习预备知识-数据操作（3）广播机制提示：本系列持续更新中文章目录AI学习预备知识-数据操作（3）广播机制前言广播机制总结前言随着开始人工智能的学习越来越多，那么再学习过程中，我们应该有一定的基础知识储备，本系列为基础知识储备介绍，在以往系列中我们提到了相同形状的张量按元素操作，那不同形状的张量操作就涉及到本文主要讲解AI学习储备知识–广播机制。广播机制提示：默认使用python，数据操作使用
AI与.NET技术实操系列胖头鱼不吃鱼- 人工智能 .net
引言在当今技术飞速发展的时代，人工智能（ArtificialIntelligence,AI）已成为推动创新和变革的核心力量。从智能助手到自动化决策系统，AI的应用无处不在，深刻影响着我们的生活和工作方式。对于软件开发者而言，掌握AI技术不仅意味着紧跟潮流，更是在竞争激烈的市场中保持优势的关键。作为微软的旗舰开发平台，.NET为开发者提供了丰富的工具和库，使他们能够轻松地将AI功能集成到应用程序中。
卷积神经网络应用-训练手写体数字数据集并展示识别精度 yeahamen 深度学习 python 机器学习卷积神经网络手写体数字识别
#卷积神经网络(CNN)训练手写体数据集importnumpyasnpimportmatplotlib.pyplotaspltimporttensorflow.kerasaskaimportdatetime#python3.X版本显示图片还需导入此库importpylabnp.random.seed(0)#定义加载数据集函数defload_data_npz(path):#np.load文件可以加载
深度学习实战：用TensorFlow构建高效CNN的完整指南芯作者 DD：日记深度学习
一、为什么每个开发者都要掌握CNN？在自动驾驶汽车识别路标的0.1秒里，在医疗AI诊断肺部CT片的精准分析中，甚至在手机相册自动分类宠物的日常场景里，卷积神经网络（CNN）正悄然改变着我们的世界。本文将以工业级实践标准，带您从零构建一个在CIFAR-10数据集上达到90%+准确率的CNN模型，深入解析TensorFlow2.x的最新特性，并揭秘模型优化的七大核心策略。[外链图片转存失败,源站可能有
Python从0到100（十八）：面向对象编程应用是Dream呀 python 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
机器学习笔记有涯小学生赵卫东机器学习笔记机器学习人工智能
1概述1.1简介机器学习（MachineLearning）是计算机科学的子领域，也是人工智能的一个分支和实现方式。“对于某类任务T和性能度量P，如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善，那么就称这个计算机程序在从经验E学习。”（汤姆·米切尔（TomMitchell），1997，MachineLearning）1.2机器学习、人工智能、数据挖掘从本质上看，数据科学的目标是通过处理各
FLOPS, FLOPs and MACs Aidanmomo 深度学习 pytorch python
FLOPS:FloatingPointOperationsPerSecond,每秒浮点运算次数，是一个衡量硬件速度的指标FLOPs:FloatingPointOperations,浮点运算次数，用来衡量模型计算复杂度，常用来做神经网络模型速度的间接衡量标准MACs:Multiply–AccumulateOperations,乘加累积操作数，常常被人们与FLOPs概念混淆实际上1MACs包含一个乘法
基于opencv答题卡识别判卷深度学习乐园深度学习实战项目 opencv 人工智能计算机视觉
项目源码获取方式见文章末尾！回复暗号：13，免费获取600多个深度学习项目资料，快来加入社群一起学习吧。**《------往期经典推荐------》**项目名称1.【基于DDPG算法的股票量化交易】2.【卫星图像道路检测DeepLabV3Plus模型】3.【GAN模型实现二次元头像生成】4.【CNN模型实现mnist手写数字识别】5.【fasterRCNN模型实现飞机类目标检测】6.【CNN-LS
机器学习—赵卫东阅读笔记（一）走在考研路上深度学习了解机器学习笔记人工智能
第一章：机器学习基础1.1.2机器学习主要流派1.符号主义2.贝叶斯分类——基础是贝叶斯定理3.联结主义——源于神经学，主要算法是神经网络。——BP算法：作为一种监督学习算法，训练神经网络时通过不断反馈当前网络计算结果与训练数据之间的误差来修正网络权重，使误差足够小。4.进化计算——通过迭代优化，找到最佳结果。——具有自组织、自适应、自学习的特性，能够有效处理传统优化算法难以解决的复杂问题（例如N
职坐标AIGC课程实战项目深度解析职坐标在线其他
内容概要在人工智能技术加速渗透各行业的背景下，职坐标IT培训体系中的AIGC课程以实战项目经验为核心，构建了从基础理论到产业落地的立体化培养框架。课程聚焦人工智能生成内容（AIGC）的核心技术链，涵盖自然语言处理、生成模型架构及多模态数据融合等模块，通过电商智能客服系统与新媒体文案生成工具两类典型场景的深度实践，强化学员对模型训练、参数调优及商业落地的综合能力。为适配行业需求，课程设计采用“三阶递
基于MATLAB/Simulink仿真可运行，光储联合微电网，光储微电网，光伏发电系统，光伏模块，MPPT qq924711725 matlab 开发语言
MATLAB/Simulink仿真可运行，光储联合微电网，光储微电网，光伏发电系统，光伏模块，MPPT（最大功率点跟踪控制），储能模块，蓄电池模块，蓄电池充放电控制（双向斩波，恒流，恒压，限压），恒定负载供电文章目录光伏发电系统与MPPT控制MPPT控制算法（例如P&O）蓄电池充放电控制MATLAB/Simulink模型1.光伏发电系统2.MPPT控制（P&O算法）3.蓄电池模块4.双向斩波器5.
从入门到精通：清华DeepSeek全六版使用手册，AI学习的超强攻略指南 2501_90771553 pdf
从入门到精通：清华DeepSeek全六版使用手册，AI学习超强攻略指南在人工智能飞速发展、应用日益广泛的今天，越来越多的人渴望踏入AI学习的领域，探索其中的奥秘。然而，AI知识体系庞大复杂，从基础概念到前沿技术，想要快速掌握并非易事。此时，拥有一套系统、全面且权威的学习指南就显得尤为重要。今天，我们就为大家带来清华DeepSeek全六版使用手册，堪称AI学习的超强攻略指南，助力你从入门小白成长为A
TensorFlow\Keras实战100例——BP\CNN神经网络~MINST手写数字识别 AI街潜水的八角 tensorflow 人工智能 python
一.原理说明BP神经网络是一种多层的前馈神经网络，其主要的特点是：信号是前向传播的，而误差是反向传播的。具体来说，对于如下的只含一个隐层的神经网络模型：BP神经网络的过程主要分为两个阶段，第一阶段是信号的前向传播，从输入层经过隐含层，最后到达输出层；第二阶段是误差的反向传播，从输出层到隐含层，最后到输入层，依次调节隐含层到输出层的权重和偏置，输入层到隐含层的权重和偏置。卷积神经网络（Convolu
智能驾驶：驶向未来的变革之路测试者家园人工智能质量效能智能驾驶人工智能质量效能机器人智能驾驶智能汽车无人汽车无人驾驶
在科技迅猛发展的今天，智能驾驶作为人工智能与交通运输深度融合的产物，正引领着汽车行业的革命性变革。从最初的驾驶辅助系统到如今的高度自动驾驶，智能驾驶技术的演进不仅改变了人们的出行方式，也对社会经济、法律法规等多个层面产生了深远影响。一、智能驾驶的技术演进与现状1.技术等级划分根据国际自动机工程师学会（SAE）的定义，自动驾驶技术被分为L0至L5六个等级：L0级：无自动化，完全由人类驾驶员控制。L1
深度学习揭秘：神经网络如何模拟人脑 shelly聊AI AI核心技术深度学习神经网络人工智能
大家好，我是Shelly，一个专注于输出AI工具和科技前沿内容的AI应用教练，体验过300+款以上的AI应用工具。关注科技及大模型领域对社会的影响10年+。关注我一起驾驭AI工具，拥抱AI时代的到来。AI工具集1：大厂AI工具【共23款】，一次性奉上，今天是百度和阿里AI工具集2：大厂AI工具【共12款】，一次性奉上，看看腾讯和字节的宝贝人工智能&AIGC术语100条Shelly聊AI-重磅发布一
Qt中的QDateTimeEdit控件与Matlab的使用方法冰雪之境 qt 数据库开发语言 Matlab
Qt中的QDateTimeEdit控件与Matlab的使用方法QDateTimeEdit是Qt框架中的一个日期和时间编辑控件，用于方便地选择和编辑日期和时间。本文将介绍如何在Qt中使用QDateTimeEdit控件，并提供相应的源代码示例。在Qt中使用QDateTimeEdit控件非常简单。首先，我们需要在Qt项目中包含QDateTimeEdit头文件：#include接下来，我们可以在UI界面中
DeepSeek vs Grok vs ChatGPT：大模型三强争霸，谁将引领AI未来？带上一无所知的我 chatgpt 人工智能 DeepSeek
DeepSeekvs.Grokvs.ChatGPT：大模型三强争霸，谁将引领AI未来？在人工智能领域，生成式模型的竞争已进入白热化阶段。DeepSeek、Grok和ChatGPT作为三大代表性工具，凭借独特的技术路径和应用优势，正在重塑行业格局。本文将从技术架构、核心功能、应用场景、性能成本等多维度展开深度对比，揭示其背后的竞争逻辑与未来趋势。一、技术架构：从知识图谱到通用智能的演进1.DeepS
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 (quickselect@163.com), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu