1000sprites

Caffe学习日记4

1. class Blob

解析：

（1）void FromProto(const BlobProto& proto, bool reshape = true);：反序列化函数，从BlobProto中恢复Blob对象。

（2）void ToProto(BlobProto* proto, bool write_diff = false) const;：序列化函数，将内存中的Blob对象保存到

BlobProto中。

（3）shared_ptr data_;：存放指向data的指针。

（4）shared_ptr diff_;：存放指向diff的指针。

（5）shared_ptr shape_data_;：存放指向shape_data_的指针。

（6）vector shape_;：形状信息。

（7）int count_;：存放有效元素数目信息。

（8）int capacity_;：存放Blob容器的容量信息。

（9）DISABLE_COPY_AND_ASSIGN(Blob);：禁用拷贝构造函数、赋值运算符重载。

说明：Caffe类中成员变量都带有后缀“_”，这样在函数实现中容易区分临时变量和类成员变量。

2. Caffe Model Zoo

解析：Caffe Model Zoo提供了一个分享模型的平台，世界各地的研究人员可以把自己的训练成果共享给社区中更多的

人使用，以节省人力和物力。

3. class SyncedMemory

解析：CPU/GPU共享内存类，该类负责存储分配以及主机和设备数据同步。

（1）enum SyncedHead { UNINITIALIZED, HEAD_AT_CPU, HEAD_AT_GPU, SYNCED };：状态机变量，表示4种状态：未初始化，CPU数据有效，GPU数据有效，已同步。

（2）void to_cpu();：数据同步至CPU。

（3）void to_gpu();：数据同步至GPU。

（4）void* cpu_ptr_;：位于CPU的数据指针。

（5）void* gpu_ptr_;：位于GPU的数据指针。

（6）size_t size_;：存储空间大小。

（7）SyncedHead head_;：状态机变量。

（8）bool own_cpu_data_;：标志是否拥有CPU数据所有权（否，即从别的对象）

（9）bool cpu_malloc_use_cuda_;：是否使用CUDA标记。

（10）bool own_gpu_data_;：标志是否拥有GPU数据所有权。

（11）int gpu_device_;：GPU设备号。

（12）CaffeMallocHost/CaffeFreeHost和malloc/free功能相同，即分配/释放内存/显存的函数。如果使用了GPU，则

在在GPU上分配和释放，否则在内存上分配和释放。

说明：通过将构造函数声明为explicit（显式）的方式可以抑制隐式转换。

4. #include

解析：

（1）CHAR_MIN：char最小值。

（2）SCHAR_MAX：signed char最大值。

（3）SCHAR_MIN：signed char最小值。

（4）UCHAR_MAX：unsigned char最大值。

（5）SHRT_MAX：short最大值。

（6）SHRT_MIN：short最小值。

（7）USHRT_MAX：unsigned short最大值。

（8）INT_MAX：int最大值。

（9）INT_MIN：int最小值。

（10）UINT_MAX：unsigned int最大值。

（11）UINT_MIN：unsigned int最小值。

（12）LONG_MAX：long最大值。

（13）LONG_MIN：long最小值。

（14）ULONG_MAX：unsigned long最大值。

（15）FLT_MANT_DIG：float类型的尾数。

（16）FLT_DIG：float类型的最少有效数字位数。

（17）FLT_MIN_10_EXP：float类型的负指数的最小值（以10为底）。

（18）FLT_MAX_10_EXP：float类型的正指数的最大值（以10为底）。

（19）FLT_MIN：float类型正数最小值。

（20）FLT_MAX：float类型正数最大值。

5. #ifndef与#pragma once异同

解析：为了避免同一个文件被include多次，C/C++中有两种方式，一种是#ifndef方式，一种是#pragma once方式。

#pragma once用来防止某个头文件被多次include，而#ifndef，#define，#endif用来防止某个宏被多次定义。

6. class Layer

解析：Layer是Caffe的基本计算单元，至少有一个输入Blob（Bottom Blob）和一个输出Blob（Top Blob），部分

Layer带有权值（Weight）和偏置项（Bias），有两个运算方向：前向传播（Forward）和反向传播（Backward），

其中前向传播计算会对输入Blob进行某种处理（有权值和偏置项的Layer会利用这些对输入进行处理），得到输出

Blob；而反向传播计算则对输出Blob的diff进行某种处理，得到输入Blob的diff（有权值和偏置项的Layer可能也会计算

权值Blob、偏置项Blob的diff）。

7. message LayerParameter

解析：

（1）repeated float loss_weight = 5;：为每个Top Blob分配对损失函数的权重，每个Layer都有默认值，要么为0，表

示不参与目标函数计算；要么为1，表示参与损失函数计算。

（2）repeated ParamSpec param = 6;：指定训练参数（例如相对全局学习常数的缩放因子，以及用户权值共享的名

称或其它设置）。

（3）repeated BlobProto blobs = 7;：承载了该层数值参数的Blob。

（4）repeated bool propagate_down = 11;：是否对Bottom Blob进行反向传播过程。该字段的维度应与Bottom Blob

个数一致。

8. layer_factory.hpp:81] Check failed: registry.count(type) == 1 (0 vs. 1) Unknown layer type: Input (known types: )

解析：添加头文件head.h，如下所示：

#include "caffe/common.hpp"  
#include "caffe/layers/input_layer.hpp"  
#include "caffe/layers/inner_product_layer.hpp"  
#include "caffe/layers/dropout_layer.hpp"  
#include "caffe/layers/conv_layer.hpp"  
#include "caffe/layers/relu_layer.hpp"  
#include "caffe/layers/pooling_layer.hpp"  
#include "caffe/layers/lrn_layer.hpp"  
#include "caffe/layers/softmax_layer.hpp"  
namespace caffe
{
	extern INSTANTIATE_CLASS(InputLayer);
	extern INSTANTIATE_CLASS(InnerProductLayer);
	extern INSTANTIATE_CLASS(DropoutLayer);
	extern INSTANTIATE_CLASS(ConvolutionLayer);
	REGISTER_LAYER_CLASS(Convolution);
	extern INSTANTIATE_CLASS(ReLULayer);
	REGISTER_LAYER_CLASS(ReLU);
	extern INSTANTIATE_CLASS(PoolingLayer);
	REGISTER_LAYER_CLASS(Pooling);
	extern INSTANTIATE_CLASS(LRNLayer);
	REGISTER_LAYER_CLASS(LRN);
	extern INSTANTIATE_CLASS(SoftmaxLayer);
	REGISTER_LAYER_CLASS(Softmax);
}

说明：Net在Caffe中代表一个完整的CNN模型，它包含若干Layer实例，看到的ProtoBuffer文本文件（prototxt）描述

的经典网络结构（LeNet，AlexNet），这些结构反映在Caffe代码实现上就是一个Net对象。Net中既包括Layer对象，

又包括Blob对象。其中，Blob对象用于存放每个Layer输入/输出中间结果，Layer则根据Net描述对指定的输入Blob进

行某些计算处理（卷积、下采样、全连接、非线性变换、计算代价函数等），输出结果放到指定的输出Blob中。输入

Blob和输出Blob可能为同一个。所有的Layer和Blob对象都用名字区别，同名的Blob表示同一个Blob对象，同名的

Layer表示同一个Layer对象，而Blob和Layer同名则不代表它们有任何直接关系。

9. message NetParameter

解析：

（1）optional bool force_backward = 5 [default = false];：网络是否强制每个层执行后向传播计算。如果设置为

false，那么是否执行后向传播计算由网络结构、学习速率自动确定。

（2）optional NetState state = 6;：网络的当前状态（包括phase、level和stage）。

（3）optional bool debug_info = 7 [default = false];：在运行Net::Forward、Net::Backward、Net::Update时是否打印

结果的调试信息。

（4）repeated LayerParameter layer = 100;：组成 Net的所有层，每个层配置都包括连接属性与行为，由

LayerParameter定义。

10. class Net

解析：

（1）layers_：记录Net prototxt中出现的每个Layer。

（2）layer_names：记录Net prototxt中出现的每个Layer的名称。

（3）layer_names_index_：记录Net prototxt中每个Layer名称与顺序索引的对应关系。

（4）layer_need_backward_：记录每个Layer是否需要反向传播过程。

（5）blobs_：记录Net中所有Blob。

（6）blob_names_：记录每个Blob名称。

（7）blob_names_index_：记录每个Blob名称与顺序索引的对应关系。

（8）blob_need_backward_：记录每个Blob是否需要反向传播过程。

（9）bottom_vecs_：blobs_的影子，记录每个Layer的输入Blob。

（10）bottom_id_vecs_：与bottom_vecs_关联，用于在blobs_中定位每个Layer的每个输入Blob。

（11）bottom_need_backward_：与bottom_vecs_关联，标志每个Blob是否需要反向传播过程。

（12）top_vecs_：blobs_的影子，记录每个Layer的输出Blob。

（13）top_id_vecs_：与top_vecs_关联，用于在blobs_中定位每个Layer的每个输出Blob。

（14）blob_loss_weights_：Net中每个Blob对损失函数的投票因子。一般损失层为1，其它层为0。

（15）net_input_blob_indices_：Net输入Blob在blobs_中的索引。

（16）net_output_blob_indices_：Net输出Blob在blobs_中的索引。

（17）net_input_blobs_：Net输入Blob。

（18）net_output_blobs_：Net输出Blob。

（19）params_：Net权值Blob，用于存储网络权值。

（20）param_display_names_：Net中权值Blob的名称。

（21）learnable_params_：Net中可训练的权值Blob。

（22）params_lr_：learnable_params_中每个元素的学习速率倍乘因子。

（23）has_params_lr_：标志learnable_params_中每个元素是否有学习速率倍乘因子。

（24）params_weight_decay_：learnable_params_中每个元素的权值衰减倍乘因子。

（25）has_params_decay_：标志learnable_params_中每个元素是否有权值衰减倍乘因子。

说明：以param开头的权值Blob和以blob开头的Layer输入/输出Blob，虽然都是Blob类型，但在网络中的地位截然不

同。权值Blob会随着学习过程而更新，归属于“模型”。Layer输入/输出Blob则只会随网络输入变化，归属于“数据”。

11. message DataParameter和TransformationParameter

解析：

（1）Caffe数据读取层（DataLayer）是Layer的派生类，除了读取LMDB、LEVELDB外，也可以从原始图像直接读

取（ImageDataLayer）。如下所示：

（2）Caffe的数据变换器（DataTransformer）主要提供了对原始输入图像的预处理方法，包括随机切块、随机镜

像、幅度缩放、去均值、灰度/色度变换等。

12. 深度学习模型参数组成

解析：

（1）可学习参数：又称训练参数、神经网络权系数、权重，其数值由模型初始化参数、误差反向传播过程控制，一

般不可人工干预。可学习参数在内存中使用Blob对象保持，必要时以二进制ProtoBuffer文件（*.caffemodel）形态序

列化并存储于磁盘上，便于进一步微调（finetune，又称精调）、共享（例如参数服务器Parameter Server，PS）、

性能评估（benchmark）。

（2）结构参数：包括卷积层/全连接层/下采样层数目、卷积核数目、卷积核大小等描述网络结构的参数，一旦设定

好，在网络训练阶段不能更改；值得注意的是，训练阶段网络结构参数和预测阶段网络结构参数很可能不同。结构参

数使用ProtoBuffer文本格式（*.prototxt）描述，网络初始化时通过该描述文件构建Net对象、Layer对象形成有向无环

图结构，在Layer与Layer之间、Net输入源和输出阱均为持有数据和中间结果的Blob对象。

（3）训练超参数：用来控制网络训练收敛的参数，训练阶段可以自动或手动调节以获得更好的效果，预测阶段不需

要该参数。训练超参数同样使用ProtoBuffer文本格式（*.prototxt）描述，训练阶段利用该描述文件构建求解器

（Solver）对象，该对象按照一定规则在训练网络时自动调节这些超参数值。

13. BVLC

解析：BVLC：Berkeley Vision and Learning Center。

14. Caffe前向传播

解析：在Caffe中CNN前向传播过程由Net+Layer组合完成，中间结果和最终结果则使用Blob承载。可以用

NetParameter对象或net.prototxt文件初始化Net构造函数，二者都调用了Init()函数，传递给该函数的参数param是

NetParameter对象，Init()函数完成了非常关键的网络初始化和层初始化操作。

15. Caffe反向传播

解析：CNN进行前向传播阶段，依次调用每个Layer的Forward函数，得到逐层的输出，最后一层与目标函数比较得到

损失函数，计算误差更新值，通过反向传播路径逐层到达第一层，所有权值层在反向传播结束后一起更新。损失层

（Loss Layer）是CNN的终点，接受两个Blob作为输入，其中一个为CNN的预测值，另一个是真实标签。Caffe中实

现了多种损失层，分别用于不同场合。其中，SoftmaxWithLossLayer实现了Softmax+交叉熵损失函数计算过程，适

用于单label的分类问题；另外还有欧式损失函数（用于回归问题）、Hinge损失函数（最大间隔分类，SVM）、

Sigmoid+交叉熵损失函数（用于多属性/多分类问题）等。

16. Caffe中的求解器

解析：

（1）随机梯度下降法（SGD）。

（2）AdaDelta。

（3）自适应梯度法（ADAGRAD）。

（4）Adam。

（5）Nesterov加速梯度法（NAG）。

（6）RMSprop。

17. extract_features.exe特征提取

解析：Caffe提供的使用工具extract_features.exe实现了特征提取功能，该程序需要一个训练好的网络和一个数据输

入层，运行后可得到相应数据通过网络某个中间层产生的特征图并保存到磁盘。

18. Caffe计算图像均值

解析：均值是所有训练样本的均值，减去之后再进行训练会提高其速度和精度。如下所示：

compute_image_mean.exe examples/mnist/mnist_train_lmdb examples/mnist/mean.binaryproto

说明：mean_binaryproto是生成的二进制均值文件。

19. Train和Test损失曲线

解析：

（1）train loss不断下降，test loss不断下降，说明网络仍然在学习。

（2）train loss不断下降，test loss趋于不变，说明网络过拟合。

（3）train loss趋于不变，test loss趋于不变，说明学习遇到瓶颈，需减小学习速率或批量数据尺寸。

（4）train loss趋于不变，test loss不断下降，说明数据集100%有问题。

（5）train loss不断上升，test loss不断上升（最终变为NaN），可能是网络结构设计不当、训练超参数设置不当、程

序bug等某个问题引起的，需要进一步定位。

20. Netscope [3][4]

解析：Netscope是个支持Caffe的神经网络结构在线可视化工具。

21. Caffe中的Blob [5]

解析：图像本身（多张图像）是一个Blob实例，卷积层的输入（多个feature maps）是一个Blob实例，卷积层的输出

（多个feature maps）是一个Blob实例，卷积操作中的卷积核（多个滤波器）是一个Blob实例。

22. Windows安装Faster RCNN（Python）[6][7][8][9]

解析：坑多。Check failed: registry.count(type) == 1 (0 vs. 1) Unknown layer type: ROIPooling.

23. 用BVLC CaffeNet Model模型进行图像分类

解析：

D:\caffe-master\Build\x64\Release\classification.exe \  #二进制程序名
D:\caffe-master\models\bvlc_reference_caffenet\deploy.prototxt \  #模型描述文件
D:\caffe-master\models\bvlc_reference_caffenet\bvlc_reference_caffenet.caffemodel \  #*.caffemodel模型权值文件
D:\caffe-master\data\ilsvrc12\imagenet_mean.binaryproto \  #图像均值文件
D:\caffe-master\data\ilsvrc12\synset_words.txt \  #图像类别标签信息
D:\caffe-master\examples\images\cat.jpg  #输入待分类图像

命令行输出的预测结果，如下所示：

---------- Prediction for D:\caffe-master\examples\images\cat.jpg ----------
0.3134 - "n02123045 tabby, tabby cat"
0.2380 - "n02123159 tiger cat"
0.1235 - "n02124075 Egyptian cat"
0.1003 - "n02119022 red fox, Vulpes vulpes"
0.0715 - "n02127052 lynx, catamount"

上述给出了5个预测结果，按照概率分布从高到低的顺序排列，这种预测结果称为Top-5预测结果，对当前样本而言，

分类正确率为5项之和。除了Top-5预测结果外，还有Top-3、Top-1等预测结果。

参考文献：

[1] Caffe Model Zoo：http://caffe.berkeleyvision.org/model_zoo.html

[2] caffe源码阅读(2)-Layer：http://www.cnblogs.com/korbin/p/5608878.html

[3] Netscope：http://ethereon.github.io/netscope/#/editor

[4] Caffe神经网络模型结构可视化：http://blog.csdn.net/solomon1558/article/details/53144606

[5] Caffe基本数据结构Blob：http://www.cnblogs.com/zjutzz/p/5960289.html

[6] windows下跑python版subcnn和faster rcnn：http://blog.csdn.net/chenzhi1992/article/details/52618386

[7] Solutions to caffe-layer creation failure：http://m.blog.csdn.net/article/details?id=50499948

[8] caffe中增加triplet loss layer的实现：http://blog.csdn.net/tangwei2014/article/details/46812153

[9] Windows下编译fast rcnn：http://blog.csdn.net/lien0906/article/details/47007319#reply

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
深度学习-13-小语言模型之SmolLM的使用皮皮冰燃深度学习深度学习
文章附录1SmolLM概述1.1SmolLM简介1.2下载模型2运行2.1在CPU/GPU/多GPU上运行模型2.2使用torch.bfloat162.3通过位和字节的量化版本3应用示例4问题及解决4.1attention_mask和pad_token_id报错4.2max_new_tokens=205参考附录1SmolLM概述1.1SmolLM简介SmolLM是一系列尖端小型语言模型，提供三种规
基于深度学习的农作物病害检测 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的农作物病害检测利用卷积神经网络（CNN）、生成对抗网络（GAN）、Transformer等深度学习技术，自动识别和分类农作物的病害，帮助农业工作者提高作物管理效率、减少损失。1.农作物病害检测的挑战病害种类繁多：农作物病害的类型多样，不同病害在同一作物上的表现差异很大，同时同一种病害在不同生长阶段的症状也可能不同。环境影响：天气、光照、湿度等外部环境因素会影响农作物的表现，使得病害检
基于深度学习的文本引导的图像编辑 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的文本引导的图像编辑（Text-GuidedImageEditing）是一种通过自然语言文本指令对图像进行编辑或修改的技术。它结合了图像生成和自然语言处理（NLP）的最新进展，使用户能够通过描述性文本对图像内容进行精确的调整和操控。1.文本引导的图像编辑的挑战文本和图像之间的对齐：如何将文本中的语义信息准确地映射到图像中的特定区域或元素是一个关键挑战。这涉及到多模态数据的对齐和理解。编
深度学习--对抗生成网络（GAN, Generative Adversarial Network） Ambition_LAO 深度学习生成对抗网络
对抗生成网络（GAN,GenerativeAdversarialNetwork）是一种深度学习模型，由IanGoodfellow等人在2014年提出。GAN主要用于生成数据，通过两个神经网络相互对抗，来生成以假乱真的新数据。以下是对GAN的详细阐述，包括其概念、作用、核心要点、实现过程、代码实现和适用场景。1.概念GAN由两个神经网络组成：生成器（Generator）和判别器（Discrimina
深度学习：怎么看pth文件的参数奥利给少年深度学习人工智能
.pth文件是PyTorch模型的权重文件，它通常包含了训练好的模型的参数。要查看或使用这个文件，你可以按照以下步骤操作：1.确保你有模型的定义你需要有创建这个.pth文件时所用的模型的代码。这意味着你需要有模型的类定义和架构。2.加载模型权重使用PyTorch的load_state_dict方法来加载权重。这里是如何操作的：importtorchimporttorch.nnasnn#定义模型结构
chatgpt赋能python：如何在Python中安装Keras库？ turensu ChatGpt python chatgpt keras 计算机
如何在Python中安装Keras库？Keras是一个简单易用的神经网络库，由FrançoisChollet编写。它在Python编程语言中实现了深度学习的功能，可以使您更轻松地构建和试验不同类型的神经网络。如果您是一名Python开发人员，肯定会想知道如何在您的Python项目中安装Keras库。在本文中，我们将向您展示如何安装和配置Keras库。步骤1：安装Python要使用Keras库，您需
如何理解深度学习的训练过程奋斗的草莓熊深度学习人工智能 python scikit-learn virtualenv numpy pandas
文章目录1.训练是干什么？2.预训练模型进行训练，主要更改的是预训练模型的什么东西？1.训练是干什么？以yolov5为例子，训练的目的是把一组输入猫狗图像放到神经网络中，得到一个输出模型，这个模型下次可以直接用来识别哪个是猫，哪个是狗2.预训练模型进行训练，主要更改的是预训练模型的什么东西？超参数（Hyperparameters）：这是模型结构中定义的参数，比如：卷积核大小（kernel_size
Keras深度学习框架入门及实战指南司莹嫣Maude
Keras深度学习框架入门及实战指南keraskeras-team/keras:是一个基于Python的深度学习库，它没有使用数据库。适合用于深度学习任务的开发和实现，特别是对于需要使用Python深度学习库的场景。特点是深度学习库、Python、无数据库。项目地址:https://gitcode.com/gh_mirrors/ke/keras一、项目介绍Keras简介Keras是一款高级神经网络
深度学习驱动的车牌识别：技术演进与未来挑战逼子歌深度学习车牌识别神经网络字符识别 YOLO 卷积神经网络
一、引言1.1研究背景在当今社会，智能交通系统的发展日益重要，而车牌识别作为其关键组成部分，发挥着至关重要的作用。车牌识别技术广泛应用于交通管理、停车场管理、安防监控等领域。在交通管理中，它可以用于车辆识别、交通违法监控和车流统计等，提高交通管理的效率和准确性。在停车场管理中，实现车辆的自动识别和收费，提升管理和服务水平。在安防监控领域，可用于追踪嫌疑人及犯罪行为。深度学习的出现为车牌识别带来了重
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
什么是AIGC？有哪些免费工具？ chent_某位 AIGC
AIGC（AIGeneratedContent），即“人工智能生成内容”，是指通过人工智能技术自动生成各种类型的数字内容。AIGC让机器能够根据输入的信息或数据生成符合人类需求的文本、图像、音频、视频等内容，极大提高了内容创作的效率。AIGC的背景与起源随着深度学习和自然语言处理技术的快速发展，人工智能已经不再局限于简单的任务，如分类、预测和数据分析，而是具备了生成内容的能力。生成式AI模型，如O
transformer架构(Transformer Architecture)原理与代码实战案例讲解 AI架构设计之禅大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
transformer架构(TransformerArchitecture)原理与代码实战案例讲解关键词：Transformer,自注意力机制,编码器-解码器,预训练,微调,NLP,机器翻译作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来自然语言处理（NLP）领域的发展经历了从规则驱动到统计驱动再到深度学习驱动的三个阶段。
如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
【深度学习】【OnnxRuntime】【Python】模型转化、环境搭建以及模型部署的详细教程牙牙要健康深度学习 onnx onnxruntime 深度学习 python 人工智能
【深度学习】【OnnxRuntime】【Python】模型转化、环境搭建以及模型部署的详细教程提示:博主取舍了很多大佬的博文并亲测有效,分享笔记邀大家共同学习讨论文章目录【深度学习】【OnnxRuntime】【Python】模型转化、环境搭建以及模型部署的详细教程前言模型转换--pytorch转onnxWindows平台搭建依赖环境onnxruntime调用onnx模型ONNXRuntime推理核
基于深度学习的多模态信息检索 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的多模态信息检索（MultimodalInformationRetrieval,MMIR）是指利用深度学习技术，从包含多种模态（如文本、图像、视频、音频等）的数据集中检索出满足用户查询意图的相关信息。这种方法不仅可以处理单一模态的数据，还可以在多种模态之间建立关联，从而更准确地满足用户需求。1.多模态信息检索的挑战异构数据表示：多模态数据通常具有不同的特征和表示形式（如文本的词嵌入与图
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name

Caffe学习日记4

你可能感兴趣的:(深度学习)