shuzfan

mxnet学习记录【1】

由于caffe依赖性太多，配置极其复杂，所以将接下来的学习转向mxnet.因此本文主要记录我的学习历程，如果描述有什么问题，欢迎大家的指正。

mxnet的优点很明显，简洁灵活效率高，多机多卡支持好。

mxnet的github下载链接：https://github.com/dmlc/mxnet/

mxnet的开发文档链接：http://mxnet.readthedocs.org/en/latest/build.html

开发文档清晰易读，包含安装、语法、示例等，并且还在不断丰富当中

1- linux下安装mxnet和python接口配置

mxnet可以安装到linux、OSX和windows下。由于windows下配置相对较为复杂，故这里选择安装在linux下。具体我的linux版本为64位的ubuntu14.04LTS，之前使用ubuntu15时发现不是很稳定。还有，这里我是在笔记本上安装的，因此没有安装CUDA、CUDNN之类的GPU管理程序。

mxnet支持在线安装，在终端中单步依次执行以下代码：

sudo apt-get update
sudo apt-get install -y build-essential git libatlas-base-dev libopencv-dev
git clone --recursive https://github.com/dmlc/mxnet
cd mxnet; make -j4

python接口的配置:
mxnet目前主要支持python、R和Julia这3种接口。我选择了相对熟悉的python。
mxnet要求2.7及以上版本的python和numpy库，一般linux都自带python编译器，因此我们只需要再检查一下是否缺少numpy库。可以直接输入下面的numpy安装代码：

sudo apt-get install python-numpy

上面处理完成之后可以尝试一下能否运行官方提供的一个案例：在mnist数据集上训练一个多层感知器MLP。

python mxnet/example/image-classification/train_mnist.py

如果之前配置过GPU(如何配置可以参考官方文档)，可以尝试用GPU测试一下网络：

python mxnet/example/image-classification/train_mnist.py --network lenet --gpus 0

注意：上述过程完成后，直接在python中执行以下代码(如 import mxnet as mx)可能会提示“no module named ”,这可能是因为未添加路径导致的。可以通过单步依次执行下面代码解决：

// ~表示我的mxnet安装在home下面
export PYTHONPATH=~/mxnet/python
cp -r ~/mxnet/python/mxnet .
cp ~/mxnet/lib/libmxnet.so mxnet/

2- 如何将训练图片转换格式并送入网络

就好像在caffe中训练模型之前要现将训练图片转化为leveldb或者LMDB格式数据一样，mxnet在训练之前也要先将图片转化为REC格式的数据。

这里直接记录转换过程，后续会详细讲解REC数据格式的编码以及最终如何将REC格式数据再加载到网络当中。

linux下转换使用的工具是mxnet/bin下名为“im2rec”的可执行文件，该文件的源码可以查看mxnet/tools/im2rec.cc

首先，来说明以下im2rec这个转换工具有哪些输入参数：

首先是必须输入的3个参数，依次是

image_lst:  //保存图片和标签信息的文本的名字

image_root_dir：//图片的存放路径

output_rec：//转换后的.rec格式文件的存放路径

可选的输入参数有：


label_width://标签个数，默认为1，即每个图片只有一个标签

resize: //默认为-1，即不调整图片尺寸。否则将图片的较短边的长度调整为resize大小，另一边按比例调整
    %%例如图片尺寸为300*200，resize=100,那么调整之后图片尺寸为150*100.

quality： //JPEG编码质量，默认为80。输入范围为1-100.（mxnet转换数据时是编码存储的）

center_crop： //默认为0，if(center_crop)，则将图片以中心裁剪为正方形。注意：只有if(resize>0)成立时，该参数才有效。

nsplit：//默认为1，用于将部分图片进行转换，按照位置将image_lst中的图片分成nsplit个part
    %%注意，这里只是大概平分，例如12个训练图片，nsplit=3，实际分块为5+4+3，而不是预想中的4+4+4.（关于这一点我也还没搞明白）

part： //默认为0，用于将部分图片进行转换。和nsplit结合使用，可以只转换nsplit中的第part个分块

这里举一个实际应用的例子
（1）首先是保存图片和标签信息的文本，这里我的文件是train.txt.

编号 标签 图片名
1 0 FY2D1.bmp
2 1 FY2E1.bmp
3 0 FY2D2.bmp
4 1 FY2E2.bmp

（2）为了方便运行和调整参数，这里写了一个类似于windows批处理命令一样的可执行文件，来调用im2rec。这里我的可执行文件名为convert.sh，训练图片存储于data文件夹，转换后的结果保存到当前文件夹下，命名为train.rec

#!/bin/sh
/home/zfan/mxnet/bin/im2rec train.txt data/ train.rec quality=90 resize=1000

（3）打开终端，cd到convert.sh所在文件夹，输入 ./convert.sh 回车。运行提示如下：

[15:44:19] tools/im2rec.cc:54: New Image Size: Short Edge 1000
[15:44:19] tools/im2rec.cc:76: Write to output: train.rec
[15:44:19] tools/im2rec.cc:78: Output: train.rec
[15:44:19] tools/im2rec.cc:86: JPEG encoding quality: 90
[15:44:19] tools/im2rec.cc:160: Total: 4 images processed, 0.166033 sec elapsed

迭代器-将转换后的数据送入网络:

总体来说，开始一项训练，需要3个部分：训练参数、网络模型和训练数据。在上一小节，我已经详细介绍了如何将原始图片数据转化为mxnet可以接受的REC格式数据。但是，实际训练的时候我们还需要一个工具来将REC数据送入我们的训练网络中。这个工具就是“迭代器”-iterator

mxnet为我们提供了快速构建迭代器的函数ImageRecordIter，该函数位于python/mxnet/io.py中，其返回一个迭代器对象。或者可以在python命令窗中键入以下命令来获取io函数的位置以及说明：

import mxnet as mx
help(mx.io)
#或者输入help(mx.io.ImageRecordIter)来直接查看迭代器的参数说明

接下来说明ImageRecordIter的几个常用参数：（更多的参数可以通过上面的help查看）


path_imgrec：rec图像数据的存储路径；string型数据；默认为'./data/imgrec.rec'

data_shape：迭代器产生的每一个实例的形状，即图片数据的形状；元组型数据；必选参数

mean_img：图像均值文件的存放路径；string型数据；默认为空

batch_size：batch的大小；int型数据；必选参数

shuffle：是否打乱数据；布尔型数据；默认为False;

mirror：是否对图片执行镜像操作；布尔型数据；默认为False;

rand_mirror：是否随机地对图片执行镜像操作；布尔型数据；默认为False;

rand_crop：是否随机地对图片执行剪切操作；布尔型数据；默认为False;

label_width：图片的标签个数；int型数据；默认为1

mean_r、 mean_g、 mean_b:3个颜色通道的均值；float型数据；默认为0

num_parts：将训练数据分为几份；int型数据；默认为1

part_index:第几部分数据将会被读取；int型数据；默认为0

接下来以实例来说明怎样构建迭代器，该例子位于example/image-classification/train_imagenet.py中

#分别为训练数据和验证数据各构建一个迭代器
def get_iterator(args, kv):
    train = mx.io.ImageRecordIter(
        path_imgrec = args.data_dir + "train.rec",
        mean_img    = args.data_dir + "mean.bin",
        data_shape  = data_shape,
        batch_size  = args.batch_size,
        rand_crop   = True,
        rand_mirror = True,
        num_parts   = kv.num_workers,
        part_index  = kv.rank)
    val = mx.io.ImageRecordIter(
        path_imgrec = args.data_dir + "val.rec",
        mean_img    = args.data_dir + "mean.bin",
        rand_crop   = False,
        rand_mirror = False,
        data_shape  = data_shape,
        batch_size  = args.batch_size,
        num_parts   = kv.num_workers,
        part_index  = kv.rank)
    return (train, val)

3- 构建一个网络模型

一个网络模型是一层一层连接器来的，因此想要构建一个网络模型，首先我们得知道mxnet中都有哪些可以用的层。(以下按照使用频率来排序)
下面介绍一些比较常用的层，更多的层大家可以在python命令窗执行以下代码来查询

import mxnet as mx
help(mx.symbol)

(1)Activation：激活函数

   data: 输入数据，symbol型变量
   act_type: {'relu', 'sigmoid', 'tanh'}, 可选的3种激活函数

(2)Convolution:卷积层

data:输入数据，symbol型变量
weight：权重矩阵，symbol型变量
bias:偏置，symbol型变量
kernal:卷积核的尺寸（y,x）,二维tuple型变量
stride：卷积步长（y,x）,二维tuple型变量，默认为（1,1）
pad：卷积的填补量（y,x）,二维tuple型变量，默认为（0,0）
num_filter ：卷积滤波器(通道)个数，int型变量
no_bias ：是否取消偏置，布尔型变量，默认为False
num_group：groups划分的个数，int型变量，默认为1.该选项不被CUDNN所支持， you can use SliceChannel to num_group,apply convolution and concat instead to achieve the same need.
workspace：卷积的Tmp工作空间的大小MB。long型变量，默认为512

(3)Deconvolution：反卷积层

参数同卷积层一致

(4)Dropout：

data:输入数据，symbol型变量
p : 训练时对输入数据进行dropped out的比例，float型变量，默认为0.5

(5)Flatten:将N维数据变为1维

data:输入数据，symbol型变量
name : string, optional. Name of the resulting symbol.

(6)FullyConnected：全连接层

data:输入数据，symbol型变量
weight：权重矩阵，symbol型变量
bias:偏置，symbol型变量
no_bias ：是否取消偏置，布尔型变量，默认为False
num_hidden：输出隐藏节点的个数，int型变量

(7)LRN：

data:输入数据，symbol型变量
alpha : float, optional, default=0.0001.value of the alpha variance scaling parameter in the normalization formula
beta : float, optional, default=0.75.value of the beta power parameter in the normalization formula
knorm : float, optional, default=2.value of the k parameter in normalization formula
nsize : int (non-negative), required.normalization window width in elements.

(8)Pooling

data:输入数据，symbol型变量
kernal:pooling核的尺寸（y,x）,二维tuple型变量
stride：pooling步长（y,x）,二维tuple型变量，默认为（1,1）
pad：pooling的填补量（y,x）,二维tuple型变量，默认为（0,0）
pool_type : pooling的类型，可选的3种{'avg', 'max', 'sum'}

(9)SoftmaxOutput：使用logloss进行BP

data:输入数据，symbol型变量
grad_scale : 为梯度乘以一个比例系数，float型变量，默认为1
multi_output : 布尔型变量，默认为False
    # If set to true, for a (n,k,x_1,..,x_n) dimensionalinput tensor, softmax will generate n*x_1*...*x_n output, eachhas k classes

(10)Variable：定义一个symbol型变量

name : 变量的名字，str型变量
attr : dict of string -> string.Additional attributes to set on the variable.

mxnet/example/image-classification文件夹下以symbol开头的几个.py文件都是定义好的网络模型。我们可以任意打开一个来具体了解一下如何构建一个网络。
有一点需要注意的是：mxnet中通常要在卷积层和全连接层之间价加一个Flatten层用于衔接

4- 开始训练

首先，来总结一下我们现在都有了什么：保存网络模型的.py文件、REC格式的训练数据、将数据送入网络的迭代器。
在此基础上，我们缺少的就只剩下网络训练的一些控制参数：如学习率、训练日志、GPU选择等等。
在初期，我们往往可以先快速的拿来用，而不用在意其细节。那么，最简单的办法就是直接修改套用mxnet中的示例。示例主要集中在/example/image-classification和/tests/python当中。下面就简单的介绍如何快速开始训练：
（1）新建一个文件夹，将/example/image-classification文件夹下find_mxnet.py、symbol_alexnet.py、train_imagenet.py和train_model.py这4个文件copy进来；
（2）保持find_mxnet.py文件不变，在symbol_alexnet.py中按照里面Alexnet网络的构建方法来建立自己的网络。最后最好再把文件名改为自己的网络名，如mynet.py;
（3）将train_imagenet.py最好也修改一下名字，如改为train_xx.py.将第40行代码中的’symbol’删除，否则你的网络文件就必须以‘symbol’开始命名，如symbol_mynet.py.

net = importlib.import_module('symbol_' + args.network).get_symbol(args.num_classes)
改为：
net = importlib.import_module(args.network).get_symbol(args.num_classes)

剩下的就是要在parser.add_argument中修改默认值了，否则你在调用mynet.py就必须准确的指定每一个参数。
（4）写一个脚本文件，运行脚本文件就可以开始训练了。如

python train_xx.py --data-dir=xx --model-prefix==xx --gpus=0
# 如果想要在每次epoch结束时保存一个模型，那么model-prefix就不能为空

未完待续

Datawhale X 魔塔 Ai夏令营 --深度学习基础
一、局部极小值与全局极小值全局极小值：在损失函数的整个定义域内，损失值最小的点。这是我们在训练深度学习模型时希望找到的点，因为它代表着模型的最佳性能。局部极小值：在损失函数的一个局部区域内，损失值达到最小，但在整个函数定义域内可能不是最小的。当优化算法陷入局部极小值时，它可能会误以为已经找到了全局最优解，从而停止搜索。局部极小值的检测两种直观的方法来检测局部极小值：可视化方法：对于低维问题，我们可
【深度学习基础】PyTorch中model.eval()与with torch.no_grad()以及detach的区别与联系？
目录1.核心功能对比2.使用场景对比3.区别与联系4.典型代码示例(1)模型评估阶段(2)GAN训练中的判别器更新(3)提取中间特征5.关键区别总结6.常见问题与解决方案(1)问题：推理阶段显存爆掉(2)问题：Dropout/BatchNorm行为异常(3)问题：中间张量意外参与梯度计算7.最佳实践8.总结以下是PyTorch中model.eval()、withtorch.no_grad()和.d
深度学习基础与应用：从理论到实战创新工场
本文还有配套的精品资源，点击获取简介：深度学习是人工智能的核心分支，通过模拟人脑神经网络处理大量数据以执行复杂任务。Python因其简洁性和强大的库支持成为深度学习研究的首选语言。本文概述了深度学习基础概念、核心算法、Python框架，并假设了一个包含教程、示例代码、数据集、交互式学习环境、性能评估指标和进阶主题的“deep-learning-study-main”压缩包内容，旨在帮助学习者深入理
深度学习基础2 TY-2025 深度学习深度学习人工智能
5.张量索引操作（1）索引操作行列索引列表索引print(data[[0,2],[1,2]])#返回(0,1)，(2,2)两个位置的元素print(data[[[0],[1]],[1,2]])#返回0，1行的1，2列共4个元素范围索引print(data[:3,:2])#前3行前2列数据print(data[2:,:2])#第2行到最后的前2列数据布尔索引tensor([[0,7,6,5,9],[
阅读笔记(2) 单层网络:回归 a2507283885 笔记
阅读笔记(2)单层网络:回归该笔记是DataWhale组队学习计划（共度AI新圣经：深度学习基础与概念）的Task02以下内容为个人理解，可能存在不准确或疏漏之处，请以教材为主。1.从泛函视角来看线性回归还记得线性代数里学过的“基”这个概念吗？一组基向量是一组线性无关的向量，它们通过线性组合可以张成一个向量空间。也就是说，这个空间里的任意一个向量，都可以表示成这组基的线性组合。函数其实也可以看作是
基于通义大模型的智能客服系统构建实战：从模型微调到API部署大熊计算机开发实战语言模型人工智能
1引言本文将深入探讨基于通义大模型的智能客服系统构建全流程，从数据准备、模型微调、性能优化到API部署和系统集成。不同于理论概述，本文将通过实战案例、代码演示和性能数据对比，展示每个环节的技术细节与工程实践。文章面向具备Python和深度学习基础的开发者，重点解决以下核心问题：如何针对客服场景准备和优化训练数据？如何高效微调通义大模型以适配特定业务需求？如何解决大模型部署中的延迟和并发挑战？如何构
TensorFlow：深度学习基础设施的架构哲学与工程实践革新双囍菜菜 AI 深度学习 tensorflow 架构
TensorFlow：深度学习基础设施的架构哲学与工程实践革新文章目录TensorFlow：深度学习基础设施的架构哲学与工程实践革新一、计算范式革命：从静态图到动态执行的深度架构剖析1.1静态计算图的编译优化体系1.2动态图模式的实现原理1.3混合执行模式的编译原理二、张量计算引擎的深度架构解析2.1运行时核心组件2.2计算图优化技术2.3分布式训练架构三、可微分编程范式的实现奥秘3.1自动微分系
计算机视觉与深度学习实战：以Python为工具，基于深度学习的汽车目标检测好知识传播者 Python实例开发实战计算机视觉深度学习 python 基于深度学习的汽车目标检测
随着人工智能技术的飞速发展，计算机视觉与深度学习已经成为当今科技领域的热点。其中，汽车目标检测作为自动驾驶、智能交通等系统的核心技术，受到了广泛关注。本文将以Python为工具，探讨基于深度学习的汽车目标检测方法及其实战应用。一、计算机视觉与深度学习基础计算机视觉是研究如何让计算机从图像或视频中获取信息、理解内容并作出决策的科学。深度学习则是一种模拟人脑神经网络的机器学习技术，通过构建深层神经网络
程序员转向人工智能 CoderIsArt 机器学习与深度学习人工智能
以下是针对程序员转向人工智能（AI）领域的学习路线建议，分为基础、核心技术和进阶方向，结合你的编程背景进行优化：1.夯实基础数学基础（选择性补足，边学边用）线性代数：矩阵运算、特征值、张量（深度学习基础）概率与统计：贝叶斯定理、分布、假设检验微积分：梯度、导数（优化算法核心）优化算法：梯度下降、随机梯度下降（SGD）学习资源：3Blue1Brown（视频）、《程序员的数学》系列编程工具Python
深度学习基础知识总结
1.BatchNorm2d加速收敛：BatchNormalization可以使每层的输入保持较稳定的分布（接近标准正态分布），减少梯度更新时的震荡问题，从而加快模型训练速度。减轻过拟合：批归一化引入了轻微的正则化效果，因为它依赖于mini-batch中的统计信息，这种方式可以减少对单个样本的过度拟合。提高模型性能：在训练过程中，BatchNormalization通过动态调整激活值的分布，让模型更
大数据最新大模型学习路线与建议：掌握大模型学习路径大模型教程大数据学习人工智能大模型 AI大模型程序员 AI
1既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新第一章深度学习基础第二章智能对话系统基础第三章大模型基础第四章大模型应用实践第五章大模型实战项目第一章深度学习基础深度学习基础深度学习经典模型解
深度学习模型：技术演进、热点突破与未来图景 accurater c++算法笔记深度学习
第一章深度学习模型的技术演进1.1从感知机到深度神经网络里程碑突破：AlexNet在ImageNet竞赛中实现图像分类性能飞跃，首次验证深度卷积网络（CNN）的潜力。其采用ReLU激活函数、Dropout正则化等创新，奠定现代深度学习基础架构。梯度消失的破解：LSTM网络通过门控机制实现长时序依赖建模，为自然语言处理（NLP）开辟道路，后续双向LSTM、GRU等变体持续优化记忆能力。计算范式革新：
我们掌握的技能与进入企业的机会万能小贤哥人工智能算法深度学习
深度学习：从基础到实践一、引言深度学习是机器学习的一个分支，它通过构建多层神经网络来模拟人类大脑的信息处理方式，从而实现对复杂数据的自动特征提取和模式识别。近年来，深度学习在计算机视觉、自然语言处理、语音识别等领域取得了巨大的突破，引发了全球范围内的研究和应用热潮。本文将从深度学习的基本概念出发，逐步深入到实际应用，并结合代码示例展示如何实现一个简单的深度学习模型。二、深度学习基础（一）神经网络的
吴恩达深度学习课程实践项目集 Kiki-2189
本文还有配套的精品资源，点击获取简介：吴恩达深度学习编程作业包含了Coursera平台课程中的实践环节，为学员提供深度学习理论与编程技能的巩固。这些作业从基础神经网络到复杂架构，涵盖深度学习的各种关键概念和技术，使用TensorFlow进行模型构建和训练，适合作为入门深度学习的资源。1.深度学习基础与理论框架在当今的人工智能领域，深度学习以其强大的模式识别能力，已经成为了众多技术革新的核心。本章将
YOLOv7在自定义数据集上的Jupyter Notebook训练指南 t0_54program 大数据与人工智能 YOLO jupyter ide 个人开发
在当今的计算机视觉领域，目标检测是一项至关重要的任务，而YOLO（YouOnlyLookOnce）系列算法因其高效性和准确性备受关注。本文将详细介绍如何在JupyterNotebook环境中，利用YOLOv7模型对自定义数据集进行训练。前期准备环境与基础设置：开始之前，你需要具备一定的Python编程经验和深度学习基础知识，并且拥有一台性能足够强大的机器。若没有GPU，DigitalOceanGP
自然语言处理 (NLP) 学习路线我喝AD钙我的学习笔记自然语言处理学习人工智能
自然语言处理学习路线1.基础准备（可参考mooc学习）2.学习基础NLP技术（可参考mooc学习）3.经典机器学习算法在NLP中的应用（可参考吴恩达机器学习课程）4.深度学习基础（基础参考吴恩达、工具看TF、Keras官网手册）5.深度学习在NLP中的应用（arxiv论文原文和解析博客，实战参考gitee/github）6.现代NLP模型（arxiv论文原文和解析博客，实战参考gitee/gith
MONAI 高级开发者研究教程专栏：从精通到引领医学影像AI创新 LIUDAN'S WORLD MONAI 高级开发者研究教程专栏人工智能
专栏导语：本专栏旨在为已有深度学习基础并希望在医学影像AI领域进行深入研究的高级开发者提供一套系统性的MONAI学习与实践指南。我们将不仅仅停留在“如何使用”，更会深入探讨“为何如此设计”以及“如何扩展与创新”，助您充分利用MONAI的强大功能，引领前沿研究。第一章MONAI基石与医学影像AI生态MONAI的设计哲学与核心架构解析：不仅仅是介绍：深入探讨MONAI诞生的背景，解决了医学影像AI的哪
深度学习面试八股简略速览石去皿学习记录经验分享深度学习人工智能
在准备深度学习面试时，你可能会感到有些不知所措。毕竟，深度学习是一个庞大且不断发展的领域，涉及众多复杂的技术和概念。但别担心，本文将为你提供一份全面的指南，从基础理论到实际应用，帮助你在面试中脱颖而出。1.深度学习基础：理解核心概念1.1神经网络基础神经网络是深度学习的核心，它由许多简单的处理单元（神经元）组成，这些神经元通过权重连接在一起。每个神经元接收输入，通过一个激活函数进行处理，然后输出结
【第15章：量子深度学习与未来趋势—15.2 量子深度学习模型的基础理论与实现方法探索】再见孙悟空_ #【深度学习・探索智能核心奥秘】深度学习 DeepSeek 人工智能计算机视觉强化学习量子计算量子深度学习
还记得《三体》中智子锁死地球科技的绝望吗？今天AI领域正面临类似的困境——GPT-4训练需要消耗1.7万个NVIDIAA100GPU运行3个月，能耗相当于300个家庭一年的用电量。更可怕的是，图像识别任务的参数空间维度每增加1级，计算量就会爆炸式增长10^8倍。这时候量子计算犹如破壁者，带着量子并行计算和指数级存储空间这两把密钥，正在打开AI的降维打击时代。一、量子深度学习基础：从量子比特到量子神
【深度学习基础/面试高频问题】归一化-为何BN层能帮助模型优化无敌悦悦王面试准备基础理论深度学习人工智能计算机视觉图像处理
深度学习基础知识为何BN能够帮助训练优化1、发现问题2、BatchNorm的性能是否源于控制内部协变量偏移？3、为什么BatchNorm有效？1）BatchNorm的平滑效果2）优化景观的探索3）BatchNorm是平滑景观的最佳（唯一？）方法吗？4、理论分析5、相关工作6、结论参考文献：1、HowDoesBatchNormalizationHelpOptimization?HowDoesBatc
第21节：深度学习基础-激活函数比较（ReLU, Sigmoid, Tanh）点我头像干啥从零开始学习深度学习图像分类实战(pytorch)深度学习算法人工智能
1.引言在深度学习领域，激活函数是神经网络中至关重要的组成部分它决定了神经元是否应该被激活以及如何将输入信号转换为输出信号激活函数为神经网络引入了非线性因素，使其能够学习并执行复杂的任务没有激活函数，无论神经网络有多少层，都只能表示线性变换，极大地限制了网络的表达能力本文将深入探讨三种最常用的激活函数：ReLU（RectifiedLinearUnit）、Sigmoid和Tanh（双曲正切函数），从
AI Python 教程 Empty-Filled 人工智能 python 开发语言
AIPython教程为什么使用Python学习AI？AI之Python前提AIPython教程人工智能AI之Python-机器学习监督学习回归算法分类算法非监督学习聚类算法数据降维增强学习AI之Python-深度学习深度学习基础深度学习架构AI之Python-自然语言处理文本处理和表示文本处理文本表示词汇语义学AI之Python-计算机视觉图像处理和转换图像识别架构物体检测架构两步检测器单步检测器
第20节：深度学习基础-反向传播算法详解点我头像干啥从零开始学习深度学习图像分类实战(pytorch)深度学习神经网络人工智能机器学习
一、引言反向传播算法（Backpropagation，简称BP算法）是深度学习领域最为核心的算法之一，它为神经网络提供了一种高效计算梯度的方法，使得基于梯度的优化成为可能。自20世纪80年代被重新发现并广泛应用以来，反向传播算法已经成为训练多层神经网络的标准方法，推动了深度学习革命的发展。反向传播算法的本质是链式法则（ChainRule）在神经网络中的巧妙应用，它通过从输出层向输入层反向传播误差信
深度学习模型：从基础到前沿的技术解析与实践指南爱吃青菜的大力水手深度学习人工智能
深度学习模型全面解析文章框架，结合代码演示与图形展示，内容深入浅出：深度学习模型：从基础到前沿的技术解析与实践指南第一章深度学习基础与核心思想1.1深度学习的本质与优势表示学习理论：通过多层非线性变换自动提取数据特征，无需人工设计特征（如CNN对边缘→纹理→物体的逐层抽象）与传统机器学习的对比：以ImageNet分类为例，AlexNet将Top-5错误率从26.2%降至15.3%，证明了深度学习的
PyTorch深度学习基础/Logistic回归 Zeal Just Hurries 深度学习人工智能机器学习 pytorch 回归 python
一、PyTorch深度学习基础1、Tensor对象及其运算Tensor对象是一个多维的数据结构，用于存储数值型数据，通常用在深度学习中进行各种计算。Tensor对象可以简单理解为一个高维数组，它是矩阵概念的扩展。在深度学习领域，特别是在使用某些框架如PyTorch或TensorFlow时，Tensor扮演着核心角色。它们不仅拥有丰富的数学属性，还内置了一些专为深度学习设计的运算，这使得Tensor
探索人工智能在医疗诊断中的前沿应用：深度学习助力精准医疗 Thanks_ks IT 洞察集深度学习医疗诊断医学影像识别基因组学智能辅助诊断精准医疗个性化治疗
目录引言一、深度学习基础与医疗诊断的融合1.深度学习的自适应学习能力2.特征提取的自动化与高效性3.多模态数据的融合处理4.实时诊断与远程医疗的潜力5.个性化医疗的推动二、深度学习在医学影像识别中的应用1.肿瘤检测与分类2.眼科疾病筛查3.病变识别4.脑部疾病诊断5.骨折检测与评估6.多模态影像融合分析7.自动化报告生成三、深度学习在基因组学中的应用1.精准遗传病诊断2.疾病风险预测与预防3.精准
深度学习基础知识-全连接层 Jul.01 深度学习人工智能神经网络
全连接（FullyConnected，简称FC）层是深度学习神经网络中一种基本的层结构。它主要用于神经网络的最后几层，将高层特征映射到输出空间中。全连接层对数据的每个输入节点与每个输出节点进行连接，用于实现输入特征和输出结果之间的映射关系。以下是对全连接层的详细解释。1.全连接层的结构和原理在全连接层中，每一个输入节点与每一个输出节点之间都有一条连接线。假设输入层有n个神经元，输出层有m个神经元，
深度学习基础：从入门到理解核心概念巷955 深度学习人工智能
引言近年来，深度学习(DeepLearning)已成为人工智能领域最热门的研究方向之一。从AlphaGo战胜人类围棋冠军，到ChatGPT等大型语言模型的惊艳表现，深度学习技术正在深刻改变我们的生活和工作方式。本文将系统介绍深度学习的基础知识，帮助初学者建立对这一领域的全面认识。一、什么是深度学习？深度学习是机器学习的一个子领域，它通过模拟人脑神经元的工作方式，构建多层的神经网络模型，从数据中自动
深度学习基础原理知识整理 MayByte 深度学习深度学习人工智能
深度学习基础原理知识整理线性回归模型线性回归模型定义假设给定数据集(D={(x1,y1),(x2,y2),…,(xm,ym)})，其中xi=(xi1;xi2;…;xid)，xi∈Rx~i~\in\mathbb{R}xi∈R。线性回归就是试图学得一个线性模型，尽可能准确地预测实际输出值。通俗地讲，即求属性与结果之间的线性关系。线性回归模型的函数表达式为：f(x)=w1x1+w2x2+⋯+wnxn+b
人脸识别：基于深度学习的人脸识别_（2）.深度学习基础 zhubeibei168 检验检测&人脸识别深度学习人工智能开源计算机视觉人脸识别
深度学习基础引言深度学习是机器学习的一个分支，它通过构建多层神经网络来模拟人脑的结构和功能，从而实现对复杂数据模式的自动学习和识别。在计算机视觉领域，深度学习已经取得了显著的成果，尤其是在人脸识别方面。本节将介绍深度学习的基本概念、常用算法和框架，为后续的人脸识别技术打下坚实的基础。神经网络基础什么是神经网络神经网络是一种计算模型，它由大量的节点（或称为神经元）组成，这些节点通过连接形成一个网络。
html 周华华 html
js 1，数组的排列 var arr=[1,4,234,43,52,]; for(var x=0;x<arr.length;x++){ for(var y=x-1;y<arr.length;y++){ if(arr[x]<arr[y]){ &
【Struts2 四】Struts2拦截器 bit1129 struts2拦截器
Struts2框架是基于拦截器实现的，可以对某个Action进行拦截，然后某些逻辑处理，拦截器相当于AOP里面的环绕通知，即在Action方法的执行之前和之后根据需要添加相应的逻辑。事实上，即使struts.xml没有任何关于拦截器的配置，Struts2也会为我们添加一组默认的拦截器，最常见的是，请求参数自动绑定到Action对应的字段上。 Struts2中自定义拦截器的步骤是：
make:cc 命令未找到解决方法 daizj linux 命令未知 make cc
安装rz sz程序时，报下面错误： [root@slave2 src]# make posix cc -O -DPOSIX -DMD=2 rz.c -o rz make: cc：命令未找到 make: *** [posix] 错误 127 系统：centos 6.6 环境：虚拟机错误原因：系统未安装gcc，这个是由于在安
Oracle之Job应用周凡杨 oracle job
最近写服务，服务上线后，需要写一个定时执行的SQL脚本，清理并更新数据库表里的数据，应用到了Oracle 的 Job的相关知识。在此总结一下。一：查看相关job信息 1、相关视图 dba_jobs all_jobs user_jobs dba_jobs_running 包含正在运行
多线程机制朱辉辉33 多线程
转至http://blog.csdn.net/lj70024/archive/2010/04/06/5455790.aspx 程序、进程和线程：程序是一段静态的代码，它是应用程序执行的蓝本。进程是程序的一次动态执行过程，它对应了从代码加载、执行至执行完毕的一个完整过程，这个过程也是进程本身从产生、发展至消亡的过程。线程是比进程更小的单位，一个进程执行过程中可以产生多个线程，每个线程有自身的
web报表工具FineReport使用中遇到的常见报错及解决办法（一）老A不折腾 web报表 finereport java报表报表工具
FineReport使用中遇到的常见报错及解决办法（一）这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、address pool is full：含义：地址池满，连接数超过并发数上
mysql rpm安装后没有my.cnf 林鹤霄没有my.cnf
Linux下用rpm包安装的MySQL是不会安装/etc/my.cnf文件的，至于为什么没有这个文件而MySQL却也能正常启动和作用，在这儿有两个说法，第一种说法，my.cnf只是MySQL启动时的一个参数文件，可以没有它，这时MySQL会用内置的默认参数启动，第二种说法，MySQL在启动时自动使用/usr/share/mysql目录下的my-medium.cnf文件，这种说法仅限于r
Kindle Fire HDX root并安装谷歌服务框架之后仍无法登陆谷歌账号的问题 aigo root
原文：http://kindlefireforkid.com/how-to-setup-a-google-account-on-amazon-fire-tablet/ Step 4: Run ADB command from your PC On the PC, you need install Amazon Fire ADB driver and instal
javascript 中var提升的典型实例 alxw4616 JavaScript
// 刚刚在书上看到的一个小问题,很有意思.大家一起思考下吧 myname = 'global'; var fn = function () { console.log(myname); // undefined var myname = 'local'; console.log(myname); // local }; fn() // 上述代码实际上等同于以下代码 m
定时器和获取时间的使用百合不是茶时间的转换定时器
定时器:定时创建任务在游戏设计的时候用的比较多 Timer();定时器 TImerTask();Timer的子类由 Timer 安排为一次执行或重复执行的任务。定时器类Timer在java.util包中。使用时，先实例化，然后使用实例的schedule(TimerTask task, long delay)方法，设定
JDK1.5 Queue bijian1013 java thread java多线程 Queue
JDK1.5 Queue LinkedList： LinkedList不是同步的。如果多个线程同时访问列表，而其中至少一个线程从结构上修改了该列表，则它必须保持外部同步。（结构修改指添加或删除一个或多个元素的任何操作；仅设置元素的值不是结构修改。）这一般通过对自然封装该列表的对象进行同步操作来完成。如果不存在这样的对象，则应该使用 Collections.synchronizedList 方
http认证原理和https bijian1013 http https
一.基础介绍在URL前加https://前缀表明是用SSL加密的。你的电脑与服务器之间收发的信息传输将更加安全。 Web服务器启用SSL需要获得一个服务器证书并将该证书与要使用SSL的服务器绑定。 http和https使用的是完全不同的连接方式，用的端口也不一样,前者是80，后
【Java范型五】范型继承 bit1129 java
定义如下一个抽象的范型类，其中定义了两个范型参数，T1，T2 package com.tom.lang.generics; public abstract class SuperGenerics<T1, T2> { private T1 t1; private T2 t2; public abstract void doIt(T
【Nginx六】nginx.conf常用指令(Directive) bit1129 Directive
1. worker_processes 8; 表示Nginx将启动8个工作者进程，通过ps -ef|grep nginx,会发现有8个Nginx Worker Process在运行 nobody 53879 118449 0 Apr22 ? 00:26:15 nginx: worker process
lua 遍历Header头部 ronin47 lua header 遍历　
local headers = ngx.req.get_headers() ngx.say("headers begin", "<br/>") ngx.say("Host : ", he
java-32.通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小(两数组的差最小)。 bylijinnan java
import java.util.Arrays; public class MinSumASumB { /** * Q32.有两个序列a,b，大小都为n,序列元素的值任意整数，无序. * * 要求：通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小。 * 例如: * int[] a = {100,99,98,1,2,3
redis 开窍的石头 redis
在redis的redis.conf配置文件中找到# requirepass foobared 把它替换成requirepass 12356789 后边的12356789就是你的密码打开redis客户端输入config get requirepass 返回 redis 127.0.0.1:6379> config get requirepass 1) "require
[JAVA图像与图形]现有的GPU架构支持JAVA语言吗？ comsci java语言
无论是opengl还是cuda，都是建立在C语言体系架构基础上的，在未来，图像图形处理业务快速发展，相关领域市场不断扩大的情况下，我们JAVA语言系统怎么从这么庞大，且还在不断扩大的市场上分到一块蛋糕，是值得每个JAVAER认真思考和行动的事情
安装ubuntu14.04登录后花屏了怎么办 cuiyadll ubuntu
这个情况，一般属于显卡驱动问题。可以先尝试安装显卡的官方闭源驱动。按键盘三个键：CTRL + ALT + F1 进入终端，输入用户名和密码登录终端：安装amd的显卡驱动 sudo apt-get install fglrx 安装nvidia显卡驱动 sudo ap
SSL 与数字证书的基本概念和工作原理 darrenzhu 加密 ssl 证书密钥签名
SSL 与数字证书的基本概念和工作原理 http://www.linuxde.net/2012/03/8301.html SSL握手协议的目的是或最终结果是让客户端和服务器拥有一个共同的密钥，握手协议本身是基于非对称加密机制的，之后就使用共同的密钥基于对称加密机制进行信息交换。 http://www.ibm.com/developerworks/cn/webspher
Ubuntu设置ip的步骤 dcj3sjt126com ubuntu
在单位的一台机器完全装了Ubuntu Server，但回家只能在XP上VM一个，装的时候网卡是DHCP的，用ifconfig查了一下ip是192.168.92.128,可以ping通。转载不是错： Ubuntu命令行修改网络配置方法 /etc/network/interfaces打开后里面可设置DHCP或手动设置静态ip。前面auto eth0，让网卡开机自动挂载. 1. 以D
php包管理工具推荐 dcj3sjt126com PHP Composer
http://www.phpcomposer.com/ Composer是 PHP 用来管理依赖（dependency）关系的工具。你可以在自己的项目中声明所依赖的外部工具库（libraries），Composer 会帮你安装这些依赖的库文件。中文文档入门指南下载安装包列表 Composer 中国镜像
Gson使用四（TypeAdapter） eksliang json gson Gson自定义转换器 gsonTypeAdapter
转载请出自出处：http://eksliang.iteye.com/blog/2175595 一.概述 Gson的TypeAapter可以理解成自定义序列化和返序列化二、应用场景举例例如我们通常去注册时（那些外国网站），会让我们输入firstName，lastName,但是转到我们都
JQM控件之Navbar和Tabs gundumw100 html xml css
在JQM中使用导航栏Navbar是简单的。只需要将data-role="navbar"赋给div即可： <div data-role="navbar"> <ul> <li><a href="#" class="ui-btn-active&qu
利用归并排序算法对大文件进行排序 iwindyforest java 归并排序大文件分治法 Merge sort
归并排序算法介绍，请参照Wikipeida zh.wikipedia.org/wiki/%E5%BD%92%E5%B9%B6%E6%8E%92%E5%BA%8F 基本思想：大文件分割成行数相等的两个子文件，递归（归并排序）两个子文件，直到递归到分割成的子文件低于限制行数低于限制行数的子文件直接排序两个排序好的子文件归并到父文件直到最后所有排序好的父文件归并到输入
iOS UIWebView URL拦截啸笑天 UIWebView
本文译者：candeladiao，原文：URL filtering for UIWebView on the iPhone说明：译者在做app开发时，因为页面的javascript文件比较大导致加载速度很慢，所以想把javascript文件打包在app里，当UIWebView需要加载该脚本时就从app本地读取，但UIWebView并不支持加载本地资源。最后从下文中找到了解决方法，第一次翻译，难免有
索引的碎片整理SQL语句 macroli sql
SET NOCOUNT ON DECLARE @tablename VARCHAR (128) DECLARE @execstr VARCHAR (255) DECLARE @objectid INT DECLARE @indexid INT DECLARE @frag DECIMAL DECLARE @maxfrag DECIMAL --设置最大允许的碎片数量,超过则对索引进行碎片
Angularjs同步操作http请求with $promise qiaolevip 每天进步一点点学习永无止境 AngularJS 纵观千象
// Define a factory app.factory('profilePromise', ['$q', 'AccountService', function($q, AccountService) { var deferred = $q.defer(); AccountService.getProfile().then(function(res) {
hibernate联合查询问题 sxj19881213 sql Hibernate HQL 联合查询
最近在用hibernate做项目，遇到了联合查询的问题，以及联合查询中的N+1问题。针对无外键关联的联合查询，我做了HQL和SQL的实验，希望能帮助到大家。（我使用的版本是hibernate3.3.2） 1 几个常识：（1）hql中的几种join查询，只有在外键关联、并且作了相应配置时才能使用。（2）hql的默认查询策略，在进行联合查询时，会产
struts2.xml wuai struts
<?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache