zlinzju

深度学习中GPU和显存分析

文章目录

Linux查看GPU信息和使用情况

1.查询命令
2.参数释义

深度学习中GPU和显存分析（科普）

0.预备知识
1.显存分析

1.1 存储指标
1.2 神经网络显存占用

1.2.1 参数的显存占用
1.2.2 梯度与动量的显存占用
1.2.3 输入输出的显存占用

1.3 节省显存的方法

2 计算量分析

2.1 常用操作的计算量
2.2 AlexNet 分析
2.3 减少卷积层的计算量
2.4 常用模型显存 / 计算复杂度 / 准确率

3 总结

3.1 建议
3.2 关于显卡选购

Linux查看GPU信息和使用情况

1.查询命令

在linux中，命令行输入nvidia-smi指令即可看到当前nvidia显卡的使用情况

2.参数释义

• Fan：显示风扇转速，数值在0到100%之间，是计算机的期望转速，如果计算机不是通过风扇冷却或者风扇坏了，显示出来就是N/A；
• Temp：显卡内部的温度，单位是摄氏度；
• Perf：表征性能状态，从P0到P12，P0表示最大性能，P12表示状态最小性能；
• Pwr：能耗表示；
• Bus-Id：涉及GPU总线的相关信息；
• Disp.A：是Display Active的意思，表示GPU的显示是否初始化；
• Memory Usage：显存的使用率；
• Volatile GPU-Util：浮动的GPU利用率；
• Compute M：计算模式；

下边的Processes显示每块GPU上每个进程所使用的显存情况。

如果要周期性的动态输出显卡的使用情况，可以在终端输入watch -n 1 nvidia-smi ，-n后面的数字是更新的时间间隔(秒)

深度学习中GPU和显存分析（科普）

作者：陈云
链接：https://zhuanlan.zhihu.com/p/31558973
来源：知乎

深度学习最吃机器，耗资源，在本文，我将来科普一下在深度学习中：

何为“资源”
不同操作都耗费什么资源
如何充分的利用有限的资源
如何合理选择显卡

并纠正几个误区：

显存和GPU等价，使用GPU主要看显存的使用？
Batch Size 越大，程序越快，而且近似成正比？
显存占用越多，程序越快？
显存占用大小和batch size大小成正比？

0.预备知识

nvidia-smi是Nvidia显卡命令行管理套件，基于NVML库，旨在管理和监控Nvidia GPU设备。nvidia-smi 命令的输出，其中最重要的两个指标：

显存占用
GPU 利用率

显存占用和 GPU 利用率是两个不一样的东西，显卡是由 GPU 计算单元和显存等组成的，显存和 GPU 的关系有点类似于内存和 CPU 的关系。

这里推荐一个好用的小工具：gpustat, 直接pip install gpustat即可安装，gpustat基于nvidia-smi可以提供更美观简洁的展示

结合 watch 命令，watch --color -n1 gpustat -cpu，可以动态实时监控GPU 的使用情况

显存可以看成是空间，类似于内存。

显存用于存放模型和数据等
显存越大，所能运行的网络也就越大

GPU 计算单元类似于 CPU 中的核，用来进行数值计算。衡量计算量的单位是 flop： the number of floating-point multiplication-adds，浮点数先乘后加算一个 flop。计算能力越强大，速度越快。衡量计算能力的单位是 flops：每秒能执行的 flop 数量。

 1*2+3               1 flop
 1*2+3*4+4*5         3 flop

1.显存分析

1.1 存储指标

1Byte = 8 bit
1K = 1024 Byte
1M = 1024 K
1G = 1024 M
1T = 1024 G

10 K = 10*1024 Byte

除了K，M，G，T等之外，我们常用的还有KB、MB，GB，TB，二者有细微的差别：K,，M，G，T是以 1024 为底，而KB、MB，GB，TB以 1000 为底。

1Byte=8bit
1KB=1000Byte
1MB=1000KB
1GB=1000MB
1TB=1000GB
10KB=10000Byte

不过一般来说，在估算显存大小的时候，我们不需要严格的区分这二者。

在深度学习中会用到各种各样的数值类型，数值类型命名规范一般为TypeNum，比如 Int64、Float32、Double64

Type：有 Int，Float，Double 等
Num: 一般是 8，16，32，64，128，表示该类型所占据的比特数目

常用的数值类型如下图所示 (int64 准确的说应该是对应c中的long long类型， long类型在32位机器上等效于int32)：

其中 Float32 是在深度学习中最常用的数值类型，称为单精度浮点数，每一个单精度浮点数占用 4Byte 的显存。

举例来说：有一个 1000x1000 的矩阵，float32，那么占用的显存差不多就是1000x1000x4 Byte = 4MB；32x3x256x256 的四维数组（BxCxHxW）占用显存为：32x3x256x256 / 1024 =24MB

1.2 神经网络显存占用

神经网络模型占用的显存包括：模型自身的参数，模型的输出。举例来说，对于如下图所示的一个全连接网络 (不考虑偏置项 b)

模型的显存占用包括：

参数：二维数组 W
模型的输出：二维数组 Y

输入 X 可以看成是上一层的输出，因此把它的显存占用归于上一层。

这么看来显存占用就是W和Y两个数组？

并非如此！！！

下面细细分析。

1.2.1 参数的显存占用

只有有参数的层，才会有显存占用。这部份的显存占用和输入无关，模型加载完成之后就会占用。

有参数的层主要包括：

卷积
全连接
BatchNorm
Embedding
… …

无参数的层：

多数的激活层 (Sigmoid/ReLU)
池化层
Dropout
… …

更具体的来说，模型的参数数目 (这里均不考虑偏置项 b) 为：

Linear(M->N): 参数数目：M×N
Conv2d(Cin, Cout, K): 参数数目：Cin × Cout × K × K
BatchNorm(N): 参数数目： 2N
Embedding(N,W): 参数数目： N × W

参数占用显存 = 参数数目 ×n

n = 4 ：float32
n = 2 : float16
n = 8 : double64

在 PyTorch 中，当你执行完model=MyGreatModel().cuda()之后就会占用相应的显存，占用的显存大小基本与上述分析的显存差不多（会稍大一些，因为其它开销）。

1.2.2 梯度与动量的显存占用

举例来说，优化器如果是 SGD：

可以看出来，除了保存 W 之外还要保存对应的梯度，因此显存占用等于参数占用的显存 x2；如果是带 Momentum-SGD

这时候还需要保存动量，因此显存 x3；如果是 Adam 优化器，动量占用的显存更多，显存 x4；总结一下，模型中与输入无关的显存占用包括：

参数 W
梯度 dW（一般与参数一样）
优化器的动量（普通 SGD 没有动量，momentum-SGD 动量与梯度一样，Adam 优化器动量的数量是梯度的两倍）

1.2.3 输入输出的显存占用

这部份的显存主要看输出的 feature map 的形状：

比如卷积的输入输出满足以下关系：

据此可以计算出每一层输出的 Tensor 的形状，然后就能计算出相应的显存占用。模型输出的显存占用，总结如下：

需要计算每一层的 feature map 的形状（多维数组的形状）
模型输出的显存占用与 batch size 成正比
需要保存输出对应的梯度用以反向传播（链式法则）
模型输出不需要存储相应的动量信息（因为不需要执行优化）

对于深度学习中神经网络的显存占用，我们可以得到如下公式：

显存占用 = 模型显存占用 + batch_size × 每个样本的显存占用

可以看出显存不是和 batch-size 简单的成正比，尤其是模型自身比较复杂的情况下：比如全连接很大，Embedding 层很大

另外需要注意：

输入（数据，图片）一般不需要计算梯度
神经网络的每一层输入输出都需要保存下来，用来反向传播，但是在某些特殊的情况下，我们可以不要保存输入。比如 ReLU，在 PyTorch 中，使用nn.ReLU(inplace = True)能将激活函数 ReLU 的输出直接覆盖保存于模型的输入之中，节省不少显存。感兴趣的读者可以思考一下，这时候是如何反向传播的*（提示：y=relu(x) -> dx = dy.copy();dx[y<=0]=0）*

1.3 节省显存的方法

在深度学习中，一般占用显存最多的是卷积等层的输出，模型参数占用的显存相对较少，而且不太好优化。

节省显存一般有如下方法：

降低 batch-size
下采样 (NCHW -> (1/4)*NCHW)
减少全连接层（一般只留最后一层分类用的全连接层）

2 计算量分析

计算量的定义，之前已经讲过了，计算量越大，操作越费时，运行神经网络花费的时间越多。

2.1 常用操作的计算量

常用的操作计算量如下：

全连接层：BxMxN , B 是 batch size，M 是输入形状，N 是输出形状。
卷积的计算量:
BatchNorm 计算量我个人估算大概是
池化的计算量：
ReLU 的计算量： BHWC

2.2 AlexNet 分析

AlexNet 的分析如下图，左边是每一层的参数数目（不是显存占用），右边是消耗的计算资源。这里某些地方的计算结果可能和上面的公式对不上, 这是因为原始的AlexNet实现有点特殊(在多块GPU上实现的)。

可以看出：

全连接层占据了绝大多数的参数
卷积层的计算量最大

2.3 减少卷积层的计算量

谷歌提出的 MobileNet，利用了一种被称为 DepthWise Convolution 的技术，将神经网络运行速度提升许多，它的核心思想就是把一个卷积操作拆分成两个相对简单的操作的组合。如图所示, 左边是原始卷积操作，右边是两个特殊而又简单的卷积操作的组合（上面类似于池化的操作，但是有权重，下面类似于全连接操作）。

这种操作使得：

显存占用变多 (每一步的输出都要保存)
计算量变少了许多，一般为原来的 10－15%，具体为

2.4 常用模型显存 / 计算复杂度 / 准确率

去年（2016年）一篇论文 (https://arxiv.org/abs/1605.07678) 总结了当时常用模型的各项指标，横座标是计算复杂度（越往右越慢，越耗时），纵座标是准确率（越高越好），圆的面积是参数数量（不是显存占用）。左上角我画了一个红色小圆，那是最理想的模型的的特点：快，效果好，占用显存小。

3 总结

3.1 建议

时间更宝贵，尽可能使模型变快（减少 flop）
显存占用不是和 batch size 简单成正比，模型自身的参数及其延伸出来的数据也要占据显存
batch size 越大，速度未必越快。在你充分利用计算资源的时候，加大 batch size 在速度上的提升很有限

尤其是 batch-size，假定 GPU 处理单元已经充分利用的情况下：

增大 batch size 能增大速度，但是很有限（主要是并行计算的优化）
增大 batch size 能减缓梯度震荡，需要更少的迭代优化次数，收敛的更快，但是每次迭代耗时更长
增大 batch size 使得一个 epoch 所能进行的优化次数变少，收敛可能变慢，从而需要更多时间才能收敛（比如 batch_size 变成全部样本数目）

3.2 关于显卡选购

当前（2017年11月）市面上常用的显卡指标如下：
更多显卡的更多指标请参阅
https://en.wikipedia.org/wiki/List_of_Nvidia_graphics_processing_units

显然GTX 1080TI性价比最高，速度超越新 Titan X，价格却便宜很多，显存也只少了 1 个 G（据说故意阉割掉一个 G，不然全面超越了 Titan X 怕激起买 Titan X 人的民愤~）

K80 性价比很低（速度慢，而且贼贵）
注意 GTX TITAN 和 Nvidia TITAN 的区别，别被骗
tensorcore的性能目前来看还无法全面发挥出来, 这里不考虑. 其它的tesla系列像P100这些企业级的显卡这里不列了,普通消费者不会买, 而且性价比较低(一台DGX 1上百万…)

另外，针对本文，我做了一个 Google 幻灯片：神经网络性能分析，国内用户可以点此下载PPT ；Google 幻灯片格式更好，后者格式可能不太正常。

本文都是针对单机单卡的分析，分布式的情况会和这个有所区别。在分析计算量的时候，只分析了前向传播，反向传播计算量一般会与前向传播有细微的差别。

限于本人水平，文中有疏漏之处，还请指正。

计算机毕业设计PHP仓储综合管理系统（源码+程序+VUE+lw+部署） java毕设程序源码王哥 php 课程设计 vue.js
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：phpStudy+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：原生PHP++Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是小皮phpstudy最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
【2023年】云计算金砖牛刀小试6 geekgold 云计算服务器网络 kubernetes 容器
第一套【任务1】私有云服务搭建[10分]【题目1】基础环境配置[0.5分]使用提供的用户名密码，登录提供的OpenStack私有云平台，在当前租户下，使用CentOS7.9镜像，创建两台云主机，云主机类型使用4vCPU/12G/100G_50G类型。当前租户下默认存在一张网卡，自行创建第二张网卡并连接至controller和compute节点（第二张网卡的网段为10.10.X.0/24，X为工位号
linux简单安装gcc和gdb chn-zgq Linux linux ubuntu
linux安装gcc以及环境配置和gdb安装gcc-10.0添加源:sudoadd-apt-repositoryppa:ubuntu-toolchain-r/ppa更新源:sudoaptupdate下载gcc:sudoaptinstallgcc-10g++-10默认GCC版本设置为gcc-10.0:sudoupdate-alternatives--install/usr/bin/gccgcc/us
计算机毕设Node.js+Vue校园易购二手交易平台（程序+LW+部署） Node程序源码强子 vue.js 课程设计 node.js
项目运行环境配置：Node.js最新版+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue。项目技术：Express框架+Node.js+Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是Nodejs最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
snmp v2 trap搭建监控端小黑要上天 snmp linux 服务器 centos 运维 snmp
1.基础环境配置为了防止防火墙及selinux等的影响，需关闭防火墙及selinux等，具体参考：Linux常规基础配置_linux基础配置-CSDN博客2.安装snmpyum源配置，具体参考：Linux常规基础配置_linux基础配置-CSDN博客snmp安装命令：yuminstall-ynet-snmpnet-snmp-utils[root@kibana~]#yuminstall-ynet-s
计算机毕业设计Node.js+Vue基于Java的医院预约挂号系统(程序+源码+LW+部署) Nodejs洋洋程序 java vue.js 课程设计
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：Node.js+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：Express框架+Node.js+Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是Nodejs最新版，我们在这个版本上开发的。其他版本理论上也可
[附源码]SSM计算机毕业设计游戏账号交易平台JAVA 计算机程序源码 java 游戏 mysql
项目运行环境配置：Jdk1.8+Tomcat7.0+Mysql+HBuilderX（Webstorm也行）+Eclispe（IntelliJIDEA,Eclispe,MyEclispe,Sts都支持）。项目技术：SSM+mybatis+Maven+Vue等等组成，B/S模式+Maven管理等等。环境需要1.运行环境：最好是javajdk1.8，我们在这个平台上运行的。其他版本理论上也可以。2.ID
【保姆级】Protobuf详解及入门指南 AQin1012 Java 网络 protobuf 序列化二进制协议协议 Java
目录Protobuf概述什么是Protobuf为什么要使用ProtobufProtobuf实战环境配置创建文件解析/封装数据附录AQin.proto完整代码Protobuf概述什么是ProtobufProtobuf（ProtocolBuffers）协议Protobuf是一种由Google开发的二进制序列化格式和相关的技术，它用于高效地序列化和反序列化结构化数据，通常用于网络通信、数据存储等场景为什
Python+Django毕业设计校园易购二手交易平台（程序+LW+部署） Python、JAVA毕设程序源码课程设计 java mysql
项目运行环境配置：Jdk1.8+Tomcat7.0+Mysql+HBuilderX（Webstorm也行）+Eclispe（IntelliJIDEA,Eclispe,MyEclispe,Sts都支持）。项目技术：SSM+mybatis+Maven+Vue等等组成，B/S模式+Maven管理等等。环境需要1.运行环境：最好是javajdk1.8，我们在这个平台上运行的。其他版本理论上也可以。2.ID
《昇思 25 天学习打卡营第 25 天 | 基于 MindSpore 实现 BERT 对话情绪识别》 Sam9029 Mindscope模型学习深度学习
《昇思25天学习打卡营第25天|基于MindSpore实现BERT对话情绪识别》活动地址：https://xihe.mindspore.cn/events/mindspore-training-camp签名：Sam9029环境配置确保安装了正确版本的MindSpore和MindNLP库。!pipuninstallmindspore-y!pipinstall-ihttps://pypi.mirror
使用 uni-app 开发微信小程序：深入教程与技巧代码伐木匠笔记本 uni-app 微信小程序 notepad++
使用uni-app开发微信小程序：深入教程与技巧uni-app是一个使用Vue.js语法开发跨平台应用的框架，能够编译到iOS、Android、H5、微信小程序等多个平台。通过uni-app，你可以一套代码同时生成多个端的应用，极大提升开发效率。本文将带你深入了解如何使用uni-app开发微信小程序，并提供大量实践经验与技巧。1.环境配置与项目创建要开始使用uni-app开发微信小程序，首先需要搭
Servlet 文件上传 lly202406 开发语言
Servlet文件上传在JavaWeb开发中，文件上传是一个常见的需求。Servlet作为一种服务器端的技术，可以轻松实现文件上传功能。本文将详细介绍如何在Servlet中处理文件上传，包括环境配置、代码实现以及常见问题的解决方案。环境配置1.添加依赖在项目的pom.xml文件中，添加ApacheCommonsFileUpload库的依赖。这个库提供了易于使用的API来处理文件上传。commons
Uni-app 开发微信小程序 vvvae1234 uni-app
随着移动互联网的发展，微信小程序已经成为一种流行的应用开发模式。Uni-app作为一种跨平台的开发框架，使用Vue.js语法，能够方便快速地开发出微信小程序、H5、App等多端应用。本指南将引导您从环境配置到实战案例开发，帮助您快速掌握使用Uni-app开发微信小程序的技巧。2.Uni-app概述2.1什么是Uni-app？Uni-app是一个使用Vue.js语法的跨平台开发框架，允许开发者用一套
企业商城单点部署 lifeng4321 nginx 运维
1.基础环境配置1.1规划节点安装基础服务的服务器规划，见表1-1-1。表1-1-1节点规划IP地址主机名节点192.168.100.100mall单节点服务器1.2基础准备使用VMWareWorkstation软件安装CentOS7.2操作系统，镜像使用提供的CentOS-7-x86_64-DVD-1511.iso，最小化安装CentOS7.2系统，YUM源使用提供的本地gpmall-repo包
R语言包AMORE安装报错问题以及RStudio与Rtools环境配置卡卡_R-Python R语言数据分析与可视化 r语言开发语言
在使用R语言进行AMORE安装时会遇到报错，这时候需要采用解决办法：'''AMORE包安装，需要离线官网下载安装包：Indexof/src/contrib/Archive/AMORE(r-project.org)https://cran.r-project.org/src/contrib/Archive/AMORE/一、出现的问题最近开始学习R语言，安装了最新版的R4.4.1和RStudio，但安
react-native mac 开发环境搭建Android SDK版本N/A问题，已解决 aaaaanqi react native
react-nativemac开发环境搭建AndroidSDK版本N/A问题，已解决使用npxreact-nativedoctor校验开发环境，AndroidSDK报错但是开发环境配置和文档描述得没有什么差别，怀疑是bug，git仓库下的issue有提类似问题，直接使用npmrunandroid运行，报以下错>Failedtoapplyplugin'com.android.internal.app
windows系统最新python多版本,虚拟环境配置 web:小源 windows python 开发语言
window系统python多版本管理方法一:按照教程安装https://github.com/pyenv-win/pyenv-win方法二:下载压缩包,配置环境变量2.1克隆项目:gitclonehttps://github.com/pyenv-win/pyenv-win.git2.2配置环境变量2.3使用方法"""pyenvinstall--list#查看可以下载的版本pyenvinstall
note: This error originates from a subprocess, and is likely not a problem with pip. ERROR: Failed 哎呀——哪是啥 openmmlab pip
确保环境配置正确：检查Python版本是否与mmcv兼容（通常情况下，Python3.6-3.9是支持的）。确认安装了合适的PyTorch版本，mmcv常常需要与PyTorch版本紧密配合。更新pip，setuptools，和wheel：在运行安装命令之前，确保这些库是最新的：plaintextpipinstall--upgradepipsetuptoolswheel尝试使用预编译的轮文件：可以尝
Anaconda安装与Python虚拟环境配置保姆级图文教程(附速查字典)_anaconda配置python环境 2401_84976246 程序员 c语言 c++学习
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！目录1混乱的Python库2什么是Anacond
PyCharm配置教程，手把手教你如何配置 E绵绵 Everything pycharm ide python
文章目录引言1.安装PyCharm1.1下载和安装1.2初次启动2.基本配置2.1设置界面2.2常用配置项3.项目配置3.1创建新项目3.2配置解释器4.虚拟环境配置4.1创建虚拟环境4.2使用已有虚拟环境4.3管理依赖5.插件和扩展5.1安装插件5.2推荐插件6.调试配置6.1配置调试器6.2设置断点和启动调试7.版本控制集成7.1配置Git7.2克隆仓库7.3使用Git插件8.代码风格和检查8
COI实验室技能：图像到图像的深度学习开发框架（pytorch版）山颠海涯深度学习 pytorch 人工智能
Basicdeeplearningframeworkforimage-to-image这个开发框架旨在帮助科研人员快速地实现图像到图像之间的模型开发。github连接：https://github.com/SituLab/Basic-deep-learning-framework-for-image-to-image目录1模型开发1-1克隆项目到本地1-2深度学习开发2环境配置2-1安装conda
Oracle GoldenGate(OGG)-Oracle数据库迁移到MySQL数据库(全量+增量) 侯晓阳丶 Oracle MySQL 数据库 oracle mysql dba linux 迁移学习经验分享
目录前言环境介绍环境准备Oracle环境准备Oracle环境配置方法MySQL环境配置方法表结构转换和导入备份Oracle表结构为SQL文件使用sqlines工具将表结构进行转换安装OracleGoldenGate(OGG)Oracle端安装MySQL端安装创建相关用户MySQL端Oracle端OGG配置参数配置源端oracle-OGG配置目标端MySQL-OGG配置启动进程顺序(重要)相关报错解
测试平台系列(32) 编写环境配置页面(中) 米洛丶
回顾大家好呀，又见面了！上期我们已经完整地编写了环境管理CRUD的接口，但是光有接口是不行的，我们需要为之编写一个web页面，使用户能够在页面上管理环境数据。这是前端系列文章的第一篇，包含了部分教程在里面，所以本来是下篇的它，变成了中篇。image原型设计我们在实现某个功能的时候，就算不画出原型，心中也一定设计好大概的结构。以我们的环境管理为例子，用户可以通过table查看当前已有的环境，也提供i
conda进行transformers安装大多_C conda
首先建立新环境condacreate-nmyenvpython=3.8安装numpy和pytorchcondainstallnumpycondainstallpytorchtorchvisiontorchaudiocpuonly-cpytorch-cconda-forge其余的一些环境配置huggingface_hub0.16.4py_0huggingfaceimportlib-metadata6
（2）Django生产环境数据库的切换以及环境配置python-dotenv方案一个简短且非常好记的ID Django分化整理 python django 数据库
简介本文分享下个人目前在用的，DRF项目开发环境、生产环境数据库切换的方案。没做过什么大项目，可能实现的不是那么优雅。主要思路就是通过python-dotenv库，编辑.env环境配置文件区分开发环境和生产环境，再使用数据库路由，部署在生产环境的项目将自动连接生产环境数据库。环境配置区分实现流程（python-dotenv）1.安装python-dotenvpipinstallpython-dot
mysql8.0使用MHA实现高可用 Fish_1112 mysql MHA
1.环境配置本实验环境共有四个节点，其角色分配如下（实验机器均为centos7.x）机器名称IP配置服务角色manager172.16.90.211manager控制器master172.16.90.212数据库主服务器slave1172.16.90.213数据库从服务器slave2172.16.90.214数据库从服务器为了方便我们后期的操作，我们在各节点的/etc/hosts文件配置内容中添加
Java中的System.getenv()和System.getProperty() 星辰鸿溟 Java Hadoop Yarn Hadoop HDFS
System.getenv()和System.getProperty()是Java种常用的两种读取环境配置信息的方法，它们都是java.lang.System类的方法，用途有相似之处，但我们在实际使用中，需要更加注意二者的区别。1.System.getenv()System.getenv()读取的是当前系统环境的环境变量。要深入理解环境变量的本质，需要对系统父子进程关系有更加清晰的认识。一般来说，
HALCON 错误代码 #7709 聪明不喝牛奶 Halcon+CSharp 深度学习 halcon 深度学习
前言最近在研究halcon的深度学习，在环境配置上花了不少的功夫搞定，结果正要开始训练分类的第二个train文件就出现了一个错误，报7709，折腾了三天才解决。原因报7709主要的原因有如下几个原因：1、就是你选的cuda版本和cudnn的不匹配，这个原因应该大家在选择的时候注意一下版本对比的话可以避免，基本上不是这个原因造成的。2、显卡的驱动版本的过低，需要下载一个驱动精灵升级一下显卡的驱动，但
【附源码】计算机毕业设计Python安卓校园外卖点餐系统ojry5（源码+程序+LW+调试部署） Python毕设程序设计uniapp 课程设计 python 开发语言
【附源码】计算机毕业设计Python安卓校园外卖点餐系统ojry5（源码+程序+LW+调试部署）该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程项目运行环境配置：Python3.7.7+Django+Mysql5.7+piplist+HBuilderX（Vscode也行）+uni+Vue+Pychram社区版。项目技术：Django+uni小程序+Python+Mysql等等组成，B
在国产平台上Flak Web应用开发 Botiway FlaskWeb python flask 后端 linux web3
在国产平台上进行FlaskWeb应用开发，特别是在像统信UOS这样的国产操作系统上，可以遵循与在其他操作系统上类似的开发流程，但可能需要注意一些特定的环境配置和兼容性问题。木合塔尔·沙地克所著的《FlaskWeb应用开发项目实战基于Python和统信UOS》一书，为在统信UOS上进行FlaskWeb应用开发提供了宝贵的指导和实战案例。1.环境准备首先，确保你的开发环境已经安装了Python和pip
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod