liyiersan123

这绝对是你见过的最全深度学习服务器管理配置手册，学不会你打我

这绝对是你见过的最全深度学习服务器管理/配置手册，学不会你打我

最近在配置服务器，遇到了不少问题，在此整理记录一下。主要是以下几个方面：多用户管理、服务器环境配置、Anaconda虚拟环境安装TensorFlow/PyTorch、远程访问。

- - 这绝对是你见过的最全深度学习服务器管理/配置手册，学不会你打我
  - - 一、多用户管理
    - - 1、新建/删除用户
      - 2、更改用户权限
    - 二、服务器环境配置
    - - 1、安装NVIDIA驱动
      - 2、安装CUDA Toolkit
      - 3、配置启动内核
      - 4、挂载硬盘
    - 三、Anaconda虚拟环境配置
    - - 1、安装Anaconda
      - 2、配置TensorFlow虚拟环境
      - 3、配置PyTorch虚拟环境
    - 四、服务器远程访问配置
    - - 1、配置ssh
      - 2、配置xrdp
      - 3、配置frp内网穿透
      - 4、配置frp开机自启
    - 五、遇到的其他问题

一、多用户管理

1、新建/删除用户

参考：Linux下useradd命令与adduser命令的区别

linux新建用户命令有两个：useradd和adduser。这两个命令略有区别，总结如下：

1、adduser会自动创建用户组，useradd不会自动创建，需要加参数

2、adduser会自动创建用户目录，useradd不会自动创建，需要加参数

3、adduser会自动选择shell版本，useradd不会自动选择

4、adduser会提示添加用户密码，useradd不会

推荐使用adduser来创建新用户，设置完密码之后，一切默认即可：

sudo adduser test_user

参考：Linux的userdel和deluser命令

类似地，删除用户命令也有两个：userdel和deluser，区别如下：

1、deluser的选项要比userdel丰富，功能要更强大

2、deluser可以删除普通用户、从系统中删除用户组、将用户从一个组中删除

推荐使用usedel来删除用户，并使用-r选项删除用户目录：

sudo userdel -r test_user

2、更改用户权限

参考：Linux下添加用户并赋予root权限三种方法

对于新建的用户可能需要赋予root权限，推荐使用如下方法：

1、vim /etc/sudoers ，找到下面内容

## Allow root to run any commands anywhere
root    ALL=(ALL)     ALL

2、在root后添加如下内容

test_user   ALL=(ALL)     ALL

3、修改后的文件内容如下，此时通过sudo命令，test_user即可获得root权限

## Allow root to run any commands anywhere
root    	ALL=(ALL)     ALL
test_user   ALL=(ALL)     ALL

二、服务器环境配置

1、安装NVIDIA驱动

对于深度学习服务器，可以使用nvidia-smi命令查看显卡使用情况，这就需要安装NVIDIA驱动。

1、去官网下载显卡对应的驱动版本，先选择显卡版本，然后点击搜索和下载即可

2、上传驱动程序至服务器，并赋予可执行权限

sudo chmod +x NVIDIA-Linux-x86_64-515.76.run

3、安装驱动程序，然后按照提示安装即可

sudo ./NVIDIA-Linux-x86_64-515.76.run

安装过程可能遇到如下问题，对应解决方案如下：

参考：安装 NVIDIA 显卡驱动时报错：An NVIDIA kernel module ‘nvidia-drm‘ appears to already be load

1、An NVIDIA kernel module ‘nvidia-drm‘ appears to already be load

原因：因为安装的是Ubuntu 图形化版本，之前也安装了 NVIDIA 驱动和 CUDA，系统加载图形化界面后，就会自动加载运行 NVIDIA 相关模块（如：nvidia-drm、nvidia-modeset 等）。

解决方法：启动 Ubuntu 系统时不让系统加载图形化界面。在终端命令模式下卸载 NVIDIA 驱动，再重装新的驱动。

# 1. 获得超级用户权限
sudo -i
# 2. 关闭所有使用 GPU 的进程
sudo systemctl isolate multi-user.target
sudo modprobe -r nvidia-drm
# 3. 重装 NVIDIA 驱动
sudo ./NVIDIA-Linux-x86_64-XX.run 
# 4. 打开使用GPU的进程
sudo systemctl set-default multi-user.target  
# 5. 重新启动
sudo reboot

2、缺失gcc或make

sudo apt-get install gcc
sudo apt-get install make

3、x server或nouveau相关

sudo ./NVIDIA-Linux-x86_64-XX.run --no-x-check --no-nouveau-check

4、貌似安装驱动时加上 --no-opengl-files可以避免重启后nvidia-smi命令失效

5、如果出现ERROR: Unable to load the kernel module ‘nvidia.ko’. 安装输出的日志，可能是gcc原因，也可能是nouveau的原因。如果是nouveau的原因，可参考TITAN RTX安装驱动、cuda10 cudnn神报错： ERROR: Unable to load the kernel module ‘nvidiko‘

# 查看lightdm和dgm状态
sudo service lightdm status
service gdm status
# 如果正在运行，就stop；否则忽略即可
sudo service lightdm stop
service gdm stop

# 修改/etc/modprobe.d/blacklist.conf，末尾添加如下两行：
blacklist nouveau
options nouveau modeset=0

# update
sudo update-initramfs -u
# 重启
sudo reboot
# 查看nouveau状态，如果没有输出，则说明ok了
lsmod | grep nouveau

2、安装CUDA Toolkit

1、去官网选择要安装的版本

2、以cuda 11.1为例，选择系统配置

3、执行安装命令，由于前面已经安装了nvidia驱动，所以在安装选项里要取消Driver

wget https://developer.download.nvidia.com/compute/cuda/11.1.1/local_installers/cuda_11.1.1_455.32.00_linux.run
sudo sh cuda_11.1.1_455.32.00_linux.run

4、将cuda写入环境变量，由于是多用户系统，推荐在/etc/profile文件（所有用户均生效）的末尾写入，也可以在~/.bashrc文件（仅当前用户生效）的末尾写入

#####################cuda11.1#######################
export PATH=$PATH:/usr/local/cuda-11.1/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.1/lib64

5、source刷新环境变量

source /etc/profile

安装过程可能遇到如下问题，对应解决方案如下：

1、gcc版本太高

推荐使用gcc 9.4.0，也可以根据提示no-check

参考：Ubuntu中gcc、 g++安装与卸载

# 1.卸载
sudo apt-get remove gcc gcc-xx   #可能有多个版本，都要删掉
sudo apt-get remove g++
# 2.安装gcc、g++
sudo apt-get install gcc # 默认安装的是gcc 9.4.0
sudo apt-get install build-essential

3、配置启动内核

在安装好NVIDIA驱动后，如果重启服务器，可能出现一种奇怪的现象：nvidia-smi命令无法使用，NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver。

这是由于系统内核版本过高，导致NVIDIA驱动失效，这时候就需要配置启动内核，步骤如下：

1、查看当前内核版本，默认是5.15.0

uname -a

2.安装旧的内核，亲测5.11.0-34-generic可用

参考：UBUNTU 18.04安装指定内核

apt-get install linux-image-5.11.0-34-generic linux-headers-5.11.0-34-generic linux-modules-extra-5.11.0-34-generic

如果安装成功，使用

dpkg --list | grep linux-image

就可以从列表中看到 linux-image-5.11.0-34-generic

3.修改系统默认启动内核

需要修改/etc/default/grub文件来设置系统启动的内核，该配置文件默认内容如下：

GRUB_DEFAULT=0 # 默认内核启动项
GRUB_TIMEOUT_STYLE=hidden # 系统启动时菜单是否显示
GRUB_TIMEOUT=0
GRUB_DISTRIBUTOR=`lsb_release -i -s 2> /dev/null || echo Debian`
GRUB_CMDLINE_LINUX_DEFAULT="quiet splash"
GRUB_CMDLINE_LINUX=""

我们要修改的就是第一项，那么如何修改第一项使得我们的启动内核变为我们想要的版本呢？有三种方式：

在重启时，快速按ESC进入GNU grub界面，通过启动菜单来观察我们需要的内核，可参考：Ubuntu指定默认Linux内核启动

但是这种方法只适合于本地机器，对于服务器来说，我们通常不会到机房去直接连接机器进行操作。
直接在GRUB_DEFAULT中指定内核版本，可参考：Ubuntu设置开机时启动的系统内核版本 & 安装低版本内核

这种方法直接修改配置文件第一行为：
```
GRUB_DEFAULT="Advanced options for Ubuntu>Ubuntu, with Linux 5.11.0-34-generic"
```
注意，如果按照这种方式修改更新并重启后，发现系统内核版本并未切换成功，可能是因为你的系统语言是中文。所以需将第一行修改为：
```
GRUB_DEFAULT="Ubuntu 高级选项>Ubuntu，Linux 5.11.0-34-generic"
```

由于第一种方法需要连接机器来实现，那有没有办法不连接机器就可以知道启动菜单呢？当然是有的，这就是第三种方法。可参考：Ubuntu修改默认启动的内核版本（grub）

首先查看启动菜单的配置文件

cat /boot/grub/grub.cfg | grep menuentry
# 结果如下：
menuentry 'Ubuntu' 
submenu 'Advanced options for Ubuntu' 
        menuentry 'Ubuntu, with Linux 5.15.0-50-generic'
        menuentry 'Ubuntu, with Linux 5.15.0-50-generic (recovery mode)' 
        menuentry 'Ubuntu, with Linux 5.15.0-48-generic' 
        menuentry 'Ubuntu, with Linux 5.15.0-48-generic (recovery mode)' 
        menuentry 'Ubuntu, with Linux 5.11.0-34-generic' 
        menuentry 'Ubuntu, with Linux 5.11.0-34-generic (recovery mode)' 
menuentry 'UEFI Firmware Settings'

在上述显示信息的情况下，说明grub开机启动界面的菜单结构理应如下：

*Ubuntu # *表示一级菜单
*Advanced options for Ubuntu
**Ubuntu, with Linux 5.15.0-50-generic # **表示二级菜单
**Ubuntu, with Linux 5.15.0-50-generic (recovery mode)
**Ubuntu, with Linux 5.15.0-48-generic
**Ubuntu, with Linux 5.15.0-48-generic (recovery mode)
**Ubuntu, with Linux 5.11.0-34-generic
**Ubuntu, with Linux 5.11.0-34-generic (recovery mode)
*UEFI Firmware Settings

所以我们需要将配置文件第一行修改为：

GRUB_DEFAULT="1>4" # 表示进入第1个一级菜单下的第4个二级菜单

（菜单的起始索引为0，所以"Advanced options for Ubuntu"对应的就是0， "Ubuntu, with Linux 5.11.0-34-generic"对应的就是4）

4.更新配置文件并重启

sudo update-grub
sudo reboot

重启完成后，可使用

uname -a

再次查看内核版本是否正常切换

4、挂载硬盘

在配置深度学习服务器时，除了系统盘外，还会存在多个数据盘，为了方便访问，需要将这些数据盘挂载到指定目录。可参考：Ubuntu硬盘的挂载（临时、永久挂载）

1、临时挂载

sudo mkdir /data # 在根目录下新建目录data作为挂载目录
sudo mount /dev/sdb1 /data # 将硬盘/dev/sdb1挂载到/data目录，可通过sudo fdisk -l | grep /dev来查看磁盘情况

2、开机自动挂载

修改/etc/fstab文件，添加如下内容：

/dev/sdb1     /data  auto   defaults    0       0

命令格式为：

/dev/device mountpoint type rules dump order

设备名称挂载点分区类型挂载选项 dump选项 fsck选项

各参数含义如下：

设备名称挂载点分区类型挂载选项 dump选项 fsck选项

设备名称可以通过sudo fdisk -l | grep /dev来查看
挂载点即创建的挂载目录
分区类型指的是该磁盘的文件系统
default的意义是在于按照大多数文件系统的缺省值设置挂载定义，即系统的默认定义（对于大多数文件系统的处理方式），其实除了default还有auto就是开机自动挂载，noauto就是开机不自动挂载，nouser就是只有超级用户才挂载，user，所有用户都挂载
dump 就是从不备份
fsck的检查顺序，0为不检查，分区为1，其他分区从2开始，这里指的是检查的优先级

三、Anaconda虚拟环境配置

1、安装Anaconda

在使用服务器时，可以使用Anaconda来创建和管理多个虚拟环境，非常好用。安装步骤如下：

1、去官网下载安装文件

2、上传至服务器并赋予执行权限

chmod +x Anaconda3-2022.05-Linux-x86_64.sh

3、安装

sh ./Anaconda3-2022.05-Linux-x86_64.sh

注意，安装路径默认是当前用户的home目录下的anaconda3，例如：/home/test_user/anaconda3。在询问是否执行conda initialization时，选择yes，这样就不需要自己配置环境变量了（默认写入~/.bashrc文件）。

2、配置TensorFlow虚拟环境

1、新建一个Python环境

conda create -n tf2.6 python=3.8 # 新建一个名为tf2.6的Python3.8环境
conda activate tf2.6 # 激活tf2.6环境

注：推荐Python环境为3.6-3.9，太高或太低都可能出现一些问题

2、下载TensforFow-GPU版本

pip install tensorflow-gpu==2.6.0 # 通过pip下载tensorflow-gpu的2.6.0版本

3、验证是否安装成功，执行如下Python代码即可：

import tensorflow as tf
tf.test.is_gpu_available()

4、tensorflow最近更新到2.12+版本了，有大坑。2.12+版本不再区分cpu和gpu，所以需要自己配置好cuda和cudnn环境。
如果想安装新版本，有点麻烦，可参考关于GPU版本tensorflow2.12.0版本安装问题。推荐的安装方式可参考：tensorflow gpu 快速安装与验证（自动装配，无需手动选择 cudnn，cudatoolkit），conda-forge通道很慢，尽量不要使用。

5，直接用pip安装tensorflow-gpu需要配置好cudnn，具体可参考Ubuntu 18.04安装CUDA和cuDNN

1, 从官网download与cuda版本对应的cudnn包
2，解压
3，将指定文件复制到cuda安装目录
4，赋予相关权限

3、配置PyTorch虚拟环境

1、新建一个Python环境

conda create -n py1.7 python=3.7 # 新建一个名为py1.7的python3.7环境
conda activate py1.7 # 激活py1.7环境

2、下载PyTorch-GPU版本

去官网查看对应版本的安装命令并执行

conda install pytorch==1.7.1 torchvision==0.8.2 torchaudio==0.7.2 cudatoolkit=11.0 -c pytorch

3、验证是否安装成功，执行如下Python代码即可：

import torch
print(torch.__version__)
print(torch.cuda.is_available())

4、注意conda-forge这个通道会比较慢，所以安装pytorch的时候，最好选择不带conda-forge的命令，例如：

# CUDA 11.3, 推荐，速度很快
conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=11.3 -c pytorch
# CUDA 11.6，不推荐，速度很慢
conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=11.6 -c pytorch -c conda-forge

四、服务器远程访问配置

1、配置ssh

配置ssh是服务器配置的第一步，只有这样，才可以通过ssh命令远程访问服务器。

参考：使用Linux，从正确配置ssh开始

sudo apt update
sudo apt install openssh-server -y
sudo systemctl status ssh #查看状态
# 如果你的防火墙开启了，使用下面语句
sudo ufw allow ssh

配置好ssh之后，就可以使用ssh命令远程访问服务器了。

ssh username@server_ip -p ssh_port # 例如 ssh [email protected] -p 22

2、配置xrdp

当配置ssh之后，也只能使用终端来远程访问服务器，如果要使用图形界面，例如Windows的远程桌面来访问就需要配置xrdp。可参考：如何在Ubuntu 20.04 上安装 Xrdp 服务器（远程桌面）

sudo apt install xrdp # 安装xrdp
sudo systemctl status xrdp # 查看xrdp状态
sudo adduser xrdp ssl-cert # 将xrdp用户添加到"ssl-cert"用户组
sudo systemctl restart xrdp # 重启xrdp服务

3、配置frp内网穿透

由于服务器一般只限于局域网内访问，这就使得外地远程访问并不友好，可以通过frp配置内网穿透来实现外地访问服务器。可参考：ubuntu frp方式，实现内网穿透

1、准备

需要准备一台可以正常访问的具有公网ip的外网服务器，可以购买阿里云、腾讯云等云服务器。

外网服务器需要开启相应的访问端口，包括：连接端口和转发映射端口。

在准备好外网服务器之后，去GitHub下载对应的程序包。

2、配置frps服务器端

将程序包上传至外网服务器，并解压
```
tar -xzvf frp_0.44.0_linux_amd64.tar.gz
```

配置frps.ini文件

[common]
bind_port = 7000 # 外网服务器和本地服务器连接的端口

启动frps服务器

nohup ./frps -c frps.ini >frps.log 2>&1 &

3、配置frpc客户端

将程序包上传至本地网服务器，并解压
```
tar -xzvf frp_0.44.0_linux_amd64.tar.gz
```

配置frpc.ini文件

[common]
server_addr = 外网服务器公网ip
server_port = 7000

[ssh-22] # 转发映射22端口
type = tcp
local_ip = 127.0.0.1
local_port = 22 # 本地服务器的22端口
remote_port = 2222 # 外网服务器的2222端口

[ssh-3389] # 转发映射3389端口
type = tcp
local_ip = 127.0.0.1
local_port = 3389 # 本地服务器的3389端口
remote_port = 3390 # 外网服务器的3390端口

启动frpc客户端

nohup ./frpc -c frpc.ini >frpc.log 2>&1 &

4、配置frp开机自启

nohup启动只能保证frp服务会一直挂载在后台，如果服务器重启，frp服务也会中断。因此需要配置开机自启，以本地服务器配置frpc开机自启为例。可参考：frp设置开机自启的几种方法

1、安装Supervisor

sudo apt install supervisor

2、配置frpc服务

sudo vim /etc/supervisor/conf.d/frpc.conf

文件内容如下：

[program:frpc]
command = /your_frp_path/frpc -c /your_frp_path/frpc.ini
autostart = true

记得给frpc chmod +x 赋予可执行权限

3、重启Supervisor

# 重启supervisor
sudo systemctl restart supervisor
# 查看supervisor运行状态
sudo supervisorctl status

五、遇到的其他问题

1、ubuntu网络链接激活失败

参考：ubuntu网络链接激活失败，或者网络链接图标不显示的问题

sudo service network-manager restart # 重启网络
sudo service network-manager stop
sudo rm /var/lib/NetworkManager/NetworkManager.state
sudo service network-manager start

2、E：无法定位软件包

参考：解决 Ubuntu 无法定位软件包问题

把软件和更新里面的"下载自：主服务器"改为"下载自：中国的服务器"即可

你可能感兴趣的:(#,深度学习服务器,服务器,深度学习,linux)

如何在 Windows 上安装 ONLYOFFICE 文档 v7.2 ONLYOFFICE
通过阅读本文，了解如何在Windows上安装ONLYOFFICE文档v7.2。引言使用社区版，您可以在本地服务器上安装ONLYOFFICE文档，并将在线编辑器与ONLYOFFICE协作平台或其他热门系统集成在一起。ONLYOFFICE文档是一个在线办公套件，包括文本文档、电子表格和演示文稿的查看器和编辑器，与包括.docx、.xlsx、.pptx在内的OfficeOpenXML格式完全兼容，并支持
# 检测 COM 服务器在线状态胡八一、报错解决服务器 qt 运维
适用场景OPCDA／OPCAE等基于DCOM的工业软件巡检自动化部署脚本中批量验证远程COM组件是否可用Windows服务开机自检1.背景在工业控制与运维场景下，我们经常需要判断某台机器上的COM/DCOM服务器（例如OPCServer）是否存活，并在掉线时及时告警或自动重连。.NET自带的System.Type.GetTypeFromProgID/Activator.CreateInstance
虚拟机中 Linux环境下idea 报Java HotSpot(TM) 64-Bit Server VM warning: ignoring option MaxPermSize=350m；秋林辉 JAVA idea linux jdk intellij idea
问题JavaHotSpot(TM)64-BitServerVMwarning:ignoringoptionMaxPermSize=350m;supportwasremovedin8.0无法启动原因在Java8中，命令行标志MaxPermSize已被删除。原因是永久代已从热点堆中删除，并已移至本机内存。所以不需要配置，内存足够！第一先看看你是不是使用JDK8，如果是MaxPermSize这个配置无效
云服务器、VPS、虚拟主机三者之间的区别一只IT攻城狮
一、VPSVPS（VirtualPrivateServer虚拟专用服务器）技术，将一台服务器分割成多个虚拟专享服务器的优质服务。实现VPS的技术分为容器技术，和虚拟化技术。在容器或虚拟机中，每个VPS都可分配独立公网IP地址、独立操作系统、实现不同VPS间磁盘空间、内存、CPU资源、进程和系统配置的隔离，为用户和应用程序模拟出“独占”使用计算资源的体验。VPS可以像独立服务器一样，重装操作系统，安
Linux检测远程端口是否打开的六种方法岚天start 运维网络 linux ssh 网络
Linux检测远程端口是否打开的六种方法服务器环境：[root@java-test-server~]#cat/etc/redhat-releaseCentOSLinuxrelease7.6.1810(Core)方法一：Telnet命令【yum-yinstalltelnet】#端口通显示如下（实验IP为自定义IP）[root@java-test-server~]#telnet88.88.88.888
高防IP与高防CDN有哪些区别呢？肖家山子龙
为了避免因为攻击导致的服务器瘫痪，运营商们通常会选择具备高防御的服务器来进行运营。如果是在运营过程中遭遇了攻击，不想去更换服务器的话。这个时候，就可以采用添加高防IP或者高防CDN的形式去防御了。那么在使用上，高防IP与高防CDN有哪些区别呢？区别一：应用场景的不同高防IP与高防CDN都是具备防御攻击特性的两种产品。但是在应用上，两者应用的范围是有区别的，高防IP主要是应用在游戏上居多。而高防CD
关于anaconda的一些初级小配置玄枫若雲_濟玄 python conda jupyter
anaconda镜像源这里推荐北京外国语大学镜像源，北京外国语大学镜像源是清华大学镜像源的姊妹站，都由清华大学维护，但服务器是北京外国语大学的。所以使用北京外国语大学的镜像源能避免清华大学镜像源服务器压力过大导致的速度慢等等。（北京外国语大学镜像源链接）北外的镜像最近已经不提供anaconda服务了，现在我已经把文中的换成了西交大镜像源具体配置可参加北京外国语大学镜像源的介绍，这里为了方便读者阅读
Linux系统磁盘挂载操作及原理详解
前言：在Linux系统的日常运维与管理中，磁盘存储的配置是一项基础且关键的工作。无论是新增一块物理硬盘、扩展云服务器的云盘，还是处理分区扩容，最终都绕不开“挂载”这一核心操作——只有将磁盘分区正确挂载到系统目录树中，其存储空间才能被有效利用。然而，挂载并非简单的“连接”操作，它涉及分区识别、文件系统格式化、挂载点设置、开机自动挂载配置等多个环节，每个步骤都有其特定的逻辑和注意事项。例如，不同文件系
错误代码ERR_TOO_MANY_REDIRECTS网页打不开？从Nginx配置到Cloudflare的排查全记录
前言：从“网页打不开”到找到根源的真实记录“ERR_TOO_MANY_REDIRECTS”——这个错误代码想必不少开发者都遇到过：明明域名解析、服务器配置都检查过了，可网页就是打不开，浏览器提示“重定向次数过多”。更让人头疼的是，有时候注释掉某段Nginx配置（比如用于强制跳转的return301），网页突然就能打开了，但原本想要的功能（比如HTTP强制转HTTPS）却没了。最近我就碰到了这个典型
天文图像处理：星系分类与天体定位 xcLeigh 计算机视觉CV 图像处理分类人工智能 AI 计算机视觉
天文图像处理：星系分类与天体定位一、前言二、天文图像处理基础2.1天文图像的获取2.2天文图像的格式2.3天文图像处理的基本流程三、天文图像预处理3.1去噪处理3.2平场校正3.3偏置校正四、星系分类4.1星系的分类体系4.2基于特征提取的星系分类方法4.3基于深度学习的星系分类方法五、天体定位5.1天体坐标系统5.2基于星图匹配的天体定位方法5.3基于深度学习的天体定位方法六、总结与展望致读者一
深度学习——CNN（3）飘涯
前言：前面介绍了最基本的Lenet，下面介绍几种其他的网络结构CNN-AlexNet网络结构如下图：从图中可以看出，采用双gpu训练增加LRN归一化层：本质上，这个层也是为了防止激活函数的饱和的。采用dropout防止过拟合基于AlexNet进行微调，诞生了ZF-netCNN-GoogleNetGoogLeNet借鉴了NIN的特性，在原先的卷积过程中附加了11的卷积核加上ReLU激活。这不仅仅提升
分布式系统中优化ELK日志采集性能 Alex艾力的IT数字空间 elk 微服务中间件架构 ux 安全性测试可用性测试
架构设计、组件调优、资源分配等多维度入手一、架构优化：分布式与解耦设计分层采集与缓冲Filebeat轻量级采集：在每台服务器部署Filebeat替代Logstash作为日志收集器，降低资源占用（CPU/内存减少70%以上）。引入缓冲队列：通过Redis或Kafka作为日志缓冲池，缓解Logstash或Elasticsearch的突发流量压力，避免数据丢失（如Logstash异常时Redis暂存数据
快速入门--Linux常用指令实操（1） small_jimmy 服务器 linux 运维
操作步骤命令示例设置root密码sudopasswdroot创建新目录mkdirproject进入project目录cdproject查看当前路径pwd查看目录内容ls-l创建temp目录mkdirtemp删除空目录temprmdirtemp文件查看相关分页查看文件morehello.txt高级分页查看lesshello.txt查看文件结尾tailhello.txt编辑文件gedithello.t
Linux 系统进阶操作实践：目录管理与系统信息查看指南小任今晚几点睡 RHCSA linux 网络运维
文章摘要本文详细记录了Linux系统中通过Xshell远程管理的核心操作，包括系统信息查询、复杂目录结构创建与树形展示、多级目录快速生成、文件创建与删除、大文件制作等实践步骤。通过命令示例与输出解析，清晰呈现每一步操作的逻辑与效果，帮助读者掌握目录管理、系统信息查看及文件操作的实用技巧，适合Linux实操学习者参考。一、通过Xshell远程登录及系统信息查询使用Xshell通过root账户登录Li
Linux基础学习---文件相关命令
文件操作命令命令作用语法格式参数案例touch创建文件touch文件名-t时间：手动指定时间戳（格式：YYMMDDhhmm[.ss]）touchfile1.txt:在当前目录下创建file1.txttouchfile1.txtfile2.txtfile3.txt:创建多个文件touch-t202501011230.45file.txt:指定时间戳（设为2025年1月1日12:30:45）cp（co
PHP MySQL 读取数据 froginwe11 开发语言
PHPMySQL读取数据引言在Web开发中，PHP和MySQL是两个常用的技术栈。PHP作为服务器端脚本语言，而MySQL作为关系型数据库管理系统，两者结合能够构建强大的动态网站。本文将详细介绍如何使用PHP从MySQL数据库中读取数据，包括连接数据库、执行查询、处理结果等关键步骤。连接MySQL数据库在PHP中，首先需要连接到MySQL数据库。以下是一个示例代码，展示了如何使用mysqli扩展连
Linux和Windows保存Git账号和密码小米加大米Q
场景：Linux和Windows中每次pull的时候都会输入用户名和密码？如图：解决方案：在系统中输入命令：gitconfig--globalcredential.helperstore之后操作不在需要输入用户名和密码。
微算法科技技术突破：用于前馈神经网络的量子算法技术助力神经网络变革 MicroTech2025 量子计算算法神经网络
随着量子计算和机器学习的迅猛发展，企业界正逐步迈向融合这两大领域的新时代。在这一背景下，微算法科技（NASDAQ:MLGO）成功研发出一套用于前馈神经网络的量子算法，突破了传统神经网络在训练和评估中的性能瓶颈。这一创新性的量子算法以经典的前馈和反向传播算法为基础，借助量子计算的强大算力，极大提升了网络训练和评估效率，并带来了对过拟合的天然抗性。前馈神经网络是深度学习的核心架构，广泛应用于图像分类、
linux安装Node.js 环境，Docker 环境，Ruby 环境，MongoDB 环境，PostgreSQL 数据库，Go 开发环境，Python 虚拟环境 2401_87017622 数据库 linux node.js
在Linux上安装其他常见的开发环境可以根据具体需求而定，以下是一些常见的安装步骤：1.Node.js环境Node.js是一个基于ChromeV8引擎的JavaScript运行环境，适用于服务器端开发。安装Node.js：通过包管理器安装：sudoyuminstall-ygcc-c++makecurl-sLhttps://rpm.nodesource.com/setup_14.x|sudo-Eba
Http与Https区别和联系
一、HTTP详解HTTP（HyperTextTransferProtocol）是互联网数据通信的基础协议，用于客户端（浏览器）与服务器之间的请求-响应交互核心特性：1.无连接（Connectionless）每次请求/响应后立即断开TCP连接（早期HTTP/1.0）。HTTP/1.1默认启用持久连接（Connection:keep-alive），但逻辑上仍视为独立的请求2.无状态（Stateless
WIFI7新特性浅析及Linux内核对其的支持 winter91 Linux NetWork linux WIFI
WIFI7新特性浅析及Linux内核对其的支持|DD'NotesWIFI7新特性浅析及Linux内核对其的支持wifi7新特性Wi-Fi7（IEEE802.11be）作为下一代无线网络标准，在速度、延迟、容量和稳定性等方面实现了显著提升。以下是其核心新特性：1.更高带宽与速率320MHz信道带宽支持连续320MHz或非连续160+160MHz带宽（6GHz频段），相比WiFi6的160MHz实现速
C++-linux 7.文件IO（二）文件描述符、阻塞与非阻塞 HHRL-yx C++-linux系统编程 linux c++服务器
文件IO进阶：文件描述符、阻塞与非阻塞在前文我们介绍了文件IO的核心系统调用，本章将深入探讨Linux文件IO的底层机制，包括文件描述符的本质、阻塞与非阻塞IO模型、文件偏移量控制（lseek）以及系统调用中的参数传递规则，帮助你构建更完整的系统编程知识体系。一、文件描述符：进程与文件的桥梁在Linux系统中，当我们打开或创建一个文件（或套接字）时，操作系统会提供一个文件描述符（FileDescr
如何使用Google AdSense实现H5小游戏变现（二） Louisa的工作日记
上一篇内容主要介绍了H5小游戏的市场情况洞察、GoogleAdSense介绍、收入核心指标，本篇文章将介绍如何改善展示次数、eCPM，以及如何使用GA来优化网站质量。01.如何改善展示次数1、网站DAU网站DAU和你的渠道息息相关，这里作为H5小游戏网站常常容易遇到的问题：服务器承载压力过大崩溃。需要时刻监控服务器情况，海外推荐使用亚马逊相关服务，国内服务提供商均存在不稳定情况。此外，必须支持ht
Tomcat生命周期原理深度剖析
Tomcat生命周期原理深度剖析本文围绕Tomcat生命周期机制，结合架构图、源码精讲、设计思想、实际案例、调优技巧等全方位解读，帮助读者系统掌握Tomcat生命周期的本质与应用。一、Tomcat生命周期概述Tomcat作为JavaWeb服务器的代表，其架构中每个核心组件（如Server、Service、Engine、Host、Context、Wrapper等）都拥有独立的生命周期。Tomcat通
网络请求的基本概念、原理及生活化解析程序小武 python爬虫入门网络
一、引言：你每天用的网络请求，原来这么复杂！每天清晨，你打开手机点个外卖，点了杯咖啡。这个简单的动作，背后其实有一连串复杂的网络请求发生。就像你和咖啡师说“来一杯美式加奶”，在数字世界里，手机和咖啡店系统之间也在“对话”。这些对话遵循一套规则，今天就用一些生活中的比喻来跟你解说这些规则是怎么运作的。二、核心概念：生活化理解网络请求1.客户端与服务器：数字世界的“顾客”与“商家”客户端：就是你手中的
通过 Docker 和 Kubernetes 部署前后端代码到服务器
目录通过Docker和Kubernetes部署前后端代码到服务器一、准备工作二、创建Docker镜像三、部署到Kubernetes四、访问应用程序五、总结在现代软件开发中，Docker和Kubernetes已成为部署应用程序的强大工具。它们提供了一种可靠、可扩展和高效的方式来将前后端代码部署到服务器上。本文将介绍如何使用Docker和Kubernetes来部署前后端代码。一、准备工作安装Docke
mac OS上docker安装zookeeper
拉取镜像：$dockerpullzookeeper:3.5.73.5.7:Pullingfromlibrary/zookeeper3.5.7:Pullingfromlibrary/zookeeper3.5.7:Pullingfromlibrary/zookeepernomatchingmanifestforlinux/arm64/v8inthemanifestlistentries报错：由于时M3
英伟达Triton 推理服务详解 leo0308 基础知识机器人 Triton 人工智能
1.TritonInferenceServer简介TritonInferenceServer（简称Triton，原名NVIDIATensorRTInferenceServer）是英伟达推出的一个开源、高性能的推理服务器，专为AI模型的部署和推理服务而设计。它支持多种深度学习框架和硬件平台，能够帮助开发者和企业高效地将AI模型部署到生产环境中。Triton主要用于模型推理服务化，即将训练好的模型通过
Apache Olingo OData4 教程凌崧铖
ApacheOlingoOData4教程1.项目介绍ApacheOlingo是一个由Apache软件基金会支持的开源库，用于实现OData（OpenDataProtocol）协议的客户端和服务器端。OData4版本是针对OData规范第4版的实现，提供了一组Java库，帮助开发者轻松创建ODataV4兼容的服务和应用程序。2.项目快速启动Maven配置在你的pom.xml文件中添加ApacheOl
Linux 定时器应用示例
1.运行结果2.程序#include#include#includeintcount=0;structitimervalt;voidtimer_handler(intsig){printf("timer_handler:signal=%d,count=%d\n",sig,++count);if(count>=8){printf("canceltimer\n");t.it_value.tv_sec=
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To [email protected]:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to '[email protected]
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。