吃饭就用盆

slurm作业调度集群搭建及配置

一环境准备

二时间同步

三 munge认证

四数据库安装

五 slurm搭建

六集群用户管理和初始化配置

qos配置

一环境准备

主机规划

master 192.168.220.128

node1 192.168.220.129

关闭防火墙 hosts文件互相通信

二时间同步

1.安装时间同步软件
yum -y install ntp.x86_64
yum -y install ntpdate.x86_64

2.同步阿里云时间服务器
ntpdate ntp.aliyun.com

3.开机自启服务
systemctl stop firewalld
systemctl enable ntpd
systemctl restart ntpd

三 munge认证

master配置

1.确保没有安装过munge和munge用户
yum remove -y munge munge-libs munge-devel
userdel -r munge

2.添加munge用户

export MUNGEUSER=1120
groupadd -g $MUNGEUSER munge 
useradd -m -c "MUNGE Uid 'N' Gid Emporium" -d /var/lib/munge -u $MUNGEUSER -g munge -s /sbin/nologin munge 

3.安装munge软件
yum install munge munge-devel munge-libs rng-tools -y

4.添加配置文件

rngd -r /dev/urandom
create-munge-key
dd if=/dev/urandom bs=1 count=1024 > /etc/munge/munge.key  
chown munge: /etc/munge/munge.key 
chmod 400 /etc/munge/munge.key
chown -R munge: /var/lib/munge
chown -R munge: /var/run/munge
chown -R munge: /var/log/munge

5.发送秘钥给客户端

scp /etc/munge/munge.key root@node1:/etc/munge/

6.启动服务

systemctl start munge
systemctl enable munge

node1配置

1.确保没有安装过munge和munge用户
yum remove -y munge munge-libs munge-devel
userdel -r munge

2.添加munge用户

export MUNGEUSER=1120
groupadd -g $MUNGEUSER munge 
useradd -m -c "MUNGE Uid 'N' Gid Emporium" -d /var/lib/munge -u $MUNGEUSER -g munge -s /sbin/nologin munge 

3.安装munge软件
yum install munge munge-devel munge-libs rng-tools -y

4.添加配置文件

rngd -r /dev/urandom
chmod 700 /etc/munge
chown -R munge: /etc/munge
chown -R munge: /var/lib/munge
chown -R munge: /var/run/munge
chown -R munge: /var/log/munge

5.启动服务
systemctl start rngd
systemctl start munge
systemctl enable rngd
systemctl enable munge

四数据库安装

1.安装数据库
yum install mariadb-server mariadb-devel

2.重置密码
mysql_secure_installation
mysql -u root -ppassword   #password为之前你设置的root密码

3.进入数据库
# 生成slurm用户，以便该用户操作slurm_acct_db数据库，其密码是SomePassWD，可自行设定
create user 'slurm'@'localhost' identified by 'SomePassWD';
 
# 生成账户数据库slurm_acct_db
create database slurm_acct_db;
# 赋予slurm从本机localhost采用密码SomePassWD登录具备操作slurm_acct_db数据下所有表的全部权限
grant all on slurm_acct_db.* TO 'slurm'@'localhost' identified by 'SomePassWD' with grant option;
# 赋予slurm从node1采用密码SomePassWD登录具备操作slurm_acct_db数据下所有表的全部权限
grant all on slurm_acct_db.* TO 'slurm'@'node1' identified by 'SomePassWD' with grant option;
 
# 生成作业信息数据库slurm_jobcomp_db
create database slurm_jobcomp_db;
# 赋予slurm从本机localhost采用密码SomePassWD登录具备操作slurm_jobcomp_db数据下所有表的全部权限
grant all on slurm_jobcomp_db.* TO 'slurm'@'localhost' identified by 'SomePassWD' with grant option;
# 赋予slurm从node1采用密码SomePassWD登录具备操作slurm_jobcomp_db数据下所有表的全部权限
grant all on slurm_jobcomp_db.* TO 'slurm'@'node1' identified by 'SomePassWD' with grant option;

 flush privileges; ##保存配置

修改配置文件my.cnf

# The following options will be passed to all MySQL clients
[client]
port=3306
socket=/var/lib/mysql/mysql.sock
default-character-set=utf8mb4
 
# Here follows entries for some specific programs
[mariadb_safe]
log-error=/var/log/mariadb/mariadb.log
pid-file=/var/run/mariadb/mariadb.pid
 
# The MySQL server
[mariadb]
# explicit_defaults_for_timestamp = true
datadir=/var/lib/mysql
port = 3306
# Disabling symbolic-links is recommended to prevent assorted security risks
symbolic-links=0
#
sql_mode='STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION'
 
interactive_timeout=1200
wait_timeout=1800
 
skip_name_resolve=OFF
innodb_file_per_table=ON
max_connections=2048
max_connect_errors=1000000
max_allowed_packet=16M
sort_buffer_size=512K
net_buffer_length=16K
read_buffer_size=512K
read_rnd_buffer_size=512K
character_set_server=utf8mb4
collation_server=utf8mb4_bin
thread_stack=256K
thread_cache_size=384
tmp_table_size=96M
max_heap_table_size=96M
 
#open slow query
slow_query_log=OFF
slow_query_log_file=/var/lib/mysql/mysql-slow-query.log
#set slow time to default 10 second, minimum value 0
long_query_time=4
 
local_infile=OFF
 
# binary logging is required for replication
#log_bin=mysql-bin
 
#master - slave syncronized setting
log_slave_updates=ON
 
server-id=1
 
log-bin=mysql-bin
sync_binlog=1
binlog_checksum = none
binlog_format = mixed
auto-increment-increment = 2
auto-increment-offset = 1
slave-skip-errors = all
sync_binlog=1
binlog_checksum = none
binlog_format = mixed
auto-increment-increment = 2
auto-increment-offset = 1
slave-skip-errors = all
 
 
# Uncomment the following if you are using InnoDB tables
#innodb_data_home_dir = /var/lib/mysql/
#innodb_data_file_path = ibdata1:10M:autoextend
#innodb_log_group_home_dir = /var/lib/mysql/
#innodb_log_arch_dir = /var/lib/mysql/
# You can set .._buffer_pool_size up to 50 - 80 %
# of RAM but beware of setting memory usage too high
event_scheduler=ON
default_storage_engine=InnoDB
innodb_buffer_pool_size=1024M  #64M # 1024M
innodb_purge_threads=1
innodb_log_file_size=128M
innodb_log_buffer_size=2M
innodb_lock_wait_timeout=900  #120
 
bulk_insert_buffer_size=32M
myisam_sort_buffer_size=8M
 
#MySQL rebuild index allowed maxmum cache file
myisam_max_sort_file_size=4G
myisam_repair_threads=1
lower_case_table_names=0
 
[mysqldump]
quick
max_allowed_packet=16M
 
#[isamchk]
#key_buffer = 16M
#sort_buffer_size = 16M
#read_buffer = 4M
#write_buffer = 4M
 
[myisamchk]
key_buffer=16M
sort_buffer_size=16M
read_buffer=4M
write_buffer=4M
 
#
# include all files from the config directory
#
!includedir /etc/my.cnf.d

4.重启数据库 
cd /var/lib/mysql
mv ib_logfile0 ib_logfile0.bak
mv ib_logfile1 ib_logfile1.bak

systemctl restart mariadb && systemctl enable mariadb

五 slurm搭建

1.编译slurm包
yum install -y readline-devel perl-ExtUtils* perl-Switch pam-devel lua-devel hwloc-devel


2.下载slurm包 本次使用的是最新版本22.05

Downloads | SchedMDhttps://www.schedmd.com/downloads.php

3.编译安装包

rpmbuild -ta -with lua slurm-21.08.8-2.tar.bz2

root用户编译完成后会在/root/rpmbuild/RPMS/x86_64下生成与slurm有关的rpm包

4.添加slurm用户

export SLURMUSER=1121
groupadd -g $SLURMUSER slurm 
useradd -m -c "SLURM workload manager" -d /var/lib/slurm -u $SLURMUSER -g slurm -s /bin/bash slurm

5.安装rmp包

rpm -ivh slurm*.rpm

master节点操作

6.创建配置文件
 
#slurmdbd.conf文件为slurmdbd服务的配置文件，所有者必须为slurm用户
touch /etc/slurm/slurmdbd.conf
chown slurm:slurm /etc/slurm/slurmdbd.conf
chmod 600 /etc/slurm/slurmdbd.conf
 
#slurm.conf文件为slurmd、slurmctld的配置文件，所有者必须为root用户
touch /etc/slurm/slurm.conf
chown root:root /etc/slurm/slurm.conf
 
#建立slurmctld服务存储其状态等的目录，由slurm.conf中StateSaveLocation参数定义：
mkdir /var/spool/slurmctld
chown slurm:slurm /var/spool/slurmctld
 
#建立日志文件存储目录，并修改目录权限
mkdir /var/log/slurm
cd /var/log/slurm/
touch slurmd.log
touch slurmctld.log
touch slurmdbd.log
chown slurm:slurm /var/log/slurm

编辑/etc/slurm/slurmdbd.conf文件，添加如下内容：

AuthType=auth/munge  #认证方式，该处采用munge进行认证
AuthInfo=/var/run/munge/munge.socket.2 #为了与slurmctld控制节点通信的其它认证信息
 
# slurmDBD info
DbdAddr=localhost # 数据库节点名
DbdHost=localhost # 数据库IP地址
DbdPort=6819 # 数据库端口号，默认为6819
SlurmUser=slurm # 用户数据库操作的用户
MessageTimeout=60 # 允许以秒为单位完成往返通信的时间，默认为10秒
DebugLevel=5 # 调试信息级别，quiet：无调试信息；fatal：仅严重错误信息；error：仅错误信息； info：错误与通常信息；verbose：错误和详细信息；debug：错误、详细和调试信息；debug2：错误、详细和更多调试信息；debug3：错误、详细和甚至更多调试信息；debug4：错误、详细和甚至更多调试信息；debug5：错误、详细和甚至更多调试信息。debug数字越大，信息越详细
LogFile=/var/log/slurm/slurmdbd.log # slurmdbd守护进程日志文件绝对路径
PidFile=/var/run/slurmdbd.pid # slurmdbd守护进程存储进程号文件绝对路径
 
# Database info 
StorageType=accounting_storage/mysql # 数据存储类型
StorageHost=localhost # 存储数据库节点名
StoragePort=3306 # 存储数据库服务端口号
StoragePass=password # 存储数据库密码
StorageUser=slurm # 存储数据库用户名
StorageLoc=slurm_acct_db # 存储位置，对应数据库中的slurm_acct_db的表名称

编辑完成后保存，启动slurmdbd服务并加入开机自启：

systemctl enable slurmdbd
systemctl restart slurmdbd

配置slurmd服务
无配置模式是Slurm的一项新特性（从20.02版起支持），可以允许计算节点和用户登录节点从slurmctld守护进程获取配置而无需采用 /etc/slurm 等目录下的本地配置文件。需要在管理节点的slurm.conf文件配置SlurmctldParameters=enable_configless选项。

编辑/etc/slurm/slurm.conf文件，添加如下内容：

配置的更多详情可参考slurm官方说明:Slurm Workload Manager - slurm.conf

# slurm.conf file. Please run configurator.html
# (in doc/html) to build a configuration file customized
# for your environment.
#
 
################################################
#                   CONTROL                    #
################################################
ClusterName=hgy       #集群名称
SlurmctldHost=cn03    #管理服务主控节点名
SlurmUser=root        #slurm的主用户
SlurmdUser=root       #slurmd服务的启动用户
SlurmctldPort=6817    #slurmctld服务端口
SlurmdPort=6818        #slurmd服务的端口
AuthType=auth/munge    #采用munge认证，与其他计算节点通信
 
################################################
#            LOGGING & OTHER PATHS             #
################################################
SlurmctldDebug=info
SlurmctldLogFile=/var/log/slurm/slurmctld.log
SlurmdDebug=info
SlurmdLogFile=/var/log/slurm/slurmd.log
SlurmctldPidFile=/var/run/slurmctld.pid
SlurmdPidFile=/var/run/slurmd.pid
SlurmdSpoolDir=/var/spool/slurmd
StateSaveLocation=/var/spool/slurmctld
SlurmctldParameters=enable_configless  #采用无配置模式
 
################################################
#                  ACCOUNTING                  #
################################################
AccountingStorageEnforce=associations,limits,qos  #account存储数据的配置选项
AccountingStorageHost=cn03    #数据库存储节点
AccountingStoragePass=/var/run/munge/munge.socket.2 #munge认证文件，与slurmdbd.conf文件中的AuthInfo文件同名。
AccountingStoragePort=6819     #slurmd服务监听端口，默认为6819
AccountingStorageType=accounting_storage/slurmdbd   #数据库记账服务
AccountingStorageTRES=cpu,mem,energy,node,billing,fs/disk,vmem,pages,gres/gpu:tesla  #记账信息
AcctGatherEnergyType=acct_gather_energy/none   #作业消耗能源信息，none代表不采集
AcctGatherFilesystemType=acct_gather_filesystem/none
AcctGatherInterconnectType=acct_gather_interconnect/none
AcctGatherNodeFreq=0
AcctGatherProfileType=acct_gather_profile/none
ExtSensorsType=ext_sensors/none
ExtSensorsFreq=0
 
################################################
#                      JOBS                    #
################################################
JobCompHost=localhost   #作业完成信息的数据库本节点
#JobCompLoc=
JobCompPass=password    #slurm用户数据库密码
JobCompPort=6819        #作业完成信息数据库端口，与上面的端口一致
JobCompType=jobcomp/mysql  #作业完成信息数据存储类型，采用mysql数据库
JobCompUser=slurm        #作业完成信息数据库用户名
JobContainerType=job_container/none
JobAcctGatherFrequency=30
JobAcctGatherType=jobacct_gather/linux
PrivateData=jobs,usage
DisableRootJobs=NO
 
#
################################################
#           SCHEDULING & ALLOCATION            #
################################################
PreemptMode=OFF
PreemptType=preempt/none
PreemptExemptTime=00:00:00
PriorityType=priority/multifactor
SchedulerTimeSlice=300
SchedulerType=sched/backfill
SelectType=select/cons_tres
SelectTypeParameters=CR_CPU
SlurmSchedLogLevel=0
 
################################################
#                   TOPOLOGY                   #
################################################
TopologyPlugin=topology/none
 
################################################
#                    TIMERS                    #
################################################
BatchStartTimeout=100
CompleteWait=0
EpilogMsgTime=2000
GetEnvTimeout=10
InactiveLimit=0
KillWait=30
MinJobAge=300
SlurmctldTimeout=600
SlurmdTimeout=600
WaitTime=0
MessageTimeout=30
TCPTimeout=10
 
################################################
#                    POWER                     #
################################################
ResumeRate=300
ResumeTimeout=120
SuspendRate=60
SuspendTime=NONE
SuspendTimeout=60
#
################################################
#                    DEBUG                     #
################################################
DebugFlags=NO_CONF_HASH
 
################################################
#               PROCESS TRACKING               #
################################################
ProctrackType=proctrack/linuxproc
 
################################################
#             RESOURCE CONFINEMENT             #
################################################
TaskPlugin=task/affinity
TaskPluginParam=threads
 
 
################################################
#                    PRIORITY                  #
################################################
#PrioritySiteFactorPlugin=
PriorityDecayHalfLife=7-00:00:00
PriorityCalcPeriod=00:05:00
PriorityFavorSmall=No
#PriorityFlags=
PriorityMaxAge=7-00:00:00
PriorityUsageResetPeriod=NONE
PriorityWeightAge=0
PriorityWeightAssoc=0
PriorityWeightFairShare=0
PriorityWeightJobSize=0
PriorityWeightPartition=0
PriorityWeightQOS=1000
 
################################################
#                    OTHER                     #
################################################
AllowSpecResourcesUsage=No
CoreSpecPlugin=core_spec/none
CpuFreqGovernors=Performance,OnDemand,UserSpace
CredType=cred/munge
EioTimeout=120
EnforcePartLimits=NO
MpiDefault=none
FirstJobId=2
JobFileAppend=0
JobRequeue=1
MailProg=/bin/mail
MaxArraySize=1001
MaxDBDMsgs=24248
MaxJobCount=10000
MaxJobId=67043328
MaxMemPerNode=UNLIMITED
MaxStepCount=40000
MaxTasksPerNode=512
MCSPlugin=mcs/none
ReturnToService=2
RoutePlugin=route/default
TmpFS=/tmp
TrackWCKey=no
TreeWidth=50
UsePAM=0
SwitchType=switch/none
UnkillableStepTimeout=60
VSizeFactor=0
 
################################################
#                    NODES                     #
################################################
NodeName=master CPUs=3 Boards=1 SocketsPerBoard=1 CoresPerSocket=3 ThreadsPerCore=1 RealMemory=2827   State=UNKNOWN  #节点信息
################################################
#                  PARTITIONS                  #
################################################
PartitionName=debug MAXCPUsPerNode=2  Nodes=ALL Default=YES MaxTime=INFINITE State=UP #分区信息

计算节点配置

1.创建日志目录，并添加日志文件：      

mkdir -p /var/log/slurm
cd /var/log/slurm/
touch slurmd.log
2. 编辑/lib/systemd/system/slurmd.service文件，按照如下所述修改：

#修改前
ExecStart=/usr/sbin/slurmd -D -s $SLURMD_OPTIONS
 
#修改后
ExecStart=/usr/sbin/slurmd --conf-server cn03:6817 -D -s $SLURMD_OPTIONS
        执行成功后直接启动slurmd服务并加入开机自启即可。  
3.重启服务
systemctl daemon-reload
systemctl enable slurmd
systemctl start slurmd

4.主节点配置

[root@master x86_64]# vim /lib/systemd/system/slurmctld.service
[Unit]
Description=Slurm controller daemon
After=network-online.target munge.service mariadb.service
##要添加maridb服务 否则重启时服务起不来


        此时输入sinfo已经可以看到分区信息了，至此slurm安装配置完毕。
若节点显示darin 
[root@master x86_64]# scontrol update NodeName=node1 State=resume 刷新节点

六集群用户管理和初始化配置

节点都显示idle则代表节点正常
[root@master x86_64]# sinfo
PARTITION AVAIL  TIMELIMIT  NODES  STATE NODELIST
debug*       up   infinite      2   idle master,node1


1.集群添加account属性  默认属性

sacctmgr add account normal Description="Default account"

2.添加用户
UIDNOW=1300
useradd test -p test -d /public/home/$1 -u ${UIDNOW} -s /bin/bash
scp /etc/passwd /etc/shadow /etc/group node1:/etc/

3.将用户加入slurm集群组

sacctmgr -i add user test DefaultAccount=normal

4.测试
bash-4.2$ srun -n 6 hostname
master
node1
node1
master
node1
master

qos配置

1，添加qos
[root@master x86_64]# sacctmgr add qos ceshi
##添加qos
[root@master x86_64]# sacctmgr show qos format=name,priority，user
##展示qos和优先级
[root@master x86_64]# sacctmgr modify qos ceshi set priority=10 
##修改qos ceshi 优先级10
[root@master x86_64]# sacctmgr modify user test set qos=ceshi
##将用户添加qos

用户操作

查询用户

sacctmgr show user ***

添加用户

sacctmgr add user sghpc2 DefaultAccount=acct02 Qos=test_qos

修改用户 

sacctmgr modify user sghpc2 set QoS=nomal

删除用户

sacctmgr delete user username

slurm作业调度管理系统配置-集群搭建步骤6_slurm集群搭建_R★F的博客-CSDN博客https://blog.csdn.net/xhk12345678/article/details/124710528?spm=1001.2014.3001.5502此篇只是完善此博主的slurm搭建中遇到的错误，由衷感谢他提供的模板。

如何从一个 Shell 脚本调用另一个 Shell 脚本？ bash
在Unix和Linux的世界中，shell脚本是一种强大的工具，可用于任务自动化和系统管理等。通常，我们需要从一个shell脚本中调用另一个shell脚本。这不仅有助于将复杂的脚本组织成可管理的模块，而且有助于脚本的可重用性和可维护性。BasicMethod最直接的方法是在父脚本中使用它的路径。假设您有两个脚本：script1.sh和script2.shscript1.sh:#!/bin/bash
Nmap使用总结黑客KKKing 网络工程师网络安全网络 web安全安全
0X00背景nmap是测试中常用的网络探测工具，但是这回简单的操作，一直了解不深入，现在深入的了解和学习一下。在文章结构上，我把平时常用的内容提前了，以便再次查阅的时候，比较方便。0X01安装nmap可以到DownloadtheFreeNmapSecurityScannerforLinux/Mac/Windows下载最新版本(目前最新版本nmap-7.70)0X02实例部分实例下面给出一些实例，简
如何给 Flask 项目创建 Systemd 服务 ? flasksystemd
为Flask应用程序创建systemd服务文件是确保应用程序在Linux系统上顺利运行的一种极好的方法，它提供了一种健壮且可靠的方式来管理应用程序进程。本文将指导您完成为Flask应用程序创建和配置systemd服务。1:CreateaFlaskApplication创建一个样例Flask应用程序fromflaskimportFlaskapp=Flask(__name__)@app.route('
如何限制用户运行 chmod 777 命令？ linux
为chmod创建自定义脚本包装可以帮助您管理和限制某些chmod命令的使用，例如防止设置777权限。下面是如何在linux的系统中创建这样一个脚本的基本示例。Step1:CreatetheScript打开终端，并使用文本编辑器创建脚本。sudonano/usr/local/bin/safe_chmod将以下内容添加到文件中：#!/bin/bash#Customscriptwrapperforchm
掌握Linux top命令：优化系统性能的关键
Linuxtop命令：系统性能监控与优化指南top命令是Linux系统中优化系统性能的关键工具之一。通过实时监控系统资源，top帮助管理员和开发者迅速定位性能瓶颈，进行有效优化。本文将详细介绍如何使用top命令监控和优化系统性能，涵盖其主要功能和实际应用技巧。top命令概述top命令提供了实时的系统资源使用情况，包括CPU使用率、内存使用率、进程列表等信息。通过这些数据，用户可以快速了解系统当前的
【Docker】Supervisor 实现单容器运行多服务进程行者Sun1989 Docker Docker 容器 Supervisor
本文内容均来自个人笔记并重新梳理，如有错误欢迎指正！如果对您有帮助，烦请点赞、关注、转发、订阅专栏！专栏订阅入口|精选文章|Kubernetes|Docker|Linux|羊毛资源|工具推荐|往期精彩文章【Docker】（全网首发）KylinV10下MySQL容器内存占用异常的解决方法【Docker】（全网首发）KylinV10下MySQL容器内存占用异常的解决方法（续）【K8s】专题十五（6）：
Docker里的泰拉瑞亚，来开黑！！！ docker
准备docker安装，参考之前docker中部署开源的接口管理工具doclever中的docker安装部分，本篇环境wsl2的ubuntu系统。泰拉瑞亚服务端文件，下载地址泰拉瑞亚服务端，如果链接失效，可以百度泰拉瑞亚官网找下载。构建准备一个临时文件夹，将下载的服务端文件解压后，只需要copylinux版本进来就行。$mkdirtemp#给这个文件加上执行权限$chmod+xlinux/Terra
shell中实现浮点数运算自不量力的A同学 shell Linux开发相关 shell
linux下的浮点数运算shell实现浮点数运算awk实现浮点数运算bc实现浮点数运算awk实现浮点数运算AWK是一种处理文本文件的语言，是一个强大的文本分析工具。主要部分awk‘{printf“%0.8f\n”,$1/$2}’使用printf实现小数点后数值的保留。0.8f保留小数点后8位。$1/$2表示传入的当前行的第一个数据除以第二个数据。例如相除v=$(echo$a$b|awk'{prin
Linux从0到1——线程自定义封装 -指短琴长- Linux linux c++运维
Linux从0到1——线程自定义封装1.Thread.hpp2.main.cc1.Thread.hpp#pragmaonce#include#include#includetemplateusingfunc_t=std::function;templateclassThread{public:Thread(func_tfunc,conststd::string&threadname,Tdata):
ubuntu grub 没有windows_WIN10/Ubuntu双系统常见问题 weixin_39691968 ubuntu grub 没有windows ubuntu systemctl 开机时间 ubuntu 开机启动flask ubuntu不能输入美元符号 ubuntu双系统引导梅花
我最初装双系统的时候也遇到了许多问题，基本上别人能遇到的问题我都遇到了，这里整理了我当时的解决方案。（当时的ubuntu版本为16版）当时参考的是这篇安装教程：实用教程：PC实现Win10/Ubuntu双系统-Ubuntu,双系统,Linux-IT之家www.ithome.com1.WIN10重启无法进入BIOS按照教程上的要求制作好了装机U盘，可重启后不论是F2还是F10、F12都试过了，却无法
环境变量设置之后，pycharm 中程序获取不生效？ drebander pycharm chrome ide python
在Linux系统中，/etc/profile是一个全局配置文件，主要用于定义所有用户的环境变量。当我们修改了/etc/profile文件后，如何让这些变量快速生效，而不需要重启系统呢？本文将为你详细讲解。问题背景当环境变量设置在远程服务器上时，通过本地Python脚本链接远程服务器，尝试使用以下代码获取环境变量可能会失败：chrome_path=os.environ.get('CHROME_PAT
Mac 配置iTerm2，安装rz/sz 魔法屋运维 linux 编辑器
前言一般来说，linux服务器大多是通过ssh客户端来进行远程的登陆和管理的，使用ssh登陆linux主机以后，如何能够快速的和本地机器进行文件的交互呢，也就是上传和下载文件到服务器和本地；与ssh有关的两个命令可以提供很方便的操作：sz：将选定的文件发送（send）到本地机器rz：运行该命令会弹出一个文件选择窗口，从本地选择文件上传到服务器(receive)安装rz/szroot账号登陆后，依次
ubuntu20:04快速安装docker教程与君相识 docker docker 容器运维 ubuntu
1.使用国内镜像替代官方源先删除可能已有的apt官方源：sudorm-f/etc/apt/sources.list.d/docker.list然后配置国内源（以阿里云为例）：aptinstallcurlsudomkdir-p/etc/apt/keyringscurl-fsSLhttps://mirrors.aliyun.com/docker-ce/linux/ubuntu/gpg|sudogpg-
nginx1.18.0集群安装（docker版） leveretz 大数据 nginx
主机规划192.168.31.101cancer01nginxloaderbalancer192.168.31.102cancer02nginxweb1192.168.31.103cancer03nginxweb2环境准备以下设置请根据实际情况自行配置，此处略设置IP设置主机名关闭防火墙关闭selinux禁用透明大页设置虚拟内存设置文件句柄数和进程数主机时间同步配置免密安装jdk添加用户授权sod
Linux/MacOS中如何远程调试C/C++程序捕鲸叉软件调试和诊断 linux macos 软件调试
在Linux或macOS中远程调试C/C++程序，可以使用gdb（GNUDebugger）或lldb（LLVMDebugger）结合SSH或NAT/VPN来实现远程调试。以下是详细的步骤和方法：1.远程调试的需求和准备目标机器：运行需要调试的程序（通常是远程服务器）。调试机器：运行调试器（通常是本地开发机）。目标程序：必须是使用调试符号（-g选项）编译的C/C++程序。编译程序确保目标程序是用调试
linux中的open 机器人开发者 linux open
open函数用于打开和创建文件。以下是open函数的简单描述#includeintopen(constchar*pathname,intoflag,...);返回值：成功则返回文件描述符，否则返回-1对于open函数来说，第三个参数（...）仅当创建新文件时才使用，用于指定文件的访问权限位（accesspermissionbits）。pathname是待打开/创建文件的路径名（如C:/cpp/a.
设备树与 Linux 内核设备驱动模型的整合憧憬一下嵌入式驱动开发 #总线和设备树嵌入式 linux驱动开发内核源码设备树 arm开发
往期内容总线：驱动中的device和device_driver结构体-CSDN博客bus总线的相关结构体和注册逻辑-CSDN博客bus中设备驱动的probe触发逻辑和device、driver的添加逻辑-CSDN博客platformbus平台总线详解-CSDN博客设备树：设备树语法规则讲解-CSDN博客基于设备树的嵌入式系统硬件平台识别与参数传递流程解析-CSDN博客device_node：解压设
firefox PAC代理黑客呀网络安全网络工程师计算机 firefox 前端安全 web安全
在linux用firefox，又不像windows下的chrome那样，可以直接设置个自动代理，但是发现firefox有个自动代理的功能哦。/home/allen/Documents/google.pac的内容如下："usestrict";/**Generatedfromhttps://github.com/NewFuture/pac*seeallpacfileshttps://pac.newfu
在MacOS上怎样远程调试PC的内核驱动程序捕鲸叉软件调试和诊断 macos 软件调试诊断调试
在macOS上远程调试Windows或LinuxPC的内核驱动程序是一个复杂的过程，因为macOS并没有直接支持内核调试的工具。通常需要借助交叉调试工具链和虚拟化技术来实现。以下是详细的步骤和方法，分为远程调试Windows内核驱动程序和远程调试Linux内核驱动程序两部分。1.远程调试Windows内核驱动程序（从macOS）由于Windows内核调试工具（如WinDbg）不直接支持macOS，
数据仓库的复用性：模型层面通用指标体系、参数化模型、版本化管理 PersistDZ 大数据与AI 数据仓库 spark 大数据
在数据仓库设计中，复用性是一个关键原则，它不仅能提升数据资产的使用效率，还能降低开发成本、优化系统运维。下面将从模型层面的复用性、通用指标体系、参数化模型、版本化管理四个方面进行详细介绍，并提供可落地的设计方案。1.模型层面的复用性1.1复用性设计目标减少重复建模：通过统一的模型设计满足多个业务场景。灵活扩展性：模型设计具有适应不同业务需求的能力。标准化：统一命名、标准化维度和指标字段。1.2模型
v10 server 安装EPEL、PowerTools 存储库【1】风儿你慢慢吹 Linux linux
步骤1：启用PowerTools存储库要设置滚动，启动终端并安装核心DNF插件如下。$sudodnfinstalldnf-plugins-core安装后，转到下一步并启用EPEL存储库。第2步：启用EPEL存储库下一步是安装EPEL。EPEL是ExtraPackagesforEnterpriseLinux的首字母缩写词，是一个存储库，提供一组来自Fedora默认情况下不包含在RedHat和RedH
初探 OpenTelemetry 程序员Live golang 分布式
什么是OpenTelemetryOpenTelemetry由OpenTracing和OpenCensus项目合并而成，是一组规范、工具、API和SDK的集合。使用它来检测、生成、收集和导出遥测数据（Metrics、Logs和Traces），以帮助运维开发人员分析软件的性能和行为。为众多开发人员带来Metrics、Traces、Logs的统一标准，三者都有相同的元数据结构，可以轻松实现互相关联。Op
linux dns劫持转发,linux的dns被劫持（解决方案） Beyond Imp linux dns劫持转发
如何解决linuxdns被劫持？1.首先如何确定是否被劫持:那么查询一个并不存在的域名nslookupmmmmm.happy如果返回了一个ip地址，说明dns被劫持了，假设此ip地址为:123.34.5.6那么用8.8.8.8域名服务器解析一下此错误域名试试:nslookupmmmmm.happy8.8.8.8输出的内容如下:[root@masteretc]#nslookupmmmmm.happy
从头到尾快速学习一遍Linux，高级工程师多年实践实战经验精华总结和实例示例，第七章：Linux精通学习路线及各个大厂优秀的学习资料代码讲故事服务器学习 linux 服务器运维网络资料教程
从头到尾快速学习一遍Linux，高级工程师多年实践实战经验精华总结和实例示例，第七章：Linux精通学习路线及各个大厂优秀的学习资料。Linux精通学习路线及各个大厂优秀的学习资料看见好东西先收集起来，待时间充裕集中消灭他们。tcp_wrappers################################Linux系统下的防火墙主要分为两层：第一层是对IP进行过滤的iptables，第二层
Linux安装docker，安装配置xrdp远程桌面代码讲故事服务器 linux docker rdp xrdp 远程桌面远程连接图形化
Linux安装docker，安装配置xrdp远程桌面。1、卸载旧版本docker卸载旧版本docker命令yumremovedocker\docker-client\docker-client-latest\docker-common\docker-latest\docker-latest-logrotate\docker-logrotate\docker-engine现在就是没有旧版本的dock
一行命令查看Linux系统重启时间和相关记录代码讲故事服务器个人笔记
一行命令查看Linux系统重启时间和相关记录。系统启动时间并转换为秒：date-d"$(who-b|awk-F'''{print$(NF-1),$NF}')"+%s当前时间并转换为秒：date+%s使用当前时间减去启动时间，可以得到系统的运行时间。举例：假如系统重启后，10分钟内，判断为系统重启，否则判断为运行状态。很多服务和应用可以根据系统重启后，进行相应的初始化操作。判断脚本如下：result
Linux文件编程(open read write close函数)
在Linux文件编程中，open、read、write和close是四个核心的系统调用函数，它们用于操作文件和文件描述符。掌握这些函数的使用，对于开发高效、稳定的文件处理程序至关重要。核心函数概述1.open函数功能：用于打开文件，并返回一个文件描述符。#includeintopen(constchar*path,intflags,mode_tmode);参数解释：path：文件路径。flags：
11个精美网页——Web前端开发技术课程大作业，期末考试，Dreamweaver简单网页制作 web学生网页设计 web前端 web前端网页设计网页设计与制作网页作业
HTML实例网页代码,本实例适合于初学HTML的同学。该实例里面有设置了css的样式设置，有div的样式格局，这个实例比较全面，有助于同学的学习,本文将介绍如何通过从头开始设计个人网站并将其转换为代码的过程来实践设计。精彩专栏推荐❤【作者主页——获取更多优质源码】❤【web前端期末大作业——毕设项目精品实战案例(1000套)】文章目录一、网页介绍一、网页效果二、代码展示1.HTML代码2.CSS代
读书笔记（SRE：Google运维解密）：第17章测试可靠性 github_37320188 运维
对服务质量的自信可以用过去的系统可靠度和未来的系统可靠度来衡量。前者可以通过抓取和分析历史性监控信息来获得，后者可以用基于历史数据的预测来量化。为了让这些预测信息足够准确，必须满足下列条件中之一：（a）在这段时间内，该系统完全没有改变。包括没有任何软件更新以及服务器数量变化，这意味着未来的行为方式应该与过去的行为方式类似。（b）可以充分描述整个系统的所有改变，这样可以针对每个系统变化引入的不确定性
Web第一次作业 feng68_ 前端
目录题目html代码indexloginregistercss代码baseindexloginregister效果展示indexloginregister题目实现一个登录页面、实现一个注册页面；实现一个主页-登录页面：`login.html`-注册页面：`register.html`-主页：`index.html`要求如下：-主页中，可以点击**注册**或者**登录**能直接在新窗口跳转到对应的页
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。

slurm作业调度集群搭建及配置

一 环境准备

二 时间同步

三 munge认证

四 数据库安装

五 slurm搭建

六 集群用户管理和初始化配置

qos配置

你可能感兴趣的:(linux,作业调度系统,运维)

一环境准备

二时间同步

四数据库安装

六集群用户管理和初始化配置