运维技巧看这一篇就够了

文章目录

      • 1、归零的心态
      • 2、密码破解及系统只读修复
      • 3、RAID
      • 4、故障解决经验
      • 5、智能DNS
      • 6、CDN Content Delivery Network = 内容分发网络
      • 7、数据中心路由器及交换机
      • 8、正常关机 init 0
      • 9、tty 查看终端 不同虚拟终端之间通讯
      • 10、!$ 引用上一个命令的最后一个参数
      • 11、静态服务
      • 12、来电开机、定时开机
      • 13、没有root权限的用户使用docker:
      • 14、unix2dos编码问题

1、归零的心态

最终目标 方向  
折腾  命令 
搭建服务  服务完整配置和优化  
思考和总结,找最简单的方法实现复杂功能  
 集群架构 负载均衡 自动化运维 运维管理(多练才是硬道理)

2、密码破解及系统只读修复

  • 破密
    进入系统内核引导时,按e字母进入
    继续按e编辑,先择kernel内核项
    输入single 或者 1(默认是3)
    按 b 重新引导
    进入后 passwd root
    reboot
  • 只读尝试修复
    先备份
    以光盘进入系统,选择 Rescue installed system救援模式  回车
    进入系统执行: chroot /mnt/sysimage 切换到原系统的根分区,否则是光盘里面的系统分区
    df -h 
    fdisk -l
    修复 fsck.ext4 /dev/sdb -y 进行修复即可
  • 如果启动项占用内存过大 或者挂载的硬盘有问题:
    使用单用户模式进入 修改/etc/rc.local 注释一些起不来的
    修改玩主机名字后,一般在/etc/hosts中添加一下 可以ping 本机名字

3、RAID

标准机柜(42U) = 12 * 2U = 8.74cm,每个服务器间隔1U 加上交换机

  • 常见企业采购服务器配置:
    CPU Xeon 2.3GHz 1颗4核 2颗6核
    DDRⅢ 16 32 64
    硬盘 西街3.5寸 2T SATA 7500转 / 希捷 600G SAS 15000转


    应用服务器:2*300G SAS  Raid 1技术,如果是三块硬盘 Raid 5 实现冗余
    数据服务器:4 块硬盘 Raid 10 
    RAID Redundant Arrays of Independent Disks 独立磁盘构成的具有冗余能力的阵列
       原理:利用数组方式来作磁盘组,配合数据分散配列的设计,提升数据的安全性
    Parity Check同位检查,在数组中任一颗硬盘故障时,仍可读出数据
    磁盘更换时,将数据经计算后重新写入

    RAID0 读写性能强 没有冗余 如果一个盘坏了 就坏了
    RAID1 50%利用率  相当于做了备份
    RAID5 读效率高  写效率一般 最低需要三块硬盘
    RAID10 0 1 的折中方案

    开机 根据提示按 ctrl+p/r 进入 RAID配置界面
    按F2或者回车进入选择 Create New VD --> RAID 界面 回车
    看到 RAID 卡 支持的几种RAID 
    按空格键选择下面6块磁盘 然后点击最右边的 ok 即可,如果想划分多个虚拟磁盘 只需修改 VD Size 后面的大小
        企业常用划分: VD SIZE1: 120G 装系统
                      VD SIZE2: 232131G (超过2T 采用GPT 格式格式化)
    最后选择快速格式化即可,然后重启BIOS,进入系统安装即可
  • 系统安装标准
   分区 /boot 200M
   /      80G
   swap   16G
   /data  剩余的
  • 格式化大于两个 T的硬盘
   parted -s /dev/sdb  mklabel gpt(GPT格式)
   mkfs.ext3 /dev/sdb
   mount /dev/sdb /data/
   或者:
   parted --> select /dev/sdc --> mklabel gpt --> yes --> 
   mkpart primary 0 -1 --> i --> print -->quite
   mkfs.ext4 /dev/sdc1
   mount /dev/sdc1 /data/ 挂载    
  • 集群架构图
    LNAMP
  • ITIL-Information Technology Infrastructure Library IT基础架构库
	好比LOL中的打野  前期队友支援打野  中期打野反哺队友
	为企业的IT服务管理实践提供了一个客观、严谨、可量化的标准和规范,定制基础架构及服务管理
	实施ITIL能为企业的业务运维提供更好的支持,让企业的IT投资回报最大化

    业务管理
    服务管理
    ICT基础架构管理
    IT服务管理规划与实施  核心 = 服务提供 + 服务支持
    应用管理和安全管理
  • 编写MYSQL备份脚本
#!/bin/bash
#auto backup mysql
#wugk
#Define PATH 定义变量
BAKDIR=/data/backup/mysql/`date +%Y-%m-%d`
MYSQLDB=webapp
MYSQLPW=backup
MYSQLUSR=backup
#must use root user run scripts
if
  [ $UID -ne 0 ];then
  echo This script must use the root user!!!
  sleep 2
  exit 0
fi

#Define DIR and mkdir DIR 判断目录是否存在,不存在则新建
if
  [ ! -d $BAKDIR ];then
  mkdir -p $BAKDIR
else
  echo This is $BAKDIR exits....
fi

#Use mysqldump backup mysql 使用 mysqldump 备份数据库
/usr/bin/mysqldump -u$MYSQLUSR -p$MYSQLPW -d $MYSQLDB > $BAKDIR/webapp_db.sql
echo "The mysql backup successfully"

4、故障解决经验

  • LVS
    先看看定义LVS VIP
有监控最好了 
	ping  域名/ip 
	登陆LVS 服务器 ipvsadm -Ln
    可以看到LVS选择的轮询方式为加权最少连接 再看nginx日志 VIP
    
    tail -fn 100 /usr/local/nginx/logs/access.log
    awk '{print $1}' /usr/local/nginx/logs/access.log |sort|uniq -c|sort -nr|grep -v \-"" |more
    netstat -an |awk '/^tcp/ {print $NF}' |sort|uniq -c|sort -nr
    
    LVS默认用TCP检测,只要80端口能通 请求就能转发到后端 
    增加LVS对后端NGINX URL 的检测,能访问URL则表示服务正常
  • Nginx 502/504
    nginx 跟后端服务通信超时导致 如果后端服务没问题 可能是nginx版本问题

5、智能DNS

   本地hosts文件 --> 本地DNS(30ms左右)
    免费智能DNS https://www.dnspod.cn
        1、配置
        2、必须拥有电信 网通 或者其他链路的多个IP

6、CDN Content Delivery Network = 内容分发网络

    解决网络带宽小 用户访问量大 网点分布不均
    边缘服务器(从中心服务器拿数据)  中心服务器(北 上 广)  原站
    申请后 原站域名指向别名 cname, 在使用CDN时,全局调度服务器可以进行智能域名解析,
    网站需要将原来的域名CNAME到GSLB智能解析的域名上,这样CDN就做到对网民透明了。
    技术: 负载均衡GSLB 缓存技术(squid ngnix | HIT MISS)   

7、数据中心路由器及交换机

转发率 Mpps 每秒可以转发多少百万个数据包(路宽+速度)
背板带宽 相当于路宽 带宽越高,同时通过的数据包就越多 是的包转发率越高

8、正常关机 init 0

对所有终端广播消息:系统10分钟后关机
shutdown +10
shutdown -c 取消关系

9、tty 查看终端 不同虚拟终端之间通讯

10、!$ 引用上一个命令的最后一个参数

11、静态服务

python3 -m http.server
python2 -m SimpleHttpServer
nginx 给个静态目录就行

12、来电开机、定时开机

从x86到大型机  配置还是以官方网站为主  经常查阅京东 淘宝的不那么权威
设置服务器来电开机 Integrated Peripharals(外围设备)中的SuperIO Device -> SuperIO Device -> Restore On AC Power Loss
设置服务器定时开机 power managerment setup -> wake up event setup -> RTC Alarm

13、没有root权限的用户使用docker:

sudo groupadd docker     		#添加docker用户组
sudo gpasswd -a $USER docker    #将登陆用户加入到docker用户组中
newgrp docker     				#更新用户组
docker ps    					#测试docker命令是否可以使用sudo正常使用

14、unix2dos编码问题

运维技巧看这一篇就够了_第1张图片
运维技巧看这一篇就够了_第2张图片

你可能感兴趣的:(linux)