面试问题整理(1)

文章目录

      • Nginx反向代理配置,此类url www.abc.com/refuse,禁止访问,返回403
      • 如何使用iptables将本地80端口的请求转发到8080端口,当前主机IP为192.168.16.1,其中本地网卡eth0
      • 如何查看linux系统的当前状态,cpu内存的使用情况和负载
      • nginx如何重新定义或者添加发往后端服务器的请求头?
      • 编写一个shell脚本将当前目录下大于10k的文件转移到/tmp目录下
      • 写出你所了解的门户网站的服务架构,可用什么方式实现的高可用、负载均衡?
      • nginx日志过滤10点到12点之间访问IP排名和统计
      • 在11月份内,每天的早上6点到12点,每隔2小时执行一次/usr/bin/httpd.sh怎么实现
      • 分布式文件存储是否有过了解和使用,了解过的有什么特性
      • 使用netstat和awk命令统计下网络连接数
      • 在linux下,假设nginx日志的路径为/opt/logs/access.logs,日志不能自动分割,请写出一个简单的脚本,让日志每年能够定时自动分割
      • 写出raid的几种模式,以及他们的特性
      • 写一个脚本,查出15天前以png结尾的文件并删除
      • 对于服务器的监控使用过哪类工具及其特点
      • 作为运维工程师,你对该职位的认识和理解有哪些,日志工作中应该怎么做

Nginx反向代理配置,此类url www.abc.com/refuse,禁止访问,返回403

location /www.abc.com/refuse { 
    return 403;
}

如何使用iptables将本地80端口的请求转发到8080端口,当前主机IP为192.168.16.1,其中本地网卡eth0

iptables -t nat -A PREROUTING -p tcp -i eth0 --dport 8080 -j DNAT --to 192.168.16.1:80

如何查看linux系统的当前状态,cpu内存的使用情况和负载

系统 
# uname -a # 查看内核/操作系统/CPU信息 
# head -n 1 /etc/issue # 查看操作系统版本 
# cat /proc/cpuinfo # 查看CPU信息 
# hostname # 查看计算机名 
# lspci -tv # 列出所有PCI设备 
# lsusb -tv # 列出所有USB设备 
# lsmod # 列出加载的内核模块 
# env # 查看环境变量 
资源 
# free -m # 查看内存使用量和交换区使用量 
# df -h # 查看各分区使用情况 
# du -sh # 查看指定目录的大小 
# grep MemTotal /proc/meminfo # 查看内存总量 
# grep MemFree /proc/meminfo # 查看空闲内存量 
# uptime # 查看系统运行时间、用户数、负载 
# cat /proc/loadavg # 查看系统负载

nginx如何重新定义或者添加发往后端服务器的请求头?

headers-more-nginx-module 模块用于添加,修改,或者清除 请求/响应头
more_set_headers 用于添加、修改、清除响应头
more_clear_headers 用于清除响应头
more_set_input_headers 用于添加、修改、清除请求头
more_clear_input_headers 用于清除请求头

编写一个shell脚本将当前目录下大于10k的文件转移到/tmp目录下

#!/bin/bash
for Filename in $(ls -l |awk '$5 > 10240 {print $9}')
do
mv $Filename /tmp
done

写出你所了解的门户网站的服务架构,可用什么方式实现的高可用、负载均衡?

软负载: nginx+keepalived
lvs+keepalived 
应负载: F5
补充:
代理服务器一般使用nginx 作为反向代理
web服务器: 一般使用nginx
缓存服务器一般使用redis或者memcached
数据库服务器:一般使用mysql
常见的web集群:
apache+tomcat;nginx+tomcat;lvs+nginx+tomcat(lvs负责集群调度,nginx负责静态文件处理,tomcat负责动态文件)
LVS+keepalive 高可用。

nginx日志过滤10点到12点之间访问IP排名和统计

cat access.log | grep "16/Jun/2020" | sed -n '/10:00:00/,/12:00:01/p' | awk '{print $1}' | sort | uniq -c | sort -t " " -k2 -n
这个是升序排的,你要降序,就再加个-r, sort -t " " -k2 -n -r

在11月份内,每天的早上6点到12点,每隔2小时执行一次/usr/bin/httpd.sh怎么实现

0 6-12/2 * 11 * /usr/bin/httpd.sh

分布式文件存储是否有过了解和使用,了解过的有什么特性

FastDFS
解决了大数据量的存储和负载均衡问题,特别适合中小文件为载体的在线服务,比如在线相册,视频网站等等。 网盘社区,广告和应用下载的存储。
补充:
单机时代:  在静态目录中存放文件资源。
优点:便利,项目直接引用目录,不需要复杂的技术
缺点: 如果作为前端网站使用,代码和文件耦合在一起,文件越多存放越混乱。如果流量大,静态文件访问会占用一定 的资源,影响业务的正常运行
独立文件服务器时代:
缺点:点击存在性能瓶颈,容灾,垂直扩展能力较差。
比如独立的图片服务器,项目上次文件的时候,通过ssh或者ftp上传到图片服务器的某个目录下,在通过nginx来访问此目录,返回一个独立域名的url地址。
分布式文件系统:
优点: 定时备份,如果一台down掉,迅速切换到另一台。扩展能力强,能够保证文件系统的可用性,也能够保证数据的完整性和唯一性
缺点: 系统复杂程度较高,需要更多服务器
常见的分布式文件系统还有: GlusterFS, GoogleFS, TFS, OSS

使用netstat和awk命令统计下网络连接数

netstat -n | awk '/^tcp/ {++state[$NF]} END {for(key in state) print key,"\t",state[key]}'
------------------------------------------------------------
netstat -n
Active Internet connections (w/o servers)
Proto Recv-Q Send-Q Local Address Foreign Address State
tcp 0 0 123.123.123.123:80 234.234.234.234:12345 TIME_WAIT
你实际执行这条命令的时候,可能会得到成千上万条类似上面的记录,不过我们就拿其中的一条就足够了。
再来看看awk:
/^tcp/
滤出tcp开头的记录,屏蔽udp, socket等无关记录。
state[]
相当于定义了一个名叫state的数组
NF
表示记录的字段数,如上所示的记录,NF等于6
$NF
表示某个字段的值,如上所示的记录,$NF也就是$6,表示第6个字段的值,也就是TIME_WAIT
state[$NF]
表示数组元素的值,如上所示的记录,就是state[TIME_WAIT]状态的连接数
++state[$NF]
表示把某个数加一,如上所示的记录,就是把state[TIME_WAIT]状态的连接数加一
END
表示在最后阶段要执行的命令
for(key in state)
遍历数组
print key,"\t",state[key]
打印数组的键和值,中间用\t制表符分割,美化一下。
状态:描述
CLOSED:无连接是活动的或正在进行
LISTEN:服务器在等待进入呼叫
SYN_RECV:一个连接请求已经到达,等待确认
SYN_SENT:应用已经开始,打开一个连接
ESTABLISHED:正常数据传输状态
FIN_WAIT1:应用说它已经完成
FIN_WAIT2:另一边已同意释放
ITMED_WAIT:等待所有分组死掉
CLOSING:两边同时尝试关闭
TIME_WAIT:另一边已初始化一个释放
LAST_ACK:等待所有分组死掉

在linux下,假设nginx日志的路径为/opt/logs/access.logs,日志不能自动分割,请写出一个简单的脚本,让日志每年能够定时自动分割

#! /bin/bash
base_path='/usr/local/nginx/logs'
log_path=$(date -d yesterday +"%Y%m")
minute=$(date -d "1 minute ago" +"%Y%m%d-%H:%M")
mkdir -p $base_path/$log_path
echo $base_path/access.log
mv $base_path/access.log $base_path/$log_path/access_$minute.log
echo $base_path/$log_path/access_$minite.log
kill -USR1 `cat /usr/local/nginx/logs/nginx.pid`
定时任务
#crontab -l
* * 1 * * eck_nginx_log.sh

写出raid的几种模式,以及他们的特性

raid  名称 特点
raid0 提高读写性能,最少两块容量为N的硬盘,容量为2N
raid1 提高数据安全性,提高读取性能,不能提高写入性能,2003自带raid1功能,最少两块容量为N的硬盘,容量为N
raid10 先提高安全性,再提高性能,最少4块容量为N的硬盘,容量为2N,RAID10RAID01在安全性方面要强(体现在容错率上)
raid01 先提高性能,再提高安全性,最少4块容量为N的硬盘,容量为2N
raid5 提升安全性,安全性低于raid10(三块盘的情况下),大文件读写没有优势,小文件读写能力低于raid10,最低三块盘,容量为2快盘

写一个脚本,查出15天前以png结尾的文件并删除

#!/bin/bash
find /picture/*.png* -type f  -mtime +15 -exec rm  {} \;

对于服务器的监控使用过哪类工具及其特点

zabbix, prometheus, cacti ,nagios
特点略

作为运维工程师,你对该职位的认识和理解有哪些,日志工作中应该怎么做

做运维岗位带给你的改变: 
1. 可以认识更多的人,同时也能被更多的人认识, 对于一个喜欢沟通和交流的我来说,更能够在这个岗位上干的长久。
2. 运维人员临场应变能力和处理突发事件的能力会随着工作经验的增长而增强。更容易养成未雨绸缪,思维上得到锻炼,考虑问题更全面,细致,透彻,且内心承受能来强大
3. 运维能力不是高学历可以搞定的,需要的是勤奋努力,善于总结 
其次: 运维不是单纯的运维维护,而是运维规范和规则的制定者以及安全运维规范的忠实维护者和践行者。
在工作中应该做什么?
1. 监控,报警,线上部署
2. 脚本自动化,工具自动化
3. 故障处理
要弄懂底层原理,比如监控: 任何的监控都是: 收集数据,存储数据,数据分析,数据指标展示,告警五个部分。理解了这个,对于任何监控你可以去分析,哪个模块是在分析数据,哪个模块是在收集数据,能不能用其他的代替。

你可能感兴趣的:(面试问题整理(1))