我做运维期间一些碰到的业务方面的问题和解决思路

1.pc端无发正常访问页面(页面没有提供状态码)

我的解决思路:

根据架构,先去web服务器上检查相关服务和端口是否正常,修改host文件,将域名绑定至本地,然后curl,看是否正常,如果正常就说明web服务器没有问题,然后ping域名,查看返回的地址是哪里,如果是代理ip,要去检查ip所在的服务器或者出口ip是否正常,如果是cdn,要上相关cdn上去检查设置

 

2.app手游客户端登陆问题

目前app登陆流程:

点开图标后,app自检版本是否一致,如果不一致,进行大小版本更新,如果版本一致,拉取登陆信息,获取认证,充值,等级,装备,记录等情况,我目前遇到的基本都是这样

 

如果热更新失败,会提示更新失败或者无法获取到更新,需要确定更新服务器代码是否完成,版本文件是否是最新,刷新cdn,基本都能解决

当更新完成后,会有加载中,登陆大厅等提示,这是拉取个人资料,获取个人数据,登陆认证等,网络因素,数据库延迟都会造成无法登陆成功

当登陆完成后,头像无法显示

现在一般都是获取qq或微信头像,如果你用微信登陆的时候,会自动获取你头像信息,你的头像会被保存至文件服务器,如果文件服务器上有,那就是网络延迟,如果没有在继续检查为什么没有上传成功,比如权限等问题

 

 

3.域名劫持,dns污染

添加https这个问题就可以解决

 

4.ddos

我遇到的是直接打你机器ip,机器被拉入黑洞,我的方法就是在搞一台备份,做智能切换,域名做cdn,或者阿里ddos高防服务

 

5.服务器被加入挖矿程序

挖矿程序会把你的cpu,内存,流量等占满,上去服务器后,看下top服务,ps进程,找到pid号直接干掉,但是一般都是有守护进程,清除定时任务,找到/usr/lib/systemd/system/底下相对应的守护进程,清除未知的秘钥,检查防火墙

 

 

 

 

 

 

你可能感兴趣的:(linux,业务故障,python)