2012-11-30我的运维生涯第3个错。
错误一:uninstall mysql。
解决办法:tube发现用户安装的mysql路径和我们的不同。然后根据原来的路径找到了数据。Tube说这是狗屎运。。。。。。
铭记:要备份,备份,备份。。。。。
数据库的操作一定要谨慎谨慎再谨慎。。。
错误二:告诉用户明天周末我休息。
铭记:我们是7*24小时服务。绝对没有休息时间。。。。。。
昨天晚上查看系统发送有没关闭的工单。
看到有个单号没有关闭
单号说明是配置lnmp环境。
我登录到客户机器执行了netstat –lntp看到用户确实没有配置环境。
然后就给一键安装了一套lnmp。
之后用户网站崩溃了。
今天一大早发现了客户回馈的一堆崩溃信息。
我的第一反应是我完蛋了。我的运维生涯要结束了。这才开始20天。
因为netstat –lntp 查不出来用户在跑的任务。之前我是不知道的。
现在需要研究一下netstat –lntp命令的用法
总结:以后登录用户机器时,
1.用history看用户做了哪些操作。如果用户动过。请用户重置环境交给我们配置。
2. 再netstat –lntp看显示网络状态。
-l或--listening 显示监控中的服务器的Socket。
-n或--numeric 直接使用IP地址,而不通过域名服务器。
-N或--netlink或--symbolic 显示网络硬件外围设备的符号连接名称。
-t或--tcp 显示TCP传输协议的连线状况。
-p或--programs 显示正在使用Socket的程序识别码和程序名称。
3.用service httpd status
Service mysqld status
…….
查看服务的状态
4. ps –ef | grep httpd
Ps –ef | grep mysqld
…….
看到是否有进程
今天用户的网站崩溃之后。我非常紧张。
我没有敢做任何操作,也不知道该做任何操作。
马上打电话给了我们的技术经理tube
Tube说遇到问题不要慌。不要害怕。先想一下如何解决问题。
然后非常淡定的帮我分析。
1. 由于是lnmp环境。
我们默认的网页目录是/home/wwwroot
2. 正好原站的数据迁移也是我做的。但是客户发了2个工单。一个申请数据迁移,一个申请环境配置。
3. 我们找到原先迁移的网站文件在/var/www下面。文件还在。
4. Tube说配置个nginx的虚拟主机把虚拟目录指向/var/www就可以解决了。
但是解决的过程中发现新的数据库mysql是没有文件的。
5. 我们启用了新的数据库。然后把截至到30号的用户数据备份导入到了新的数据库中。
6. 我发现mysql的2个数据库都存在。
7. 但是2套nginx不知道是怎么回事。到底新nginx有没有覆盖老的nginx?是2个并存还是只存在一个???
排错的过程中发现有2个80端口在使用。Nginx的端口号80.
无法start nginx
解决办法
1.# lsof -i:80
2.kill掉所有lsof列出的占用80端口的进程号。
3.脚本启动nginx
/etc/init.d/nginx stop
/etc/init.d/nginx start
8. 报错了301错误。重定向问题。错误 310 (net::ERR_TOO_MANY_REDIRECTS):重定向过多
出错感言:
1. 感谢耐心沉稳的领导tube,在第一时刻他告诉我不要害怕,要冷静的分析问题。还说了一句,我马上到公司,你先看一下错误日志报什么错。
2. 感谢热心的战斗在第一线的兄弟姐妹,他们在我非常紧张的情况下热情的帮我解决问题,分析问题,想办法。
3. 通过今天的错误我学到了很多东西。今天是做运维以来最痛苦的一天也是最开心的一天。
后记:最后的解决办法是用户重置机器,丢失了一周的数据。铭记于此!!!我的痛!!!