最近使用python写了个小监控,为什么使用python?简单、方便、好管理。
首先我也是个python小白,就现学现用了。
1.入门
首先你得用过C/C++、java、Javascript等的一种,编程小白估计比较艰难,有一定编程经验的python小白相对简单些。笔者是参考的这篇文章 Learn Python in 10 minutes,写的相当不错,但是我看完用了30分钟,哈哈。
1.1 Hello World!
Python安装比较简单,到官网上下载安装包,一路下一步就可以了。因为我的服务器上安装的是2.6.6,所以我也下了这个版本。话说2.x的差别不是很大,如果想用3.x,可能下面的代码直接运行不过,不过也差不多,稍微改改即可。
新建一个文件,命名为hello.py。使用python的IDLE打开hello.py,写入以下代码:
print "Hello World!"
按F5,就可以看见输出结果了。
1.2 基本语法
每一行是一条语句。C语言是通过分号”;“;
通过缩进来组织代码块。C语言是通过大括号”{}“;
注释使用井号”#“。
1.3 数据类型、运算符、数据结构
运算符和C语言差不多,C语言有的基本上直接用就可以。
数据类型有数值型,字符串。数据结构有 list, tuple, dict, set。介绍一下tuple, 不能修改,通过索引进行查找。dict类似于map,存放键值对。来看例子,看看tuple使用:
>>> t=(1,2,[1,2])
>>> t[2]
[1, 2]
1.4 流程控制
Python中可以使用if elif else、for和 while 来实现流程控制。同样有 break 和 continue。有一点和C不同,如果有一个分支什么都不做,要使用 pass。例如
list=[0, 1, 2, 3, 4, 5]
for item in list:
if item == 1:
print item
elif item in (2, 3, 4, 5):
print "aha " + str(item)
else:
pass
运行结果是:
1
aha 2
aha 3
aha 4
aha 5
1.5 模块组织
有方法和类。
方法这样定义
def func(var):
some code here
类和C++等有些不同
class MyClass(object):
common = 1
def __init__(self):
self.myvariable = 5
def myfunction(self, arg1, arg2):
return self.myvariable
common变量相当于C++中用 static 修饰的变量,所有类通用;继承也非常简单,可以看看开始推荐的那篇文章。
1.6 异常处理
异常处理非常简单,直接贴代码了:
def some_function():
try:
# Division by zero raises an exception
10 / 0
except ZeroDivisionError:
print "Oops, invalid."
else:
# Exception didn't occur, we're good.
pass
finally:
# This is executed after the code block is run
# and all exceptions have been handled, even
# if a new exception is raised while handling.
print "We're done with that."
1.7 工程组织
直接引用库,或者从库中引入某一个方法或变量。
import random
from time import clock
2. 数据库查询
既然是监控,免不了和数据库打交道。我使用的是PostgreSQL,所以就介绍一下python怎么调用postgres。其他数据库类似,自行google就好了。
连接postgres首先要安装一个库psycopg2,Windows下直接下载安装即可,注意选对版本。我的服务器是CentOS,安装直接运行
yum install python-psycopg2
就OK了。
2.1 首先创建数据库连接
#get database connect
def get_con():
host = '127.0.0.1'
port = "5432"
database = 'platform'
user = 'postgres'
password = 'postgres'
conn = psycopg2.connect(database=database, user=user, password=password, host=host, port=port)
return conn
2.2 执行SQL语句
#执行sql查询
def query(conn, sql):
cursor = conn.cursor()
cursor.execute(sql)
results = cursor.fetchall()
#close cursor
cursor.close()
return results
2.3 然后就可以写具体业务了
def getUsers():
conn = get_con()#open connect
sql = """select *
from t_user
order by intime DESC
limit 5"""
items = query(conn , sql)
print str(items)
conn.close() #close connect
注意3个引号""",就是普通字符串,不过可以换行。
3. 发送邮件
查询到数据之后不能及时通知管理员的话监控就没有意义了。所以我们通过邮件来通知,直接使用python的标准库 smtplib 就可以了。写个发送邮件的函数:
#发送邮件
def send_email(subject, content):
sender = "yourmail@***.com"
password = "******" #密码是看不见的哦
receivers = [tq8117179#163.com] #本人真实邮箱,欢迎发邮件讨论技术问题
host = "smtp.exmail.qq.com"
port = 465
msg = MIMEText(content,'html','utf-8')
msg['From'] = sender
msg['To'] = ",".join(receivers)
msg['Subject'] = Header(subject, 'utf-8')
try:
smtp = smtplib.SMTP_SSL(host, port)
smtp.login(sender, password)
smtp.sendmail(sender, receivers, msg.as_string())
except Exception, e:
logger.error(e)
logger.info(content)
4.日志
发送邮件时我们使用了logger,这个logger是怎么来的呢?新建一个log.py,代码如下
# coding=utf-8
import logging
import logging.handlers
logger = logging.getLogger('monitor')
logger.setLevel(logging.DEBUG)
filehandler = logging.handlers.TimedRotatingFileHandler(
"/mnt/log/monitor/monitor_log", 'midnight', 1, 7)
# 设置文件后缀名称
filehandler.suffix = "%Y%m%d.log"
formatter = logging.Formatter('%(asctime)s-%(name)s-%(levelname)s: %(message)s')
filehandler.setFormatter(formatter)
logger.addHandler(filehandler)
通过logging.getLogger('monitor')生成一个logger,然后配置一个文件处理器。
然后在我们监控程序中引用即可:
from log import logger
5. 把可配置信息放到配置文件中
如果我们添加一个管理员怎么办?如果我们的邮箱密码变了怎么办?直接修改python文件啊,哈哈。python不用编译直接改代码就好了,可是我们的程序以后要打包呢,所以最好写个配置文件,python的配置文件读取非常简单,使用python库 ConfigParser 即可:
config = None
#get config
def getConfig():
global config
if config is None:
config = ConfigParser.ConfigParser()
config.read("monitor.ini")
return config
然后这样使用:
#get database connect
def get_con():
host = getConfig().get('db', 'host')
port = getConfig().get('db', 'port')
database = getConfig().get('db', 'database')
user = getConfig().get('db', 'user')
password = getConfig().get('db', 'password')
conn = psycopg2.connect(database=database, user=user, password=password, host=host, port=port)
return conn
#发送邮件
def send_email(subject, content):
sender = getConfig().get('mail', 'sender')
password = getConfig().get('mail', 'password')
receivers = getConfig().get('mail', 'receivers').split(",")
host = getConfig().get('mail', 'host')
port = getConfig().getint('mail', 'port')
msg = MIMEText(content,'html','utf-8')
msg['From'] = sender
msg['To'] = ",".join(receivers)
msg['Subject'] = Header(subject, 'utf-8')
try:
smtp = smtplib.SMTP_SSL(host, port)
smtp.login(sender, password)
smtp.sendmail(sender, receivers, msg.as_string())
except:
logger.exception("Exception: ")
logger.info(content)
配置文件是monitor.ini,内容如下:
#数据库配置
[db]
host = 127.0.0.1
port = 5432
database = platform
user = postgres
password = postgres
#邮件配置
[mail]
sender = [email protected]
password = ******
#多个联系人用英文逗号隔开
receivers = tq8117179#163.com
host = smtp.exmail.qq.com
port = 465
6. 加点控制
我们每5分钟查一下数据,可是业务sql只能查询最近的几条,所以要加个时间段限制,弄个开始、结束时间。
start_time = "2015-10-1 16:24:24"
end_time = None
#update end_time, invoke before get new data
def update_end_time():
global end_time
now = time.mktime(datetime.now().timetuple())
end_time = time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(now))
return end_time
#update end_time, invoke after get new data
def update_start_time():
global start_time
global end_time
start_time = end_time
return start_time
getUsers可以改写成:
def getUsers (conn):
global start_time
global end_time
sql = """select *
from t_user
where intime>=""" +"'"+start_time+"' and intime<"+"'"+end_time+"';"
items = query(conn, sql)
if items is not None and len(items)>0:
count = len(items)
tip = "又有"+str(count)+"个用户已经注册了。"+end_time
send_email(tip, tip+"\n"+str(items))
然后写个统一的调度:
def task():
#init end_time and start_time, must init end_time first!!!
end_time = update_end_time()
start_time = update_start_time()
#init config
getConfig()
while True:
conn = get_con() #open connect
end_time = update_end_time()
############## process ##############
logger.info("query: "+end_time)
getUsers (conn)
#do some task else here
## end
update_start_time()
conn.close()#close connect
time.sleep(5*60)
#end of while
def run_monitor():
monitor = threading.Thread(target=task)
monitor.start()
if __name__ == "__main__":
run_monitor()
在task这个函数的while中,首先更新end_time,也就是当前时间;执行完再把start_time更新成刚刚的end_time,这样就不会有漏网之鱼了。还有一个需要注意的地方,关键字global。 在python中,使用全局变量是需要global关键字进行声明的,否则会出问题。
7. 运行
打开linux 控制台,直接运行python monitor.py
是可以运行的,可是shell一旦退出,任务也就停止了。于是我就选择了一个进程管理工具:Supervisor。Supervisor 在进程中断时还能自动重启。
7.1. 安装supervisor
首先安装python-setuptools
yum install python-setuptools
安装supervisor
easy_install supervisor
生成supervisor配置文件
echo_supervisord_conf > /etc/supervisord.conf
然后在/etc/supervisord.conf添加:
[program:monitor]
command = python /usr/monitor/monitor.py
directory = /usr/monitor
user = root
7.2. 运行监控
然后在终端中运行supervisord
启动supervisor。
在终端中运行supervisorctl
,进入shell,运行status
查看脚本的运行状态。
7.3. 关闭监控 以及常用命令
以下命令全部在supervisorctl的shell中执行。
shutdown
停止Supervisor(子进程也会被停止) ;
start monitor
开启monitor进程服务(一旦monitor进程退出,会自启动) ;
stop monitor
关闭monitor进程服务 ;
restart monitor
关闭正在运行的monitor进程,并且重新启动monitor进程服务 ;
reload
重新加载supervisor配置文件 ;
exit
退出supervisorctl的shell。
程序基本上就写完了,也可以跑起来了。中间借鉴过好多网络上的博客,但是记不住了,在这谢谢博主们。希望我的这篇文者可以帮到读友们,也欢迎大家给我发邮件讨论。其中很多英文注释还是很蹩脚的,哈哈,写代码有时比较懒,不想切换中文输入法了,大家凑合着看吧。