转--python 黑魔法2

叶落下了思念，风摇曳那些岁岁年年

　　本文用作记录，在使用python过程中遇到的一些奇技淫巧，有些代码是本人所写，有些则是python内置函数，有些则取之互联网。在此记录，只为备份以及遗忘时方便查找。
　　本文将会持续更新，内容仅限记录一些常用好用却又永远记不住的代码或者模块。

控制台操作

控制台不闪退

1	os.system( 'pause')

获取控制台大小

1	rows, columns = os.popen( 'stty size', 'r').read().split()

输入输出控制

解决输入提示中文乱码问题

1	raw_input(unicode( '请输入文字','utf-8').encode('gbk'))

格式化输出

1	print a.prettify()

接受多行输入

            text= 
           "" 
          
           while 1: 
          
            data=raw_input( 
           ">>") 
          
           if data.strip()=="stop": 
          
           break 
          
            text+= 
           "%s\n" % data 
          
           print text 
          
            --------------------------- 
          
            >>1 
          
            >>2 
          
            >>3 
          
            >>stop 
          
            1 
          
            2 
          
            3

同行输出

1 2	Print '%s' % a, Print '%s \r' % a

标准输入输出

1 2	sys.stdout.write( "input") 标准输入 sys.stdout.flush() 刷新缓冲区

print的功能与sys.stdout.write类似，因为2.x中print默认就是将输出指定到标准输出中（sys.stdout)。

颜色控制

控制台颜色控制(适用于windows)

            WConio.textcolor(WConio.YELLOW) 
          
           print "yellow" 
          
            WConio.textcolor(WConio.BLUE) 
          
           print "blue"

输出颜色控制(全平台)

            red = 
           '\033[1;31m' 
          
            green = 
           '\033[1;32m' 
          
            yellow = 
           '\033[1;33m' 
          
            white = 
           '\033[1;37m' 
          
            reset = 
           '\033[0m’ 
          
            print red+"color is red"+reset 
          
            print green+"color is green"+reset

进度条控制

方案一

            from __future__ import division 
          
            import sys,time 
          
            j = 
           '#' 
          
           for i in range(1,61): 
          
            j += 
           '#' 
          
            sys.stdout.write(str(int((i/60)*100))+ 
           '% ||'+j+'->'+"\r") 
          
            sys.stdout.flush() 
          
            time.sleep(0.1)

方案二

            import sys 
          
            import time 
          
           for i in range(1,61): 
          
            sys.stdout.write( 
           '#'+'->'+"\b\b") 
          
            sys.stdout.flush() 
          
            time.sleep(0.5)

方案三

            from progressbar import * 
          
            import time 
          
            import os 
          
            rows, columns = os.popen( 
           'stty size', 'r').read().split() #获取控制台size  
          
            console_width=int(columns) 
          
            total = 10 
          
            progress = ProgressBar() 
          
            def 
           test(): 
          
           ''' 
          
            进度条函数，记录进度 
          
            ' 
           '' 
          
           for i in progress(range(total)): 
          
            test2() 
          
            def test2(): 
          
           ''' 
          
            执行函数，输出结果 
          
            ' 
           '' 
          
            content= 
           "nMask'Blog is http://thief.one" 
          
            sys.stdout.write( 
           "\r"+content+" "*(console_width-len(content))) 
          
            time.sleep(1) 
          
            sys.stdout.flush() 
          
           test()

更多高级用法可以使用progressbar模块。

系统操作

系统信息

获取python安装路径

1 2	from distutils.sysconfig import get_python_lib print get_python_lib

获取当前python版本

1 2	sys.version_info sys.version

获取当前时间

            c=time.ctime() 
          
           #自定义格式输出 
          
            ISOTIMEFORMAT=’%Y-%m-%d %X’ 
          
            time.strftime( ISOTIMEFORMAT, time.localtime() )

查看系统环境变量

1	os.environ[ "PATH"]

获取系统磁盘

1	os.popen( "wmic VOLUME GET Name")

获取当前路径(包括当前py文件名)

1	os.path.realpath(__file__)

当前平台使用的行终止符

1	os.linesep

获取终端大小

            rows, columns = os.popen( 
           'stty size', 'r').read().split() 
          
           #python3以后存在可以使用os 
          
            os.get_termial_size()

退出程序

return：返回函数的值，并退出函数。
exit()：直接退出。
sys.exit(): 引发一个SystemExit异常，若没有捕获错误，则python程序直接退出；捕获异常后，可以做一些额外的清理工作。
sys.exit(0):为正常退出，其他（1-127）为不正常，可抛异常事情供捕获。（一般用于主线程中退出程序）
os._exit(0): 直接退出python程序，其后的代码也不会执行。（一般用于线程中退出程序）

网络操作

域名解析为ip

1	ip= socket.getaddrinfo(domain, 'http')[0][4][0]

获取服务器版本信息

            sUrl = 
           'http://www.163.com' 
          
            sock = urllib2.urlopen(sUrl) 
          
            sock.headers.values()

文件操作

open函数,使用wb、rb代替w、r

1 2	with open( "test.txt","wr") as w: w.write( "test")

这种写法可以兼容python2/3。
输出一个目录下所有文件名称

            def search(paths): 
          
           if os.path.isdir(paths): #如果是目录 
          
            files=os.listdir(paths) 
           #列出目录中所有的文件 
          
           for i in files: 
          
            i=os.path.join(paths,i) 
           #构造文件路径 
          
            search(i) 
           #递归 
          
           elif os.path.isfile(paths): #如果是文件 
          
           print paths #输出文件名

文件查找

            import glob 
          
           print glob.glob(r"E:/*.txt") #返回的是一个列表 
          
            查找文件只用到三个匹配符：”*”, “?”, “[]“ 
          
            ”*”匹配0个或多个字符； 
          
            ”?”匹配单个字符； 
          
            ”[]“匹配指定范围内的字符，如：[0-9]匹配数字。

查找指定名称的文件夹的路径

            def search(paths,file_name,tag,lists): 
          
           if os.path.isdir(paths): #如果是目录 
          
           if file_name==tag: #如果目录名称为tag 
          
            lists.append(paths) 
           #将该路径添加到列表中 
          
           else: #如果目录名称不为tag 
          
            try: 
          
            files_list=os.listdir(paths) 
           #列出目录中所有的文件 
          
           for file_name in files_list: 
          
            path_new=os.path.join(paths,file_name) 
           #构造文件路径 
          
            search(path_new,file_name,tag,lists) 
           #递归 
          
            except: 
           #遇到特殊目录名时会报错 
          
            pass 
          
           elif os.path.isfile(paths): #如果是文件 
          
            pass 
          
           return lists

数据操作

判断数据类型

1	isinstance( "123",(int,long,float,complex)

字符串(string)

字符串推导

            a= 
           "True" 
          
            b=a 
           if a=="True" else "False" 
          
            >>> 
           print b 
          
            True

format方法拼接字符串与变量

            a= 
           "{test} abc {test2}".format(test="123",test2="456") 
          
            >>>> 
           print a  
          
            123 abc 456 
          
            或者： 
          
            a= 
           "{},{}".format(1,2) 
          
            >>>>> 
           print a 
          
            1,2

去掉小数点后面的数字

1 2	a=1.21311 b=Int(math.floor(a))

字符串倒置

1 2	>>> a = "codementor" >>> a[::-1]

字符串首字母变大写

            info = 
           'ssfef' 
          
           print info.capitalize() 
          
           print info.title()

返回一个字符串居中，并使用空格填充至长度width的新字符串。

1	"center string".center(width) #width设置为控制台宽度，可控制输出的字符串居中。

列举所有字母

 
           print string.ascii_uppercase 所有大写字母 
          
           print string. ascii_lowercase 所有小写字母 
          
           print string.ascii_letters 所有字母（包括大小写）

列表(list)

列表去重

1 2	ids = [1,4,3,3,4,2,3,4,5,6,1] ids = list( set(ids))

判断列表为空

1 2	a=[] if not a:

列表运算

            a=[1,2,3] 
          
            b=[3,4,5] 
          
           set(a)&set(b) 与 
          
           set(a)|set(b) 或 
          
           set(a)-set(b) 非

单列表元素相加

            a = [ 
           "Code", "mentor", "Python", "Developer"] 
          
            >>> 
           print " ".join(a) 
          
            Code mentor Python Developer

多列表元素分别相加

            list1 = [ 
           'a', 'b', 'c', 'd'] 
          
            list2 = [ 
           'p', 'q', 'r', 's'] 
          
            >>> 
           for x, y in zip(list1,list2):  
          
           print x, y 
          
            ap 
          
            bq 
          
            cr 
          
            ds

将嵌套列表转换成单一列表

            a = [[1, 2], [3, 4], [5, 6]] 
          
            >>> import itertools 
          
            >>> list(itertools.chain.from_iterable(a)) 
          
            [1, 2, 3, 4, 5, 6]

列表内元素相加

1 2	a=[1,2,3]（数字） sum(a)

产生a-z的字符串列表

1	map(chr,range(97,123))

列表复制

            a=[1,2,3] 
          
            b=a 
          
            当对b进行操作时，会影响a的内容，因为共用一个内存指针，b=a[:] 这样就是单独复制一份了。

列表推导

if+else配合列表解析

1	[i if i >5 else -i for i in range(10)]

多层嵌套列表

            a=[[1,2],[3,4]] 
          
            b=[ 
           for j in i for i in a] 
          
           print b 
          
            [1,2,3,4]

生成一个生成器，调用next方法，可以减少内存开支。

1	a=(i else i+1 for i in b if i==1)

字典推导

更换key与value位置

1 2	dict={ "a":1,"b":2} b={value:key for key value in dict.items()}

字典操作(dict)

筛选出值重复的key

            list1=self.dict_ip.items() 
          
            ddict=defaultdict(list) 
          
           for k,v in list1: 
          
            ddict[v].append(k) 
          
            list2=[(i,ddict[i]) 
           for i in ddict if len(ddict[i])>1] 
          
            dict_ns=dict(list2)

字典排序（py2）

1 2	file_dict={ "a":1,"b":2,"c":3} file_dict_new=sorted(file_dict.iteritems(), key=operator.itemgetter(1),reverse=True) ##字典排序,reverse=True由高到低，itemgetter(1)表示按值排序，为0表示按key排序。

字典值判断

            b={ 
           "a":1} 
          
            a=b.get( 
           "a","") #如果不存在a，则返回”” 
          
            c=a 
           if a else 0 #如果存在a，则返回a，不然返回0

模块操作

导入模块时，设置只允许导入的属性或者方法。

            fb.py: 
          
            ----------------------- 
          
            __all__=[ 
           "a","b"] 
          
            a= 
           "123" 
          
            c= 
           "2345" 
          
            def b(): 
          
           print “123” 
          
            ----------------------- 
          
            from fb import * 
          
            可以导入__all__内定义的变量，a跟b()可以导入，c不行。如果不定义__all__则所有的都可以导入。

导入上级目录下的包

1 2	sys.path.append( "..") from spider.spider_ import spider_

导入外部目录下的模块

1	需要在目标目录下创建__init__.py文件，内容随便。

增加模块属性

            有时候源代码中，我们需要写上自己的名字以及版本介绍信息，可以用__name__的方式定义。 
          
            a.py: 
          
           #! -*- coding:utf-8 -*- 
          
            __author__= 
           "nMask"

然后当我们导入a这个模块的时候，可以输出dir(a)看看

            >>> import p 
          
            >>> 
           print dir(p) 
          
            [ 
           '__author__', '__builtins__', '__doc__', '__file__', '__name__', '__package__'] 
          
            >>> 
           print p.__author__ 
          
            nmask

动态加载一个目录下的所有模块

            目录： 
          
            --- 
           test 
          
            ----a.py 
          
            ----b.py 
          
            ---c.py 
          
            c.py导入 
           test下面的所有模块： 
          
           for path in ["test"]: 
          
           for i in list(set([os.path.splitext(i)[0] for i in os.listdir("./"+path)])): 
          
           if i!="__init__" and i!=".DS_Store": ##排除不必要的文件 
          
            import_string = 
           "import path+"."+i+" 
          
           exec import_string #执行字符串中的内容

函数操作

eval/exec

            def 
           test(content): 
          
           print content 
          
           exec(“test(‘abc')”)

输出：abc
说明：exec函数没有返回值

            def 
           test(content): 
          
           return content 
          
           print eval(“test(‘abc')”)

输出：abc
说明：eval函数有返回值

装饰器函数

输出当前时间装饰器

            def current_time(aclass): 
          
            def wrapper(): 
          
           print "[Info]NowTimeis:",time.ctime() 
          
           return aclass() 
          
           return wrapper

itertools迭代器

            p=product([ 
           "a","b","c","d"],repeat=2) 
          
            ---- 
          
            [( 
           "a","a"),("b","b")......]

reduce函数

函数本次执行的结果传递给下一次。

            def 
           test(a,b): 
          
           return a+b 
          
            reduce( 
           test,range(10)) 
          
            结果：从0+1+2......+9

enumerate函数

输入列表元素以及序列号

            n=[ 
           "a","b","c"] 
          
           for i,m in enumerate(n): 
          
           print(i,m)

函数超时时间设置

@于2017.05.27更新
利用signal设置某个函数执行的超时时间

            import time 
          
            import signal 
          
            def 
           test(i): 
          
            time.sleep(0.999) 
           #模拟超时的情况 
          
           print "%d within time"%(i) 
          
           return i 
          
            def fuc_time(time_out): 
          
           # 此为函数超时控制，替换下面的test函数为可能出现未知错误死锁的函数 
          
            def handler(signum, frame): 
          
            raise AssertionError 
          
            try: 
          
            signal.signal(signal.SIGALRM, handler) 
          
            signal.alarm(time_out) 
           #time_out为超时时间 
          
            temp = 
           test(1) #函数设置部分，如果未超时则正常返回数据， 
          
           return temp 
          
            except AssertionError: 
          
           print "%d timeout"%(i)# 超时则报错 
          
           if __name__ == '__main__': 
          
           for i in range(1,10): 
          
            fuc_time(1)

函数出错重试

利用retrying模块实现函数报错重试功能

            import random 
          
            from retrying import retry 
          
            @retry 
          
            def have_a_try(): 
          
           if random.randint(0, 10) != 5: 
          
            raise Exception( 
           'It's not 5!') 
          
            print 'It 
           's 5!'

如果我们运行have_a_try函数，那么直到random.randint返回5，它才会执行结束，否则会一直重新执行，关于该模块更多的用法请自行搜索。

程序操作

@于2017.05.27更新

Ctrl+C退出程序

利用signal实现ctrl+c退出程序。

            import signal 
          
            import sys 
          
            import time 
          
            def handler(signal_num,frame): 
          
           print "\nYou Pressed Ctrl-C." 
          
            sys.exit(signal_num) 
          
            signal.signal(signal.SIGINT, handler) 
          
           # 正常情况可以开始你自己的程序了。 
          
           # 这里为了演示，我们做一个不会卡死机器的循环。 
          
           while 1: 
          
            time.sleep(10) 
          
           # 当你按下Ctrl-C的时候，应该会输出一段话，并退出.

程序自重启

利用os.execl方法实现程序自重启

            import time 
          
            import sys 
          
            import os 
          
            def restart_program(): 
          
            python = sys.executable 
          
           print "info:",os.execl(python, python, * sys.argv) 
          
           #os.execl方法会代替自身进程，以达到自重启的目的。 
          
           if __name__ == "__main__": 
          
           print 'start...' 
          
           print u"3秒后,程序将结束...".encode("utf8") 
          
            time.sleep(3) 
          
            restart_program()

[原文地址](https://thief.one/2017/04/19/1/)

转--python 黑魔法2

Python 高效编程小技巧

1. 拆箱（这个方法比较常见，非常高效）

2. 指定步长的切割

3. 压缩器zip

4. 列表展开

5. 生成器表达式

6. 字典推导和集合推导

7. Counter 计数器

8. 双端队列

9. 默认词典

10. 利用json库打印出漂亮的JSON串

11. 最大和最小的几个列表元素

12. 一些更贴近大脑的写法，和一些掉了下巴的代码段

13. 一个超小型的Web服务

python奇技淫巧