导语
Python有好多非常实用的函数总是让人觉得相见恨晚!(握拳)
String
- 判断string的开头是否含有某个字段startStr
str.startswith(startStr)
- 将string用指定格式输出
print "{0} and {1} are couple.".format('Rose', 'Jack')
# which is equal to
print "%s and %s are couple." % (Rose', 'Jack')
# print string with equal width
print "{0:10} | {0:10} | {0:10}".format(str1, str2, str3)
List
- 将List用指定符号连接成String
" ".join(list) # use a space to join the list
Dict
- 有一种dict,当查询其键值时,若查询值不存在也不会报错
from collections import defaultdict
"""
dataType can be null, or can be claimed with certain data type
"""
dict = defaultdict(dataType)
Date
- 拿到一个时间格式的字段,如何快速分离出year、month、day、hour、min、sec?
dateutil.parser.Parse
可以解析大多数常见的日期格式
from dateutil.parser import parse
date = parse(dateString)
day = date.days
DataFrame
- Excel中的PivotTabel在统计分布的时候十分好用啊,在
pandas.dataframe
中也有简单快速有效的函数实现这一功能
"""
ATTENTION: return a dataframe with distinct values of this COLUMN serving as index
"""
df['COLUMN'].value_counts()
- 将dataframe保存成csv
df.to_csv('df.csv', index = False)
编码
关于中文的编码问题笔者只能感到惆怅……这时一定会提到一个包:codecs
- 写入txt/csv文件时中文乱码
import codecs
# open csv/txt file with utf-8 encoding
csvFile = codecs.open('csvFile.csv', encoding = 'utf-8')
csv.write('XXX')
- 写入中文的csv用Excel打开会乱码
这里涉及到了另一种概念——BOM头,具体可参考UTF8 + BOM产生问题与小结如果希望写入的文件含有BOM头,则可参照以下代码:
with open('csvFile.csv', 'w') as csvFile:
csvFile.write(codecs.BOM_UTF8)
csvFile.write('XXX')
若希望在读取文件之前删除BOM头:
csvFile = codecs.open('csvFile', 'r', 'utf_8_sig')
当然,若文件不大的话,也可以使用编辑器进行转码,例如:notepad++、ultraedit
Terminal
让Terminal的输出有字体颜色差异:
STYLE = {
'fore': {
'black': 30, 'red': 31, 'green': 32, 'yellow': 33,
'blue': 34, 'purple': 35, 'cyan': 36, 'white': 37,
},
'back': {
'black': 40, 'red': 41, 'green': 42, 'yellow': 43,
'blue': 44, 'purple': 45, 'cyan': 46, 'white': 47,
},
'mode': {
'bold': 1, 'underline': 4, 'blink': 5, 'invert': 7,
},
'default': {
'end': 0,
}
}
def use_style(string, mode='', fore='', back=''):
mode = '%s' % STYLE['mode'][mode] if STYLE['mode'].has_key(mode) else ''
fore = '%s' % STYLE['fore'][fore] if STYLE['fore'].has_key(fore) else ''
back = '%s' % STYLE['back'][back] if STYLE['back'].has_key(back) else ''
style = ';'.join([s for s in [mode, fore, back] if s])
style = '\033[%sm' % style if style else ''
end = '\033[%sm' % STYLE['default']['end'] if style else ''
return '%s%s%s' % (style, string, end)
# example print
print use_style('Hello World!', mode='bold', fore='red')