Python Tips (Continue...)

导语

Python有好多非常实用的函数总是让人觉得相见恨晚!(握拳)

String

  • 判断string的开头是否含有某个字段startStr
str.startswith(startStr)
  • 将string用指定格式输出
print "{0} and {1} are couple.".format('Rose', 'Jack')
# which is equal to 
print "%s and %s are couple." % (Rose', 'Jack')

# print string with equal width
print "{0:10} | {0:10} | {0:10}".format(str1, str2, str3)

List

  • 将List用指定符号连接成String
" ".join(list)  # use a space to join the list

Dict

  • 有一种dict,当查询其键值时,若查询值不存在也不会报错
from collections import defaultdict

"""
dataType can be null, or can be claimed with certain data type
"""
dict = defaultdict(dataType)

Date

  • 拿到一个时间格式的字段,如何快速分离出year、month、day、hour、min、sec?dateutil.parser.Parse可以解析大多数常见的日期格式
from dateutil.parser import parse

date = parse(dateString)
day = date.days

DataFrame

  • Excel中的PivotTabel在统计分布的时候十分好用啊,在pandas.dataframe中也有简单快速有效的函数实现这一功能
"""
ATTENTION: return a dataframe with distinct values of this COLUMN serving as index
"""
df['COLUMN'].value_counts()
  • 将dataframe保存成csv
df.to_csv('df.csv', index = False)

编码

关于中文的编码问题笔者只能感到惆怅……这时一定会提到一个包:codecs

  • 写入txt/csv文件时中文乱码
import codecs

# open csv/txt file with utf-8 encoding
csvFile = codecs.open('csvFile.csv', encoding = 'utf-8')
csv.write('XXX')
  • 写入中文的csv用Excel打开会乱码
    这里涉及到了另一种概念——BOM头,具体可参考UTF8 + BOM产生问题与小结如果希望写入的文件含有BOM头,则可参照以下代码:
with open('csvFile.csv', 'w') as csvFile:
    csvFile.write(codecs.BOM_UTF8)
    csvFile.write('XXX')

若希望在读取文件之前删除BOM头:

csvFile = codecs.open('csvFile', 'r', 'utf_8_sig')

当然,若文件不大的话,也可以使用编辑器进行转码,例如:notepad++、ultraedit

Terminal

让Terminal的输出有字体颜色差异:

STYLE = {
        'fore': {
                'black': 30, 'red': 31, 'green': 32, 'yellow': 33,
                'blue': 34, 'purple': 35, 'cyan': 36, 'white': 37,
        },
        'back': {
                'black': 40, 'red': 41, 'green': 42, 'yellow': 43,
                'blue': 44, 'purple': 45, 'cyan': 46, 'white': 47,
        },
        'mode': {
                'bold': 1, 'underline': 4, 'blink': 5, 'invert': 7,
        },
        'default': {
                'end': 0,
        }
}

def use_style(string, mode='', fore='', back=''):
    mode = '%s' % STYLE['mode'][mode] if STYLE['mode'].has_key(mode) else ''
    fore = '%s' % STYLE['fore'][fore] if STYLE['fore'].has_key(fore) else ''
    back = '%s' % STYLE['back'][back] if STYLE['back'].has_key(back) else ''
    style = ';'.join([s for s in [mode, fore, back] if s])
    style = '\033[%sm' % style if style else ''
    end = '\033[%sm' % STYLE['default']['end'] if style else ''
    return '%s%s%s' % (style, string, end)

# example print
print use_style('Hello World!', mode='bold', fore='red')

你可能感兴趣的:(Python Tips (Continue...))