# -*- coding: utf-8 -*-
import gc
del obj #删除对象名
gc.collect()
以如下文件为例,文件名为test.txt,文本内容如下:
WIFIAPTag,passengerCount,timeStamp
E1-1A-1<E1-1-01>,15,2016-09-10-18-55-04
E1-1A-2<E1-1-02>,15,2016-09-10-18-55-04
E1-1A-3<E1-1-03>,38,2016-09-10-18-55-04
示例1
with open(name='test.txt',mode='r') as file:
print file.readline()
print file.readline()
file.seek(0)
print file.readline()
输出1
WIFIAPTag,passengerCount,timeStamp
E1-1A-1,15,2016-09-10-18-55-04
WIFIAPTag,passengerCount,timeStamp
分析1
1. print函数输出会自动换行,函数原型print(*objects, sep=’ ‘, end=’\n’, file=sys.stdout, flush=False)。
解决办法:
Python 2:from future import print_function print(“hello”,end=”)
Python 3:输入参数end:print (‘hello’, end=”)。
2. with open 的组合可以取代 open close这样的文件操作,由with进行管理文件关闭。
3. readline()方法表示从文件中读取一行,且有一个文件指针,当使用file.seek(0),指针指向文件起始处。
示例2
with open(name='test.txt',mode='r') as file:
column_names = file.readline().strip().split(',')
print column_names
data = []
for line in file:
(wifi_ap_tag,passenger_count,time_stamp) = line.strip().split(',')
data.append([wifi_ap_tag,passenger_count,time_stamp])
print data
输出2
[‘WIFIAPTag’, ‘passengerCount’, ‘timeStamp’]
[[‘E1-1A-1’, ‘15’, ‘2016-09-10-18-55-04’], [‘E1-1A-2’, ‘15’, ‘2016-09-10-18-55-04’], [‘E1-1A-3’, ‘38’, ‘2016-09-10-18-55-04’]]
分析2
1. strip()去除多余的空格
2. split(‘,’),以逗号为分隔符进行划分. split(‘,’,maxsplit=1)可以使用maxsplit控制最多只划分一次.
示例3
#文本追加
with open(name='test.txt',mode='a') as file:
file.write('\nhello python')
输出3
WIFIAPTag,passengerCount,timeStamp
E1-1A-1,15,2016-09-10-18-55-04
E1-1A-2,15,2016-09-10-18-55-04
E1-1A-3,38,2016-09-10-18-55-04
hello python
分析3
r以读方式打开文件,可读取文件信息。
w以写方式打开文件,可向文件写入信息。如文件存在,则清空该文件,再写入新内容
a以追加模式打开文件(即一打开文件,文件指针自动移到文件末尾),如果文件不存在则创建
r+以读写方式打开文件,可对文件进行读和写操作。
w+消除文件内容,然后以读写方式打开文件。
a+以读写方式打开文件,并把文件指针移到文件尾。
b以二进制模式打开文件,而不是以文本模式。该模式只对Windows或Dos有效,类Unix的文件是用二进制模式进行操作的。
代码
try:
data = open(name='1.txt',mode='r')
except IOError as err:
print 'File error : ' + str(err)
finally:
if 'data' in locals(): #locals()会返回当前作用域中定义所有名的一个集合
data.close()
输出
File error : [Errno 2] No such file or directory: ‘1.txt’
a = [1,2,3,4,5,4,6,8]
x = sorted(set([(item*item) for item in a if item > 3]),reverse=True)[0:3]
print x
#输出 [64, 36, 25]
#set() 表示集合
#对数据完成复制排序 data2 = sorted()
#对数据完成原地排序 data.sort()
#默认排序是升序,使用reverse=True可以降序输出
#函数原型 sorted(iterable, cmp=None, key=None, reverse=False)
(1)匿名函数lambda。原型lambda [arg1[,arg2,arg3,…,argn]] : expression
>>> add = lambda x,y : x + y
>>> add(1,2)
3
(2)filter(bool_func,seq):此函数的功能相当于过滤器。调用一个布尔函数bool_func来迭代遍历每个seq中的元素;返回一个使bool_seq返回值为true的元素的序列。
>>> filter(lambda x : x%2 == 0,[1,2,3,4,5])
[2, 4]
(3)map(func,seq1[,seq2…]):将函数func作用于给定序列的每个元素,并用一个列表来提供返回值;如果func为None,func表现为身份函数,返回一个含有每个序列中元素集合的n个元组的列表。
>>> map(lambda x : None,[1,2,3,4])
[None, None, None, None]
>>> map(lambda x : x * 2,[1,2,3,4])
[2, 4, 6, 8]
>>> map(lambda x : x * 2,[1,2,3,4,[5,6,7]])
[2, 4, 6, 8, [5, 6, 7, 5, 6, 7]]
>>> map(lambda x : None,[1,2,3,4])
[None, None, None, None]
(4)reduce(func,seq[,init]):func为二元函数,将func作用于seq序列的元素,每次携带一对(先前的结果以及下一个序列的元素),连续的将现有的结果和下一个值作用在获得的随后的结果上,最后减少我们的序列为一个单一的返回值:如果初始值init给定,第一个比较会是init和第一个序列元素而不是序列的头两个元素。
>>> reduce(lambda x,y : x + y,[1,2,3,4])
10
>>> reduce(lambda x,y : x + y,[1,2,3,4],10)
20
(5)zip
zip(seq1 [, seq2 […]]) -> [(seq1[0], seq2[0] …), (…)]
x = [1, 2, 3]
y = [4, 5, 6, 7]
xy = zip(x, y)
#输出 [(1, 4), (2, 5), (3, 6)]
(6)enumerate
for i,j in enumerate(('a','b','c')):
print i,j
#输出
#0 a
#1 b
#2 c
import time
time.time() #获取当前时间戳
time.localtime() #当前时间的struct_time形式
time.ctime() #当前时间的字符串形式
#格式化成2016-11-16 14:45:39形式
time.strftime("%Y-%m-%d %H:%M:%S", time.localtime())
#统计程序运行时间
from time import clock
t_finish = clock()
t_finish = clock()
print('==============运行时间为:%s 秒==============' % str(t_finish - t_start))
import pickle
#以保存模型参数为例
with open(name='test.pickle',mode='wb') as save_file: #‘b’表示二进制模式
pickle.dump({'depth':8,'ntree':100},save_file)
with open(name='test.pickle',mode='rb') as restored_file:
para = pickle.load(restored_file)
print para['depth']
print para['ntree']
import os
os.getcwd() #当前工作目录
os.chdir('../python/code') #注意.与..的区别
#新建文件夹
if not os.path.exists('submit'):
os.mkdir('submit')
list:列表(即动态数组,C++标准库的vector,但可含不同类型的元素于一个list中)
a = [“I”,”you”,”he”,”she”] #元素可为任何类型。
dictionary: 字典(即C++标准库的map)
dict = {‘ob1’:’computer’, ‘ob2’:’mouse’, ‘ob3’:’printer’}
每一个元素是pair,包含key、value两部分。key是Integer或string类型,value 是任意类型。
键是唯一的,字典只认最后一个赋的键值。
dictionary的方法
D.get(key, 0) #同dict[key],多了个没有则返回缺省值,0。[]没有则抛异常
D.has_key(key) #有该键返回TRUE,否则FALSE
D.keys() #返回字典键的列表
D.values()
D.items()
D.update(dict2) #增加合并字典
D.popitem() #得到一个pair,并从字典中删除它。已空则抛异常
D.clear() #清空字典,同del dict
D.copy() #拷贝字典
D.cmp(dict1,dict2) #比较字典,(优先级为元素个数、键大小、键值大小)
#第一个大返回1,小返回-1,一样返回0
dictionary的复制
dict1 = dict #别名
dict2=dict.copy() #克隆,即另一个拷贝
字典的遍历
(1)遍历字典的key(键)
for key in dict.keys():
print key
(2)遍历字典的value(值)
for value in dict.values():
print value
(3)遍历字典的项(元素)
for item in dict.items():
print item
(4)遍历字典的key-value
for item,value in dict.items():
print ‘key=%s, value=%s' %(item, value)
或
for item,value in dict.iteritems():
print ‘key=%s, value=%s' %(item, value)
string:字符串(即不能修改的字符list)
str = “Hello World”
字符串是一个整体。如果你想直接修改字符串的某一部分,是不可能的。但我们能够读出字符串的某一部分。
子字符串的提取str[:6]
字符串包含判断操作符:in,not in
”He” in str
“she” not in str
string模块方法
S.find(substring, [start [,end]]) #可指范围查找子串,返回索引值,否则返回-1
S.rfind(substring,[start [,end]]) #反向查找
S.index(substring,[start [,end]]) #同find,只是找不到产生ValueError异常
S.rindex(substring,[start [,end]])#同上反向查找
S.count(substring,[start [,end]]) #返回找到子串的个数
S.lowercase()
S.capitalize() #首字母大写
S.lower() #转小写
S.upper() #转大写
S.swapcase() #大小写互换
S.split(str, ’ ‘) #将string转list,以空格切分
S.join(list, ’ ‘) #将list转string,以空格连接
处理字符串的内置函数
len(str) #串长度
cmp(“my friend”, str) #字符串比较。第一个大,返回1
max(‘abcxyz’) #寻找字符串中最大的字符
min(‘abcxyz’) #寻找字符串中最小的字符
string的转换
oat(str) #变成浮点数,float(“1e-1”) 结果为0.1
int(str) #变成整型, int(“12”) 结果为12
int(str,base) #变成base进制整型数,int(“11”,2) 结果为2
long(str) #变成长整型,
long(str,base) #变成base进制长整型,
字符串的格式化(注意其转义字符,大多如C语言)
str_format % (参数列表) #参数列表是以tuple的形式定义的,即不可运行中改变
print “”%s’s height is %dcm” % (“My brother”, 180)
#结果显示为 My brother’s height is 180cm