函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段。
函数能提高应用的模块性,和代码的重复利用率。Python提供了许多内建函数,比如print()。但也可以自己创建函数,这被叫做用户自定义函数。
你可以定义一个由自己想要功能的函数,以下是简单的规则:
def functionname( parameters ):
function_suite
return [expression]
默认情况下,参数值和参数名称是按函数声明中定义的的顺序匹配起来的。
举例1:
def add(x, y):
print(“x = {0}”.format(x))
print(“x = {0}”.format(x))
print(“x + y = {0}”.format(x+y))
return x+y
举例2:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time : 2018/4/14 20:31
# @Author : Feng Xiaoqing
# @File : demo1.py
# @Function: -----------
def f(x,l=[]):
for i in range(x):
l.append(i*i)
print(l)
# f(2) = f(2, l=[])
f(2)
# 结果:[0, 1]
f(3,[3,2,1])
# 结果: [3, 2, 1, 0, 1, 4]
f(x=3, l=[])
# 结果: [0, 1, 4]
运行结果:
[0, 1]
[3, 2, 1, 0, 1, 4]
[0, 1, 4]
2.函数的调用
定义一个函数只给了函数一个名称,指定了函数里包含的参数,和代码块结构。
这个函数的基本结构完成以后,你可以通过另一个函数调用执行,也可以直接从Python提示符执行。
如下实例调用了add()函数:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time : 2018/4/15 21:01
# @Author : Feng Xiaoqing
# @File : demo2.py
# @Function: -----------
# 自定义加法函数add()
def add(x,y):
print("{0} + {1} = {2}".format(x,y,x+y))
return
print("finished") #在return后不会执行这条语句
# 调用函数,计算2+3的得数
add(2,3)
运行结果:
2 + 3 = 5
3.函数的参数
形式参数和实际参数
在定义函数时,函数名后面,括号中的变量名称叫做形式参数,或者称为"形参"
在调用函数时,函数名后面,括号中的变量名称叫做实际参数,或者称为"实参"
def fun(x,y): //形参
print(x + y)
fun(1,2) //实参
3
fun('a','b')
ab
函数默认参数:
缺省参数(默认参数)
def fun(x,y=100)
print x,y
#调用:
fun(1,2)
fun(1)
定义:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
def fun(x=2,y=3):
print x+y
调用:
fun()
#结果:
5
fun(23)
#结果
26
fun(11,22)
#结果:
33
我们经常在看别人的代码中,经常出现def(*args, **kwargs)这样的表现形式:
*args 指的是:tuple (1, )
**kwargs 指的是:dict {“k”: “v”}
fun(*args, **keargs)
fun(1, 2, 3, 4, 5, a=10, b=40)
4.函数的返回值
函数返回值:
函数被调用后会返回一个指定的值
函数调用后默认返回None
return返回值
返回值可以是任意类型
return执行后,函数终止
return与print区别
#!/usr/bin/env python
# -*- coding:utf-8 -*-
def fun():
print 'hello world'
return 'ok'
print 123
fun()
#结果
hello world
123
None
5.函数的变量
局部变量和全局变量:
Python中的任何变量都有特定的作用域
在函数中定义的变量一般只能在该函数内部使用,这些只能在程序的特定部分使用的变量我们称之为局部变量
在一个文件顶部定义的变量可以供文件中的任何函数调用,这些可以为整个程序所使用的变量称为全局变量。
def fun():
x=100
print x
fun()
x = 100
def fun():
global x //声明
x +=1
print x
fun()
print x
外部变量被改(x由100改为101):
x = 100
def fun():
global x
x += 1
print (x)
fun()
print (x)
#结果
101
101
内部变量外部也可用:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time : 2018/4/15 21:33
# @Author : Feng Xiaoqing
# @File : demo2.py
# @Function: -----------
x = 100
def fun():
global x
x +=1
global y
y = 1
print(x)
fun()
print(x)
print(y)
#结果:
101
101
1
统计程序中的变量,返回的是个字典
#!/usr/bin/env python
# -*- coding:utf-8 -*-
x = 100
def fun():
x = 1
y = 1
print(locals())
fun()
print (locals())
结果:
{'y': 1, 'x': 1}
{'__name__': '__main__', '__doc__': None, '__package__': None, '__loader__': <_frozen_importlib_external.SourceFileLoader object at 0x02FF6390>, '__spec__': None, '__annotations__': {}, '__builtins__': , '__file__': 'D:/PycharmProjects/PythonLive/untitled/day07/demo2.py', '__cached__': None, 'x': 100, 'fun': }
6.匿名函数
顾名思义就是没有名字的函数,那为什么要设立匿名函数,他有什么作用呢?
lambda 函数是一种快速定义单行的最小函数,可以用在任何需要函数的地方
python 使用 lambda 来创建匿名函数。
lambda函数的语法只包含一个语句,如下:
lambda [arg1 [,arg2,.....argn]]:expression
举例:
求两数的乘积:
常规写法:
def fun(x,y)
return x*y
lambda版本写法:
r = lambda x,y:x*y
7.高阶函数
(1)map(f, list)
返回每个元素通过f计算完的value的list
map()函数接收两个参数,一个是函数,一个是序列,map将传入的函数依次作用到序列的每个元素,并把结果作为新的list返回。
举例:计算列表里值的平方
#!/usr/bin/env python
# -*- coding:utf-8 -*-
def f(x):
return x*x
for i in map(f,[1,2,3,4,5,6,7]):
print(i)
结果:
1
4
9
16
25
36
49
(2)reduce(f,list)函数(求list中数的和)
reduce把一个函数作用在一个序列[x1, x2, x3...]上,这个函数必须接收两个参数,reduce把结果继续和序列的下一个元素做累积计算,其效果就是:
举例:计算列表中所有数的和
#!/usr/bin/env python
# -*- coding:utf-8 -*-
from functools import reduce #导入reduce函数
def f(x,y):
return x+y
print(reduce(f,[1,2,3,4,5,6,7,8,9,10]))
print(reduce(f,range(1,101)))
#结果:
55
5050
(3)filter()函数(过滤)
filter函数接收一个函数f和一个list,函数f的作用是对每个元素进行判断,返回True或者False,filter()根据判断结果自动过滤掉不符合条件的元素,返回符合要求的元素组成的list
filter(lamdba x: x%2 ==1, [1, 2, 3, 4, 5])
举例:计算list中小于7的数
#!/usr/bin/env python
# -*- coding:utf-8 -*-
for i in filter(lambda x:x<7, [1, 2, 3, 4, 5,40,8]):
print(i)
#结果:
1
2
3
4
5
(4)sorted()函数(排序)
sorted(...)
sorted(iterable, cmp=None, key=None, reverse=False) --> new sorted list
# sorted(iterable, key, reverse)
# iterable 一个可迭代的对象
# key 对什么进行排序
# reverse bool类型,如果为true为反序, 默认为false
# 返回值是一个list
举例:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time : 2018/4/15 22:47
# @Author : Feng Xiaoqing
# @File : demo3.py
# @Function: -----------
m = dict(a=1, c=10, b=20, d=15)
print(sorted(m.items(), key = lambda d:d[1],reverse = True)) #按value值倒序排列
#结果:
[('b', 20), ('d', 15), ('c', 10), ('a', 1)]
Python 中的 file 不止使用 PC 时所说的单个文件,比如 .txt、.exe 等这类文件,也包括“打开一个网址”、程序间的通信数据等,都抽象成 file 的概念。
所有的这些数据处理,可以通过一套相同的操作函数进行,简化文件操作逻辑,降低了学习难度。
以下是 Python 自带的文件操作函数(即“内建函数”):
open() --> write() --> close()
打开 --> 写入内容 --> 保存关闭文件
记录常见的“英文名字”。
【说明:】不采用中文,是因为中文的字符不是统一的,一个汉字是两个字符位,而标点是一个字符位,不容易理解。
使用 open()
函数。
# 记录常见的英文名字到 txt 文件中
file_names = open('enNames.txt','w') # 需要添加‘’,说明为 操作标记,否则被认为是 变量
print("file_names 的文件 type 是:")
print(type(file_names))
file_names 的文件 type 是:
open('enName.txt', mode = 'w')
open('enName.txt', 'w')
file_names = open('enName.txt','w')
open(file, mode, buffering, encoding, errors, newline, ...)
open(file 是处理的文件名字,需要为 str 数据类型,只有这个是必填项(不然干嘛还用这个函数呢);mode 是处理文件的模式,有 'r'(read 只读模式,不能修改里面的数据)、'w'(write 写入模式,清空内容写入)、'a'(不清楚原有内容的写入),不输入就用默认的 r 模式;buffering 后面这些暂时不需要用到,放过)
使用 write
函数。
# 向 file_names 文件内写入 “John” 这个名字,string 类型的。
file_names.write('John')
4
使用 close()
函数。
file_names.close()
open() --> read() --> close()
打开 --> 读取内容 --> 保存关闭文件
读取到文件内容,并进行打印输出。
# 打开需要操作的文件,赋值给一个变量以便操作
file_2 = open('enNames.txt') # 默认是 r 模式,所以不用书写
# 读取 file_2 内容,也就是 file_names.txt 的内容
# file_2.read()
# 对读取的内容进行输出打印:
print('file_names.txt 的内容是:')
print(file_2.read())
# 关闭保存文件
file_2.close()
file_names.txt 的内容是:
John
在文件原有的内容上增加内容。
# 增加写入 ‘Bob’ 名字
file_3 = open('enNames.txt','a')
file_3.write('Bob')
file_3.close()
# 需要重新定义变量进行查看,原来的模式为 write,是 unreadable 状态
file_4 = open('enNames.txt')
print("新增内容后的全部内容是:")
print(file_4.read())
file_4.close()
新增内容后的全部内容是:
JohnBob
增加的内容在新的一行上。
file_5 = open('enNames.txt', 'w')
file_5.write('John\n')
file_5.write('Bob\n')
file_5.write('Jack\n')
file_5.write('Rose\n')
file_5.close()
file_6 = open('enNames.txt')
print("具有多行 string 的内容是:")
print(file_6.read())
file_6.close()
具有多行 string 的内容是:
John
Bob
Jack
Rose
逐行读取内容,以 string 类型的数据为例子。
file_7 = open('enNames.txt')
print('一行的内容是:')
print(file_7.readline())
print('下一行的内容是:')
print(file_7.readline())
file_7.close()
一行的内容是:
John
下一行的内容是:
Bob
批量逐行读取内容,用到 for
函数。
file_8 = open('enNames.txt')
for line in file_8.readlines():
print('这行的内容是:'+line)
print('=*=*=*=')
file_8.close()
这行的内容是:John
=*=*=*=
这行的内容是:Bob
=*=*=*=
这行的内容是:Jack
=*=*=*=
这行的内容是:Rose
=*=*=*=
【指针】:可以简单理解为我们进行 word 编辑的时候的那个“光标”,位置和 sequence 的下标一样,用数字表示。对应的“函数”是 tell()
。
获得指针位置信息。
file_9 = open('enNames.txt', 'rb') # 需要增加 b 字符,才能在后面进行相对偏移的操作,否则没有权限。
print('初始指针位置(应该是 0):')
print(file_9.tell())
print("读取3个字符,内容是:")
print(file_9.read(3)) # read()默认是读取全部内容,增加的数字是指定读取的字符数量。
print("现在的指针位置是:")
print(file_9.tell())
print('再读取4个字符,内容是(我不知道换行符是不是算一个字符):')
print(file_9.read(4))
print("处理两次后,当前的指针位置:")
print(file_9.tell())
初始指针位置(应该是 0):
0
读取3个字符,内容是:
b'Joh'
现在的指针位置是:
3
再读取4个字符,内容是(我不知道换行符是不是算一个字符):
b'n\r\nB'
处理两次后,当前的指针位置:
7
mode = 'r'
的情况
【分析:】为什么最后是8,不应该是3+4=7的么?【猜想:】应该是换行符有点特别吧。
mode = 'rb
的情况
【分析:】打印的内容为什么出现b''
字样?【基本猜测:】b 的意思是 binary mode,即 二级制,需要进行提醒。
将指针返回到文件开头。使用的是 seek()
函数。
print("我们进行了 seek() 的操作,seek(0)")
file_9.seek(0) # 输入的数字是定位的位置的数字标记。
print("当前的指针位置是:")
print(file_9.tell())
print("重新定位指针后,读取的两个字符内容是:")
print(file_9.read(2))
print("读取完成后,当前的指针位置是:")
print(file_9.tell())
我们进行了 seek() 的操作,seek(0)
当前的指针位置是:
0
重新定位指针后,读取的两个字符内容是:
b'Jo'
读取完成后,当前的指针位置是:
2
在当前位置相对移动指针。
接着上面,指针已经在 2 位置处。
print("当前位置偏移4个字符的 seek() 操作")
file_9.seek(4, 1)
print("当前的指针位置是:%s"%file_9.tell())
print("读取2个字符,内容是:%s"%file_9.read(2))
print("从文件开头位置偏移3个字符的 seek() 操作")
file_9.seek(3, 0)
print("当前的指针位置是:%s"%file_9.tell())
print("读取2个字符,内容是:%s"%file_9.read(2))
print("从文件结尾位置偏移3个字符的 seek() 操作")
file_9.seek(-3, 2)
print("当前的指针位置是:%s"%file_9.tell())
print("读取2个字符,内容是:%s"%file_9.read(2))
file_9.close()
当前位置偏移4个字符的 seek() 操作
当前的指针位置是:6
读取2个字符,内容是:b'Bo'
从文件开头位置偏移3个字符的 seek() 操作
当前的指针位置是:3
读取2个字符,内容是:b'n\r'
从文件结尾位置偏移3个字符的 seek() 操作
当前的指针位置是:20
读取2个字符,内容是:b'e\r'
【参数说明:】
seek
2.1、os.getcwd( )方法获取代码当前工作路径
import os
os.getcwd()
os.getcwd( )方法获取代码当前工作路径
2.2、 os.listdir()方法获取当前工作文件夹内的文件夹或文件
import os
os.listdir()
os.listdir()方法获取当前工作文件夹内的文件夹或文件
2.3 、 os.scandir() 方法获取当前工作文件夹内的文件夹或文件
os.scandir('/home/davidwu/kaggle')
os.scandir() 方法获取当前工作文件夹内的文件夹或文件
返回的是可迭代对象对吧?
我们用for循环迭代一下遍出结果
for f in os.scandir():
if not f.is_file(): #is_file判断是否是文件
print('yes',f)
else:
print('no:', f)
for循环迭代遍历出结果
2.4 、 os.makedirs() # 创建文件夹
os.makedirs("haha1/haha2") # 创建文件夹
os.makedirs() # 创建文件夹
2.5 、 os.chdir( ) # 创建文件夹
os.chdir('/home/davidwu/kaggle/haha1/haha2')
os.chdir( ) # 创建文件夹
2.6 、 os.path.join() # 路径拼接为
os.path.join('kaggle', 'kaggle233', 'kaggle666')
2.7 、 os.path.abspath( ) # os.path.abspath(path):返回path的绝对路径。
os.path.abspath("haha1")
返回path的绝对路径
2.8 、 os.system(command) #用来运行shell命令。
python调用Shell脚本,有两种方法:os.system(cmd)或os.popen(cmd),前者返回值是脚本的退出状态码,后者的返回值是脚本执行过程中的输出内容。实际使用时视需求情况而选择。