算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。也就是说,能够对一定规范的输入,在有限时间内获得所要求的输出. 数学函数可理解为是算法的一种特殊形式.
以梯度下降法求极值问题为例:
一个算法应该具有以下五个重要的特征:
数据对象的运算和操作:计算机可以执行的基本操作是以指令的形式描述的。一个计算机系统能执行的所有指令的集合,称为该计算机系统的指令系统。一个计算机的基本运算和操作有如下四类:
同一问题可用不同算法解决,而一个算法的质量优劣将影响到算法乃至程序的效率。算法分析的目的在于选择合适算法和改进算法。一个算法的评价主要从时间复杂度和空间复杂度来考虑。
(1). 时间复杂度
算法的时间复杂度是指执行算法所需要的计算工作量。一般来说,计算机算法是问题规模 n n n 的函数 f ( n ) f(n) f(n),算法的时间复杂度也因此记做:
t ( n ) = O ( f ( n ) ) t(n)=O(f(n)) t(n)=O(f(n))
因此,问题的规模 n n n 越大,算法执行的时间的增长率与 f ( n ) f(n) f(n) 的增长率正相关,称作渐进时间复杂度(Asymptotic Time Complexity)。
(1) 空间复杂度
算法的空间复杂度是指算法需要消耗的内存空间。其计算和表示方法与时间复杂度类似,一般都用复杂度的渐近性来表示。同时间复杂度相比,空间复杂度的分析要简单得多。
(2) 正确性
算法的正确性是评价一个算法优劣的最重要的标准。
(3) 可读性
算法的可读性是指一个算法可供人们阅读的容易程度
(4) 鲁棒性
鲁棒性是指一个算法对不合理数据输入的反应能力和处理能力,也称为容错性。
if语句的一般形式如下:
if 表达式: 语句1
else: 语句2
if语句中的“表达式”可以是关系表达式、逻辑表达式,甚至是数值表达式。其中最直观、最容易理解的是关系表达式。所谓关系表达式就是两个数值进行比较的式子。
a,b = 5,2
if a < b:
print('两个数中的最小值为: ', a)
else:
print('两个数中的最小值为: ', b)
两个数中的最小值为: 2
name=input("Please input your name:")
if name=="Johnson":
print("Hello my son.")
elif name=="Judy":
print("Hello my daughter.")
elif name=="Aric":
print("Hello my friend.")
elif name=="John":
print("Hello to myself.")
else:
print("Hello others.")
Please input your name:John
Hello to myself.
a = 1
b = 5
c = a + b if a+b < 8 else 8
print(c)
6
for循环是编程语言中一种循环语句,而循环语句由循环体及循环的判定条件两部分组成,其表达式为:for单次表达式;条件表达式;末尾循环体: 中间循环体。如:
for i in range(5):
print('Hello, world! \n')
Hello, world!
Hello, world!
Hello, world!
Hello, world!
Hello, world!
t = 0
while t < 5:
print('Hello, world! \n')
t = t+1
Hello, world!
Hello, world!
Hello, world!
Hello, world!
Hello, world!
for y in range(1,10):
for x in range(1,y+1):
print('%dX%d=%d'%(x,y,x*y),end=' ')
print(' ')
1X1=1
1X2=2 2X2=4
1X3=3 2X3=6 3X3=9
1X4=4 2X4=8 3X4=12 4X4=16
1X5=5 2X5=10 3X5=15 4X5=20 5X5=25
1X6=6 2X6=12 3X6=18 4X6=24 5X6=30 6X6=36
1X7=7 2X7=14 3X7=21 4X7=28 5X7=35 6X7=42 7X7=49
1X8=8 2X8=16 3X8=24 4X8=32 5X8=40 6X8=48 7X8=56 8X8=64
1X9=9 2X9=18 3X9=27 4X9=36 5X9=45 6X9=54 7X9=63 8X9=72 9X9=81
函数是组织好的,可重复使用的,用来实现单一或相关联功能的代码段。
函数能提高应用的模块性,和代码的重复利用率。你已经知道Python提供了许多内建函数,比如print()。但你也可以自己创建函数,这被叫做用户自定义函数。
可以定义一个由自己想要功能的函数,以下是简单的规则:
python 定义的基本语法为:
# "函数_文档字符串"
def functionname( parameters ):
function_suite
return [expression]
调用函数格式
if __name__ == "__main__":
paras
functionname( paras )
默认情况下,参数值和参数名称是按函数声明中定义的顺序匹配起来的。
例子
# 求前两个数相乘与第三个数的和
def mulsum(a,b,c):
d = a*b + c
return d
if __name__ == "__main__":
m = [1,3,5,7]
n = [2,4,5,6]
t = [2,5,6,8]
for i in range(len(m)):
s = mulsum(m[i],n[i],t[i])
print('Solution is: ', s)
Solution is: 4
Solution is: 17
Solution is: 31
Solution is: 50
import time
def Add_N(n):
total = 0
for a in range(1,n+1):
total = total + a
return total
if __name__ == "__main__":
N = 10000000
t1 = time.process_time()
print("1 到 %d 自然数累加结果为 %d" %(N, Add_N(N)))
t2 = time.process_time()
print("循环累加算法用时: %.8f"%(t2-t1))
t3 = time.process_time()
sol = N*(N+1)/2
print("累加公式结果为: %d"%sol)
t4 = time.process_time()
print("累加公式用时: %.8f"%(t4-t3))
1 到 10000000 自然数累加结果为 50000005000000
循环累加算法用时: 0.52862200
累加公式结果为: 50000005000000
累加公式用时: 0.00000900
时间复杂度和空间复杂度能给帮助我们衡量一个算法的优劣,在不同环境中我们对时间效率和空间效率要求不同,因此有了时间复杂度和空间复杂度能够指引程序员设计符合程序环境的代码。
时间复杂度的计算并不要求我们计算准确的算法运行的时间,由于运行时间和执行次数成正比,我们用算法的执行次数当做时间复杂度计算。
def FUN1(N):
count = 0
for i in range(2*N):
count = count + 1
M = 10
while True:
count = count + 1
M = M-1
if M <= 0:
break
return count
if __name__ == "__main__":
print(FUN1(100))
实例1基本操作执行了2N+10次,通过推导大O阶方法知道,时间复杂度为 O(N)
def FUN2(N,M):
count = 0
for i in range(N):
for j in range(M):
count = count + 1
return count
if __name__ == "__main__":
print(FUN1(50,70))
实例2基本操作执行了MN次,有两个未知数M和N,时间复杂度为 O(NM)
类函数是非常有用的工具, 可以把诸多函数封装起来, 只保留参数和数据两个结构, 这也是 python 机器学习中常用的调用格式. 而初学者对类的学习通常都感觉不容易, 通过编程书上利用动物类,猫啊狗啊的例子,或者人作为类,张三李四具体化, 越讲越糊涂.
其实对类的理解在不断运行代码的过程中很容易理解, 就是避免反复编译函数而生的, 而且无需每次都要考虑一系列函数的逻辑关系. 对于一个算法、一篇论文、一个大的项目, 类无疑是最方便的, 而且 python 语言的类定义更加的简单, 易读.
下面通过一个例子可以了解一下类的写法和功能
本案例是给定一个由数组组成的列表, 先转化成向量, 然后把向量前 k k k 个元素相加求和, 并显示结果的过程. 本例中数据和参数 k k k 可随意更改, 类只需要提前编译一次即可,可反复利用. 使用方法和sklearn库类似, 两句话:(1) 生成空模型; (2) 利用 fit(x) 喂数据.
import numpy as np
# 类的优势是把所有函数封装起来,只保留数据和参数接口, 当数据和参数变化时,无需重新运行类函数
class VECTOR_SUM:
# 初始化模型参数
def __init__(self, num=4):
self.num = num
# 定义类函数,可以通过 self 为其它函数调用
def string2array(self,s):
v = np.array(s)
return v
# 类的主要函数, 是数据的接口
def fit(self,s):
temp = self.string2array(s) # 调用类内函数时需要用到 self
summation = 0
for i in range(self.num):
summation = summation + temp[i]
return summation
if __name__ == "__main__":
x = [1,2,3,4,5,6,7,8] # 生成数据,可反复修改而无需重新编译类函数
model = VECTOR_SUM(num=5) # 调用空模型,可设置参数
summation = model.fit(x) # 类和数据的接口
print("summation is : ", summation)
输出
summation is : 15