物联网技术部培训——python基本语法

python 基础语法,numpy入门及KNN算法的代码实现

  • python - 冉冉升起的高级语言
  • python入门篇:基本语法
      • 第一个程序:helloworld!
      • python语法 - 基本数据类型
          • 1.1 变量的定义
          • 1.2 连续赋值
          • 1.3 python的基本输入和输出
            • 1.3.1 输入输出语句格式拓展
      • python语法 - 分支语句,循环语句
          • 2.1 分支语句
          • 2.2 循环语句
      • python语法 - 组合数据类型
          • 3.1 集合
          • 3.2 列表
          • 3.3 元组
          • 3.4 字典
      • python语法 - 字符串
          • 4.1 字符串的定义
          • 4.2 字符串的各种操作
      • python语法 - 函数
      • python语法 - 常用库
          • 5.1 库的调用
          • 5.2 常用库:time库
          • 5.3 常用库:jieba库
  • numpy简介
    • numpy 安装
  • 为什么使用numpy中的array
    • python list 的特点
    • array类型
    • numpy.array
  • numpy.array的创建方法
    • 整体创建
    • arange
    • linspace
    • random
  • numpy.array 的基本操作
    • 查看基本属性
    • 数据访问
    • reshape
    • 合并操作
    • 分割操作
  • 运算操作
    • Universal Functions
    • 矩阵运算
    • 向量和矩阵的运算

 
 
 

python - 冉冉升起的高级语言

终于来到激动人心的时刻辣!我们要开始进行对python的学习!
 
python应该是很多小会员的第二门程序设计语言。在开始今天的讲学之前,我们先来解决小会员们心中可能存在的疑惑:python是什么?为什么要学python?python和C/C++有什么区别?
 
对于python,大家应该并不陌生。很多人应该都在大大小小的各种三流网站上看到过“7天学会python“的扯淡广告,虽然这种捷径是不存在的,但至少说明了python的易学性和火热性。(据说,python的发明者因为不喜欢有大括号的编程,就”随手“编出了python)
 
python是当下非常常用且热门的编程语言之一,这张图是HelloGitHub最新的数据,我们可以看到python的使用率正在不断地飙升,已经逐渐超过了老牌强势语言C++,现在排列第三,前两位是Java和C
物联网技术部培训——python基本语法_第1张图片
python语言在数据处理领域确实非常优秀,加上本身语言的简单性,使得python非常适合进行海量数据处理和进行人工智能方面的研究。
 
在详细介绍这门语言之前,我们还要明确一点:python是一门十分高级的语言。何为高级语言?事实上,我们现阶段学习的所有语言都是属于高级语言的范畴,但相较于C等,python还要更加高级一点。高级就体现在,程序员利用python去编程和实现程序十分的轻便和简单;同样,简单也给python带来了一个弊病:那就是其运行速度非常慢。具体有多慢呢?C语言1秒就能实现的程序,Java要2秒,而python需要整整十秒。换言之,人看得懂的东西,机器就不容易看懂。
而且,python的简单性仅仅体现在语法实现的简单性,高级的python语言并不是简单的!
 
那么,相较于我们已经学会的程序设计语言,python和他有什么区别呢?或者说,我们既然已经能够利用计算机编程了,为什么还要再去学习另外的 程序语言呢?
 
首先,python与C,C++等等其他所有语言之间并没有特别本质上的区别,都是通过程序设计,使得计算机在代码的控制下执行一定的指令。绝大多数C,C++能做的(这里的例外就比如操作系统只能用C来写,Android只能用Java来写等等),python一样可以做,而且可能会更加简便的实现。
 
当下python的使用非常的广泛,的确可以说是学了就不用担心没有地方用。很多著名网站比如YouTube就是用python写的,很多游戏后台也可以用python来写。
 
说了这么多,总之是希望能给大家一个python的轮廓,让大家觉得学习这门语言有点意思!这门语言之后还会陪伴很多学习机器学习的同学走很远,这一节课我们首先给大家简单讲解python语法基础。

 
 
 

python入门篇:基本语法

第一个程序:helloworld!

helloworld几乎是我们学习所有语言开始的第一个程序。python如何去实现输出helloworld呢?
 
首先我们打开IDLE。IDLE的主界面是一个简便的变量查看器,适用于我们简单的尝试几个函数,以及测试写好的程序的内容,我们一般不用它来编程。点击左上角的“file”,再点“new file”,我们就建立了一个python文件。按下CTRL+s,保存到指定的路径:没错,简单的语言就连编译器都如此简单(当然不是,我们之后会用到更高级的编译器…)
 
!!要注意,IDLE不是很聪明,写的时候一定要注意中英文输入法的切换,不然一不小心就调出帮助文档了…!!
!!关于字体的修改:点击“Options”,“Configure Idle”就可以调整了!我用的是comic Sans MS!!

 

下面就是见证奇迹的时刻!我们输入

print("helloworld")

不用printf!不用%s!不用分号!不用头文件!不用return 0 !不用大括号!就是这么任性!
输入好之后,我们按下F5,就可以运行。在我们的shell里,已经打印出了我们的内容。
 

python语法 - 基本数据类型

 
既然已经尝试了输出,我们当然还希望操作python的数据。下面我们就开始基本数据类型的学习。

1.1 变量的定义

变量的定义不需要声明,使用的时候直接丢到程序里面就可以。比如那我们刚刚的程序,我们在helloworld的输出下面加一行

a = 4

然后我们对他进行输出( 不需要%d,不需要分号都可以不需要)

print(a)

就可以看到,程序正确的输出了4。
此外,在输出界面,也就是我们的shell里面,我们直接输入a,shell会帮我们打印出a的内容。
 
python语言变量不需要提前声明,也就是说,python语言中变量的类型是没有规定的。上一秒a还是整形,下一秒可以直接用字符串来赋给他,a就变成了一个字符串类型。

print("helloworld")
a = 4
print(a)
a = "helloworld"
print(a)

输出为:
helloworld
4
helloworld

 
但是,这样方便的python同样有要求:那就是使用变量之前必须对该变量进行赋值。没有赋值直接使用是不被允许的。但是没有赋值,却用变量直接承接表达式是被允许的。

a = 4
b = 3
c = a + b
# 没有对c进行初始化的情况下直接进行c = a + b 是允许的
# 井字号是python的单行注释方法

此外,在今后使用一些库或者函数的时候,如果你要是用的变量是该库的特殊变量,则在使用之前也必须进行初始化。比如在tensorflow中,当a,b是张量变量时,不可以直接使用c = a + b

1.2 连续赋值

python可以接受同时多个变量的赋值:

x, y, z = 1, 2, 3
a = b = 123
# 都是python语言允许的定义
1.3 python的基本输入和输出

 
python的输出我们已经见识过了:print即可。
print函数可谓来者不拒,不论要输出整形浮点型双精度字符串列表集合等等等等,只要是变量,统统丢到函数当中即可。python的字符串表达也非常简单,但凡是用引号括起来的内容都是字符串,都可以随意输出。
 
python中,为了方便输入输出的内容带引号,字符串的定义有四种方式:

a = "i love python!"
a = 'really!'
a = '''learning python is good for my hair!''' 
a = """人生苦短,我学python"""

三种定义方式都是允许的。其中,三个连续单引号的定义方式一般用于当作多行注释

'''
   那是因为三个连续引号可以装入回车,
   而其本身是没有任何意义的变量,程序不会做处理
'''

 
python的输入同样非常简单,只需要input即可。不论输入符号,数字,字母,都是允许的。

x = input()

但是要特别注意:这里input的所有内容都是字符串类型。

print(type(x)) # 输出x的类型。结果为:

如果我们想进行“输入x,计算x的平方”的程序应该怎么做呢?

这里提供两种方法:

# 1.对x进行强制转换 : 
x = input()
x = int(x) * int(x)
print(x)
# 2.对输入的内容进行去引号处理
x = input()
x = eval(x) * eval(x)
print(x)
# 其中,去引号函数在把引号去掉赋给变量之前,还会自动的根据括号的内容对变量的类型进行分配
print(type(eval(x)))
# 如果输入 5,则会输出 int;如果输入 5.5, 则会输出  float;如果输入[1, 2, 3],就会输出 list,等等
# 然而eval并不能拆字符串

两种方法都可以使用,但是我们平时使用eval函数更多一点

1.3.1 输入输出语句格式拓展
  1. python允许在input括号内通过加字符串的格式来对输入内容进行描述
x = input("please input a integer:")
print(x)
  1. python的print输出函数自动计入回车。取消回车的方式是:
print("I don't want an enter",end='')
# 实际上,end=做的事情是将等号后面的字符串加到每一次输出的末尾,默认为回车。
  1. 此下,给出了其他可用的输出格式,大家课后自己学习
print("{} is a sb,{} is niubi".format("mcx","zyc"))  # 这样输出时,大括号的顺序和format顺序一一对应
print("{1} is a sb,{0} is niubi".format("zyc","mcx"))  # 这样输出时,大括号顺序按照填写内容进行对应

#1.填充对齐宽度
print("{0:~^20}".format(bstring))
#print("{0:           =        ^      20}".format("bstring"))      ^居中,>右对齐,<左对齐
   #      |           |         |      |       |      |
   #     引导符     填充物      居中   宽度    格式化  目标字符串
print("{0:*>20}".format("bit"))
print("{:20}".format("aa"))  # 将aa放于左边,自动补齐剩余空格
# 2.逗号(千分符,用于财务记账)   点精度(浮点数小数精度或字符串最大输出长度,{:.2f})
#   类型
print("{:,.2f}".format(12345.6789))    # 1 .整数部分放置千分符分割;2.精度补为两位

print("{0:b},{0:c},{0:d},{0:o},{0:x},{0:X}".format(425))  # 用二进制,Unicode编码,十进制,八进制,大小写十六进制表示括号内的数值

print("{0:e},{0:E},{0:f},{0:%}".format(3.14))  # 用小写大写的科学记数法表示,用通常的浮点数表示,用百分数表示

 

python语法 - 分支语句,循环语句

 

2.1 分支语句

在进行python程序的编写时,应该格外注意格式的书写。因为python是没有大括号的语言,所以能够判断python语段范围的只有缩进。python的分支表达式为:

if <语句段>:
	# 必须缩进,否则会报错。而且只能缩进一次
	<语句段>

我们来小小的实践一下:

a = eval(input())
if a % 2 == 0 :
	print('ok!')
elif a % 2 == 1:
	print('no!')
# 或者也可以直接else:

 

2.2 循环语句

与分支语句相同,循环语句中的缩进同样非常重要。python的循环表达式为:

for <循环判断>:
	# 必须缩进,否则会报错。而且只能缩进一次
	<语句段>

其中,循环判断的格式为:

	i in <范围>

这个范围可以是一个列表:

list = [1, 2, 3]
for i in list:
	print(i)
	# 则i会遍历整个列表

也可以是一个整数:

for i in range(45):
	print(i,end='  ')
	# 则i会分别被赋值为0, 1, ..., 44

总之,只要是能够进行循环遍历操作的,都用 i in … 来修饰即可
 
 

python语法 - 组合数据类型

 
python的组合数据类型大家完全可以类比C语言中的各种数组。python中,没有严格的数组概念,而是用其他组合数据类型代替。

3.1 集合

python的集合概念与数学概念上的集合非常相像,就是一群有相同意义的数据的集合,在python中常用于数据去重。python的语法表达中,集合的表达形式为:

b = 2
a = {1, 'python', b}
# 集合来者不拒,大多数数据类型都可以直接包含到集合当中

同数学的集合相似,集合中不能有相同的元素.如果出现相同的元素,集合会直接将相同的其他项删除,只保留一项。而且,当集合中包含变量时,集合会直接判断变量的内容是否与集合内容重复。
 
另外,集合在用户进行输入之后会直接自动的对其中所有元素进行排序,但是排序的方法,在不同的操作系统,甚至不同的时刻都有可能不是完全相同。集合的顺序本身就是开发者为了方便查找遍历和使用的,我们程序员不要利用这个顺序。但是基本保持:相同数据类型会被排布在一起,相同数据类型之间会根据大小(或者字符串长短也有可能)来从小到大排序
 
以下给出集合的操作,同学们课后掌握

#-------------------------集合操作符-------------------------#
c = {1,2,3,4,5} ; d = {4,5,6,7,8}
#1.求并集: |
print('1.1 ',c|d)
#2.求集合的差(取前不取后): -
print('1.2 ',c-d)   #输出包含在c中但不在d中的元素
#3.求交集: &
print('1.3 ',c&d)
#4.求两集合中不同的元素: ^
print('1.4 ',c^d)
#5.比较两个元素的包含关系
print('1.5 ',c>=d)
e = {1,2,3}
print('1.6 ',c>=e)


#-------------------------增强操作符-------------------------#
c |= d  #更新集合c,包括c,d中的所有元素
print('2.1 ',c)
c -= d  #同上,讲c,d运算过后的结果赋值给c
print('2.2 ',c)


#------------------------集合处理方法------------------------#
c = {1,2,3,4,5}
#1.如果x不在集合中,将x增加到c
c.add(6)
print('3.1 ',c)

c = {1,2,3,4,5}
#2.如果x在集合中,移除x;如果x不在集合中,不报错
c.discard(5)
print('3.2 ',c)

c = {1,2,3,4,5}
#3.如果x在集合中,移除x;如果x不在集合中,报错
c.remove(5)
print('3.3 ',c)

c = {1,2,3,4,5}
#4.移除所有元素
c.clear()
print('3.4 ',c)

c = {1,2,3,4,5}
#5.为用户随即返回一个集合中的元素并且在几何中删除这个元素。如果集合为空则报错
f = c.pop()
print('3.5 ',f,c)

c = {1,2,3,4,5}
#6.返回一个集合的副本
d = c.copy()
print('3.6 ',d)

c = {1,2,3,4,5}
#7.返回集合元素个数
f = len(c)
print('3.7 ',f)

c = {1,2,3,4,5}
#8.判断x是否在集合中
a = 5 in c
print('3.8 ',a)

c = {1,2,3,4,5}
#9.判断x是否不在集合中
a = 5 not in c
print('3.9 ',a)

c = (1,2,3,4,5,5,5)
#10.将其他类型转化为集合类型
c = set(c)
print('3.10 ',c)
3.2 列表

列表的概念非常接近于我们C/C++中的数组。它的内容可以重复,有固定的顺序。列表定义只需要中括号即可,用逗号分隔

a = [1, 2, 'hello!']
# 或者可以用下面的方法快速定义
b = [i for i in range(10)]

对于列表a,我们有可以对其进行遍历,也可以访问列表的下标

for i in a:
	print(i)
for i in range(len(a)):
	print(a[i])

这里给出list的操作。希望大家不要尝试全部背诵,可以把这篇博客当作百科书,随用随查

len(a)  # 返回列表元素个数

a.append('dove')  # append用于单个元素的加入

a.extend(['i','love','dove']) # extend用于整个列表的加入

max(a)  min(a)  # max(a),min(a)返回列表的最大值最小值。在使用时,需要元素可以比较

a.insert(0,'hello')  # insert的两个参数:要插入的顺序,要插入的内容

a.index(123)  # 从第一个元素遍历,输出第一次出现123这个元素的位置
a.index(123,1,3)  # 从第一个到第三个元素中,第一次出现123这个元素的位置
a.count(123)  # 序列中出现123的次数

sort(a)  # 排序
reverse(a) # 逆序输出

a.clear()  # 清空列表

del a[2]  # 指定删除a下标为2的元素
3.3 元组

元组就是不能够修改的list,一般很少使用,下面给出方法

#将一些值用逗号分隔
a=1,2,3
print(a)

#常用做法
a=(1,2,3)

#调用函数tuple:它将一个序列作为参数,并将其转换为元组
a=tuple([1,2,3])
b=tuple("abc")
print(a,b,sep='\n')

#特殊情况:表示只包含一个值的元组
a=42,
b=(42,)
print(a,b,sep='\n')
3.4 字典

字典类型是很特殊的一种类型。它的元素是一对数据,也可以叫一组关系
每一个元素表示为 <键>:<值>
元素之间用逗号隔开。可以认为,列表是用数字作索引标准,字典用我们自己定义的元素作索引。
字典类型就可以类比我们现实中的字典,我们在知道键的情况下,可以通过目录的索引找到值;python语法中同样可以这样理解

zidian = {'outside':'green','inside':'blue'}
print(zidian['outside'])

同样,在C/C++中对数组的操作,在python中对list的操作同样可以类比,只不过在表达上有些许区别而已。以下给出字典的操作

#字典类型操作函数和方法
dic = {1:'mcx',2:'zyc',3:'ch',4:'ylx',5:'ljw'}
print('0.最初定义的字典变量',dic)
del  dic[1]
print('1.删除第一项',dic)

print('2.判断键“1”是否在字典中(已在上一步删除)',1 in dic)

dic = {1:'mcx',2:'zyc',3:'ch',4:'ylx',5:'ljw'}
print('3.返回所有键的信息',dic.keys())
print('4.返回所有值的信息',dic.values())
print('5.返回所有键值对的信息',dic.items())
dic = dict(((1,'mcx'),(2,'zyc'),(3,'ch'),(4,'ylx'),(5,'ljw'),(6,'wb'),(7,'dsp')))
print('5+.利用dict创建一个字典',dic)

print('6.若存在该键,则返回对应的值,否则返回',dic.get(6,'wb'))
print('7.若存在该键,则去除并返回对应的值,否则返回',dic.pop(6,'wb'))
print('8.随机取出一个键值对并以元组形式返回',dic.popitem())
print('9.删除所有键值对',dic.clear())

dic = {1:'mcx',2:'zyc',3:'ch',4:'ylx',5:'ljw'}
print('10.返回字典元素个数',len(dic))

字典类型在进行对应数据处理时非常重要,但对于前期学习的同学们,能够熟练掌握list就已经足够,因为list就是C/C++数组的超级加强版

 
 
 

python语法 - 字符串

考虑到字符串的重要地位,以及python中字符串的特殊形式,我们字符串单独拿出来讲。

4.1 字符串的定义

字符串的定义我们在最上面就已经解释过,直接利用单引号/双引号/三连单引号,双引号括起来,就已经做好了一个字符串。python的字符串非常“宽松”,即,基于python的保护机制,在使用字符串时完全不用考虑越界,超范围等等C语言中很麻烦的问题

a = 'I love esta'
b = ' I love'
print(a + b) # 如果想进行字符串连接的操作,直接 + 就可以
4.2 字符串的各种操作

在C语言中,字符串其实是利用数组去模拟的一种便捷数组表达。而python中,字符串更像一个变量。因此对字符串的操作十分自由。

a = 'I love esta'
b = 'I love'
print(a + b) # 上文已经讲过,加法代表两个字符串连接
c = '人类的本质是复读机'
print(c*5) # 直接乘法代表字符串重复多少次
d = '人类'
print(d in c) # 利用in判断d是否是后者的子串

a.upper()  # 将字符串的所有字母改为大写
a.lower()  # 将字符串的所有字母改为小写 
a.split(' ') # 将字符串根据括号内的内容分隔开,返回保存在列表中
a.count('e')
a.replace('esta','Esta')

除了字符串整体的操作,python还支持字符串的切片。

a = 'I love esta'
print(a[0])  # 返回第一个字符
print(a[-1]) # 返回最后一个字符
print(a[3:6])# 获取字符串切片,左闭右开
print(a[1:9:2])  #指从第一位开始,到第九位之前,每隔两个取一个
print(a[::-1])  #字符串的逆序

print(fstring.center(20,"="))  #将目标字符串放在宽度为20的居中位,其余用=填充
print("= python= ".strip(" =np"))  #删掉字符串两侧的“ ”,“=”,“n”,“p”,直到左右不出现这四个字符为止
print("|".join(estring))  #将目标字符串夹在join括号内字符串的出最后一位的字符后边

 
 

python语法 - 函数

python的函数定义同样十分简单。python定义函数时,不需要考虑参量的类型,返回值类型等等问题。直接使用def就可以定义函数;同样,函数必须缩进。

def hello():     #参数括号中可以写入你的参数
    print('hello!')
        
def hello2(a):   #这里我们想要调入一个列表,但我们不用事先说明他是个列表
    print(a)
    
hello2([1,2,3]) # 当然也是没有任何问题的
hello2("hi,I'm a string!") #字符串也没有问题
# 虽然python很好用,但是要注意,你传入的内容应该符合函数的操作!

此外,python还接受这样的操作:

def hello(name,greeting='Hello',punctuation='!'):
    print('{},{}{}'.format(greeting,name,punctuation))
hello('python','Hi','^_^')
hello('python',punctuation='^_^')
hello('python',greeting='Glad to see you')


#星号收集余下的位置参数并存放在一个元组中
def print_params1(title,*params):
    print(title,end=' ')
    print(params)
print_params1('Params:',1,2,3)   

#收集关键字参数需要**,得到的为一个字典
def print_params2(**params):
    print(params)
print_params2(x=1,y=2,z=3)


#1、拆分序列*
def add(x,y):
    return x+y
params=1,2
print(add(*params))

def mutiply(x,y,z):
    return x+y*z
params1=[2,3]
print(mutiply(1,*params1))   #星号部分必须位于参数列表末尾

#2、拆分字典**
def hello(greeting="Hello",name='World'):
    print(greeting+',',name)
dic={'name':'MMS','greeting':'Glad to see you'}
hello(**dic)

 
 

python语法 - 常用库

如同C/C++允许加入include,python同样可以使用库。不如说,python的灵魂就是这些各种各样的库,他们极大的丰富了python的功能。后人不用再造轮子,可以方便的实现很多功能。
这节课不会详细讲解每一个库的作用,大家只需要用的时候来找一找即可。

5.1 库的调用
#导入一个模块
import somemodule(模块)
somemodule.somefunction()   #调用该模块的某个函数

#从模块中导入(一些)函数
from somemodule import somefunction[,anotherfunction,...]
somefunction()    

 #给模块指定别名
import somemodule as m
m.somefunction()

#导入模块中的一切函数
from somemodule import *
somefunction()

#导入一个函数并指定别名
from somemodule import somefuntion as f
f()

一般,我们用前三种表达方式更多一些
 

5.2 常用库:time库

要使用time库,我们首先应该将time库导入到我们的程序中

import time

关于time库,我们首先给出常用方法

#1.0获得当前时间戳,是从1970年某一个时刻到今天的秒数
print(time.time())
#1.1易于阅读的时间:(被保存为字符串形式)
print(time.ctime())
#1.2易于计算机阅读的时间(保存为struct结构)
print(time.gmtime())

# 此外,python还提供了时间的标准化输出。
t = time.gmtime()
strtime = time.strftime("%Y-%m-%d %H:%M:%S",t)

# time库通过time.perf_counter来获得当前时间戳,保存为浮点型
start = time.perf_counter()
# 用这个函数,我们可以计算程序执行的过程中的时间
time.sleep(2)
end = time.perf_counter()
print(end - start)

下面,我们利用已经学过的time库来看看python运行速度和C的区别
物联网技术部培训——python基本语法_第2张图片

5.3 常用库:jieba库

jieba库是python中非常强的中文分词库。但jieba并不是python自带的库,我们要通过下载才能使用。
首先按下win+R,在对话框中输入cmd。
然后将这一段拷贝到命令行中,回车安装(确保联网)
pip install jieba -i https://pypi.douban.com/simple/

以下给出jieba库的用法:

#jieba库的使用
import jieba
s = '弛弛学长喜欢python'
t = "弛弛学长先吃苹果然后喝可乐"
print(jieba.lcut(s))    #精确模式:返回一个列表的分词结果
print(jieba.lcut(t,cut_all=True))    #全模式:返回所有有关联的分词结果
print(jieba.lcut_for_search(s))    #搜索模式:更为智能的分词结果
jieba.add_word('弛弛学长')  #向搜索模式中添加新词
print(jieba.lcut(s))    #精确模式:返回一个列表的分词结果

 
 
课后作业:

我们将给出一段台本,请根据jieba库进行分词,统计文本的词的频率,并将出现次数最多的10个词打印出来。

numpy

  • python - 冉冉升起的高级语言
  • python入门篇:基本语法
      • 第一个程序:helloworld!
      • python语法 - 基本数据类型
          • 1.1 变量的定义
          • 1.2 连续赋值
          • 1.3 python的基本输入和输出
            • 1.3.1 输入输出语句格式拓展
      • python语法 - 分支语句,循环语句
          • 2.1 分支语句
          • 2.2 循环语句
      • python语法 - 组合数据类型
          • 3.1 集合
          • 3.2 列表
          • 3.3 元组
          • 3.4 字典
      • python语法 - 字符串
          • 4.1 字符串的定义
          • 4.2 字符串的各种操作
      • python语法 - 函数
      • python语法 - 常用库
          • 5.1 库的调用
          • 5.2 常用库:time库
          • 5.3 常用库:jieba库
  • numpy简介
    • numpy 安装
  • 为什么使用numpy中的array
    • python list 的特点
    • array类型
    • numpy.array
  • numpy.array的创建方法
    • 整体创建
    • arange
    • linspace
    • random
  • numpy.array 的基本操作
    • 查看基本属性
    • 数据访问
    • reshape
    • 合并操作
    • 分割操作
  • 运算操作
    • Universal Functions
    • 矩阵运算
    • 向量和矩阵的运算

numpy简介

NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。
 
NumPy 是一个运行速度非常快的数学库,主要用于数组计算,包含:
1、一个强大的N维数组对象 ndarray
2、广播功能函数
3、线性代数、傅里叶变换、随机数生成等功能

numpy 安装

使用pip安装:
在cmd中输入

pip install numpy

安装验证:打开idle,输入以下代码,运行不报错即说明安装完成。可以通过第二行代码查看numpy版本,版本号达到1.12以上就不存在兼容性的问题

import numpy
numpy.__version__

由于之后我们会经常使用numpy,为了使用方便,通常在导入numpy库的时候,给numpy一个别名np,之后即可直接使用np代表numpy这个库

import numpy as np
np.__version__

为什么使用numpy中的array

python list 的特点

L = [i for i in range(10)]
L

结果:[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

L[5] #访问其中元素
L[5] = 100 #为元素赋值
L[5] = "machine learning"
L

结果:[0, 1, 2, 3, 4, ‘Machine Learning’, 6, 7, 8, 9]
在list类型中,每个数据的类型可以不一样,既有好处,增强了程序的灵活性,同时也有不可避免的问题,在list类型的底层,有自动检测类型并转换的功能,这也就会耗费大量时间。

array类型

import array
arr = array.array('i', [i for i in range(10)])
arr

结果:array(‘i’, [0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

arr[5] #True
arr[5]=100 #True
arr[5] = 'machine learning'  #False

报错:TypeError: an integer is required (got type str)
刚刚定义的array类型中,声明过类型只能是整型,所以将字符串给其中元素赋值将会报错
array类型没有list那样智能,它不会在底层自动检测数据类型并转换,但是它的效率很高很快。
 
但是在array中,数据只是以单一的类型存放,但是并没有将其视为向量或者矩阵,自身也没有相应的函数用以处理向量和矩阵。
因此,最终出现了numpy.array进行向量和矩阵的处理,在array的基础上,添加了许多处理向量和矩阵的方法。

numpy.array

nparr = np.array([i for i in range(10)])
nparr

结果:array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

nparr[5] #True
nparr[5] = 100 #True
nparr[5] = 'machine learning' #False
nparr.dtype #查看你的数据类型

numpy.array的创建方法

整体创建

np.zeros(10)
np.zeros(10).dtype  #默认float
np.zeros(10, dtype=int) #创建整型
np.zeros((3, 5))  #创建3行5列的全部为0的二维数组(矩阵)
np.zeros(shape=(3, 5), dtype=int) #另一种方式
np.ones(10)
np.ones((3, 5))
np.full((3, 5), 666) 
np.full((3, 5), 666.0) 
np.full(shape=(3, 5), fill_value=666.0)
np.full(fill_value=12, shape=10)

arange

[i for i in range(0, 20, 2)] #创建列表
np.arange(0, 20 ,2) #创建数组
[i for i in range(0, 1, 0.2)] #False
np.arange(0, 1, 0.2)
np.arange(0, 10)
np.arange(10)

linspace

np.linspace(0, 20, 10)
np.linspace(0, 20 ,11)

random

在机器学习算法中,我们常常需要定义一些随机的向量或者矩阵,但是如果每次创建的都是随机的,每次随机的值都不一样,那会造成每次算法的结果都不一样,为我们调试算法带来麻烦
所有计算机中的随机数其实都是伪随机数,其实都是内部的随机数生成算法来完成的,运行这个算法都是会有一个随机种子seed,这个seed也就决定了随机数的值

np.random.randint(0, 10)
np.random.randint(0, 10, 10)
np.random.randint(0, 1, 10)
np.random.randint(4, 8, size=10)
np.random.randint(4, 8, size=(3, 5))
np.random.seed(666)
np.random.random()
np.random.random(10)
np.random.random((3, 5))
np.random.normal()
np.random.normal(10, 100)
np.random.normal(0, 1, (3, 5))

numpy.array 的基本操作

import numpy as np
x = np.arange(10)
X = np.arange(15).reshape(3, 5)

查看基本属性

x.ndim
X.nidm

x.shape
X,shape

x.size
X.size

数据访问

x
x[0]
x[-1]

X
X[0][0]
X[(2, 2)]
X[2, 2]

x[0:5]
x[:5]
x[5:]
x[::2]
x[::-1]

X
X[:2. :3]
X[:2][:3]
X[::-1, ::-1]
X[0]
X[0, :]
X[0, :].ndim
X[:, 0]
X[:, 0].ndim


subX = X[:2, :3]
subX
subX[0, 0] = 100
subX
X
X[0, 0] = 0
subX

subX = X[:2, :3].copy()
subX
subX[0, 0] = 100
X

reshape

x.rehsape(2, 5)
x
A = x.reshape(2, 5)
A
B = x.reshape(1, 10)
B.ndim
B.shape
x.shape
x.reshape(10, -1)
x.reshape(-1, 10)
x.reshape(2, -1)
x.reshape(3, -1)

合并操作

x = np.array([1, 2, 3])
y = np.array([3, 2, 1])
z = np.array([666, 666, 666])
np.concatenate([x, y])
np.concatenate([x, y, z])
A = np.array([[1, 2, 3],
			  [4, 5, 6]])
np.concatenate([A, A])
np.concatenate([A, A], axis=1)
np.concatenate([A, z]) #False
np.concatenate([A, z.reshape(1, -1)])

np.vstack([A, z])

B = np.full((2, 2), 100)
np.hstack([A, B])
np.hstack([A, z]) #False

分割操作

划分特征和标签

x = np.arange(10)
x1, x2, x3 = np.split(x, [3, 7])
x1, x2, x3
x1, x2 = np.split(x, [5])
x1, x2

A = np.arange(16).reshape((4, 4))
A
A1, A2 = np.split(A, [2])
A1, A2

A1, A2 = np.split(A, [2], axis=1)
A1, A2

data = np.arange(16).reshape((4, 4))
data
X, y = np.hsplit(data, [-1])
X, y

运算操作

问题:给定一个向量,让向量中的每一个数乘以2
a = (0, 1, 2)
a*2 = (0, 2, 4)

L1 = [012]
2 * L1
L2 = np.array([0, 1, 2])
2 * L2

Universal Functions

X = np.arange(1, 16).reshape((3,5))
X
X + 1
X - 1
X / 2
X // 2
X * 2
X ** 2
X % 2
1 / X
np.abs(X)
np.sin(X)
np.cos(X)
np.tan(X)
np.power(3, X)
np.log(X)
np.log2(X)

矩阵运算

A = np.arange(4).reshape(2, 2)
A
B = np.full((2, 2), 10)
B
C = np.full((3, 3), 666)

A + B
A - B
A * B
A / B

A.dot(B)
A.T

A + C #False
A.dot(C)#False

向量和矩阵的运算

v = np.array([1, 2])
A
v + A
np.vstack([v] * A.shape[0])
np.vstack([v] * A.shape[0]) + A

np.tile(v, (2, 1))
np.tile(v, (2, 1)) + A

v * A
v.dot(A)
A.dot(v)

你可能感兴趣的:(python)