20190716——numpy的优势

numpy介绍
numerical (数值化的)+ python

numpy是一个开源的python科学计算库,用于快速处理任意维度的数组

n d array

n-任意
d-dimension 维度
array-数组

先将数据存储与ndarray一种数据类型

numpy使用ndarray对象来处理多维数组,该对象是一个快速而灵活的大数据容器

jupyter notebook

使用python的列表也可以存储一组数据,通过列表的嵌套也可以实现多维数组,那么为什么还需要numpy其中的ndarray

生成数组要引用random

机器学习最大的特点就是大量的数据运算

为什么ndarray为什么这么快
1)存储风格
2)并行化运算
3)底层语言

ndarray - 相同类型 - 通用性不强
list - 不同类型 - 通用性很强

ndarray支持并行化运算

用C语言写的底层

ndarray的属性、形状、类型

shape ndim size
dtype
20190716——numpy的优势_第1张图片

在这里插入图片描述
元组,8行5列

20190716——numpy的优势_第2张图片
几个纬度

在这里插入图片描述
多少个

在创建ndarray的时候
整数是int64

ndarray
np.array()来进行操作

生成数组的方法
生成0和1
从现有数组中生成
生成固定范围的数组
生成随机数

20190716——numpy的优势_第3张图片
20190716——numpy的优势_第4张图片

从现有数组中生成
np.array 与 np.copy 深拷贝
np.asrray 全拷贝

20190716——numpy的优势_第5张图片
np.linpace(0,10 ,100)
左闭右闭 生成等距离100个元素
其中100是多少个数

np.arange(a,b,c)
左开右闭
这里面的C是步长,而不是总数量

生成随机数组

分布状况
均匀分布:是概率统计中的重要分布之一,顾名思义,均匀,表示可能性相等的含义。均匀分布在自然情况下极为罕见,而人工栽培的有一定株行距的植物群落就是均匀分布

20190716——numpy的优势_第6张图片
均匀分布
落在每组的可能性相等

正态分布
20190716——numpy的优势_第7张图片
20190716——numpy的优势_第8张图片
sigma决定了分布的幅度

20190716——numpy的优势_第9张图片
20190716——numpy的优势_第10张图片

你可能感兴趣的:(数据挖掘)