数据分析是指用适当的分析方法对收集来的大量数据进行分析,提取有用信息和形成结论,对数据加以详细研究和总结概括的过程. 广义的数据分析包括狭义数据分析和数据挖掘。
狭义的数据分析是指根据数据分析目的,采用对比分析、分组分析、交叉分析和回归分析等分析方法,对收集的数据进行处理与分析,提取有信息,得到特征统计计量结果的过程。
数据挖掘是从大量的、不完全的、有噪声的实际应用数据中,通过应用聚类模型、分类模型、回归和关联规则等技术,挖掘潜在价值的过程。
Python的array模块不支持多维,numpy提供的存储单一数据类型的多维数组——ndarray可以弥补其不足。
一维:
import numpy as np #导入numpy库
arr1 = np.array([1,2,3,4])
print('创建的数组为:\n',arr1)
二维:
#前面已经导入过库,此后不再导入
arr2 = np.array([[1,2,3,4],[4,5,6,7],[7,8,9,10])
print('创建的数组为:\n',arr2)
print('数组维度为:',arr2.shape) #查看数据结构
print('数组类型为:',arr2.dtype) #查看数组类型
print('数组元素个数为:',arr2.size) #查看数组元素的个数
print('数组每个元素大小为:',arr2.itemsize) #查看数组每个元素大小
arange:
#arange是专门用来创建数组的函数
#通过指定开始值、终值和步长,创建的数组不含终值
print('使用arange函数创建的数组为:\n',np.arange(0,1,0.1))
#即从0-1,间隔为0.1
linspace:
#linspace指定开始值、终值和元素个数创建数组 包括终值
print('使用logspace函数创建的数列为:',np.logspace(0,2,10))
zero:
#zero用来创建全为0的数组
print('使用zeros函数创建的数组为:\n',np.zeros((2,3)))
eye:
#eye用来创建主对角线上元素为1的数组,类似于单位矩阵
print('使用eye创建的数组为:\n',np.eye(3))
ones:
print('使用ones函数创建元素全为1的数组为:\n',np.ones((5,3)))
类型 | 描述 |
---|---|
bool | 布尔类型(True 或者False) |
inti | 由所在平台决定精度的整数(一般为int32或者int64) |
int32 | 整数 |
int64 | 整数 |
float32 | 单精度浮点数(32位) |
float64 | 双精度浮点数(64位) |
类型转换举例;
#整型转换成浮点型:
print(np.float64(42))
#整型转换成布尔型:
print(np.bool(42))
与随机数相关的函数都在random模块中,其中包括了可以生成服从多种概率分布随机数的函数。
# random函数是最常见的生成随机数的方法
print('生成的随机数组为:',np.random.random(100))
# rand函数可以生成服从均匀分布的随机数
print('生成的随机数组为: \n',np.random.rand(10,5))
# randn函数可以生成服从正态分布的随机数
print('生成的随机数组为: \n',np.random.randn(10,5))
# randint函数可以生成给定上下限范围的随机数
#其中 low为最小值,high为最大值,size为数组的shape
print('生成的随机数组为: ',numpy.random.randint(low, high=None, size=None, dtype='1'))