Python数据分析与应用(一)

文章目录

    • 一、Python数据分析概述
    • 二、Numpy数值计算基础
        • (一) numpy的数组对象ndarray
          • 1、数组对象
          • (1)创建数组
          • (2)查看数组属性
          • (3)专门创建数组的函数
          • (4)数组的数据类型
          • 2、生成随机数

一、Python数据分析概述

 数据分析是指用适当的分析方法对收集来的大量数据进行分析,提取有用信息和形成结论,对数据加以详细研究和总结概括的过程. 广义的数据分析包括狭义数据分析和数据挖掘。
 
 狭义的数据分析是指根据数据分析目的,采用对比分析、分组分析、交叉分析和回归分析等分析方法,对收集的数据进行处理与分析,提取有信息,得到特征统计计量结果的过程。
 
 数据挖掘是从大量的、不完全的、有噪声的实际应用数据中,通过应用聚类模型、分类模型、回归和关联规则等技术,挖掘潜在价值的过程。

二、Numpy数值计算基础

(一) numpy的数组对象ndarray

Python的array模块不支持多维,numpy提供的存储单一数据类型的多维数组——ndarray可以弥补其不足。
1、数组对象
(1)创建数组

一维:

import numpy as np  #导入numpy库
arr1 = np.array([1,2,3,4])
print('创建的数组为:\n',arr1)

二维:

#前面已经导入过库,此后不再导入
arr2 = np.array([[1,2,3,4],[4,5,6,7],[7,8,9,10])
print('创建的数组为:\n',arr2)
(2)查看数组属性
print('数组维度为:',arr2.shape)   #查看数据结构
print('数组类型为:',arr2.dtype)  #查看数组类型
print('数组元素个数为:',arr2.size) #查看数组元素的个数
print('数组每个元素大小为:',arr2.itemsize) #查看数组每个元素大小
(3)专门创建数组的函数

arange:

#arange是专门用来创建数组的函数
#通过指定开始值、终值和步长,创建的数组不含终值
print('使用arange函数创建的数组为:\n',np.arange(0,1,0.1))
#即从0-1,间隔为0.1

linspace:

#linspace指定开始值、终值和元素个数创建数组 包括终值
print('使用logspace函数创建的数列为:',np.logspace(0,2,10))

zero:

#zero用来创建全为0的数组
print('使用zeros函数创建的数组为:\n',np.zeros((2,3)))

eye:

#eye用来创建主对角线上元素为1的数组,类似于单位矩阵
print('使用eye创建的数组为:\n',np.eye(3))

ones:

print('使用ones函数创建元素全为1的数组为:\n',np.ones((5,3)))
(4)数组的数据类型
类型 描述
bool 布尔类型(True 或者False)
inti 由所在平台决定精度的整数(一般为int32或者int64)
int32 整数
int64 整数
float32 单精度浮点数(32位)
float64 双精度浮点数(64位)

类型转换举例;

#整型转换成浮点型:
print(np.float64(42))
#整型转换成布尔型:
print(np.bool(42))
2、生成随机数

与随机数相关的函数都在random模块中,其中包括了可以生成服从多种概率分布随机数的函数。

# random函数是最常见的生成随机数的方法
print('生成的随机数组为:',np.random.random(100))
# rand函数可以生成服从均匀分布的随机数
print('生成的随机数组为: \n',np.random.rand(10,5))
# randn函数可以生成服从正态分布的随机数
print('生成的随机数组为: \n',np.random.randn(10,5))
# randint函数可以生成给定上下限范围的随机数
#其中 low为最小值,high为最大值,size为数组的shape
print('生成的随机数组为: ',numpy.random.randint(low, high=None, size=None, dtype='1'))

你可能感兴趣的:(数据分析,数据分析,python,数据挖掘)