如何用python进行数据处理?(一)

首先了解使用python进行数据处理常用的两个包:numpy和pandas。

numpy

最重要的特点就是n维数组对象ndarray是一个快速而灵活的大数据集容器,它是一个通用的同构数据多维容器,即所有的元素必须是相同的类型,每个数组有一个shape(表示维度大小的元组),一个dtype(说明数组数据类型的对象)。

1.创建数组常使用的函数有:array,arange
例如:
array函数:
如何用python进行数据处理?(一)_第1张图片
arange函数:
如何用python进行数据处理?(一)_第2张图片
注意:python里面左闭右开的原则

2.数据类型

在这里插入图片描述
numpy的数据类型有int/float/complex/bool/object/string

数据类型转换使用函数:astype
如何用python进行数据处理?(一)_第3张图片
另一种转换方式,在数组里面加逗号,后面输入dtpye=np.float64,如下:
如何用python进行数据处理?(一)_第4张图片
3.切片

一维数组切片,操作注意三点:中括号,左闭右开,冒号
如何用python进行数据处理?(一)_第5张图片
如何用python进行数据处理?(一)_第6张图片
二维数组切片:

注意只有冒号表示选取整个轴
如何用python进行数据处理?(一)_第7张图片
如何用python进行数据处理?(一)_第8张图片
4.矢量化

不用编写程序即可对数据执行批量运算,大小相等的数组之间的任何算数运算(加减乘除幂)都可以将运算应用到元素级

例如:
如何用python进行数据处理?(一)_第9张图片
如何用python进行数据处理?(一)_第10张图片
5.随机数生成

numpy.random对python内置函数random进行了补充,增加了高效生成多种概率分布的样本值的函数:

常用的如:

normal 产生正态分布的样本值

rand 产生均匀分布的样本值

randint 给定上下限范围内随机选取整数

randn 产生标准正态分布的样本值

permutation 返回一个序列的随机排列

seed 确定随机数生成器的种子
如何用python进行数据处理?(一)_第11张图片
帮助:

numpy.random.normal(loc=0,scale=1e-2,size=shape) ,意义如下:

参数loc(float):正态分布的均值,对应着这个分布的中心。loc=0说明这一个以Y轴为对称轴的正态分布,

参数scale(float):正态分布的标准差,对应分布的宽度,scale越大,正态分布的曲线越矮胖,scale越小,曲线越高瘦。

参数size(int 或者整数元组):输出的值赋在shape里,默认为None

6.数组转换和轴对换

reshape、T属性、transpose
如何用python进行数据处理?(一)_第12张图片
如何用python进行数据处理?(一)_第13张图片
如何用python进行数据处理?(一)_第14张图片
如何用python进行数据处理?(一)_第15张图片
以上是numpy的详细介绍,有关于pandas的详述,请留意我们明天更新的文章噢~

了解更多分析及数据抓取可查看:
http://cloud.yisurvey.com:9081/html/1d3e52e7-f130-4b08-8f2c-8c54d7ae676d.html ?ly=csdn
本文转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请联系我们删除处理。
特别说明:本文旨在技术交流,请勿将涉及的技术用于非法用途,否则一切后果自负。如果您觉得我们侵犯了您的合法权益,请联系我们予以处理。

你可能感兴趣的:(python,数据库,数据分析,数据挖掘,爬虫)