numpy,pandas学习笔记

文章目录

  • numpy & Pandas
    • ndarray
      • array创建方法
      • ndarray访问和修改
      • ndarray删除和插入
      • ndarray切片
      • ndarray过滤
      • ndarray集合运算
      • ndarray运算与广播
    • Pandas
      • Series
        • 创建Series
        • Serie访问、修改和删除
      • DataFrame
        • 创建和保存dataframe
        • 读取csv为dataframe并查看
        • 访问、修改和删除dataframe
        • 缺失值NaN
        • dataframe分组
        • apply进行批量操作
      • pd.concat()
      • pd.get_dummies()
    • dtype,astype,type

numpy & Pandas

ndarray

ndarray:存放相同类型元素的多维数组,每个元素在内存中有相同存储大小的区域。
numpy,pandas学习笔记_第1张图片

array创建方法

	np.array[1,2,3,4,5,6]
	np.arange(6)       np.arange(2,8, step=2,dtype = np.int64) #可限定范围和步长,指定dtype
	np.ones((2,2))    #全为1的矩阵
	np.zeros((2,2))   #全为0的矩阵
	np.eye(3)         #n维单位矩阵
	np.random.rand(size)  #[0,1)的随机值
	np.random.randn(size) #返回值具有标准正态分布
	np.random.randint(low,high,size) #[low,high)的随机整数组成的矩阵
	x.reshape(3,2)	 #变更shape
	np.save('filename',x)
	np.load('filename.npy')

ndarray访问和修改

numpy,pandas学习笔记_第2张图片
numpy,pandas学习笔记_第3张图片

ndarray删除和插入

numpy,pandas学习笔记_第4张图片
numpy,pandas学习笔记_第5张图片

ndarray切片

numpy,pandas学习笔记_第6张图片

ndarray过滤

numpy,pandas学习笔记_第7张图片

ndarray集合运算

numpy,pandas学习笔记_第8张图片

ndarray运算与广播

numpy,pandas学习笔记_第9张图片
numpy,pandas学习笔记_第10张图片
numpy,pandas学习笔记_第11张图片
numpy,pandas学习笔记_第12张图片

Pandas

Series

Series是一个类似于array的一维对象,与array不同的是,Series的每一个元素都可以给它分配索引标签

创建Series

numpy,pandas学习笔记_第13张图片

Serie访问、修改和删除

loc:通过index索引访问
iloc:通过行号索引访问
loc是指location的意思,iloc中的i是指integer
numpy,pandas学习笔记_第14张图片

DataFrame

创建和保存dataframe

numpy,pandas学习笔记_第15张图片

读取csv为dataframe并查看

numpy,pandas学习笔记_第16张图片
.head()
.describe()
.info()
numpy,pandas学习笔记_第17张图片

访问、修改和删除dataframe

numpy,pandas学习笔记_第18张图片
numpy,pandas学习笔记_第19张图片

缺失值NaN

NaN与任何值做比较计算都是false,甚至和NaN==NaN也是false
numpy,pandas学习笔记_第20张图片
numpy,pandas学习笔记_第21张图片
numpy,pandas学习笔记_第22张图片

dataframe分组

numpy,pandas学习笔记_第23张图片
numpy,pandas学习笔记_第24张图片
numpy,pandas学习笔记_第25张图片

apply进行批量操作

numpy,pandas学习笔记_第26张图片
numpy,pandas学习笔记_第27张图片
numpy,pandas学习笔记_第28张图片
分段制作交叉表
numpy,pandas学习笔记_第29张图片
numpy,pandas学习笔记_第30张图片

pd.concat()

pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False,
       keys=None, levels=None, names=None, verify_integrity=False)

输入的objs需要为dataframe组成的列表

pd.get_dummies()

pandas.get_dummies(data, prefix=None, prefix_sep=’_’, dummy_na=False, columns=None, sparse=False, drop_first=False)

需要制定生成列名的前缀,prefix=

dtype,astype,type

numpy,pandas学习笔记_第31张图片

你可能感兴趣的:(python,numpy)