np.array(list,dtype=np.int) 创建一个数组
np.shape 显示np数组属性
np.ndim 显示数组维度
np.dtype 显示数组元素类型
np.itemsiex 数组元素所占字节大小
np.size 数组元素个数
np.arange(1,11) 产生一个1-11的等差数列
np.arange(1,11).reshape([2,5]) 从新调整矩阵的行数、列数、维度
axis=0 是列
axis=1 是行
np.arange range的数组版
np.asarray 将输入转换成ndarray,就是将str类型转换
np.ones 根据给定形状和类型生成全1的数组
np.ones_like 根据给定数组生成形状一样的全1数组
np.zeros 根据给定形状和类型生成全0的数组
np.zeros_like 根据给定数组生成形状一样的全1数组
np.eye 生成N*N的特征矩阵
np.linspance 返回在间隔[开始,停止]上计算的num个均匀间隔的样式
n.ndim 返回数组的维度个数
n.shape 数组的维度,返回几行几列
n.size 数组元素的个数
n.dtype 元素的类型
n.itemsize 数组元素的大小
n.T 转置函数,对一维数组无影响
n.reshape() 更改数组的形状
n.resize() 当后面的数组个数大于前面的数量就随机填充
np.resize(np.arange(12), (3, 5))
n.resize(3,5)
int8,uint8 8整位整数
int16,uint16 16整位整数
int32,uint32 32整位整数
int64,uint64 64整位整数
float16 半精度
float32 单精度
float64 双精度
bool 布尔
类型转换astype
ar1 = np.arange(10, dtype=float)
ar2 = ar1.astype(np.int64)
np.hstack() 横向链接
np.vstack() 竖向链接
np.stack() 任意堆叠,当axis=1是竖向堆叠
np.hsplit((ar,2)) 纵向拆分
np.vsplit((ar,2)) 横向拆分
np.mean() 平局值
np.max() 最大值
np.min() 最小值
np.gtd() 标准差
np.var() 方差
np.sum() 参数axis=0按列求和axis=1按行求和
np.random.rand() 生成一个0-1的随机浮点数或N维浮点数 --均匀分布
np.random.randn() 正态分布
np.random.randint() 随机整数
np.random.randint(2,10) 在2-10之间随机整数
np.random.randint(10,50,size=(2,5)) 在10-50之间生成包含10个元素的二维数组
ar = np.random.rand(5,5)
np.save('arraydata.npy', ar)
ar_load = np.load('arraydata.npy')
ar = np.random.rand(5,5)
np.savetxt('a.txt', ar, fmt='%d', delimiter=',')
ar_loadtxt = np.loadtxt('a.txt', delimiter=',')
df['c'].isin(['内容1','内容2']) # 和内容是否相等
df.loc[df['c'].str.contains('内容1|内容2')] # 是否包含内容
crime.Year = pd.to_datetime(crime.Year, format='%Y') # 将Data类型的年,转换datetime64
crime.set_index('Year', drop = True) # 设置为数据框的索引,默认True删除
all_data = pd.concat([data1, data2]) # 按照行连接两个DataFrame,axis = 1是按照列
df.index.is_unique # 是否有重复数据
有索引或部分索引重叠的两个数据集。可用Series和DataFrame的combine_first方法。
duplicated() 查看列是否重复