python-数据分析与展示(Numpy、matplotlib、pandas)---1

笔记内容整理自mooc上北京理工大学嵩天老师python系列课程数据分析与展示,本人小白一枚,如有不对,多加指正

 

1.ndarray对象的属性

.ndim、.shape、.size(元素个数,不是占用内存大小)、.dtype、.itemsize

2.创建ndarray数组的方式

2.1一共有三种np.ndarray()、函数创建法、字节流创建

2.2主要记录一下常用的函数创建ndarray的方法np.arange(n)   np.ones(shape)   np.zeros(shape)   up.full(shape,val)   np.eye(n)(n*n单位矩阵,对角线是1,其宇是0)  

shape是元组类型,val是数字,ones、zeros、eye默认的元素类型是浮点型,但是可以指定为整形,dtype = int32

2.3np.ones_like(a)、np.zeros_like(a)、np.eye_like(a)生成和a同shape的n维数组

2.4np.linspace()、np.concatenate()、np.logspace()生成ndarray,space注意与np.arange()区分,可以用endpoint=true/false来调整结束点,且默认是浮点数。np库生成的ndarray默认绝大多数都是浮点数,除了np.arange();

2.5ndarray数组的维度变换.reshape(shape)   .resize(shape)    .swapaxes(ax1,ax2)    .flatten(),区别前两个,前者新生成数组,不改变原数组,后者反之,改变原数组,reshape改变形状,但是要保证数组的总的元素个数没有变换,否则改变不了形状(2,3,4)->(3,8)

2.6    .astype(new_type)   此方法创建新数组,但是数据类型会发生变化

2.7    a.tolist()

3.ndarray数组的操作-----索引和切片

3.1 一维数组的索引和切片  a[1:4:2],起始编号:终止编号(不包含):步长,跟space区分,后者一般是包含终止编号的,且第三个参数是个数

3.2多维数组索引a[1,2,3]   切片a[ : , 1, 3]     a[ :, 1:3, : ]    a[ :, : , ::2 ]      ,其实就是每个维度和一维数组切片方式相同

4.ndarray数组的运算

4.1 a.mean()求平均值,a +/-/*//标量   都是作用于数组的每一个元素

4.2 NumPy中元素级一元运算函数 np.abs(x)  np.fabs(x)  np.sqrt(x)  np.square(x)  np.log(x)  np.log10(x)  np.log2(x)  np.ceil(x)  np.floor(x)  np.rint(x)  np.modf(x) np.cos(x)   np.cosh(x)  np.exp(x)  np.sign(x)等,   注意a本身不变而是生成新的数组

4.3 NumPy中元素级二元运算函数np.maximum(x,y)   np.fmax()    np.minimum(x,y)  np.fmin()  np.mod(x,y)   np.copysign(x,y)  <>= == != <= >=

5.numpy数据存取

5.1 np.savetxt(frame, array, fmt='%.18e',delimiter=None)    参数依次为文件(可以是.gz或.bz2压缩文件),存入数组,每个数据元素的格式%d,%.2f,%.18e默认是最后,18位小数科学计数法,delimiter是分隔符,csv文件为“,”          例子np.savetxt(‘a.csv’, a, fmt=‘%d’, delimiter=‘,’)

5.2 np.loadtxt(frame,dtype=np.float,delimiter=None,unpack=False)   参数为文件(可以是.gz或.bz2压缩文件),

5.3多维数组的文件存取(前两个特指二维数组)a.tofile(frame,seq='',format='%s')  np.fromfile(frame, dtype=float, count=-1,sep='')sep如果是空串,则为二进制文件

5.4多维数据文件存取,要求numpy的文件格式.npy为拓展名  np.save(fname,attay)/np.load(fname)

6.numpy的随机数函数(numpy的random子库)

6.1np.random.rand(x1,x2,x3...),  np.random.randn(x1,x2,...)正态分布   np.random.randint(low,high,shape)  np.random.seed(s)

6.2随机库的高级函数 shuffle(a)  根据数组a的第一轴进行随机排列,改变数组a,  permutation(a)  根据数组a的第一轴进行随机排列,不改变数组a, choice(a[,size,replace,p])

6.3 np.random.uniform(low,high,size)产生具有均匀分布的数组,size为形状,np.random.normal(loc,scale,size)正态分布数组,loc为均值,scale标准差,size形状,np.random.poisson(lam,size)泊松分布

7.numpy的统计函数

7.1 sum(a,axis=None)、mean(a,axis=None)、average(a,axis=None,weights=None)、std(a,axis=None)、var(a,axis=None),mean是期望(即加权平均值),std是标准差,var是方差,axis是轴,即第几维度,从0开始。如果限制在第几维度做运算,就是其他维度相同,这一维度索引不同的元素之间相互运算而得结果

7.2  np.min(a)  np.argmin(a)计算数组a中元素的最小值的降一维后的下标,对应有max版本   np.unravel_index(index,shape)根据shape将一维下表index转换成多维下标      np.ptp(a)计算数组中元素最大值和最小值的差  np.median(a)计算数组a中元素的中位数

8.numpy的梯度函数

8.1np.gradient(f) 计算数组f中元素的梯度,当f为多维是,返回每个维度的梯度n维数组返回n个数组,2维数组返回2个数组

你可能感兴趣的:(python基础学习)