【python学习笔记】20:numpy广播、分段函数、频次统计

*用int64()取整

>>> x=np.random.rand(10)*50
>>> x
array([ 23.22184111,  32.50075356,  42.89971884,  29.7081743 ,
         9.59936762,  13.48713739,  31.01003042,   9.83144093,
        32.46756683,  32.90776814])
>>> np.int64(x) #取整(不作四舍五入)
array([23, 32, 42, 29,  9, 13, 31,  9, 32, 32], dtype=int64)
>>> x-np.int64(x) #取小数部分
array([ 0.22184111,  0.50075356,  0.89971884,  0.7081743 ,  0.59936762,
        0.48713739,  0.01003042,  0.83144093,  0.46756683,  0.90776814])

*广播运算

>>> a=np.arange(0,60,10).reshape(-1,1) #多行1列的数组作列向量
>>> b=np.arange(0,6) #行向量
>>> a
array([[ 0],
       [10],
       [20],
       [30],
       [40],
       [50]])
>>> b
array([0, 1, 2, 3, 4, 5])
>>> a[1]+b #数组与标量的加法
array([10, 11, 12, 13, 14, 15])
>>> a+b #广播运算,a的每行都做上面的运算
array([[ 0,  1,  2,  3,  4,  5],
       [10, 11, 12, 13, 14, 15],
       [20, 21, 22, 23, 24, 25],
       [30, 31, 32, 33, 34, 35],
       [40, 41, 42, 43, 44, 45],
       [50, 51, 52, 53, 54, 55]])
>>> a*b #广播运算,a的每行都和b数组相乘
array([[  0,   0,   0,   0,   0,   0],
       [  0,  10,  20,  30,  40,  50],
       [  0,  20,  40,  60,  80, 100],
       [  0,  30,  60,  90, 120, 150],
       [  0,  40,  80, 120, 160, 200],
       [  0,  50, 100, 150, 200, 250]])

*分段函数

>>> x=np.random.randint(0,10,size=(1,10))
>>> x
array([[2, 6, 4, 1, 6, 8, 1, 6, 3, 4]])
>>> np.where(x<5,0,1) #小于5的元素变成0,大于5的变成1
array([[0, 1, 0, 0, 1, 1, 0, 1, 0, 0]])
>>> np.piecewise(x,[x<4,x>7],[lambda x:x*2,lambda x:x*3])
array([[ 4,  0,  0,  2,  0, 24,  2,  0,  6,  0]])
np.piecewise()接收的后两个参数list中,将第一个list中的每个条件作后面那个list对应的下标中的函数运算,对于list中没有出现的那部分,把它们都变成0。

*计数

>>> x=np.random.randint(0,10,7)
>>> x
array([1, 0, 3, 0, 0, 3, 0])
>>> np.bincount(x) #计数
array([4, 1, 0, 2], dtype=int64)
>>> np.sum(_) #所有元素出现次数之和等于数组长度
7
>>> np.unique(x) #返回x中的唯一元素值
array([0, 1, 3])
np.bincount()返回传入的数组中0到最大数之间可能有多少个数的长度的新数组,并在每个下标处统计那个可能出现的数出现了多少次。

如上面的例子中,x中最大为3,那么返回的就是长度为4的数组,0出现了4次,1出现了1次,2出现了0次,3出现了2次。

显然,这样得到的数组中所有数字之和也就是原来那个数组中有重复地出现了多少个数,也就是原数组的长度。

>>> x=np.random.randint(0,10,10)
>>> x
array([3, 6, 3, 5, 2, 4, 2, 1, 4, 8])
>>> y=np.random.rand(10) #随机小数,模拟权重
>>> y=np.round_(y,1) #四舍五入保留1位小数
>>> y
array([ 0.8,  0.1,  0. ,  0.4,  0.1,  0.1,  0.5,  0. ,  0.3,  0. ])
>>> np.sum(x*y)/len(x) #加权总和/出现总次数
0.78000000000000003

因为numpy数组支持内置函数len,所以没有去使用bincount计数再加再一起,实际上numpy数组也支持内置函数sum的,所以下面这样也是可以的。

>>> sum(x*y)/len(x)
0.78000000000000003








你可能感兴趣的:(Python)