数据分析--Numpy--去重与重复

1.unique函数

#通过unique函数可以找出数组中的唯一值并返回已经排序的结果

arr = np.array([1,1,1,2,2,3,3,])
res = np.unique(arr)
print(res)#[1 2 3]

2.tile函数

np.tile(A,reps)

#主要有两个参数,参数’A’指定重复的数组,
#参数’reps’指定重复的次数

arr1 = np.arange(5)
arr2 = np.tile(arr1,3)
print(arr2)#[0 1 2 3 4 0 1 2 3 4 0 1 2 3 4]

3.repeat函数

numpy.repeat(a, repeats, axis=None)

repeat 函数主要有三个参数,参数“a”是需要重复的数组元素,参数“repeats”是重复次数,参数“axis”指定沿着哪个轴进行重复,axis = 0 表示按行进行元素重复;axis =1 表示按列进行元素重复。

#def repeat(a,repeats,axis=None):
#axis=1表示按列进行元素重复
arr2 = np.random.randint(0,10,size=(3,3))
print('arr2:\n',arr2)
'''
arr2:
 [[5 0 0]
 [2 4 9]
 [7 8 1]]
'''
arr2_2_0 = np.repeat(arr2,2,axis=0)
print('按行进行重复',arr2_2_0)
'''
按行进行重复 [[5 0 0]
             [5 0 0]
             [2 4 9]
             [2 4 9]
             [7 8 1]
             [7 8 1]]
'''
rr2_2_1 = np.repeat(arr2,2,axis=1)
print('按列进行重复',arr2_2_0)
'''
按列进行重复 [[5 0 0]
             [5 0 0]
             [2 4 9]
             [2 4 9]
             [7 8 1]
             [7 8 1]]
'''


repeat和tile两个函数的区别:两个函数都能够对数组进行“重复”区别在于:tile函数是将数组进行重复,repeat函数是对元素进行重复

Example:

arr2_tile = np.tile(arr2,3)
print(arr2_tile)
'''
[[5 0 0 5 0 0 5 0 0]
 [2 4 9 2 4 9 2 4 9]
 [7 8 1 7 8 1 7 8 1]]

repeat重复555000000
tile500500500
发现区别了吧
'''

你可能感兴趣的:(数据分析--Numpy--去重与重复)