numpy中的concatenate和pandas中的concat函数

concatenate功能:数组拼接
concat功能:数组拼接

1、numpy.concatenate()

numpy.concatenate((a1, a2, …), axis=0, out=None)
numpy中的concatenate和pandas中的concat函数_第1张图片
示例:

>>> a = np.array([[1, 2], [3, 4]])
>>> b = np.array([[5, 6]])
>>> np.concatenate((a, b), axis=0)	#axis=0表示沿着数组垂直方向进行拼接
array([[1, 2],
       [3, 4],
       [5, 6]])
>>> np.concatenate((a, b.T), axis=1)	#axis=1表示沿着数组水平方向进行拼接
array([[1, 2, 5],
       [3, 4, 6]])

注意:
#axis=0表示沿着数组垂直方向进行拼接
#axis=1表示沿着数组水平方向进行拼接

2、pandas.concat()

pandas.concat()通常用来连接DataFrame对象。默认情况下是对两个DataFrame对象进行纵向连接。

2.1、纵向

1、两个DataFrame对象的列完全相同

# 初始化两个DataFrame对象
df1 = pd.DataFrame([['a', 1], ['b', 2]],
                columns=['letter', 'number'])

df2 = pd.DataFrame([['c', 3], ['d', 4]],
                  columns=['letter', 'number'])

display(df1)
display(df2)

numpy中的concatenate和pandas中的concat函数_第2张图片

# 合并对象
pd.concat([df1, df2])

numpy中的concatenate和pandas中的concat函数_第3张图片
concat默认纵向连接DataFrame对象, 并且合并之后不改变每个DataFrame子对象的index值, 因此我们可以在合并之后的DataFrame中看到index的值0和1重复了两次。

如果希望重新设置合并之后的DataFrame对象的index值, 可以添加ignore_index=True参数:

pd.concat([df1, df2], ignore_index=True)

numpy中的concatenate和pandas中的concat函数_第4张图片
2、两个DataFrame对象的列不完全相同

# 初始化DataFrame对象
df1 = pd.DataFrame([['a', 1], ['b', 2]],
                columns=['letter', 'number'])

df3 = pd.DataFrame([['c', 3, 'cat'], ['d', 4, 'dog']],
                  columns=['letter', 'number', 'animal'])

display(df1)
display(df3)

numpy中的concatenate和pandas中的concat函数_第5张图片

# 合并对象
pd.concat([df1, df3], sort=False)  # sort=False : 列的顺序维持原样, 不进行重新排序。

numpy中的concatenate和pandas中的concat函数_第6张图片
从结果可以看到, 因为df1中没有animal列, 所以在合并之后的DataFrame对象里, 所对应的元素都被设置成了NaN。

如果只想合并相同的列, 我们可以添加上join='inner’参数:

pd.concat([df1, df3], join='inner')

2.2、横向

# 初始化DataFrame对象
df1 = pd.DataFrame([['a', 1], ['b', 2]],
                columns=['letter', 'number'])

df4 = pd.DataFrame([['bird', 'polly'], ['monkey', 'george']],
                  columns=['animal', 'name'])

display(df1)
display(df4)

numpy中的concatenate和pandas中的concat函数_第7张图片

# 合并对象
pd.concat([df1, df4], axis=1)

numpy中的concatenate和pandas中的concat函数_第8张图片
参考:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.concat.html

你可能感兴趣的:(python,pandas,numpy,python,机器学习,数据分析)