https://blog.csdn.net/u013019431/article/details/79949648
https://blog.csdn.net/mr_hhh/article/details/79488445
https://blog.csdn.net/gdkyxy2013/article/details/80785361
https://www.cnblogs.com/xk-bench/p/8379180.html
pandas提供了一个类似于关系数据库的连接(join)操作的方法merage,可以根据一个或多个键将不同DataFrame中的行连接起来,语法如下:
1 2 3 |
|
作为一个功能完善、强大的语言,python的pandas库中的merge()支持各种内外连接。
sql中的
1 2 3 4 5 6 7 |
|
pandas中用:
1 |
|
然后就是各种外连接了:
1 |
|
how变成left/right。全链接outer。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 |
|
输出为:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 |
|
提供了一个简便的方法用于将两个DataFrame中的不同的列索引合并成为一个DataFrame。
其中参数的意义与merge方法基本相同,只是join方法默认为左外连接how=left。
示例:
1 2 3 4 5 6 7 8 9 10 |
|
结果为:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 |
|
还有一种连接方式:
concat方法相当于数据库中的全连接(UNION ALL),可以指定按某个轴进行连接,也可以指定连接的方式join(outer,inner 只有这两种)。
与数据库不同的是concat不会去重,要达到去重的效果可以使用drop_duplicates方法
1 2 |
|
示例:
1 2 3 4 5 6 7 8 |
|
输出结果为:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 |
|