【pyhton数据预处理】利用pandas模块找出两excel表格差异并进行字段值比较

【前言】

        研0生活从枯燥的寻找数据、寻找数据、寻找数据……整理数据、整理数据、整理数据……开始,很多时候大家更喜欢从各大平台机构花money买来整理好的数据,不同平台间格式存在差异,如我某师姐遇到的问题,一份是统计资料整理过来的数据,一份是购买过来已经简单处理过的数据,某师姐想知道购买的数据是否可靠,整理的数据与购买数据的原始数据是否相同,奈何数据量太大,不便处理,由此诞生了今天的话题。

【问题提出】

        两份Excel数据,如何利用pandas进行比较找出数据上的差异(两份数据如下图所示,图1为统计资料数据,其数据简称为指标数据,图2为购买数据,其数据简称为数据库)

【pyhton数据预处理】利用pandas模块找出两excel表格差异并进行字段值比较_第1张图片

【pyhton数据预处理】利用pandas模块找出两excel表格差异并进行字段值比较_第2张图片

【问题分析】

你可能感兴趣的:(python,pandas,数据分析,数据挖掘,python)