pandas实现分类汇总,查找不重复的一 一对应数据

问题描述:统计出设备IP和设备名是不是一 一对应的关系,若是,找出这些一 一对应的组合。

1、读入数据

#-*- coding : utf-8 -*-
#coding=utf-8
import pandas as pd
#读入前先将文件通过记事本另存为utf-8格式
data= pd.read_csv("/home/admin/AI/Terminal_analyse/data.csv",encoding="utf-8")

2、 查看数据内容

data.head()

pandas实现分类汇总,查找不重复的一 一对应数据_第1张图片
3、查看数据条数

data.shape

4、统计不重复个数
data.groupby(‘设备IP’)[‘设备名’].nunique()

pandas实现分类汇总,查找不重复的一 一对应数据_第2张图片从图中可以看出,设备IP对应的设备名,不重复个数皆为0,说明,设备IP与设备名是一一对应的,接下来输出这些一一对应的组和。

5、统计不重复个数、不重复内容、重复次数

func={
    '设备名':['nunique','unique'],
    '设备IP':'count'
}
data.groupby('设备IP').agg(func)

pandas实现分类汇总,查找不重复的一 一对应数据_第3张图片
6、将结果输出到EXCEL

    func={
    '设备名':['nunique','unique'],
    '设备IP':'count'
}
result=data.groupby('设备IP').agg(func)
result.to_excel('/home/admin/AI/Terminal_analyse/Result1.xlsx')

你可能感兴趣的:(python)