《Python数据分析与应用》第4章Pandas统计分析(1) 实训部分

《Python数据分析与应用》第4章Pandas统计分析(1) 实训部分(源于大学课程python数据分析)

实训1 读取并查看P2P网络贷款数据主表的基本信息

1.利用read_csv读取P2P网络贷款数据主表《Python数据分析与应用》第4章Pandas统计分析(1) 实训部分_第1张图片
《Python数据分析与应用》第4章Pandas统计分析(1) 实训部分_第2张图片
2.利用ndim属性查看主表维度、利用shape属性查看主表形状、利用memory_usage属性查看主表占用内存信息
《Python数据分析与应用》第4章Pandas统计分析(1) 实训部分_第3张图片
3.利用describe方法对主表进行描述性统计分析
《Python数据分析与应用》第4章Pandas统计分析(1) 实训部分_第4张图片
4.利用自定义函数剔除值相同或全为空的列,标准差表示的是样本数据的离散程度,标准差为0就是数组为空值,所以求全为空的列就是求标准差为0的列《Python数据分析与应用》第4章Pandas统计分析(1) 实训部分_第5张图片

实训2 提取用户信息更新表和登录信息表的时间信息

1.利用read_csv读取用户信息更新表和登录信息表
《Python数据分析与应用》第4章Pandas统计分析(1) 实训部分_第6张图片
2.利用to_datetime函数转换用户信息更新表和登录信息表的时间字符串
《Python数据分析与应用》第4章Pandas统计分析(1) 实训部分_第7张图片
《Python数据分析与应用》第4章Pandas统计分析(1) 实训部分_第8张图片
3.利用year、month、week等方法提取用户信息更新表和登录信息表中的时间信息

3.1提取用户信息更新表字段为’ListingInfo1’、‘UserupdateInfo2’中的时间信息
在这里插入图片描述
在这里插入图片描述
3.2提取登录信息表字段为’Listinginfo1’、'LogInfo3’中的时间信息
在这里插入图片描述
在这里插入图片描述
4.计算用户信息更新表和登录信息表中两时间的差,分别以日、小时、分钟计算
4.1计算用户信息更新表的两时间差
4.1.1以日计算
《Python数据分析与应用》第4章Pandas统计分析(1) 实训部分_第9张图片
4.1.2以小时计算

《Python数据分析与应用》第4章Pandas统计分析(1) 实训部分_第10张图片

4.1.3以分钟计算
《Python数据分析与应用》第4章Pandas统计分析(1) 实训部分_第11张图片
4.2计算用户登录信息表的两时间差
4.2.1以日计算
《Python数据分析与应用》第4章Pandas统计分析(1) 实训部分_第12张图片
4.2.2以小时计算
《Python数据分析与应用》第4章Pandas统计分析(1) 实训部分_第13张图片
4.2.3以分钟计算
《Python数据分析与应用》第4章Pandas统计分析(1) 实训部分_第14张图片

你可能感兴趣的:(数据分析,python,数据挖掘)