python实验数据预处理案例_Python数据分析与应用_源代码和实验数据

【实例简介】

【实例截图】

python实验数据预处理案例_Python数据分析与应用_源代码和实验数据_第1张图片

【核心代码】

├─第1章

│ HelloWorld.html

│ 第1章选择题答案.txt

├─第2章

│ ├─习题程序

│ │ │ 第2章选择题答案.txt

│ │ │

│ │ ├─code

│ │ │ 第2章操作题.py

│ │ │

│ │ └─data

│ └─任务程序

│ ├─code

│ │ 任务2.1 认识NumPy数组对象ndarray.py

│ │ 任务2.2 认识NumPy矩阵与通用函数.py

│ │ 任务2.3 NumPy数值计算基础.py

│ │

│ ├─data

│ │ iris_sepal_length.csv

│ │

│ └─tmp

│ arr.txt

│ savez_arr.npz

│ save_arr.npy

│ y=x^2.png

├─第3章

│ ├─习题程序

│ │ │ 第3章选择题答案.txt

│ │ │

│ │ ├─code

│ │ │ 第3章操作题.py

│ │ │

│ │ ├─data

│ │ │ iris.npz

│ │ │

│ │ └─tmp

│ │ iris各特征箱线图.png

│ │ iris散点图.png

│ │

│ ├─任务程序

│ │ ├─code

│ │ │ 任务3.1 了解绘图基础语法与常用参数.py

│ │ │ 任务3.2 分析特征间的关系.py

│ │ │ 任务3.3 分析特征内部数据分布与分散状况.py

│ │ │

│ │ ├─data

│ │ │ 国民经济核算季度数据.npz

│ │ │

│ │ └─tmp

│ │ 2000-2017各产业国民生产总值箱线图.png

│ │ 2000-2017年各产业季度生产总值散点图.png

│ │ 2000-2017年季度各产业生产总值折线图.png

│ │ 2000-2017年季度各行业生产总值折线子图.png

│ │ 2000-2017年季度各行业生产总值散点子图.png

│ │ 2000-2017年季度生产总值折线图.png

│ │ 2000-2017年季度生产总值散点图.png

│ │ 2000-2017年季度生产总值点线图.png

│ │ 2017年第一季度各产业国民生产总值直方图.png

│ │ 2017年第一季度各产业生产总值占比饼图.png

│ │ sincos.png

│ │ y=x^2.png

│ │ 修改rc参数后sin曲线.png

│ │ 国民生产总值分散情况箱线图.png

│ │ 国民生产总值构成分布直方图.png

│ │ 国民生产总值构成分布直方图直方图.png

│ │ 国民生产总值构成分布饼图.png

│ │ 无法显示中文标题sin曲线.png

│ │ 显示中文标题sin曲线.png

│ │ 默认sin曲线.png

│ │

│ └─实训数据

│ populations.npz

├─第4章

│ ├─习题程序

│ │ │ 第4章选择题答案.txt

│ │ │

│ │ ├─code

│ │ │ 第4章操作题.py

│ │ │

│ │ └─data

│ │ mtcars.csv

│ │ 数据特征说明.xlsx

│ │

│ ├─任务程序

│ │ ├─code

│ │ │ 任务4.1 读写不同数据源的数据.py

│ │ │ 任务4.2 掌握DataFrame的常用操作.py

│ │ │ 任务4.3 转换与处理时间序列数据.py

│ │ │ 任务4.4 使用分组聚合进行组内计算.py

│ │ │ 任务4.5 创建透视表与交叉表.py

│ │ │

│ │ ├─data

│ │ │ meal_order_detail.xlsx

│ │ │ meal_order_detail1.sql

│ │ │ meal_order_detail2.sql

│ │ │ meal_order_detail3.sql

│ │ │ meal_order_info.csv

│ │ │ users.xlsx

│ │ │ 数据特征说明.xlsx

│ │ │

│ │ └─tmp

│ │ meal_order_detail.csv

│ │ meal_order_detail1.csv

│ │ orderInfo.csv

│ │ userInfo.xlsx

│ │

│ └─实训数据

│ Training_LogInfo.csv

│ Training_Master.csv

│ Training_Userupdate.csv

│ 数据特征说明.xlsx

├─第5章

│ ├─习题程序

│ │ │ 第5章选择题答案.txt

│ │ │

│ │ ├─code

│ │ │ 第5章操作题.py

│ │ │

│ │ └─data

│ ├─任务程序

│ │ │ detail.csv

│ │ │

│ │ ├─code

│ │ │ 任务5.1 合并数据.py

│ │ │ 任务5.2 清洗数据.py

│ │ │ 任务5.3 标准化数据.py

│ │ │ 任务5.4 转换数据.py

│ │ │

│ │ ├─data

│ │ │ detail.csv

│ │ │ meal_order_detail1.sql

│ │ │ meal_order_detail2.sql

│ │ │ meal_order_detail3.sql

│ │ │ meal_order_info.csv

│ │ │ users_info.xlsx

│ │ │ 数据特征说明.xlsx

│ │ │

│ │ └─tmp

│ │ 菜品异常数据识别.png

│ │

│ └─实训数据

│ alarm.csv

│ ele_loss.csv

│ missing_data.csv

│ model.csv

│ 数据特征说明.xlsx

├─第6章

│ ├─习题程序

│ │ │ 第6章选择题答案.txt

│ │ │

│ │ ├─code

│ │ │ 第6章操作题.py

│ │ │

│ │ └─data

│ ├─任务程序

│ │ ├─code

│ │ │ 任务6.1 使用sklearn转换器处理数据.py

│ │ │ 任务6.2 构建并评价聚类模型.py

│ │ │ 任务6.3 构建并评价分类模型.py

│ │ │ 任务6.4 构建并评价回归模型.py

│ │ │

│ │ ├─data

│ │ │ abalone.data

│ │ │ cal_housing.data

│ │ │ seeds_dataset.txt

│ │ │

│ │ └─tmp

│ │ 聚类结果.png

│ │

│ └─实训数据

│ wine.csv

│ winequality.csv

│ 数据特征说明.xlsx

├─第7章

│ ├─习题程序

│ │ │ 第7章选择题答案.txt

│ │ │

│ │ ├─code

│ │ │ 第7章操作题.py

│ │ │

│ │ └─data

│ │ data.csv

│ │ 数据特征说明.xlsx

│ │

│ ├─任务程序

│ │ ├─code

│ │ │ 任务7.2 预处理航空客户数据.py

│ │ │ 任务7.3 使用K-Means算法进行客户分群.py

│ │ │

│ │ ├─data

│ │ │ air_data.csv

│ │ │

│ │ └─tmp

│ │ airline_scale.npz

│ │

│ └─训数据

│ credit_card.csv

├─第8章

│ ├─习题程序

│ │ │ 第8章选择题答案.txt

│ │ │

│ │ ├─code

│ │ │ 第8章操作题.py

│ │ │

│ │ └─data

│ │ data.csv

│ │

│ ├─任务程序

│ │ ├─code

│ │ │ GM11.py

│ │ │ 任务8.2 分析财政收入数据特征的相关性.py

│ │ │ 任务8.3 使用Lasso回归选取财政收入预测的关键特征.py

│ │ │ 任务8.4 使用灰色预测和SVR构建财政收入预测模型.py

│ │ │

│ │ ├─data

│ │ │ data.csv

│ │ │

│ │ └─tmp

│ │ new_reg_data.csv

│ │ new_reg_data_GM11.xls

│ │ new_reg_data_GM11_revenue.xls

│ │

│ └─实训数据

│ income_tax.csv

│ 数据特征说明.xlsx

└─第9章

├─习题程序

│ │ 第9章选择题答案.txt

│ │

│ ├─code

│ │ 第9章操作题.py

│ │

│ └─data

│ data.csv

├─任务程序

│ ├─code

│ │ water_heater_nnet.m

│ │ 任务9.2 预处理热水器用户用水数据.py

│ │ 任务9.3 构建用水行为特征并筛选用水事件.py

│ │ 任务9.4 构建行为事件分析的BP神经网络模型.py

│ │

│ ├─data

│ │ original_data.xls

│ │ test_data.xlsx

│ │ water_hearter.xlsx

│ │ water_heater.xls

│ │ water_heater_log.xlsx

│ │

│ └─tmp

│ sj.csv

│ sj_final.xlsx

│ water_heart.csv

│ 用户用水事件识别ROC曲线.png

└─实训数据

USER_INFO_M.csv

你可能感兴趣的:(python实验数据预处理案例)