【DWJ_1703225514】基于Sklearn航空公司服务质量分析

【Talk is cheap】

# 导入库
import warnings
warnings.filterwarnings('ignore')

import pandas as pd 

import seaborn as sns
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False 
%matplotlib inline

from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report

1 加载数据

【DWJ_1703225514】基于Sklearn航空公司服务质量分析_第1张图片

数据集中缺失数据占的百分比为:
Unnamed: 0 0.000000
id 0.000000
Gender 0.000000
Customer Type 0.000000
Age 0.000000
Type of Travel 0.000000
Class 0.000000
Flight Distance 0.000000
Inflight wifi service 0.000000
Departure/Arrival time convenient 0.000000
Ease of Online booking 0.000000
Gate location 0.000000
Food and drink 0.000000
Online boarding 0.000000
Seat comfort 0.000000
Inflight entertainment 0.000000
On-board service 0.000000
Leg room service 0.000000
Baggage handling 0.000000
Checkin service 0.000000
Inflight service 0.000000
Cleanliness 0.000000
Departure Delay in Minutes 0.000000
Arrival Delay in Minutes 0.298352
satisfaction 0.000000

2 探索性分析

【DWJ_1703225514】基于Sklearn航空公司服务质量分析_第2张图片

【DWJ_1703225514】基于Sklearn航空公司服务质量分析_第3张图片

【DWJ_1703225514】基于Sklearn航空公司服务质量分析_第4张图片

【DWJ_1703225514】基于Sklearn航空公司服务质量分析_第5张图片

3 机器学习

3.1 分割数据

3.2 标签编码

3-3 随机森林

【DWJ_1703225514】基于Sklearn航空公司服务质量分析_第6张图片

3-4 分类报告

【DWJ_1703225514】基于Sklearn航空公司服务质量分析_第7张图片

你可能感兴趣的:(04_机器学习,sklearn,人工智能,python)