程序_丸

使用机器学习算法预测航班价格

一、前言

机票价格的预测一直是航空业和旅行者关注的重要问题之一。随着航空业的快速发展和市场竞争的加剧，正确预测机票价格对于航空公司的利润最大化和旅行者的预算规划至关重要。在过去，人们通常依靠经验和市场趋势来预测机票价格，但这种方法往往存在不准确和不稳定的问题。

为了解决这个问题，本项目旨在利用机器学习算法来预测机票价格。机器学习是一种强大的技术，可以自动从历史数据中学习规律和模式，并根据这些模式做出准确的预测。通过分析航班的相关数据，如起飞时间、航空公司、航线、季节性和市场需求等因素，我们可以构建一个机票价格预测模型。本实验在jupyter notebook中执行，本文将给出代码的详细介绍，供初学者更好的学习数据预处理、特征工程、数据划分、模型选择和训练、模型评估等过程。

二、实验所需的库及介绍

本实验所需的库与介绍如下，进行本实现请先在conda pip install以下库：

1. pandas： pandas`是一个强大的数据处理和分析库。它提供了高性能、易于使用的数据结构，如DataFrame，用于处理和操作结构化数据。pandas`可以读取和写入各种数据格式，如 CSV、Excel、SQL 数据库等。它还提供了许多数据处理和转换函数，使数据清洗、转换和整理变得更加简单。

2. seaborn: seaborn 是一个基于 matplotlib`的数据可视化库。它提供了一组高级的统计图形和绘图函数，使得创建各种统计图形变得更加简单。seaborn的设计目标是使可视化过程更加简洁、美观，并提供了一些默认的样式和颜色调色板，使得图形的生成和修改更加容易。

3. numpy: numpy 是一个用于科学计算的库。它提供了高性能的多维数组对象（ndarray）以及用于操作数组的各种函数。numpy的数组操作功能非常强大，可以进行向量化操作、广播等。它还提供了许多数学函数，如线性代数运算、傅里叶变换、随机数生成等。

4. matplotlib.pyplot: matplotlib.pyplot 是 matplotlib库的一个子模块，它提供了一组简单而有效的函数，用于创建各种类型的图形和可视化。通过 pyplot，可以创建线图、散点图、条形图、饼图等，并对图形进行自定义设置，如添加标题、标签、图例等。

5. datetime： datetime 是 Python 的一个内置模块，提供了处理日期和时间的函数和类。它可以用于创建、操作和格式化日期和时间，计算时间差、转换时间表示等。

6. scikit-learn: scikit-learn（简称为 sklearn）是一个流行的机器学习库，提供了许多常用的机器学习算法和工具。它包含了用于分类、回归、聚类、降维、模型选择和评估等任务的函数和类。train_test_split 用于划分训练集和测试集的工具函数，RandomizedSearchCV 是用于进行随机搜索交叉验证的类，RandomForestRegressor 和 ExtraTreesRegressor 是随机森林和极端随机森林回归器的类。

7. pickle： pickle 是 Python 的内置模块，用于序列化和反序列化 Python 对象。它可以将对象转换为字节流表示，从而可以将对象保存到文件或通过网络传输。pickle 在机器学习中常用于保存训练好的模型，以便以后重用。可以使用 pickle 将训练好的模型保存到文件，然后在需要时加载回来并进行预测或其他操作。

三、数据集简介

我们采用网上搜集到的国外的一个航班信息数据集用于我们的预测实验，数据集包含了航班的出发点、到达地、出发时间、到达时间、票价等航班信息。你可以通过下面链接下载该数据集：

链接：链接：https://pan.baidu.com/s/1ukycDJvkn55B-gE022rpVw?pwd=zu8l
提取码：zu8l

四、实现代码

1.导入航班价格预测所需的库

import pandas as pd
import seaborn as sns
import numpy as np
import matplotlib.pyplot as plt
import datetime as dt
from sklearn.model_selection import train_test_split, RandomizedSearchCV
from sklearn.ensemble import RandomForestRegressor, ExtraTreesRegressor
import pickle
from sklearn import metrics

2.读取训练数据

train_data = pd.read_excel('Data_Train.xlsx')
train_data.head()

这段代码使用了Pandas库来读取一个在程序同目录下名为"Data_Train.xlsx"的Excel文件，并将其内容加载到一个名为train_data的DataFrame中，显示DataFrame的前几行数据，运行结果如下：

3.检查目标列中的值

train_data['Destination'].value_counts()

这段代码对train_data DataFrame中的"Destination"列执行了value_counts()方法。它返回了一个包含每个唯一值的计数的Series对象，该Series对象按计数值降序排列。运行结果如下：

• 在我们的数据集中，最多的人前往科钦，其次是班加罗尔，然后是德里。

下面我们将"Destination"列中的'New Delhi'值替换为'Delhi'，以便在数据中统一表示目的地：

def newd(x):
    if x=='New Delhi':
        return 'Delhi'
    else:
        return x

train_data['Destination'] = train_data['Destination'].apply(newd)

4.检查我们的列车数据信息

train_data.info()

`train_data.info()`是一个用于查看DataFrame的基本信息的方法。它提供了关于DataFrame的列名、每列的非空值数量、数据类型以及占用内存等方面的信息，这对于数据清洗、处理和分析非常有用。运行结果如下：

5.将日期和月份列转换为日期时间列

train_data['Journey_day'] = pd.to_datetime(train_data['Date_of_Journey'],format='%d/%m/%Y').dt.day
train_data['Journey_month'] = pd.to_datetime(train_data['Date_of_Journey'],format='%d/%m/%Y').dt.month
train_data.drop('Date_of_Journey',inplace=True,axis=1)
train_data.head()

这段代码进行了一系列的数据处理操作，对`train_data` DataFrame进行了修改：

首先，代码使用`pd.to_datetime()`函数将"Date_of_Journey"列中的日期字符串转换为Pandas的日期时间类型。`pd.to_datetime()`函数接受两个参数：要转换的列和日期字符串的格式。在这里，日期字符串的格式是"%d/%m/%Y"，表示日期格式为"日/月/年"。转换后，日期时间对象的天数部分被提取并赋值给新的"Journey_day"列，用于表示出发日期的天数。

接着，代码再次使用`pd.to_datetime()`函数将"Date_of_Journey"列中的日期字符串转换为日期时间类型，并提取出月份部分，并将其赋值给新的"Journey_month"列，用于表示出发日期的月份。

然后，使用`drop()`方法删除了原始的"Date_of_Journey"列。`drop()`方法用于从DataFrame中删除指定的列或行，其中第一个参数是要删除的列或行的标签，`inplace=True`表示对原始DataFrame进行修改，`axis=1`表示删除列。

最后，代码通过调用`head()`方法显示修改后的DataFrame的前几行数据。

运行结果如下：

6.从时间中提取小时和分钟

train_data['Dep_hour'] = pd.to_datetime(train_data['Dep_Time']).dt.hour
train_data['Dep_min'] = pd.to_datetime(train_data['Dep_Time']).dt.minute
train_data.drop('Dep_Time',axis=1,inplace=True)

train_data['Arrival_hour'] = pd.to_datetime(train_data['Arrival_Time']).dt.hour
train_data['Arrival_min'] = pd.to_datetime(train_data['Arrival_Time']).dt.minute
train_data.drop('Arrival_Time',axis=1,inplace=True)

train_data.head()

这段代码对`train_data` DataFrame进行了一系列的操作，包括处理出发时间和到达时间，并对DataFrame进行了修改。

首先，代码使用`pd.to_datetime()`函数将"Dep_Time"列中的时间字符串转换为Pandas的日期时间类型。然后，通过使用`.dt.hour`和`.dt.minute`属性，分别将出发时间的小时和分钟提取出来，并分别赋值给新的"Dep_hour"和"Dep_min"列，用于表示出发时间的小时和分钟。

接下来，代码使用`drop()`方法删除了原始的"Dep_Time"列。`drop()`方法用于从DataFrame中删除指定的列或行，其中第一个参数是要删除的列或行的标签，`axis=1`表示删除列。

然后，代码使用类似的方式处理"Arrival_Time"列。它将"Arrival_Time"列中的时间字符串转换为日期时间类型，并提取到达时间的小时和分钟，并将它们分别赋值给新的"Arrival_hour"和"Arrival_min"列。

最后，代码通过调用`head()`方法显示修改后的DataFrame的前几行数据。

运行结果如下：

7.统计 Duration 列中的值

train_data['Duration'].value_counts()

在这里，"Duration"列包含了飞行时间的持续时间，以字符串的形式表示，例如"2h 50m"。该方法将显示每个唯一的持续时间值出现的次数，以帮助我们了解飞行持续时间的分布情况。

运行结果如下：

8. 删除 Duration 列并从中提取重要信息

duration = list(train_data['Duration'])

for i in range(len(duration)):
    if len(duration[i].split()) != 2:
        if 'h' in duration[i]:
            duration[i] = duration[i] + ' 0m'
        else:
            duration[i] = '0h ' + duration[i]

duration_hour = []
duration_min = []

for i in duration:
    h,m = i.split()
    duration_hour.append(int(h[:-1]))
    duration_min.append(int(m[:-1]))

train_data['Duration_hours'] = duration_hour
train_data['Duration_mins'] = duration_min

train_data.drop('Duration',axis=1,inplace=True)
train_data.head()

这段代码的作用是将"Duration"列中的持续时间字符串进行处理，提取出小时和分钟部分，并分别存储到"Duration_hours"和"Duration_mins"列中。然后，删除原始的"Duration"列，并显示修改后的DataFrame的前几行数据，以方便对持续时间进行分析和处理。

运行结果如下：

9.绘制航空公司与价格的箱线图

sns.catplot(x='Airline',y='Price',data=train_data.sort_values('Price',ascending=False),kind='boxen',aspect=3,height=6)

这段代码使用Seaborn库绘制了一个箱线图，用于展示航空公司（"Airline"）与票价（"Price"）之间的关系。下面是代码的详细解释：

- `sns.catplot()`: 这是Seaborn库中用于绘制分类数据的函数。它可以绘制多种类型的图形，包括箱线图（boxen plot）。
- `x='Airline'`、`y='Price'`、`data=train_data.sort_values('Price',ascending=False)`: 这些参数指定了箱线图的横轴、纵轴和数据源。横轴是航空公司（"Airline"），纵轴是票价（"Price"），数据源是`train_data` DataFrame，并按票价降序排序。
- `kind='boxen'`: 这个参数指定了绘制的图形类型为箱线图（boxen plot）。箱线图是一种用于显示数据分布和异常值的图形。
- `aspect=3`: 这个参数指定了图形的宽高比。
- `height=6`: 这个参数指定了图形的高度。

通过绘制箱线图，我们可以观察航空公司与票价之间的关系。箱线图显示了每个航空公司的票价分布情况，包括中位数、上下四分位数、异常值等信息。这有助于比较不同航空公司的票价水平和分布范围，以及识别可能存在的异常值或离群点。运行结果如下：

10.从 Airline 列中创建虚拟列

airline = train_data[['Airline']]
airline = pd.get_dummies(airline,drop_first=True)

这段代码对`train_data` DataFrame中的"Airline"列进行了独热编码（One-Hot Encoding）的处理：

首先，代码使用`train_data[['Airline']]`选择了"Airline"列，并将其赋值给新的DataFrame `airline`。这样做是为了将"Airline"列单独提取出来，以便进行独热编码的处理。

接下来，代码使用`pd.get_dummies()`函数对`airline` DataFrame进行独热编码。`pd.get_dummies()`函数将分类变量转换为二进制的独热编码表示。通过设置`drop_first=True`，代码删除了独热编码生成的第一列，以避免多重共线性问题。

最终，独热编码后的结果存储在`airline` DataFrame中，每个航空公司的名称都被转换为相应的二进制编码列。这种编码形式可以更好地表示航空公司之间的分类关系，以便于后续的分析和建模。

11.绘制来源与价格的箱线图

sns.catplot(x='Source',y='Price',data=train_data.sort_values('Price',ascending=False),kind='boxen',aspect=3,height=4)

这段代码使用Seaborn库绘制了一个箱线图，用于比较不同出发城市（"Source"）的票价（"Price"）。运行结果如下：

12.根据"Source"列创建虚拟列

source = train_data[['Source']]
source = pd.get_dummies(source,drop_first=True)
source.head()

这段代码对`train_data` DataFrame中的"Source"列进行了独热编码（One-Hot Encoding）的处理：

首先，代码使用`train_data[['Source']]`选择了"Source"列，并将其赋值给新的DataFrame `source`。这样做是为了将"Source"列单独提取出来，以便进行独热编码的处理。

接下来，代码使用`pd.get_dummies()`函数对`source` DataFrame进行独热编码。`pd.get_dummies()`函数将分类变量转换为二进制的独热编码表示。通过设置`drop_first=True`，代码删除了独热编码生成的第一列，以避免多重共线性问题。

最终，独热编码后的结果存储在`source` DataFrame中，每个出发城市的名称都被转换为相应的二进制编码列。这种编码形式可以更好地表示出发城市之间的分类关系，以便于后续的分析和建模。调用`source.head()`可以显示独热编码后的DataFrame的前几行数据。运行结果如下：

13.绘制目的地与价格之间的箱线图

sns.catplot(x='Destination',y='Price',data=train_data.sort_values('Price',ascending=False),kind='boxen',aspect=3,height=4)

这段代码使用Seaborn库绘制了一个箱线图，用于比较不同目的地城市（"Destination"）的票价（"Price"），运行结果如下：

14.从目标列中创建虚拟列

destination = train_data[['Destination']]
destination = pd.get_dummies(destination,drop_first=True)
destination.head()

这段代码对`train_data` DataFrame中的"Destination"列进行了独热编码（One-Hot Encoding）的处理：

首先，代码使用`train_data[['Destination']]`选择了"Destination"列，并将其赋值给新的DataFrame `destination`。这样做是为了将"Destination"列单独提取出来，以便进行独热编码的处理。

接下来，代码使用`pd.get_dummies()`函数对`destination` DataFrame进行独热编码。`pd.get_dummies()`函数将分类变量转换为二进制的独热编码表示。通过设置`drop_first=True`，代码删除了独热编码生成的第一列，以避免多重共线性问题。

最终，独热编码后的结果存储在`destination` DataFrame中，每个目的地城市的名称都被转换为相应的二进制编码列。这种编码形式可以更好地表示目的地城市之间的分类关系，以便于后续的分析和建模。调用`destination.head()`可以显示独热编码后的DataFrame的前几行数据。

运行结果如下：

15.删除无用的列

train_data.drop(['Route','Additional_Info'],inplace=True,axis=1)

这段代码对`train_data` DataFrame进行了列删除操作，删除了"Route"和"Additional_Info"两列。下面是代码的详细解释：

- `train_data.drop(['Route','Additional_Info'],inplace=True,axis=1)`: 这行代码使用`drop()`函数对`train_data` DataFrame进行列删除操作。通过指定`['Route','Additional_Info']`作为要删除的列名列表，代码删除了"Route"和"Additional_Info"两列。`inplace=True`表示在原地修改`train_data` DataFrame，`axis=1`表示删除列。

这段代码的执行将从`train_data` DataFrame中删除了"Route"和"Additional_Info"两列，使得DataFrame中只保留了与航班相关的特征列。这是因为"Route"列包含航班的具体路线信息，"Additional_Info"列包含一些额外的航班信息，而这些信息对于后续的分析和建模任务不是必需的。

16.统计"Total stops"列中的数值

train_data['Total_Stops'].value_counts()

这段代码统计了‘train_data’ DataFrame中"Total_Stops"列的不同取值及其出现的频数。运行结果如下：

17.将"Total_stops"列中的标签转换为数字

train_data['Total_Stops'].replace({'non-stop':0,'1 stop':1,'2 stops':2,'3 stops':3,'4 stops':4},inplace=True)
train_data.head()

这段代码对`train_data` DataFrame中的"Total_Stops"列进行了取值替换操作。下面是代码的解释：

- `train_data['Total_Stops'].replace({'non-stop':0,'1 stop':1,'2 stops':2,'3 stops':3,'4 stops':4},inplace=True)`: 这行代码使用`replace()`函数将"Total_Stops"列中的特定取值替换为相应的数值。通过提供一个字典作为参数，代码指定了要替换的取值及其对应的替换值。具体而言，"non-stop"被替换为0，"1 stop"被替换为1，"2 stops"被替换为2，"3 stops"被替换为3，"4 stops"被替换为4。`inplace=True`表示在原地修改`train_data` DataFrame。

执行该代码将对"Total_Stops"列中的取值进行替换操作。原先的文本值（例如"non-stop"、"1 stop"）被替换为对应的数值（0、1）。这样做可以将该列的数据转换为数值形式，方便后续的分析和建模任务。调用`train_data.head()`可以显示替换后的DataFrame的前几行数据。

运行结果如下：

18.检查我们的4个数据框的形状

print(airline.shape)
print(source.shape)
print(destination.shape)
print(train_data.shape)

运行结果如下：

19.合并所有 4 个数据框

data_train = pd.concat([train_data,airline,source,destination],axis=1)
data_train.drop(['Airline','Source','Destination'],axis=1,inplace=True)
data_train.head()

这段代码将经过独热编码后的`airline`、`source`和`destination`数据集与经过预处理后的`train_data`数据集进行合并，并生成一个新的数据集 `data_train`。运行结果如下：

20.提取训练数据

X = data_train.drop('Price',axis=1)
X.head()

这段代码将`data_train`数据集中的"Price"列删除，生成一个新的数据集 `X`，该数据集用于存储训练特征。最终，`X`数据集包含了`data_train`数据集中除了"Price"列之外的所有特征列。

运行结果如下：

21.提取训练数据标签

y = data_train['Price']
y.head()

这段代码将`data_train`数据集中的"Price"列提取出来，生成一个新的数据集 `y`，该数据集用于存储目标变量（价格）。下面是代码的解释：

- `y = data_train['Price']`: 这行代码通过索引操作，将`data_train`数据集中的"Price"列提取出来，并将结果赋值给新的数据集 `y`。

最终，`y`数据集包含了`data_train`数据集中的"Price"列，即目标变量（价格）。通过调用 `y.head()`，可以显示新数据集的前几行数据。这样做是为了准备训练数据，将目标变量存储在 `y` 中，以便进行后续的机器学习模型训练和预测任务。运行结果如下：

22.检查列之间的相关性

train_data_copy = train_data.copy()
string_columns = train_data_copy.select_dtypes(include=['object']).columns
train_data_copy = train_data_copy.drop(string_columns, axis=1)
plt.figure(figsize=(7,7))
sns.heatmap(train_data_copy.corr(),cmap='viridis',annot=True)

以上代码会生成一个热力图，其中每个小方块的颜色表示对应特征之间的相关性。颜色越深表示相关性越强，颜色越浅表示相关性越弱。通过观察热力图，可以了解特征之间的相关性情况，有助于选择和理解数据集中的特征。运行结果如下：

23.首先尝试用于航班价格预测的 ExtraTreesRegressor 模型

ExtraTreesRegressor（极端随机森林回归器）是一种基于随机森林算法的回归模型。它是集成学习方法的一种变体，通过构建多个决策树并对它们的预测结果进行平均来进行回归任务。与传统的随机森林相比，ExtraTreesRegressor 在构建决策树时引入了更高的随机性。在每个节点上，它随机选择一个特征的子集来进行分割，而不是考虑所有的特征。此外，它还使用随机的阈值来进行特征分割。通过引入更多的随机性，ExtraTreesRegressor 增加了模型的多样性，减少了过拟合的风险。ExtraTreesRegressor 在回归问题中具有良好的性能。它能够处理数值型特征和离散型特征，并可以处理缺失数据。此外，由于它的并行化能力，它能够高效地处理大规模数据集。

reg = ExtraTreesRegressor()
reg.fit(X,y)
print(reg.feature_importances_)

这段代码使用ExtraTreesRegressor模型对特征矩阵X和目标变量y进行训练，并打印出每个特征的重要性。下面是代码的解释：

- `reg = ExtraTreesRegressor()`: 这行代码创建了一个名为reg的ExtraTreesRegressor回归模型对象。

- `reg.fit(X, y)`: 这行代码使用X作为特征矩阵，y作为目标变量，对模型进行训练。模型会学习如何根据特征预测目标变量。

- `print(reg.feature_importances_)`: 这行代码打印出每个特征的重要性。`feature_importances_`是ExtraTreesRegressor模型的属性，表示各个特征对于预测目标变量的重要性。通过打印该属性，可以了解每个特征对于模型的贡献程度。

执行以上代码，会训练ExtraTreesRegressor模型并输出每个特征的重要性值。重要性值越高表示对目标变量的预测影响越大。这样的信息可以帮助我们理解数据集中的特征，识别哪些特征对于模型的预测最具有影响力。运行结果如下：

24.可视化 ExtraTreesRegressor 提供的特征重要性¶

plt.figure(figsize = (12,8))
feat_importances = pd.Series(reg.feature_importances_, index=X.columns)
feat_importances.nlargest(20).plot(kind='barh')
plt.show()

这段代码用于绘制特征重要性的水平条形图，显示具有最高重要性的前20个特征。下面是代码的解释：

- `plt.figure(figsize=(12, 8))`: 这行代码创建一个大小为(12, 8)的新图形窗口，用于绘制后续的条形图。

- `feat_importances = pd.Series(reg.feature_importances_, index=X.columns)`: 这行代码创建了一个名为feat_importances的Series对象，其中包含特征重要性值，索引为X.columns，即特征的列名。

- `feat_importances.nlargest(20).plot(kind='barh')`: 这行代码选择特征重要性值中最大的20个值，并以水平条形图的形式进行绘制。`.nlargest(20)`方法用于选择最大的20个值，`kind='barh'`表示绘制水平条形图。

- `plt.show()`: 这行代码显示绘制的条形图。

执行以上代码会生成一个水平条形图，显示了具有最高重要性的前20个特征。每个特征以条形的形式表示，条形的长度表示特征的重要性值。通过观察条形图，可以快速了解哪些特征对于预测目标变量的影响最大。运行结果如下：

25.将我们的数据拆分为训练和测试数据

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 42)

这段代码使用`train_test_split`函数将数据集`X`和目标变量`y`划分为训练集和测试集，划分比例为80%的数据用于训练，20%的数据用于测试。划分后的训练集和测试集可以用于机器学习模型的训练和评估。

26.训练随机森林回归模型以进行航班价格预测

n_estimators = [int(x) for x in np.linspace(start = 100, stop = 1200, num = 12)]
max_features = ['auto', 'sqrt']
max_depth = [int(x) for x in np.linspace(5, 30, num = 6)]
min_samples_split = [2, 5, 10, 15, 100]
min_samples_leaf = [1, 2, 5, 10]
random_grid = {'n_estimators': n_estimators,
               'max_features': max_features,
               'max_depth': max_depth,
               'min_samples_split': min_samples_split,
               'min_samples_leaf': min_samples_leaf}

rf_random = RandomizedSearchCV(estimator = RandomForestRegressor(), param_distributions = random_grid,scoring='neg_mean_squared_error', n_iter = 10, cv = 5, verbose=1, random_state=42, n_jobs = 1)
rf_random.fit(X_train,y_train)

这段代码用于进行随机搜索(Randomized Search)以找到随机森林模型(Random Forest)的最佳超参数组合。下面是代码的解释：

- `n_estimators`: 这是一个列表，包含了要尝试的随机森林中树的数量。在这个例子中，从100到1200之间生成了12个等间距的整数值。

- `max_features`: 这是一个列表，包含了每个决策树在拆分节点时要考虑的特征数量。'auto'表示将特征数量设置为总特征数量的平方根，'sqrt'表示与'auto'相同。

- `max_depth`: 这是一个列表，包含了决策树的最大深度。在这个例子中，从5到30之间生成了6个等间距的整数值。

- `min_samples_split`: 这是一个列表，包含了拆分内部节点所需的最小样本数。列表中的值表示要尝试的不同最小样本拆分数。

- `min_samples_leaf`: 这是一个列表，包含了每个叶子节点所需的最小样本数。列表中的值表示要尝试的不同最小叶子样本数。

- `random_grid`: 这是一个字典，包含了上述超参数的可能取值。每个超参数都有一个对应的列表作为值。

- `RandomizedSearchCV`: 这是一个用于随机搜索的交叉验证对象。在这个例子中，使用随机森林回归器(RandomForestRegressor)作为估计器(estimator)，使用neg_mean_squared_error作为评分指标(scoring)，进行5折交叉验证(cv)，搜索100个不同的超参数组合(n_iter=10)，并设置了一些其他参数。

- `rf_random.fit(X_train, y_train)`: 这行代码开始执行随机搜索过程，通过使用训练集(X_train, y_train)进行拟合。搜索过程将尝试不同的超参数组合，并根据指定的评分指标在交叉验证中评估模型的性能。

执行以上代码将执行随机搜索过程，目标是找到最佳的随机森林超参数组合，以获得更好的模型性能。搜索过程将尝试不同的超参数组合，并在交叉验证中评估每个组合的性能。一旦搜索完成，`rf_random`对象将存储找到的最佳超参数组合。

27.查看使用随机搜索交叉验证（Randomized Search CV）获得的最佳参数

rf_random.best_params_

`rf_random.best_params_` 是一个属性，用于获取随机搜索过程中找到的最佳超参数组合。在这段代码中，它将返回一个字典，包含了找到的最佳超参数组合。你可以通过打印这个属性来查看最佳超参数组合的取值。例如，执行 `print(rf_random.best_params_)` 将打印出最佳超参数组合的取值。

请注意，由于每次随机搜索的结果可能不同，因此在不同的运行中，找到的最佳超参数组合可能会有所变化。运行结果如下：

28.进行预测

prediction = rf_random.predict(X_test)

这行代码用于使用随机森林模型进行预测，并将预测结果存储在`prediction`变量中。其中的`rf_random`是通过随机搜索找到的具有最佳超参数的随机森林模型对象，而`X_test`则是用于预测的测试集特征矩阵。预测结果是对测试集样本的目标变量（航班价格）的预测值。

29.绘制残差图

plt.figure(figsize = (8,8))
sns.distplot(y_test-prediction)
plt.show()

这段代码用于绘制预测结果与实际结果之间的误差分布图。下面是代码的解释：

- `plt.figure(figsize=(8, 8))`: 这行代码创建一个大小为(8, 8)的新图形窗口，用于绘制后续的图形。

- `sns.distplot(y_test-prediction)`: 这行代码绘制误差分布图，其中`y_test-prediction`表示实际结果与预测结果之间的差异（误差）。`sns.distplot()`函数用于绘制直方图和拟合的核密度估计曲线，展示误差的分布情况。

- `plt.show()`: 这行代码显示绘制的图形。

执行以上代码会生成一个误差分布图，展示了实际结果与预测结果之间的差异。图形中的直方图表示误差的分布情况，核密度估计曲线则表示误差的概率密度分布。通过观察误差分布图，可以评估模型的预测准确度和误差的分布情况。运行结果如下：

30.绘制真实值与预测值的散点图

plt.figure(figsize = (6,6))
plt.scatter(y_test, prediction, alpha = 0.5)
plt.xlabel("y_test")
plt.ylabel("y_pred")
plt.show()

这段代码用于绘制实际结果与预测结果之间的散点图，用于可视化实际结果与预测结果之间的关系。每个散点代表一个样本，横坐标表示实际结果，纵坐标表示预测结果。通过观察散点图，可以评估模型的预测准确度和预测结果与实际结果之间的相关性。运行结果如下：

31.打印度量指标

print('r2 score: ', metrics.r2_score(y_test,prediction))

这行代码用于计算并打印模型的 R² 分数。下面是代码的解释：

- `metrics.r2_score(y_test, prediction)`: 这行代码使用 `metrics` 模块中的 `r2_score` 函数计算预测结果 `prediction` 相对于实际结果 `y_test` 的 R² 分数。R² 分数是一种用于评估回归模型拟合优度的指标，其取值范围在 0 到 1 之间，越接近 1 表示模型对观测数据的拟合越好。

- `print('r2 score: ', metrics.r2_score(y_test, prediction))`: 这行代码将计算得到的 R² 分数打印输出。

执行以上代码将输出模型的 R² 分数，评估模型对测试集数据的拟合优度。R² 分数越接近 1，表示模型对观测数据的拟合越好。运行结果如下：

32.保存我们的模型

file = open('flight_rf.pkl', 'wb')
pickle.dump(rf_random, file)

这段代码用于将训练好的随机森林模型保存到文件中。下面是代码的解释：

- `file = open('flight_rf.pkl', 'wb')`: 这行代码创建一个名为 `'flight_rf.pkl'` 的文件，并以二进制写入模式（`'wb'`）打开。`'flight_rf.pkl'` 是保存模型的文件名，可以根据需要进行修改。

- `pickle.dump(rf_random, file)`: 这行代码使用 `pickle` 模块的 `dump` 函数将随机森林模型 `rf_random` 保存到打开的文件中。`pickle.dump()` 函数将对象序列化并写入文件，以便后续可以重新加载模型。

执行以上代码将把训练好的随机森林模型保存到名为 `'flight_rf.pkl'` 的文件中。这样可以在以后的使用中加载模型，而无需重新训练。

以上就是使用机器学习算法预测航班价格的完整过程，若需要了解更多有关机器学习的实验项目，请关注博主~

你可能感兴趣的:(机器学习项目,python,机器学习,数据分析,随机森林)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
seaborn又一个扩展heatmapz qq_21478261 #Python可视化 matplotlib
推荐阅读：Pythonmatplotlib保姆级教程嫌Matplotlib繁琐？试试Seaborn！
NGS测序基础梳理01-文库构建（Library Preparation） qq_21478261 #生物信息生物学
本文介绍Illumina测序平台文库构建（LibraryPreparation）步骤，文库结构。写作时间：2020.05。推荐阅读：10W字《Python可视化教程1.0》来了！一份由公众号「pythonic生物人」精心制作的PythonMatplotlib可视化系统教程，105页PDFhttps://mp.weixin.qq.com/s/QaSmucuVsS_DR-klfpE3-Q10W字《Rg
Python 常用内置函数详解（七）：dir()函数——获取当前本地作用域中的名称列表或对象的有效属性列表
目录一、功能二、语法和示例一、功能dir()函数获取当前本地作用域中的名称列表或对象的有效属性列表。二、语法和示例dir()函数有两种形式，如果没有实参，则返回当前本地作用域中的名称列表。如果有实参，它会尝试返回该对象的有效属性列表。如果对象有一个名为__dir__()的方法，那么该方法将被调用，并且必须返回一个属性列表。dir()函数的语法格式如下：C:\Users\amoxiang>ipyth
pythonjson中list操作_Python json.dumps 特殊数据类型的自定义序列化操作
场景描述：Python标准库中的json模块，集成了将数据序列化处理的功能；在使用json.dumps()方法序列化数据时候，如果目标数据中存在datetime数据类型，执行操作时，会抛出异常：TypeError:datetime.datetime(2016,12,10,11,04,21)isnotJSONserializable那么遇到json.dumps序列化不支持的数据类型，该怎么办！首先，
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
Python 日期格式转json.dumps的解决方法 douyaoxin python json 开发语言
classDateEncoder(json.JSONEncoder):defdefault(self,obj):ifisinstance(obj,datetime.datetime):returnobj.strftime('%Y-%m-%d%H:%M:%S')elifisinstance(obj,datetime.date):returnobj.strftime("%Y-%m-%d")json.d
Python 爬虫实战：视频平台播放量实时监控（含反爬对抗与数据趋势预测）西攻城狮北 python 爬虫音视频
一、引言在数字内容蓬勃发展的当下，视频平台的播放量数据已成为内容创作者、营销人员以及行业分析师手中极为关键的情报资源。它不仅能够实时反映内容的受欢迎程度，更能在竞争分析、营销策略制定以及内容优化等方面发挥不可估量的作用。然而，视频平台为了保护自身数据和用户隐私，往往会设置一系列反爬虫机制，对数据爬取行为进行限制。这就向我们发起了挑战：如何巧妙地突破这些限制，同时精准地捕捉并预测播放量的动态变化趋势
Python技能手册 - 模块module 金色牛神 Python python windows 开发语言
系列Python常用技能手册-基础语法Python常用技能手册-模块modulePython常用技能手册-包package目录module模块指什么typing数据类型int整数float浮点数str字符串bool布尔值TypeVar类型变量functools高阶函数工具functools.partial()函数偏置functools.lru_cache()函数缓存sorted排序列表排序元组排序
Ubuntu基础（Python虚拟环境和Vue） aaiier ubuntu python linux
Python虚拟环境sudoaptinstallpython3python3-venv进入项目目录cdXXX创建虚拟环境python3-mvenvvenv激活虚拟环境sourcevenv/bin/activate退出虚拟环境deactivateVue安装Node.js和npm#安装Node.js和npm（Ubuntu默认仓库可能版本较旧，适合入门）sudoaptinstallnodejsnpm#验
苦练Python第9天：if-else分支九剑 python后端前端人工智能
苦练Python第9天：if-else分支九剑前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众号：倔强青铜三。欢迎点赞、收藏、关注，一键三连！！！欢迎来到100天Python挑战第9天！今天我们不练循环，改磨“分支剑法”——ifelse三式：单分支、双分支、多分支，以及嵌套和三元运算符，全部实战演练，让
苦练Python第8天：while 循环之妙用 python后端前端人工智能
苦练Python第8天：while循环之妙用原文链接：https://dev.to/therahul_gupta/day-9100-while-loops-with-real-world-examples-528f作者：RahulGupta译者：倔强青铜三前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它