为什么昵称不能重复

【机器学习】Xgboost的使用及参数详解

Xgboost的安装
Xgboost的使用
- Xgboost的原生库
- - 读取数据
  - 设置参数
  - - 一般参数
    - 弱评估器参数
    - 任务参数
  - 训练模型
  - 预测结果
  - 示例代码
  - - 示例1
    - 示例2
- 基于sklearnAPI的Xgboost
- - xgboost.XGBRegressor
  - - 参数
    - 属性和方法
  - xgboost.XGBClassifier
  - xgboost.XGBRFRegressor
  - xgboost.XGBRFClassifier
  - 示例代码
- Plotting API
- - xgboost.plot_importance
  - - 参数
  - xgboost.plot_tree
  - - 参数
  - xgboost.to_graphviz
  - - 参数
  - 示例代码

Xgboost的安装

由于Xgboost底层是C++实现的，所以需要先安装Microsoft Visual C++，安装 2015-2019任意一个版本就行；安装完毕后可以在控制面板查看安装结果：

然后命令行执行pip install xgboost即可

Xgboost的使用

Xgboost的原生库

使用Xgboost的原生库进行学习的流程大致如下：

读取数据
xgboost.Dmatrix()

设置参数
param={}

训练模型
bst=xgboost.train(param)

预测结果
bst.predict()

下面按照图示流程讲解每一步的参数

读取数据

原生库的数据必须封装在DMatrix中才能进行训练；Dmatrix是Xgboost自定义的一个数据矩阵类，用于封装数据，这种定义方式可以优化存储和运算速度，其参数如下：

data：训练数据（注意Dmatrix要求数据类型只能是int、float、bool之一，所以数据中如果有字符串类型需提前进行编码）
label：训练数据的标签（注意Dmatrix要求数据类型只能是int、float、bool之一，所以数据中如果有字符串类型需提前进行编码）
weight：样本的权重
base_margin：样本偏置，是一个N*1的数组，N为样本数
missing：float型，输入数据中如果有缺失值则以该值替代，默认为np.nan
silent：在计算过程中是否要输出信息，True表示不输出，默认为False
feature_names：特征名称
feature_types：特征类型
nthread：加载数据时的线程数，-1代表使用所有可用线程

类方法有以下几个（还有一些不常用的参考文末官方文档）：

feature_names()：获取特征名
feature_types()：获取特征类型
get_base_margin()：获取样本的偏置
get_label()：获取标签
get_weight()：获取权重
num_col()：获取特征数
num_row()：获取样本数
save_binary(fname, silent=True)：储存Dmatrix，fname为存储路径，silent控制是否输出信息；储存的数据可以通过xbgoost.Dmatrix(fname)取出

设置参数

一般参数

booster：弱评估器，可以是gbtree，gblinear，dart，默认是gbtree
disable_default_eval_metric：是否禁用默认的（验证集的）评估指标，注意如果你要用自定义的评估指标，需要将这一项设为True
nthread：训练模型时用的并行线程数
verbosity：控制训练过程中输出信息的多少，取值为0， 1， 2， 3，默认为1
validate_parameters：是否检查参数

弱评估器参数

基于树的弱评估器（gbtree, dart）的参数主要有以下几个：

eta：学习率，默认为0.3
gamma：叶节点继续分裂所需的最小损失函数下降值，默认为0，即不断增加树的深度直到损失函数不再下降
max_depth：树的最大深度，默认为6
min_child_weight：叶节点继续分裂所需的最小样本权重，默认为1
subsample：训练样本的采样率，默认为1，即每次都用所有样本做提升
sampling_method：样本采样方法，默认为均匀采样
colsample_bytree, colsample_bylevel, colsample_bynode：特征采样率，colsample_bytree决定构建每一棵树的时候的采样率，colsample_bylevel决定树的深度每增加一层时的采样率，colsample_bynode决定每次叶节点分裂时的采样率，这三个参数默认都为1；在训练模型时三个参数的作用是累积的，例如数据共128个特征，colsample_bytree=colsample_bylevel=colsample_bynode=0.5，那么每个叶节点分裂时用到的特征数就是16
lambda：L2正则化系数，默认为1
alpha：L1正则化系数，默认为0
tree_method：构建树采用的算法，可选值有：auto, exact, approx, hist, gpu_hist，默认为auto

如果你选的弱评估器为dart，注意它在训练时会采用dropout方法，即随机丢掉一部分树以防止过拟合，因而此时会有如下额外的参数：

sample_type：树模型的采样算法，默认均匀采样
normalize_type：树的权重的归一化算法，具体公式见文末官方文档
rate_drop：删除率，默认是0
one_drop：开启这个功能将保证每次dropout至少会删除一棵树，默认为0（关闭）
skip_drop：在一次迭代中不做dropout的概率，该参数优先于rate_drop和one_drop，默认为0

线性弱评估器（gblinear）的参数如下：

lambda：L2正则化系数，默认为0
alpha：L1正则化系数，默认为0
updater：拟合线性模型的算法，默认为shotgun算法
feature_selector：特征选择方法，默认依次选择特征（cyclic）

任务参数

objective：学习目标，默认为reg:squarederror，即以平方损失为损失函数的回归模型；除此之外还有：

参数	对应的学习目标
`reg:squaredlogerror`	以均方对数损失为损失函数的回归模型
`reg:logistic`	逻辑回归模型
`binary:logistic`	二分类逻辑回归模型（输出为概率，即Sigmoid函数值）
`binary:logitraw`	二分类逻辑回归模型（输出为 $w^Tx$ ，即Sigmoid函数的参数）
`binary:hinge`	使用合页损失函数（hinge loss）的二分类模型（输出为0或1）
`multi:softmax`	使用softmax作为目标函数的多分类模型

base_score：所有样本的初始偏置值，默认0.5
eval_metric：验证数据集的评估指标，分类问题默认为对数损失函数，回归问题默认为均方根损失函数
seed：随机数种子

训练模型

原生Xgboost库既可以用来处理分类问题，也可以用来处理回归问题，实现方法都是调用train()函数；该函数参数如下：

params：上一步定义的参数列表
dtrain：第一步读取的训练数据
num_boost_round：迭代次数
evals：验证数据集，该参数必须是由(Dmatrix, string)构成的列表，第二个string参数是用于输出的，可以任意设置
obj：自定义目标函数
feval：自定义评估函数；该参数起作用需要evals非空，并且将一般参数中的disable_default_eval_metric设为True
maximize：是否要最大化feval
early_stopping_rounds：控制训练速度；如果在验证数据集上迭代early_stopping_rounds次后损失函数没有下降就停止训练；要求evals参数不能为空
verbose_eval：控制评估模型过程中的输出数量，bool类型或int类型，默认为True，即每个提升阶段都输出相应信息；要求evals参数非空
xgb_model：加载模型（传入文件路径）
callbacks：回调函数（列表），在每轮迭代结束后调用

预测结果

上一步train()函数返回的是一个Booster类，我们可以调用这个类的predict()方法进行预测，该函数常用的两个参数如下：

data：测试集数据
ntree_limit：预测时使用的树的数量，默认为0（使用所有树）

示例代码

示例1

from sklearn.datasets import load_boston, load_iris
from sklearn.metrics import mean_squared_error, accuracy_score
from sklearn.model_selection import train_test_split
import xgboost as xgb

## 使用原生xgboost解决回归问题
# 读取数据
boston_data = load_boston()
X = boston_data.data
y = boston_data.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=23)

dtrain = xgb.DMatrix(X_train, label=y_train)
dtest = xgb.DMatrix(X_test, label=y_test)

# 设置参数
params = {
    'eta': 0.1,
    'reg_alpha': 0.01,
    'reg_lambda': 0.01,
    'max_depth': 10
}

# 训练模型
bst = xgb.train(
    params=params,
    dtrain=dtrain,
    num_boost_round=20
)

# 预测结果
ypred = bst.predict(dtest)
print('MSE of prediction on boston dataset:', mean_squared_error(y_test, ypred))
print('\n')

## 使用原生xgboost解决分类问题
# 读取数据
iris_data = load_iris()
X = iris_data.data
y = iris_data.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=23)

dtrain = xgb.DMatrix(X_train, label=y_train)
dtest = xgb.DMatrix(X_test, label=y_test)

# 设置参数
params = {
    'objective': 'multi:softmax',
    'num_class': 3,
    'eta': 0.1,
    'reg_alpha': 0.01,
    'reg_lambda': 0.01,
    'max_depth': 8
}

# 训练模型
bst = xgb.train(
    params=params,
    dtrain=dtrain,
    num_boost_round=20,
    evals=[(dtrain, 'train'), (dtest, 'test')] # 将训练数据和测试数据都作为验证集，可以实时监督训练情况，是否过拟合
)

# 预测结果
result = bst.predict(
    dtest,
    ntree_limit=10
)
print('Accuracy of prediction on iris dataset:', accuracy_score(y_test, result))

输出：

注意objective参数如果不设置的话其实不会影响学习效果，因为该模型会根据数据判断当前问题是分类问题还是回归问题，如下所示：

iris_data = load_iris()
X = iris_data.data
y = iris_data.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=23)

dtrain = xgb.DMatrix(X_train, label=y_train)
dtest = xgb.DMatrix(X_test, label=y_test)

# 设置参数
params = {
    # 'objective': 'multi:softmax',
    'num_class': 3,
    'eta': 0.1,
    'reg_alpha': 0.01,
    'reg_lambda': 0.01,
    'max_depth': 8
}

# 训练模型
bst = xgb.train(
    params=params,
    dtrain=dtrain,
    num_boost_round=20,
    evals=[(dtrain, 'train'), (dtest, 'test')]
)

# 预测结果
result = bst.predict(
    dtest,
    ntree_limit=10
)
print('Accuracy of prediction on iris dataset(objective unspecified):', accuracy_score(y_test, result))

输出：

与第一段代码运行结果对比可以发现是一样的

示例2

from sklearn.datasets import load_wine
from sklearn.metrics import accuracy_score
from sklearn.model_selection import train_test_split
import xgboost as xgb
import matplotlib.pyplot as plt

# 读取数据
wine_data = load_wine()
X = wine_data.data
y = wine_data.target
features = wine_data.feature_names
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=23)

dtrain = xgb.DMatrix(X_train, label=y_train)
dtest = xgb.DMatrix(X_test, label=y_test)

# 设置参数
params = {
    'num_class': 3,
    'eta': 0.1,
    'reg_alpha': 0.01,
    'reg_lambda': 0.01,
    'max_depth': 8
}

# 训练模型
bst = xgb.train(
    params=params,
    dtrain=dtrain,
    num_boost_round=10,
    evals=[(dtrain, 'train'), (dtest, 'dtest')]
)

feature_score = bst.get_score(importance_type='gain') # 特征得分（特征重要性）
print(feature_score)

feature_importance = {}
for tag, score in feature_score.items():
    feature_importance[features[int(tag[1:])]] = score

plt.figure(figsize=(12, 8))
plt.bar(range(len(feature_importance)), feature_importance.values())
plt.xticks(range(len(feature_importance)), feature_importance.keys(), rotation=45)
plt.ylabel('Importance')
plt.show()

# 预测结果
result = bst.predict(
    dtest,
    ntree_limit=10
)
print('Accuracy of prediction on wine dataset:', accuracy_score(y_test, result))

输出：

基于sklearnAPI的Xgboost

xgboost包已经封装了XGBRegressor，XGBClassifier，XGBRFRegressor，XGBRFClassifier等学习器，他们的调用方法和sklearn封装的学习器调用方法一样，下面分别介绍他们的参数

xgboost.XGBRegressor

这个类用于解决回归问题

参数

n_estimators：提升树的数量，即训练轮数，等价于原生库的num_boost_round
max_depth：树的最大深度
learning_rate：学习率，等价于原生库的eta
verbosity：控制学习过程中输出信息的多少，取值为0， 1， 2， 3
objective：学习目标及其损失函数，默认为reg:squarederror，即以平方损失为损失函数的回归模型
booster：弱评估器，可以是gbtree，gblinear或dart
n_jobs：训练时并行的线程数
gamma：叶节点继续分裂所需的最小损失函数下降值
min_child_weight：一个叶子节点上所需要的最小样本权重
max_delta_step：树的权重估计中允许的单次最大增量
subsample：对训练样本的采样比例
colsample_bytree, colsample_bylevel, colsample_bynode：参考上文原生库的弱评估器参数
reg_alpha：L1正则化系数
reg_lambda：L2正则化系数
base_score：所有样本的偏置
random_state：随机数种子
missing：缺失值的表达形式，默认为np.nan
importance_type：计算特征重要性的依据，可选项有“gain”, “weight”, “cover”, “total_gain”, “total_cover”，默认为“gain”
tree_method：构建树采用的算法，可选值有：auto, exact, approx, hist, gpu_hist，默认为auto

属性和方法

apply(X, ntree_limit=0)：X为测试数据，维度为[n_samples, n_features]；ntree_limit预测时使用的树的数量，默认为0（使用所有树）；返回维度为[n_samples, n_trees]的数组，第i行第j列表示第i个数据在第j个树中的叶节点的下标
evals_result()：返回验证集上的评估结果
feature_importances_：返回特征重要性

fit()：用给定数据训练模型，其参数如下：

参数	含义
`X`	训练数据集x值
`y`	训练数据集y值
`sample_weight`	样本权重
`base_margin`	样本偏置
`eval_set`	验证数据集（以 $(X, y)$ 组成的列表）
`eval_metric`	评估指标
`early_stopping_rounds`	见上文原生库参数
`verbose`	控制训练过程中输出信息的多少
`xgb_model`	要预加载的模型（字符串类型，即文件路径）
`sample_weight_eval_set`	验证集样本权重
`callbacks`	回调函数

get_booster()：返回模型的弱评估器（只能在fit()之后调用）
get_params()：返回模型参数

predict()：预测，参数如下：

参数	含义
`data`	测试集
`ntree_limit`	预测时使用的树的数量
`validate_features`	默认为True，将会检查测试数据和弱评估器的特征是否一致
`output_margin`	是否返回原始分数（对分类问题原始分数就是 $w^Tx$ ，对回归问题原始分数与预测结果一样），默认为False

save_model(fname)：保存模型，fname为字符串类型，表示文件路径
load_model(fname)：加载模型，fname为字符串类型，表示文件路径

xgboost.XGBClassifier

这个类用于解决分类问题，相比xgboost.XGBRegressor多了一个use_label_encoder参数，表示是否用sklearn的LabelEncoder对类别做编码，默认为True，但官方文档建议将其设为False；另外这个类的objective默认为binary:logistic，除此之外其他参数、属性和方法与xgboost.XGBRegressor相同

xgboost.XGBRFRegressor

这个类也是用于解决回归问题，不过在xgboost的基础上用随机森林算法做了集成，该类的学习率默认为1，subsample默认为0.8，colsample_bynode默认为0.8，reg_lambda默认为0.00001，除此之外其他参数、属性和方法与xgboost.XGBRegressor相同

xgboost.XGBRFClassifier

和xgboost.XGBRFRegressor类似，该模型在xgboost的基础上用随机森林算法做了集成，它也有use_label_encoder参数，默认为True，官方文档建议将其设为False；该类的学习率默认为1，subsample默认为0.8，colsample_bynode默认为0.8，reg_lambda默认为0.00001，除此之外其他参数、属性和方法与xgboost.XGBRegressor相同

示例代码

from sklearn.datasets import load_boston, load_iris
from sklearn.metrics import mean_squared_error, accuracy_score
from sklearn.model_selection import train_test_split
from xgboost import XGBRegressor, XGBClassifier

# 使用skleanAPI xgboost解决回归问题
boston_data = load_boston()
X = boston_data.data
y = boston_data.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=23)

reg = XGBRegressor(
    n_estimators=20,
    learning_rate=0.1,
    max_depth=5)

reg.fit(X_train, y_train)
ypred = reg.predict(X_test)

print('MSE of prediction on boston dataset:', mean_squared_error(y_test, ypred))
print('\n')

# 使用sklearnAPI xgboost解决分类问题
iris_data = load_iris()
X = iris_data.data
y = iris_data.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=23)

xgbc = XGBClassifier(
    learning_rate=0.1,
    n_estimators=20,
    seed=27,
    verbosity=1
)

xgbc.fit(X_train, y_train)
result = xgbc.predict(X_test)

print('Accuracy of prediction on iris dataset:', accuracy_score(y_test, result))

输出：

Plotting API

xgboost包除了以上功能强大的学习器外还封装了几个非常好用的绘图函数

xgboost.plot_importance

参数

booster：弱评估器或xgboost模型实例
ax：matplotlib的Axes对象，默认为None，此时将创建一个新的图
grid：是否加上网格，默认为True
importance_type：特征重要性的计算方法，默认为"weight"，即特征在树中出现的次数；其余可选项为“gain”和“cover”
max_num_features：图中显示的最大特征数，如果是None则显示所有特征（默认）
height：条形图的高度，默认0.2
xlim：元组类型，表示x的取值范围，默认为None
ylim：元组类型，表示x的取值范围，默认为None
title：图的名称，默认为"Feature importance"
xlabel：x轴名称，默认为"F score"
ylabel：y轴名称，默认为"Features"
show_values：是否在图中显示具体数值，默认为True

xgboost.plot_tree

参数

booster：弱评估器或xgboost模型实例
fmap：特征图的文件路径
num_trees：指定要画第几棵树，默认为0（第一棵）
ax：matplotlib的Axes对象，默认为None，此时将创建一个新的图

xgboost.to_graphviz

参数

booster：弱评估器或xgboost模型实例
fmap：特征图的文件路径
num_trees：指定要画第几棵树，默认为0（第一棵）
yes_color：满足节点条件的边的颜色，默认为’#0000FF’
no_color：不满足节点条件的边的颜色，默认为’#FF0000’
condition_node_params：非叶节点的参数，字典类型
leaf_node_params：叶节点的参数，字典类型

示例代码

from sklearn.datasets import load_breast_cancer
from sklearn.metrics import accuracy_score
from sklearn.model_selection import train_test_split
import xgboost as xgb
import matplotlib.pyplot as plt

cancer_data = load_breast_cancer()
X = cancer_data.data
y = cancer_data.target
features = cancer_data.feature_names
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=23)

xgbc = xgb.XGBRegressor(
    learning_rate=0.1,
    n_estimators=20,
    seed=27,
    verbosity=1
)

xgbc.fit(
    X_train, 
    y_train, 
    eval_set=[(X_train, y_train), (X_test, y_test)]
)

fea_imp = xgbc.feature_importances_
print(fea_imp)

输出：

接上文代码

# 由于并不是所有特征都能用上，所以这里统计一下用到的特征
used_features = []

for ind in range(len(features)):
    if fea_imp[ind]:
        used_features.append(features[ind])

fig = plt.figure(figsize=(10, 8))
ax = fig.add_axes([0,0,1,1])
xgb.plot_importance(xgbc, ax)
ax.set_yticklabels(used_features)

输出：

接上文代码

node_params = {
    'shape': 'box',
    'style': 'filled,rounded',
    'fillcolor': '#78bceb'
}

xgb.to_graphviz(xgbc, condition_node_params = node_params)

输出：

接上文代码

result = xgbc.predict(
    X_test,
    ntree_limit=10
)

# 预测结果是概率值，为了用accuracy_score计算准确率需要转换为类别
result = list(map(lambda x: 1 if x>0.5 else 0, result))
print('Accuracy of prediction on cancer dataset:', accuracy_score(y_test, result))

输出：

参考：官方文档

你可能感兴趣的:(机器学习,机器学习,python)

《Python期末备考全攻略：高分秘籍与实用技巧大合集！》跟着小郑学前端 python windows 开发语言数据结构
《Python期末备考全攻略：高分秘籍与实用技巧大合集！》1Python基础语法1.1变量与数据类型1.2条件语句1.3循环语句2.常见数据结构2.1列表2.2元组2.3字典2.4集合3.函数与模块3.1自定义函数3.2匿名函数（lambda）3.3标准库与第三方库4.文件操作4.1文件读写操作5.面向对象编程5.1类与对象5.2继承与多态6.综合练习题与答案1Python基础语法1.1变量与数据
Python 实现 RGB 和 HSV 相互转换算法传说里的故事 python 算法开发语言
Python实现RGB和HSV相互转换算法在图像处理领域，RGB和HSV是两种最常用的颜色空间。RGB是红绿蓝三原色的组合，HSV是色调、饱和度和亮度的组合。在不同应用场景下，需要将RGB和HSV进行相互转换。下面给出Python实现RGB和HSV相互转换的算法，并附上完整的源码。首先，我们需要导入colorsys库。这个库提供了许多颜色空间的转换函数。接下来，我们定义RGBToHSV和HSVTo
让旅游更智能：基于AR的旅游导览应用解析 Echo_Wish Python 笔记 Python算法旅游 ar restful
友友们好！我的新专栏《Python进阶》正式启动啦！这是一个专为那些渴望提升Python技能的朋友们量身打造的专栏，无论你是已经有一定基础的开发者，还是希望深入挖掘Python潜力的爱好者，这里都将是你不可错过的宝藏。在这个专栏中，你将会找到：●深入解析：每一篇文章都将深入剖析Python的高级概念和应用，包括但不限于数据分析、机器学习、Web开发等。●实战案例：通过丰富的实战案例，带你一步步实现
python 实现RGB和HSV相互转换算法 luthane python 算法开发语言
RGB和HSV相互转换算法介绍RGB和HSV之间的相互转换算法可以通过一系列的数学计算来实现。以下是对这两种色彩空间之间转换的基本算法的概述：RGB到HSV的转换1、归一化RGB值：首先，将RGB值从范围[0,255]归一化到[0,1]。这可以通过将每个颜色分量除以255来实现。2、计算明度V：明度V可以通过取RGB三个分量中的最大值来计算。即：[V=max⁡(R,G,B)][V=\max(R,G
【AI日志分析】基于机器学习的异常检测：告别传统规则的智能进阶人工智能机器学习深度学习
摘要随着系统规模的扩大和复杂性增加，传统基于规则的日志分析方法难以识别隐藏的复杂异常模式。本文将介绍基于机器学习的日志异常检测技术，包括模型选择、特征工程及实现步骤。通过具体的代码示例与图表，展示如何高效检测异常日志，并提供应用场景与优化策略。引言日志是系统运行状态的关键数据来源，但面对海量日志数据，传统规则式分析显得力不从心。机器学习能够根据日志的历史数据和行为模式，通过训练模型检测异常情况，不
【Python】edge文件转csv文件海轰Pro 唯有努力 Python python 开发语言
目录简介问题场景解决方案结语简介Hello！非常感谢您阅读海轰的文章，倘若文中有错误的地方，欢迎您指出～ଘ(੭ˊᵕˋ)੭昵称：海轰标签：程序猿｜C++选手｜学生简介：因C语言结识编程，随后转入计算机专业，获得过国家奖学金，有幸在竞赛中拿过一些国奖、省奖…已保研学习经验：扎实基础+多做笔记+多敲代码+多思考+学好英语！唯有努力本文仅记录自己感兴趣的内容问题场景存在一个类型为edge的文件需要转化为格
centos安装python3 XMYX-0 centos linux python
目录介绍安装依赖下载python安装包安装python建立软连接python3加入PATH变量验证python3安装的一些库psutil模块安装源码安装psutilpip安装windows上安装IPy的安装dns模块安装疑难杂症解决python上下键无法使用的问题安装pip以及setuptools安装pip测试：其他安装node以及pm2介绍Python是一种广泛应用的编程语言，原由荷兰国家数学与
python把列表插入列表 Zoert
python相关学习资料：https://edu.51cto.com/video/4102.htmlhttps://edu.51cto.com/video/1158.htmlhttps://edu.51cto.com/video/4645.htmlPython中列表的嵌套与操作在Python编程中，列表（List）是一种非常重要的数据结构，它不仅可以存储数据，还可以进行各种操作，如插入、删除、排序
python列表同时添加多个元素_如何将两个列表中的元素一起添加(how do i add elements from two lists together)... weixin_39627481
如何将两个列表中的元素一起添加(howdoiaddelementsfromtwoliststogether)我有两个这样的列表：l_1n-values...List不是专业的，所以专业级别没有多大意义。只有Array是专门的。classPoly[T](valcoef:List[T]){def+(op:Poly[T])(implicitadder:(T,T)=>T)=newPoly(Poly.com
【Python】Python之列表List添加插入元素 mjiansun Python
本文代码上下文person_dev_group=["徐强","倍总","航神"]第一种方式：append（）方法说明：list的实例方法append（），会在list的尾部添加一个元素person_dev_group.append("大森")第二种方式：insert（）方法，指定下标说明：index值可以为正数、也可以为负数，超出list范围的index值，将在list的头部或者尾部插入元素per
Centos7在线快速安装python3 ascarl2010 Linux系统运维 linux python
首先安装依赖包：yum-yinstallgcczlib-develbzip2-developenssl-develncurses-develsqlite-develreadline-develtk-devellibffi-develxz-devel使用国内镜像源下载Python源码（以Python3.8.12为例）：wgethttps://mirrors.huaweicloud.com/pytho
python打印对角线相连的菱形米酒馆 PYTHON python 开发语言
【开发该软件的操作系统】：windows10【软件开发环境/开发工具】：PyCharm【编程语言】：Python【开发目的】：这是老师布置的作业啦~供初学者参考学习【开发者】：江西农业大学2020级大二学生代码实现：输入菱形边长，打印对角线相连的菱形。代码如下：#打印对角线相连的菱形n=int(input('请输入菱形每边星星个数，n='))m=t=2*n-1#双重赋值,m和t为行数whilem>
【Python】高效的Web自动化测试利器—Python+Playwright快速上手自动化实战指南墩墩分墩 Python python 自动化测试 playwright 爬虫 UI自动化
文章目录前言一.playwright是什么二.python引入playwright1.安装2.playwright命令行参数3.playwrightcodegen自动生成代码4.Chrome和Chromium有什么关系？三.基本概念1.无头浏览器（HeadlessBrowser）2.同步和异步模式操作playwright2.1.同步（Sync）模式同步方式代码模板2.2.异步（Async）模式异步
【Python】记录生产编程小tips(字符串处理、列表删除、字典、csv、excel操作)持续更新墩墩分墩 Python python 开发语言字符串操作时间转换列表删除
文章目录一.for循环删除列表元素1.删除list元素方法2.直接删除往往结果与期望不一致3.循环删除元素的正确方法：方法1：while循环+i减方法2：使用copy方法3：倒叙遍历二.字符串处理库三.dict字典1.dict运用2.循环删除dict的键值对1.使用for循环和del语句2.使用字典推导式（创建新字典）3.使用popitem()方法（在Python3.7+中有序）4.使用items
centos下安装python3详细教程_centos python m0_60635321 2024年程序员学习 centos python linux
yum-yinstalllibffi-devel#安装pipyuminstallpython-pip*####4.用pip装wgetpipinstallwget*####5.用wget下载python3的源码包（评论区网友提供了淘宝镜像，替换了官网下载python3，提高下载速度）wgethttp://npm.taobao.org/mirrors/python/3.7.5/Python-3.7.5
Edge-TTS：Python中的微软Edge在线文本转语音服务葛佩蔷
Edge-TTS：Python中的微软Edge在线文本转语音服务edge-ttsUseMicrosoftEdge'sonlinetext-to-speechservicefromPythonWITHOUTneedingMicrosoftEdgeorWindowsoranAPIkey项目地址:https://gitcode.com/gh_mirrors/ed/edge-tts项目基础介绍和主要编程语
Python语法总结彧侠脚本处理 Python
Python作为一种解释型的脚本语言，无论从自动化运维、大数据处理还是人工智能都得到了广泛的应用，而且它好理解、易学习、上手快的特点也使它成为了当下最火热的开发语言之一。下面就对Python语言中的各种语法做一个总结，以备后用数据类型一、整数二、浮点数三、字符串四、布尔值五、空值print语句注释什么是变量比如：定义字符串raw字符串与多行字符串Unicode字符串字符串还有一个编码问题。整数和浮
python算法毕业设计开题答疑 DD项目分享家毕业设计 python 毕设
文章目录0简介1如何选题2最新软件工程毕设选题3最后0简介丹成学长，搜集分享最新的软件工程业专业毕设选题，难度适中，适合作为毕业设计，大家参考。学长整理的题目标准：相对容易工作量达标题目新颖选题指导,项目分享：见文末1如何选题最近非常多的学弟学妹问学长关于选题的问题，所以今天学长来教大家如何进行毕业设计选题！毕业设计的选题尤为重要，选好题目是最终完成毕业设计的第一步。因为题目的选择跟之后的设计实现
Python Turtle艺术绘画赏析与编程自由徜徉碧海蓝天 python 开发语言爬虫编程
PythonTurtle是一个强大的绘图库，通过简单的命令和指令，可以在屏幕上绘制出各种图形和艺术作品。本文将介绍PythonTurtle艺术绘画的一些技巧和示例代码，帮助您了解如何使用PythonTurtle库来创作独特的艺术作品。在开始之前，确保您已经安装了Python和Turtle库。如果您还没有安装，可以通过Python的官方网站下载并安装Python，然后在命令行中使用以下命令安装Tur
大学生python编程小游戏,python初学者小项目 2301_81895949 java 前端服务器人工智能
大家好，本文将围绕大学生python编程小游戏展开说明，python初学者小项目是一个很多人都想弄明白的事情，想搞清楚python做简单的项目需要先了解以下几个事情。开发教程目录前前言——是大佬就别进来看了，远古项目，写的很菜前言——学会项目开发项目开发的意义和重要性如何去开发一个项目(理论)开发前期准备(了解业务)项目设计项目需求讨论项目开发规划项目资源的准备源代码的编写开发后期处理正文——开发
华为OD机试E卷 --英文输入法--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript c语言 python
文章目录题目描述输入描述输出描述用例JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述主管期望你来实现英文输入法单词联想功能。需求如下：•依据用户输入的单词前缀，从已输入的英文语句中联想出用户想输入的单词，按字典序输出联想到的单词序列，•如果联想不到，请输出用户输入的单词前缀。注意：英文单词联想时，区分大小写缩略形式如”don’t”，判定为两个单词，”don”和”t”
python+ollama本地大模型批量识别PDF，总结摘要以及关键词并输出EXCEL。月野难浔丶 python pdf 开发语言
现在市场上有很多PDF文件的识别，转化，等等。有些业务可能需要总结摘要和关键词等等一系列的操作。然而随着AI的兴起，本地大模型的部署，这些成为一种很方便的方法，接下来我将为各位介绍我所使用的方法。本篇文章旨在自动化处理PDF文档，提取并清理文本数据，然后使用一种大型模型生成摘要和关键词。最后，处理结果会被整理并输出到Excel文件中，便于后续分析和查看。人工智能（AI）是一种模拟人类智能的科技，它
python edge_tts（文本转音频) Oscar_0208 python 音视频
1.安装插件edge-ttspipinstalledge-tts2.文本转音频""":paramvoice:指定声音名称:paramcontent:文本内容:paramaudioFile:音频输出文件:paramvttFile:字幕输出文件"""asyncdefcreate_tts_mp3(voice:str,content:str,audioFile:str,vttFile:str)->None
Python 编译Edge-TTS（edge_tts）转MP3工具浩读语音朗读 edge-tts python edge 自然语言处理前端
Python编译Edge-TTS利用PIPEdge-tts库来实现Azure神经网络自然语音转MP3，这应该是微软给老百姓们一个共享前沿科技大餐。（edge_tts）找了网上的很多源代，现在利用现有公开的代码混编译一个个人的学习工具。代码仅供学习研究。fromtkinterimport*fromtkinter.filedialogimport*fromtkinter.messageboximpor
使用Cursor调试Python代码的详细步骤 shine_du python java 开发语言 cursor
以下是使用Cursor调试Python代码的详细步骤：一、准备Python代码首先，确保你已经在Cursor中创建了一个Python项目并编写了要调试的Python代码。例如，以下是一段简单的Python代码示例，我们将对其进行调试：defcalculate_sum(numbers):total=0fornumberinnumbers:total+=numberreturntotaldefmain
Python 字符串基本操作 iFulling Python python
字符串基本操作一、字符串拼接+-二、获取字符串的长度-len()三、字符串截取（切片运算）四、字符串分隔-split()五、字符串合并-join()六、检索子串出现次数-count()七、检索子串出现位置1、find()2、index()八、检查是否以指定子串开头-startswith()九、检查是否以指定子串结尾-endswith()十、字符串替换-replace()十一、字符串大小写转换一、字
【Python学习笔记】简单调用百度API应用白马银枪素征袍 python python 百度开发语言
#本文一切代码及理论均来自于郑秋生、夏敏捷二位老师主编《Python项目案例发从入门到实践》一书，本人仅做微改。创作本文的目的仅为总结本人的学习过程和成果，借此巩固。可能存在许多疏漏之处，还请各位同道多多批评指正。今天学的是调用百度API一个章节，百度大家都熟悉，现如今中国最大的互联网企业之一，坐拥大量曾经的“爆款”，甚至拥有堪称第一代中国现象级软件的“百度贴吧”，创造了无数出圈梗，几乎是一代人的
python中文版软件下载-Python IDLE(Python集成开发环境)v3.7中文版编程大乐趣
PythonIDLE是一款汉化版的Python集成开发环境，是一款专门用于各类非商业Python开发的选择，不过一般下载正版的python后，IDLE会自动安装，软件涵盖了语法加亮、段落缩进、基本文本编辑、TABLE键控制、调试程序等功能，这款PythonIDLE是汉化版的，将idlelib.zip解压后替换Python安装目录下的Lib文件夹中的idlelib文件夹即可替代Python原版的ID
Python百度搜索引擎API使用手册宫和举Esmeralda
Python百度搜索引擎API使用手册python-baidusearch自己手写的百度搜索接口的封装，pip安装，支持命令行执行。BaiduSearchunofficialAPIforPythonwithnoexternaldependencies项目地址:https://gitcode.com/gh_mirrors/py/python-baidusearch概览本文档将详细介绍如何安装与使用p
Django 详解飞滕人生TYF django sqlite 数据库
Django是一个高级的PythonWeb框架，用于快速开发安全且可维护的Web应用。它遵循“Djangoforperfectionistswithdeadlines”（为有期限的完美主义者设计）的理念，提供了一套完整的工具包，帮助开发者快速构建Web应用。1.Django基础概念1.1什么是Django？Django是一个基于Python的全栈Web框架，具备如下特点：MVC架构（在Django
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s

【机器学习】Xgboost的使用及参数详解

目录

Xgboost的安装

Xgboost的使用

Xgboost的原生库

读取数据

设置参数

一般参数

弱评估器参数

任务参数

训练模型

预测结果

示例代码

示例1

示例2

基于sklearnAPI的Xgboost

xgboost.XGBRegressor

参数

属性和方法

xgboost.XGBClassifier

xgboost.XGBRFRegressor

xgboost.XGBRFClassifier

示例代码

Plotting API

xgboost.plot_importance

参数

xgboost.plot_tree

参数

xgboost.to_graphviz

参数

示例代码

你可能感兴趣的:(机器学习,机器学习,python)