宏观经济算命椰

python xgboost调参_XGBoost从原理到调参

承接上文挂枝儿：再从GBDT到XGBoost!zhuanlan.zhihu.com

理解了原理，那么接下来就要开始学习怎么调参了，之前做模型的时候用xgboost比较简单粗暴跟着教程一顿乱fit，但最近比较完整的过了下原理之后，找了个sampledata过来想练个手却感觉完全懵逼了，这篇文章就相当于给自己之后把玩xgboost当个baseline guide吧.

对了，虽然这篇文章是写调参的，但我个人还是觉得想要靠调参去极大的改善结果是很难的(还是特征工程重要啊！)

另外kaggle上已经有一些更好的调参方式，比如hyperopt基于贝叶斯优化的方式，所以这篇文章里的方式肯定还是不够炫酷的，所以就当做一个熟悉参数和建模思路的note吧.

这篇分为三个部分：1. XGboost的优势

2. 常用参数列表

3. 调参示例

1. XGBoost的优势

之前从原理层面去理解，那么剥离出学习的场景，xgboost究竟相对与其他算法有什么优势呢？正则化普通的梯度提升算法是没有正则项来防止过拟合的，但xgboost有

并行处理xgboost并行处理数据的速度要比普通提升树算法更快.

不过这个并不是指xgboost可以并行的训练，这部肯定还是串行的，但我们在训练梯度，一棵树上寻找切分点的时候是可以并行的.

自动处理确实数据(不做切分点，但会把缺失值放进左右子树看效果)

剪枝策略普通的提升采用的是贪心算法，只有在不再有增益时才会停止分裂

自带的交叉验证xgboost自带的xgboost.cv允许我们在每新增一棵树的时候都进行交叉验证，这样能够很方便的在既有参数的框架下找到最优number of tree，这个功能和sklearn的graid_search必须给定nestimator不一样.

可以在目前树模型上继续迭代xgboost可以在一整天训练中使用不同的迭代策略(1-10颗树用params1，10~20用param2来训练

2.XGBoost的参数类型总体来说，xgboost有三种参数类型General Parameters(通用): 指导总体的建模方向

Booster Parameters(集成参数): 指导每一棵树(分类or回归)的在每次迭代时的生长方式

Learning Task Parameters(任务参数): 指导在目前框架下的模型优化方式，大小权重。

2.1 通用参数booster [default=gbtree]gbtree 和 gblinear

silent [default=0]0表示输出信息， 1表示安静模式

nthread跑xgboost的线程数，默认最大线程数

2.2 集成参数eta [default=0.3, 可以视作学习率]为了防止过拟合，更新过程中用到的收缩步长。在每次提升计算之后，算法会直接获得新特征的权重。 eta通过缩减特征的权重使提升计算过程更加保守。缺省值为0.3

取值范围为：[0,1]

gamma [default=0, alias: min_split_loss]为了对树的叶子节点做进一步的分割而必须设置的损失减少的最小值，该值越大，算法越保守

range: [0,∞]

max_depth [default=6]用于设置树的最大深度

range: [1,∞]

min_child_weight [default=1]表示子树观测权重之和的最小值，如果树的生长时的某一步所生成的叶子结点，其观测权重之和小于min_child_weight，那么可以放弃该步生长，在线性回归模式中，这仅仅与每个结点所需的最小观测数相对应。该值越大，算法越保守

range: [0,∞]

max_delta_step [default=0]如果该值为0，就是没有限制；如果设为一个正数，可以使每一步更新更加保守通常情况下这一参数是不需要设置的，但是在logistic回归的训练集中类极端不平衡的情况下，将这一参数的设置很有用，将该参数设为1-10可以控制每一步更新

range: [0,∞]

subsample [default=1]表示观测的子样本的比率，将其设置为0.5意味着xgboost将随机抽取一半观测用于数的生长，这将有助于防止过拟合现象

range: (0,1]

colsample_bytree [default=1]表示用于构造每棵树时变量的子样本比率

range: (0,1]

colsample_bylevel [default=1]用来控制树的每一级的每一次分裂，对列数的采样的占比。一般不太用这个参数，因为subsample参数和colsample_bytree参数可以起到相同的作用。

range: (0,1]

lambda [default=1, alias: reg_lambda]L2 权重的L2正则化项

alpha [default=0, alias: reg_alpha]L1 权重的L1正则化项

scale_pos_weight, [default=1]在各类别样本十分不平衡时，把这个参数设定为一个正值，可以使算法更快收敛

一个可以考虑的值: sum(negative cases) / sum(positive cases) see Higgs Kaggle

2.3 任务参数objective [ default=reg:linear ]这个参数定义需要被最小化的损失函数。最常用的值有

"reg:linear" --线性回归

"reg:logistic" --逻辑回归

"binary:logistic" --二分类的逻辑回归，返回预测的概率(不是类别)

"binary:logitraw" --输出归一化前的得分

"count:poisson" --poisson regression for count data, output mean of poisson distributionmax_delta_step is set to 0.7 by default in poisson regression (used to safeguard optimization)

"multi:softmax" --设定XGBoost做多分类，你需要同时设定num_class(类别数)的值

"multi:softprob" --输出维度为ndata * nclass的概率矩阵

"rank:pairwise" --设定XGBoost去完成排序问题(最小化pairwise loss)

"reg:gamma" --gamma regression with log-link. Output is a mean of gamma distribution. It might be useful, e.g., for modeling insurance claims severity, or for any outcome that might be

"reg:tweedie" --Tweedie regression with log-link. It might be useful, e.g., for modeling total loss in insurance, or for any outcome that might be

base_score [ default=0.5 ]the initial prediction score of all instances, global bias

for sufficient number of iterations, changing this value will not have too much effect.

eval_metric [ 默认是根据损失函数/目标函数自动选定的 ]有如下的选择:"rmse":

"mae":

"logloss": negative

"error": 二分类的错误率

"error@t": 通过提供t为阈值(而不是0.5)，计算错误率

"merror": 多分类的错误类，计算公式为#(wrong cases)/#(all cases).

"mlogloss":

"auc":

"map":

seed [ default=0 ]random number seed.

3. 调参示例

使用数据集https://datahack.analyticsvidhya.com/contest/data-hackathon-3x/datahack.analyticsvidhya.com

首先导入数据

#Import libraries:

import pandas as pd

import numpy as np

import xgboost as xgb

from xgboost.sklearn import XGBClassifier

from sklearn import cross_validation, metrics #Additional scklearn functions

from sklearn.grid_search import GridSearchCV #Perforing grid search

import matplotlib.pylab as plt

%matplotlib inline

from matplotlib.pylab import rcParams

rcParams['figure.figsize'] = 12, 4

train = pd.read_csv('train_modified.csv')

target = 'Disbursed'

IDcol = 'ID'注意有2种导入xgboost的方式xgb: 这是直接的方式，可以从这里调用cv方法

XGBClassifier: 这是sklearn包装后的xgboost，几乎兼容一起其他xgboost模型

接下来制定一个建模和交叉验证的函数

def modelfit(alg, dtrain, predictors,useTrainCV=True, cv_folds=5, early_stopping_rounds=50):

if useTrainCV:

xgb_param = alg.get_xgb_params()

xgtrain = xgb.DMatrix(dtrain[predictors].values, label=dtrain[target].values)

cvresult = xgb.cv(xgb_param, xgtrain, num_boost_round=alg.get_params()['n_estimators'], nfold=cv_folds,

metrics='auc', early_stopping_rounds=early_stopping_rounds, show_progress=False)

alg.set_params(n_estimators=cvresult.shape[0])

#Fit the algorithm on the data

alg.fit(dtrain[predictors], dtrain['Disbursed'],eval_metric='auc')

#Predict training set:

dtrain_predictions = alg.predict(dtrain[predictors])

dtrain_predprob = alg.predict_proba(dtrain[predictors])[:,1]

#Print model report:

print "\nModel Report"

print "Accuracy :%.4g" % metrics.accuracy_score(dtrain['Disbursed'].values, dtrain_predictions)

print "AUC Score (Train):%f" % metrics.roc_auc_score(dtrain['Disbursed'], dtrain_predprob)

feat_imp = pd.Series(alg.booster().get_fscore()).sort_values(ascending=False)

feat_imp.plot(kind='bar', title='Feature Importances')

plt.ylabel('Feature Importance Score')

3.1总体的调参思路首先选一个相对较高的learning rate,一般是0.1，范围在0.05~0.3都可以。接下来确定在这个学习率下最优的树的数量. 在这里就可以使用xgboost的cv功能，可以在每一次树的迭代中都进行交叉验证，确定最优树的数量(cv结果我跑了下是长这样的，功能真的很夯啊)

dtrain = xgb.DMatrix(xtrain,ytrain)

dtest = xgb.DMatrix(xtest,ytest)

params = {

'obj':'binary:logistic',

'max_depth':3,

'eta':0.2,

'silent':False,

'eta':0.2,

'colsample_bytree':0.9

}

cvresult = xgb.cv(params, dtrain, num_boost_round=250, nfold=5,

metrics={'auc'}, seed=0)

2. 调整树结果相关的参数

max_depth, min_child_weight, gamma, subsample, colsample_bytree

3. 调整正则化项

lambda,alpha

4. 调低学习率，确认最佳参数组合

让我们一步步的来看以上的步骤

确认学习率，调整树的数量

predictors = [x for x in train.columns if x not in [target, IDcol]]

xgb1 = XGBClassifier(

learning_rate =0.1,

n_estimators=1000,

max_depth=5,

min_child_weight=1,

gamma=0,

subsample=0.8,

colsample_bytree=0.8,

objective= 'binary:logistic',

nthread=4,

scale_pos_weight=1,

seed=27)

modelfit(xgb1, train, predictors)

可以看到在140颗树的时候我们使用0.1的学习率达到最优

第二步：调整树结构

可以使用交叉验证来验证

param_test1 = {

'max_depth':range(3,10,2),

'min_child_weight':range(1,6,2)

}

gsearch1 = GridSearchCV(estimator = XGBClassifier( learning_rate =0.1, n_estimators=140, max_depth=5,

min_child_weight=1, gamma=0, subsample=0.8, colsample_bytree=0.8,

objective= 'binary:logistic', nthread=4, scale_pos_weight=1, seed=27),

param_grid = param_test1, scoring='roc_auc',n_jobs=4,iid=False, cv=5)

gsearch1.fit(train[predictors],train[target])

gsearch1.grid_scores_, gsearch1.best_params_, gsearch1.best_score_

在上式我们一共跑了12组交叉验证，可以看到最优解是 maxdepth=5,minchildweight=5，原文中为了找到更优的解，会减小搜索空间进一步进行网格搜索.

第三步，调整gamma参数

param_test3 = {

'gamma':[i/10.0 for i in range(0,5)]

}

gsearch3 = GridSearchCV(estimator = XGBClassifier( learning_rate =0.1, n_estimators=140, max_depth=4,

min_child_weight=6, gamma=0, subsample=0.8, colsample_bytree=0.8,

objective= 'binary:logistic', nthread=4, scale_pos_weight=1,seed=27),

param_grid = param_test3, scoring='roc_auc',n_jobs=4,iid=False, cv=5)

gsearch3.fit(train[predictors],train[target])

gsearch3.grid_scores_, gsearch3.best_params_, gsearch3.best_score_

第四部：调整列采样和行采样的比例(增加随机性降低过拟合)

param_test4 = {

'subsample':[i/10.0 for i in range(6,10)],

'colsample_bytree':[i/10.0 for i in range(6,10)]

}

gsearch4 = GridSearchCV(estimator = XGBClassifier( learning_rate =0.1, n_estimators=177, max_depth=4,

min_child_weight=6, gamma=0, subsample=0.8, colsample_bytree=0.8,

objective= 'binary:logistic', nthread=4, scale_pos_weight=1,seed=27),

param_grid = param_test4, scoring='roc_auc',n_jobs=4,iid=False, cv=5)

gsearch4.fit(train[predictors],train[target])

gsearch4.grid_scores_, gsearch4.best_params_, gsearch4.best_score_

第五步调整正则项这一步在我目前的建模方式中很少用到，一般控制好树的结构相关参数我觉得已经够了

param_test6 = {

'reg_alpha':[1e-5, 1e-2, 0.1, 1, 100]

}

gsearch6 = GridSearchCV(estimator = XGBClassifier( learning_rate =0.1, n_estimators=177, max_depth=4,

min_child_weight=6, gamma=0.1, subsample=0.8, colsample_bytree=0.8,

objective= 'binary:logistic', nthread=4, scale_pos_weight=1,seed=27),

param_grid = param_test6, scoring='roc_auc',n_jobs=4,iid=False, cv=5)

gsearch6.fit(train[predictors],train[target])

gsearch6.grid_scores_, gsearch6.best_params_, gsearch6.best_score_

我们可以发现cv分数比之前低了，再试试最优解0.01附近的参数

param_test7 = {

'reg_alpha':[0, 0.001, 0.005, 0.01, 0.05]

}

gsearch7 = GridSearchCV(estimator = XGBClassifier( learning_rate =0.1, n_estimators=177, max_depth=4,

min_child_weight=6, gamma=0.1, subsample=0.8, colsample_bytree=0.8,

objective= 'binary:logistic', nthread=4, scale_pos_weight=1,seed=27),

param_grid = param_test7, scoring='roc_auc',n_jobs=4,iid=False, cv=5)

gsearch7.fit(train[predictors],train[target])

gsearch7.grid_scores_, gsearch7.best_params_, gsearch7.best_score_

最后，我们把目前找到的最优参数组合糊进模型

xgb3 = XGBClassifier(

learning_rate =0.1,

n_estimators=1000,

max_depth=4,

min_child_weight=6,

gamma=0,

subsample=0.8,

colsample_bytree=0.8,

reg_alpha=0.005,

objective= 'binary:logistic',

nthread=4,

scale_pos_weight=1,

seed=27)

modelfit(xgb3, train, predictors)

第六步：降低学习率

最后，我们尝试降低学习率，并进一步增加更多的树.

xgb4 = XGBClassifier(

learning_rate =0.01,

n_estimators=5000,

max_depth=4,

min_child_weight=6,

gamma=0,

subsample=0.8,

colsample_bytree=0.8,

reg_alpha=0.005,

objective= 'binary:logistic',

nthread=4,

scale_pos_weight=1,

seed=27)

modelfit(xgb4, train, predictors)

本文参考Complete Guide to Parameter Tuning in XGBoost with codes in Pythonwww.analyticsvidhya.com

【Python】条件判断 while(77) python 开发语言
目录1、单分支2、双分支3、多分支4、match1、单分支weather='下雨'ifweather=='下雨':print('记得带伞')在一个if下，下级代码不是一定要缩进4个空格，但是所有下级代码缩进的格数相同2、双分支weather='下雨'ifweather=='下雨':print('记得带伞')else:print('不用带伞')if和else中的缩进可以不一样3、多分支score=9
【Python 】循环 while(77) python 开发语言
目录1、while循环2、for循环3、break4、continue5、pass1、while循环i=0whilei<5:print("hellopython")i+=12、for循环foriinrange(5):print("hellopython")range是python中的一个库函数range(start,stop,step)start、stop分别表示起始和终止位置，是左闭右开的，st
精通Python (10) 码商行者人工智能 python 开发语言
一，基于tkinter模块的GUIGUI是图形用户界面的缩写，图形化的用户界面对使用过计算机的人来说应该都不陌生，在此也无需进行赘述。Python默认的GUI开发模块是tkinter（在Python3以前的版本中名为Tkinter），从这个名字就可以看出它是基于Tk的，Tk是一个工具包，最初是为Tcl设计的，后来被移植到很多其他的脚本语言中，它提供了跨平台的GUI控件。当然Tk并不是最新和最好的选
解决：pip is configured with locations that require TLS/SSL,the ssl module in Python is not available a_flyying_pig pip ssl python
Windows版出错提示表示当前python缺少SSL模块，pip默认安装源为https://pypi.org/simple/，连接是需要SSL库，写配置文件修改为阿里安装源。pipconfig--globalsetglobal.index-urlhttp://mirrors.aliyun.com/pypi/simple/观察到配置被写入以下文件：记事本打开pip.ini文件，在末行添加[inst
【新人系列】Python 入门（二十六）：常见设计模式 Pandaconda #Python 新人系列 python 设计模式开发语言后端笔记面试经验分享
✍个人博客：https://blog.csdn.net/Newin2020?type=blog专栏地址：https://blog.csdn.net/newin2020/category_12801353.html专栏定位：为0基础刚入门Python的小伙伴提供详细的讲解，也欢迎大佬们一起交流~专栏简介：在这个专栏，我将带着大家从0开始入门Python的学习。在这个Python的新人系列专栏下，将会
轨迹优化 | 基于贝塞尔曲线的无约束路径平滑与粗轨迹生成(附ROS C++/Python仿真) Mr.Winter` 运动规划实战进阶：轨迹优化篇人工智能机器人 ROS ROS2 自动驾驶轨迹优化几何学
目录0专栏介绍1从路径到轨迹2基于贝塞尔曲线的粗轨迹生成2.1路径关键点提取2.2路径点航向角计算2.3贝塞尔曲线轨迹生成3算法仿真3.1ROSC++仿真3.2Python仿真0专栏介绍课设、毕设、创新竞赛必备！本专栏涉及更高阶的运动规划算法轨迹优化实战，包括：曲线生成、碰撞检测、安全走廊、优化建模(QP、SQP、NMPC、iLQR等)、轨迹优化(梯度法、曲线法等)，每个算法都包含代码实现加深理解
聊聊C语言和ABAP
Python中的class体内定义方法时，如果没有显式地包含self参数，有时候依然可以被调用。这是一个非常有趣的话题，因为它涉及到对Python中类与对象之间关系的更深理解。要理解为什么这种情况下方法依然能够被调用，我们需要逐步拆解Python类的构造方式以及方法绑定的原理。
【蓝桥杯】Python算法——快速幂遥感小萌新蓝桥杯蓝桥杯算法
零、前言距离25年蓝桥杯还有大概三个月时间，接下来重点应该会放在蓝桥杯备考方向，一起努力，一起加油一、快速幂如何快速求ab=pa^b=pab=p？如果直接循环aaa…毫无疑问时间复杂度是很大的，那么怎么降低计算量呢？快速幂就是从幂运算的性质出发，提出的优化。对于aba^bab,如果b是偶数，则可拆分为ab=ab//2∗ab//2a^b=a^{b//2}*a^{b//2}ab=ab//2∗ab//2
VSCode PlatformIO开发单片机(纪要) 三千烦恼丝xzh MCU vscode 单片机 ide
vscode插件参考PlatformIO界面elf转hex百度引擎查大部分是增加python脚本处理extra_script.py(和platformio.ini在同一目录)Import("env")env.AddPostAction("$BUILD_DIR/${PROGNAME}.elf",env.VerboseAction("".join(["$OBJCOPY","-O","ihex","-R
Python+Vue计算机毕业设计新新中草药管理系统06s87（源码+程序+LW+部署）永毅科技课程设计
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程项目运行环境配置：Python3.7.7+Django+Mysql5.7+piplist+HBuilderX（Vscode也行）+Vue+Pychram社区版。项目技术：Django+Vue+Python+Mysql等等组成，B/S模式等等。环境需要1.运行环境：最好是安装Python3.7.7，我们在这个平台上运行的。其他版本理论上也
whisper.cpp 学习笔记法号：行颠机器学习 whisper 学习笔记
whisper.cppwhisper.cpp学习笔记whisper介绍源码下载源码编译支持的模型优化/加速生成库文件使用whispe.cpp的demo参考文献whisper.cpp学习笔记whisper介绍whisper是基于OpenAI的自动语音识别（ASR）模型。他可以识别包括英语、普通话等在内多国语言。whisper分为whisper（python版本）和whisper.cpp（C/C++版
力扣——搜索二维矩阵（python）朗朗乾坤.py 力扣刷题 leetcode 矩阵算法
##题目##解析解法一：直接把二维列表变为一维列表，然后遍历进行比较解法二：将二位列表使用二分查找来加快效率“01234567891011”i=num//4j=num%4；不太稳定不建议使用##代码解法一classSolution(object):defsearchMatrix(self,matrix,target):""":typematrix:List[List[int]]:typetarge
Linux系统离线安装Python_linux离线安装python3 2401_84009529 程序员 linux python 运维
笔者的配置如下：内网设备：一台Linux主机（Centos7），一台使用公司内网的Windows主机外网设备：一台Windows主机三、下载Python源码官网地址如下：Indexof/ftp/python/选择自己需要的python版本，如笔者选择的为python3.6.13，则需要对应版本的tar.xz包四、将离线python包传输到Linux主机笔者采用的方式如下：①使用U盘将离线包拷入公司
2025-1-15-十大经典排序算法 C++与python 汤姆和佩琦 C/C++语言学习历程 python算法学习排序算法 c++python 学习算法数据结构
文章目录十大经典排序算法比较排序1.冒泡排序2.选择排序3.插入排序4.希尔排序5.归并排序6.快速排序7.堆排序非比较排序8.计数排序9.桶排序10.基数排序十大经典排序算法十大经典排序算法可以分为比较排序和非比较排序:前者包括冒泡排序、选择排序、插入排序、希尔排序、归并排序、快速排序、堆排序;后者包括计数排序、桶排序、基数排序;下面将详细介绍这些算法：比较排序1.冒泡排序基本思想：重复地走访要
Java面试总结（1） dd要努力变优秀！ java 面试开发语言
问题1自我介绍：面试官您好，我叫xxx，是来自xxxx大学软件工程专业的一名应届生，我这次想应聘的是java开发实习生，在校期间，我热爱编程，能够使用java，C++,python的编程语言，其中系统的学习过java及其相关技术栈，使用过SSM，springMVC，springboot等框架开发，开发过web应用，微信小程序等，很期待能到贵公司实习，提高我的开发能力。问题2项目经验（简历上的）问题
Linux部署python服务 weixin_49784554 Python linux python 运维
1.创建虚拟环境和安装依赖在部署Python程序时，使用虚拟环境是一种良好的实践，它可以帮助你隔离项目的依赖，避免与系统的Python库冲突。1.1创建虚拟环境首先，确保你已经安装了Python和python3-venv工具。如果未安装，可以使用以下命令安装：sudoaptupdatesudoaptinstallpython3python3-pippython3-venv接下来，在你的项目目录下创
[Python | CS基础 ]Python多线程`threading`和多进程`multiprocessing` 向日葵花籽儿 python语法 python 数据库
多线程和多进程的Python实现1.多线程实现1.1原理Python的多线程模块**threading**允许程序并发执行多个任务。由于全局解释器锁（GIL），Python的线程可能无法实现真正的并行执行，适合I/O密集型任务。1.2示例代码importthreadingimporttime#定义线程要执行的函数defprint_numbers(threadName,delay):count=0w
python37.dll缺失是什么情况_修复python37.dll 吉翁舰长
python37.dll是电脑系统必备的一个DLL组件修复程序。系统重要文件python37.dll。python37.dll文件是每个人都在寻找的dll修复文件。它可以帮助您修复由于缺少python37.dll而导致的字段和错误。仅在此站点上下载压缩包后，才需要将其安装在指定的文件夹中。现在，欢迎大家进入车站体验！安装教程：1.下载后，根据您的系统选择x86/x64，x86是32位计算机，x64
python中zip函数的琐记 weixin_33719619 python
定义：zip([iterable,...])zip()是Python的一个内建函数，它接受一系列可迭代的对象作为参数，将对象中对应的元素打包成一个个tuple（元组），然后返回由这些tuples组成的list（列表）。若传入参数的长度不等，则返回list的长度和参数中长度最短的对象相同。利用*号操作符，可以将listunzip（解压），看下面的例子就明白了：>>>a=[1,2,3]>>>b=[4,
python_求1-2+3-4+......-100的值 weixin_30783913 python
求1-2+3-4+5……-100=?逻辑整理：--本质上可以转换一下，1+3+5+……+99-（2+4+……+100）加减部分间隔都为2，先求1+3+5+……+99的值，再求2+4+……+100的值，减去结果就出来了--还可以如此转换1*[（-1）**(1+1)]+2*[（-1）**(1+2)]+……+100[（-1）**(1+100)]
Python与下划线（六）__name__ 和 __main__ 昊昊该干饭了 Python的下划线知识 python 服务器开发语言
在Python的模块化开发中，__name__和__main__是两个不可或缺的核心概念。它们不仅用于区分模块是直接运行还是被导入，还在模块的测试和组织中发挥了重要作用。本文将详细解析这两个特殊变量的工作原理、使用场景，并提供最佳实践来帮助开发者编写更高效的Python模块。免费专栏在这里：Python的下划线知识目录1.什么是__name__和__main__？1.1__name__的含义1.2
opencv-python安装失败的解决方法之一格格衫穿七天 opencv python 人工智能
问题描述：1.pip下载opencv-python无论使用哪个镜像网站都找不到3.4.1.15版本；2.xxx.whl文件下载后用pipinstall“路径”导入失败；3.pip下载以及直接下载xxx.whl都十分慢；解决方法：不要改安装的位置！此时我们需要安装opencv-contrib-python（version为3.4.1.15，和opencv-python保持一致）注意安装时所在的位置，
《Python内置模块010：gzip、zipfile用于处理压缩文件的模块》大大大钢琴 #Python：各类模块（代码）python 数据库服务器
gzip、zipfile：用于处理压缩文件的模块一、常用方法（一）gzip模块（1）功能:主要用于处理GNUzip格式的压缩文件（.gz）。它支持单一文件的压缩和解压缩。（2）常用方法:gzip.open(filename,mode):打开一个gzip压缩文件，支持读（'r'）、写（'w'）、追加（'a'）等模式。gzip.compress(data):压缩数据并返回压缩后的字节对象。gzip.d
Python模块和包使用懒大王爱吃狼 python python Python基础开发语言自动化 opencv
在Python中，模块和包是用于组织代码、实现代码重用和保持代码整洁的重要工具。以下是关于Python模块和包的基本使用指南：模块（Module）模块是一个包含Python代码的文件，文件名就是模块名，且文件扩展名为.py。模块中可以包含函数、类和变量，也可以导入其他模块。创建模块创建一个模块非常简单，只需编写一个Python文件即可。例如，创建一个名为mymodule.py的文件：#mymodu
w163美食推荐商城卓怡学长计算机毕业设计美食数据库 java spring spring boot intellij-idea
作者简介：多年一线开发工作经验，原创团队，分享技术代码帮助学生学习，独立完成自己的网站项目。代码可以查看文章末尾⬇️联系方式获取，记得注明来意哦~赠送计算机毕业设计600个选题excel文件，帮助大学选题。赠送开题报告模板，帮助书写开题报告。作者完整代码目录供你选择：《Springboot网站项目》400套《ssm网站项目》800套《小程序项目》300套《App项目》500套《Python网站项目
通过 SAP 官方帮助网站自学 SAP 业务知识的一种办法
Python中的class体内定义方法时，如果没有显式地包含self参数，有时候依然可以被调用。这是一个非常有趣的话题，因为它涉及到对Python中类与对象之间关系的更深理解。要理解为什么这种情况下方法依然能够被调用，我们需要逐步拆解Python类的构造方式以及方法绑定的原理。
python实现windows系统电脑自动定时关机 'Steven python 开发语言
有时我们需要电脑挂机然后一定时间后自动关机，这种当然已经有软件可以用的，不过呢我们已经会用python了，电脑python天天挂着，写两行代码就可以自动关机，难道不好吗，而且这样不用安装软件，公司电脑的话更加友好，代码非常简单，如下，还附赠你锁屏和重启的代码importosfromosimportsystemos.system('RunDll32.exeuser32.dll,LockWorkSta
解决python3.10以上pyqt6-tools无法安装问题北岭敲键盘的荒漠猫 #python开发 python
情景描述原本3.9版本python用的好好地，最新的一个自动化库要求必须要3.10以上才能使用。火急火燎更新3.12版本python，结果安装qt-tools丫的安装不了了。问题出现原因python的pyqt-tools他不支持3.10以上的python版本下载。如果想用pip下载得python3.10以下。这我丫的能忍？我刚升的版本！！解决思路我们一般把他当做外部工具来用。但是忽略了他本是就是个
Python实现Windows定时关机，面试必备知识点总结 2301_82241698 2024年程序员学习 python windows 面试
os.popen(‘at22:30shutdown-s’)调用cmd，执行命令。而其中的22和30是等待用户输入的数据。因此，应该用两个lineEdit中获取到的合法数字替换对应的h和m。用到获取lineEdit内容的方法：h=self.lineEdit.text()m=self.lineEdit_2.text()然后以h，m替换执行命令中的时，分.接着就是pushButton的部分了。为push
华为OD机试E卷 --高矮个子排队--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript c语言 c++python
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述现在有一队小朋友，他们高矮不同，我们以正整数数组表示这一队小朋友的身高，如数组(5,3,1,2,3}]。我们现在希望小朋友排队，以高"“矮”“高”“矮"顺序排列，每一个高"位置的小朋友要比相邻的位置高或者相等;每一个“矮’位置的小朋友要比相邻的位置矮或者相等;要求小朋友们移动
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比

python xgboost调参_XGBoost从原理到调参

你可能感兴趣的:(python,xgboost调参)