一直成长

xgboost简单介绍_XGBOOST模型介绍

描述

前言

这是机器学习系列的第三篇文章，对于住房租金预测比赛的总结这将是最后一篇文章了，比赛持续一个月自己的总结竟然也用了一个月，牵强一点来说机器学习也将会是一个漫长的道路，后续机器学习的文章大多数以知识科普为主，毕竟自己在机器学习这个领域是个渣渣，自己学到的新知识点会分享给大家的。

前面的文章谈了谈这次比赛非技术方面的收获，对数据集的初步了解和特征工程的处理，今天主要介绍这次使用的模型--XGBOOST。

XGBOOST模型介绍

关于xgboost的原理网络上的资源很少，大多数还停留在应用层面，自己也是仅仅学习了一点应用，关于原理可以参考陈天奇博士的这篇文章

https://xgboost.readthedocs.io/en/latest/tutorials/model.html。

简单介绍：

XGBOOST是一个监督模型，xgboost对应的模型本质是一堆CART树。用一堆树做预测，就是将每棵树的预测值加到一起作为最终的预测值。下图就是CART树和一堆CART树的示例，用来判断一个人是否会喜欢计算机游戏：

第二张图明了如何用一堆CART树做预测，就是简单将各个树的预测分数相加。

参数介绍：

官方参数介绍看这里： https://xgboost.readthedocs.io/en/latest/parameter.html#general-parameters

比较重要的参数介绍：

“reg:linear” –线性回归。 “reg:logistic” –逻辑回归。 “binary:logistic” –二分类的逻辑回归问题，输出为概率。 “binary:logitraw” –二分类的逻辑回归问题，输出的结果为wTx。

“count:poisson”–计数问题的poisson回归，输出结果为poisson分布。在poisson回归中，max_delta_step的缺省值为0.7。(used to safeguard optimization)

“multi:softmax”–让XGBoost采用softmax目标函数处理多分类问题，同时需要设置参数num_class(类别个数)

“multi:softprob” –和softmax一样，但是输出的是ndata * nclass的向量，可以将该向量reshape成ndata行nclass列的矩阵。没行数据表示样本所属于每个类别的概率。

lambda [default=0] L2 正则的惩罚系数alpha [default=0] L1 正则的惩罚系数

lambda_bias 在偏置上的L2正则。缺省值为0(在L1上没有偏置项的正则，因为L1时偏置不重要)

eta [default=0.3] 为了防止过拟合，更新过程中用到的收缩步长。在每次提升计算之后，算法会直接获得新特征的权重。eta通过缩减特征的权重使提升计算过程更加保守。取值范围为：[0,1]

max_depth[default=6]数的最大深度。缺省值为6，取值范围为：[1,∞]

min_child_weight [default=1] 孩子节点中最小的样本权重和。如果一个叶子节点的样本权重和小于min_child_weight则拆分过程结束。在现行回归模型中，这个参数是指建立每个模型所需要的最小样本数。该成熟越大算法越conservative 取值范围为: [0,∞]

xgboost参数设置的代码示例：

1xgboost参数设置代码示例： 2 3# 划分数据集 4X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.01, random_state=1729) 5print(X_train.shape, X_test.shape) 6 7#模型参数设置 8xlf = xgb.XGBRegressor(max_depth=10, 9 learning_rate=0.1, 10 n_estimators=10, 11 silent=True, 12 objective='reg:linear', 13 nthread=-1, 14 gamma=0,15 min_child_weight=1, 16 max_delta_step=0, 17 subsample=0.85, 18 colsample_bytree=0.7, 19 colsample_bylevel=1, 20 reg_alpha=0, 21 reg_lambda=1, 22 scale_pos_weight=1, 23 seed=1440, 24 missing=None)2526xlf.fit(X_train, y_train, eval_metric='rmse', verbose = True, eval_set = [(X_test, y_test)],early_stopping_rounds=100)2728# 计算分数、预测29preds = xlf.predict(X_test)

比赛代码

关于xgboost只是简单的做了一个介绍，自己也仅仅懂一点应用层，原理懂得不是很多,这次XGB代码分析使用的是第一名开源代码。

导入数据集

1import pandas as pd 2import numpy as np 3import matplotlib.pyplot as plt 4 5train_data=pd.read_csv('train.csv') 6test_df=pd.read_csv('test.csv') 7train_df=train_data[train_data.loc[:,'Time']<3] 8val_df=train_data[train_data.loc[:,'Time']==3] 910del train_data

以默认参数的XGB分数为准，低于此基准线2.554的模型一律不考虑。

1def xgb_eval(train_df,val_df): 2 train_df=train_df.copy() 3 val_df=val_df.copy() 4 5 try: 6 from sklearn.preprocessing import LabelEncoder 7 lb_encoder=LabelEncoder() 8 lb_encoder.fit(train_df.loc[:,'RoomDir'].append(val_df.loc[:,'RoomDir'])) 9 train_df.loc[:,'RoomDir']=lb_encoder.transform(train_df.loc[:,'RoomDir'])10 val_df.loc[:,'RoomDir']=lb_encoder.transform(val_df.loc[:,'RoomDir'])11 except Exception as e:12 print(e)1314 import xgboost as xgb15 X_train=train_df.drop(['Rental'],axis=1)16 Y_train=train_df.loc[:,'Rental'].values17 X_val=val_df.drop(['Rental'],axis=1)18 Y_val=val_df.loc[:,'Rental'].values1920 from sklearn.metrics import mean_squared_error2122 try:23 eval_df=val_df.copy().drop('Time',axis=1)24 except Exception as e:25 eval_df=val_df.copy()2627 reg_model=xgb.XGBRegressor(max_depth=5,n_estimators=500,n_jobs=-1)28 reg_model.fit(X_train,Y_train)2930 y_pred=reg_model.predict(X_val)31 print(np.sqrt(mean_squared_error(Y_val,y_pred)),end=' ')3233 eval_df.loc[:,'Y_pred']=y_pred34 eval_df.loc[:,'RE']=eval_df.loc[:,'Y_pred']-eval_df.loc[:,'Rental']3536 print('')37 feature=X_train.columns38 fe_im=reg_model.feature_importances_39 print(pd.DataFrame({'fe':feature,'im':fe_im}).sort_values(by='im',ascending=False))4041 import matplotlib.pyplot as plt42 plt.clf()43 plt.figure(figsize=(15,4))44 plt.plot([Y_train.min(),Y_train.max()],[0,0],color='red')45 plt.scatter(x=eval_df.loc[:,'Rental'],y=eval_df.loc[:,'RE'])46 plt.show()4748 return eval_df

原生特征的丢弃尝试

以XGB做原生特征筛选，在原生特征中丢弃后不影响分数甚至涨分的特征有：Time，RentRoom(涨幅明显)，RoomDir，Livingroom，RentType(涨幅明显)，SubwayLine(涨幅明显)，SubwayDis(涨幅明显)。

1# 丢弃各特征后的分数 2# ‘Time':2.558,'Neighborhood':2.592,'RentRoom':2.531,'Height':2.57,'TolHeight':2.591,'RoomArea':3 3# 'RoomDir':2.548,'RentStatus':2.561,'Bedroom':2.584,'Livingroom':2.548,'Bathroom':2.590,'RentType':2.538 4# 'Region':2.583,'BusLoc':2.594,'SubwayLine':2.521,'SubwaySta':2.569,'SubwayDis':2.537,'RemodCond':2.571 5for col in train_df.columns: 6 if col!='Rental': 7 print('drop col:{}'.format(col)) 8 tmp_train_df=train_df.drop([col],axis=1) 9 tmp_val_df=val_df.drop([col],axis=1)10 eval_df=xgb_eval(train_df=tmp_train_df,val_df=tmp_val_df)1112# 一起丢弃:2.55313tmp_train_df=train_df.copy()14tmp_val_df=val_df.copy()15tmp_train_df.drop(['Time','RentRoom','RoomDir','Livingroom','RentType','SubwayLine','SubwayDis'],axis=1,inplace=True)16tmp_val_df.drop(['Time','RentRoom','RoomDir','Livingroom','RentType','SubwayLine','SubwayDis'],axis=1,inplace=True)17eval_df=xgb_eval(train_df=tmp_train_df,val_df=tmp_val_df)

特征选择

一股脑加上所有特征表现不佳，使用贪心策略(前向选择、后向选择)逐个添加特征。

1train_data=pd.read_csv('train.csv') 2train_df=train_data[train_data.loc[:,'Time']<3] 3val_df=train_data[train_data.loc[:,'Time']==3] 4 5drop_cols=['SubwayLine','RentRoom','Time'] # 需要丢弃的原生特征 6 7comb_train_df=train_df.copy() 8comb_val_df=val_df.copy() 910# 前向特征选择这块我是用for循环暴力搜出来的最优特征组合，最终筛选出来的特征组合为：11# ['ab_Height','TolRooms','Area/Room','BusLoc_rank','SubwayLine_rank']1213comb_train_df.loc[:,'ab_Height']=comb_train_df.loc[:,'Height']/(comb_train_df.loc[:,'TolHeight']+1)14comb_val_df.loc[:,'ab_Height']=comb_val_df.loc[:,'Height']/(comb_val_df.loc[:,'TolHeight']+1)1516comb_train_df.loc[:,'TolRooms']=comb_train_df.loc[:,'Livingroom']+comb_train_df.loc[:,'Bedroom']+comb_train_df.loc[:,'Bathroom']17comb_val_df.loc[:,'TolRooms']=comb_val_df.loc[:,'Livingroom']+comb_val_df.loc[:,'Bedroom']+comb_val_df.loc[:,'Bathroom']18comb_train_df.loc[:,'Area/Room']=comb_train_df.loc[:,'RoomArea']/(comb_train_df.loc[:,'TolRooms']+1)19comb_val_df.loc[:,'Area/Room']=comb_val_df.loc[:,'RoomArea']/(comb_val_df.loc[:,'TolRooms']+1)2021rank_cols=['BusLoc','SubwayLine']22for col in rank_cols:23 rank_df=train_df.loc[:,[col,'Rental']].groupby(col,as_index=False).mean().sort_values(by='Rental').reset_index(drop=True)24 rank_df.loc[:,col+'_rank']=rank_df.index+1 # +1，为缺失值预留一个0值的rank25 rank_fe_df=rank_df.drop(['Rental'],axis=1)26 comb_train_df=comb_train_df.merge(rank_fe_df,how='left',on=col)27 comb_val_df=comb_val_df.merge(rank_fe_df,how='left',on=col)28 try:29 comb_train_df.drop([col],axis=1,inplace=True)30 comb_val_df.drop([col],axis=1,inplace=True)31 except Exception as e:32 print(e)33for drop_col in drop_cols:34 try:35 comb_train_df.drop(drop_col,axis=1,inplace=True)36 comb_val_df.drop(drop_col,axis=1,inplace=True)37 except Exception as e:38 pass3940# 贪心策略添加特征，目前为:2.40341eval_df=xgb_eval(train_df=comb_train_df,val_df=comb_val_df

调参对于不是很大的数据集可以用sklearn的Gridcvsearch来暴力调参。示例代码：

1params = {'depth':[3],2 'iterations':[5000],3 'learning_rate':[0.1,0.2,0.3],4 'l2_leaf_reg':[3,1,5,10,100],5 'border_count':[32,5,10,20,50,100,200]}6clf = GridSearchCV(cat, params, cv=3)7clf.fit(x_train_2, y_train_2)

对于较大的数据集，用第一种方法耗时特别长。2. 逐个参数调，先取定其它参数，遍历第一个参数，选择最优值，再调下一个参数。省时但有的时候容易陷入局部最优。3.观察数据的分布来调整对应的参数，如树模型的叶子节点数，变量较多，叶子数少欠拟合。

预测提交

1def xgb_pred(): 2 train_df=pd.read_csv('train.csv') 3 test_df=pd.read_csv('test.csv') 4 5 try: 6 from sklearn.preprocessing import LabelEncoder 7 lb_encoder=LabelEncoder() 8 lb_encoder.fit(train_df.loc[:,'RoomDir'].append(test_df.loc[:,'RoomDir'])) 9 train_df.loc[:,'RoomDir']=lb_encoder.transform(train_df.loc[:,'RoomDir'])10 test_df.loc[:,'RoomDir']=lb_encoder.transform(test_df.loc[:,'RoomDir'])11 except Exception as e:12 print(e)1314 train_df.loc[:,'ab_Height']=train_df.loc[:,'Height']/(train_df.loc[:,'TolHeight']+1)15 test_df.loc[:,'ab_Height']=test_df.loc[:,'Height']/(test_df.loc[:,'TolHeight']+1)16 train_df.loc[:,'TolRooms']=train_df.loc[:,'Livingroom']+train_df.loc[:,'Bedroom']+train_df.loc[:,'Bathroom']17 test_df.loc[:,'TolRooms']=test_df.loc[:,'Livingroom']+test_df.loc[:,'Bedroom']+test_df.loc[:,'Bathroom']18 train_df.loc[:,'Area/Room']=train_df.loc[:,'RoomArea']/(train_df.loc[:,'TolRooms']+1)19 test_df.loc[:,'Area/Room']=test_df.loc[:,'RoomArea']/(test_df.loc[:,'TolRooms']+1)2021 rank_cols=['BusLoc','SubwayLine']22 for col in rank_cols:23 rank_df=train_df.loc[:,[col,'Rental']].groupby(col,as_index=False).mean().sort_values(by='Rental').reset_index(drop=True)24 rank_df.loc[:,col+'_rank']=rank_df.index+1 # +1，为缺失值预留一个0值的rank25 rank_fe_df=rank_df.drop(['Rental'],axis=1)26 train_df=train_df.merge(rank_fe_df,how='left',on=col)27 test_df=test_df.merge(rank_fe_df,how='left',on=col)28 try:29 train_df.drop([col],axis=1,inplace=True)30 test_df.drop([col],axis=1,inplace=True)31 except Exception as e:32 print(e)33 for drop_col in drop_cols:34 try:35 train_df.drop(drop_col,axis=1,inplace=True)36 test_df.drop(drop_col,axis=1,inplace=True)37 except Exception as e:38 pass3940 print(train_df.columns,test_df.columns)4142 import xgboost as xgb43 X_train=train_df.drop(['Rental'],axis=1)44 Y_train=train_df.loc[:,'Rental'].values45 test_id=test_df.loc[:,'id']46 X_test=test_df.drop(['id'],axis=1)474849 from sklearn.metrics import mean_squared_error5051 reg_model=xgb.XGBRegressor(max_depth=8,n_estimators=1880,n_jobs=-1)52 reg_model.fit(X_train,Y_train,eval_set=[(X_train,Y_train)],verbose=100,early_stopping_rounds=10)5354 y_pred=reg_model.predict(X_test)5556 sub_df=pd.DataFrame({57 'id':test_id,58 'price':y_pred59 })60 sub_df.to_csv('sub.csv',index=False)6162 return None6364xgb_pred()

第一名XGB单模分数为1.94，线下线上是一致的，总特征数二十多个，跟自己的XGB相比，自己在特征组合方向有所欠缺，自己单模特征10个左右分数在2.01。

打开APP阅读更多精彩内容

点击阅读全文

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
如何对.NET应用程序进行数字签名溪源More 服务器 linux 网络运维
我们可以为我们的程序进行数字签名,这样就可以证明该程序的作者是可信的.首先为了签名程序,我们需要先创建一个证书.证书是由证书颁发机构(CA)颁发的,CA是受信任的第三方机构,它可以为我们颁发证书.当然我们也可以自己创建证书.接下来简单介绍下如何利用OpenSSL工具创建证书.创建证书下载openssl安装包并安装,推荐下载最新64位版本.打开命令行,输入openssl,如果提示Openssl不是内
Django REST framework 与 django-import-export 扩展结合 Venre django python
DjangoRESTframework与django-import-export扩展结合DjangoRESTframework与django-import-export简单介绍DjangoRESTframework和django-import-export是两个非常强大的工具，分别用于构建RESTfulWebAPI和处理数据的导入导出。虽然它们在功能上有所不同，但可以结合使用以实现更复杂的数据管理
STM32 ADC详解月入鱼饵 stm32 嵌入式硬件单片机
本文介绍stm32ADC的使用，本文较长，可以配合目录跳转到需要的地方阅读。ADC转换原理本文重点在于STM32的ADC的使用，介绍ADC转换原理是为了更好理解STM32中关于ADC的配置，所以这里只是简单介绍一下ADC的转换原理，想详细了解ADC的转换原理可以看看看完这篇文章，终于搞懂了ADC原理及分类！和ADC基本工作原理-CSDN。简单来说，模拟信号输入进来，经过低通滤波操作预处理信号之后，
你见过的最差的程序员是怎样的？
我来重新为你生成一篇更加详细深入的知乎高赞回答：你见过的最差的程序员是怎样的？看到这个问题，我先是愣了一下，然后长长地叹了口气。作为一个在程序员这条路上摸爬滚打了快10年的老司机，我见过太多形形色色的程序员。有让我敬佩的技术大牛，有勤奋努力的新人，有经验丰富的老手，当然也有一些让我至今想起来都头疼不已的"奇葩"。让我先简单介绍一下我的背景和经历。我本硕都是机械专业毕业，但命运的巧妙安排让我与编程结
跳转漏洞检测工具汇总（重定向漏洞）墨痕诉清风渗透工具安全
目录简单介绍绕过方式及更多介绍工具介绍Oralyzer介绍主要功能使用缺点下载地址简单介绍URL跳转漏洞是指后台服务器在告知浏览器跳转时，未对客户端传入的重定向地址进行合法性校验，导致用户浏览器跳转到钓鱼页面的一种漏洞。访问http://www.abc.com?url=http://www.xxx.com直接跳转到http://www.xxx.com说明存在URL重定向漏洞绕过方式及更多介绍htt
上位机通信(一) SunflowerCoder 上位机 c#上位机
概念基于软件的设备控制程序涉及C#的语法多线程委托（Action/Func/delegate）C#变量类型:Byteushortshortintuintlongfloatdoubledecimal设备类型：Bit(位)Byte(字节)Word(字)Dword(双字)float上位机数据交换物理接口：232422485SerialPort（串口）以太网：网口（TCP/UDP）,Socket简单介绍一
Bigint和int的区别 Stuomasi_xiaoxin mysql 数据库 database
首先简单介绍一下这两种数据类型：bigint从-2^63(-9223372036854775808)到2^63-1(9223372036854775807)的整型数据（所有数字）。存储大小为8个字节。int从-2^31(-2,147,483,648)到2^31–1(2,147,483,647)的整型数据（所有数字）。存储大小为4个字节。int的SQL-92同义字为integer。可以看出bigin
简说scp命令伊成其它服务器 linux 运维
简单介绍scp的全称是：SecureCopyProtocol（安全复制协议），是Linux中用于在网络中安全传输文件的命令行工具。它基于SSH协议，用于在本地服务器和远程服务器之间，或者两台远程服务器之间复制文件或目录。scp基本语法格式如下：scp[选项]源路径目标路径常用选项说明：-r：递归复制整个目录。-P：指定非默认的SSH端口号，默认为22。这里注意为大写的P。-C：启用压缩，提高传输效
一个常见的台式计算机有哪些硬件部分组成,台式电脑有哪些组成部分
篇一：电脑硬件的基本组成部分电脑硬件的基本组成部分很多刚接触电脑的朋友不是很清楚电脑组成部分，不清楚电脑硬件由什么组成，电脑学习网就为朋友们详细介绍电脑硬件的组成，并简单介绍电脑组成部分的这些电脑硬件的基本功能。(1)电源电源是电脑中不可缺少的供电设备，它的作用是将220V交流电转换为电脑中使用的5V，12V，3.3V直流电，其性能的好坏，直接影响到其他设备工作的稳定性，进而会影响整机的稳定性。(
ClickHouse高频面试题野老杂谈数据库
ClickHouse高频面试题1、简单介绍一下ClickHouse2、ClickHouse具有哪些特点3、ClickHouse作为一款高性能OLAP数据库，存在哪些不足4、ClickHouse有哪些表引擎5、介绍下Log系列表引擎应用场景共性特点不支持6、简单介绍下MergeTree系列引擎7、简单介绍下外部集成表引擎ODBCJDBCMySQLHDFSKafkaRabbitMQ8、ClickHou
DAY 8 标签编码与连续变量处理
主要内容：字典的简单介绍标签编码连续特征的处理：归一化和标准化字典字典是Python中一种非常常用的数据结构，它是一种可变容器模型，可以存储任意类型的对象。字典中的每个元素都是一个键值对创建字典#空字典empty_dict={}empty_dict2=dict()#等同于empty_dict={}#带初始值的字典person={'name':'Alice','age':25,'city':'New
Android逆向工具简单介绍 @ZhangJun Android 进阶 Android逆向反编译反汇编 Hook
目录一、Android逆向概述1、什么是Android逆向2、逆向过程3、逆向用途1）APP自动化执行程序脚本2）修改APP的功能3）APP安全二、常用逆向工具介绍1、APP抓包工具1）Fiddler2）Wireshark2、jadx反编译工具3、APKDB4、Frida之Hook工具5、IDA反汇编工具1）为何反汇编2）如何反汇编3）IDAPro的基本功能：4）IDA目录结构5）常用快捷键6）常
Python机器学习与深度学习：决策树、随机森林、XGBoost与LightGBM、迁移学习、循环神经网络、长短时记忆网络、时间卷积网络、自编码器、生成对抗网络、YOLO目标检测等 WangYan2022 机器学习/深度学习 Python 机器学习深度学习随机森林迁移学习
融合最新技术动态与实战经验，旨在系统提升以下能力：①掌握ChatGPT、DeepSeek等大语言模型在代码生成、模型调试、实验设计、论文撰写等方面的实际应用技巧②深入理解深度学习与经典机器学习算法的关联与差异，掌握其理论基础③熟练运用PyTorch实现各类深度学习模型，包括迁移学习、循环神经网络（RNN）、长短时记忆网络（LSTM）、时间卷积网络（TCN）、自编码器、生成对抗网络（GAN）、YOL
SAGA——Textural Features(纹理特征)提取竹_猗 SAGA GIS
由于课题需要（其实是条件有限），不得不使用SAGA软件进行特征提取，在经过一个星期的摸索之后，终于得到了一些成果，在此记录一下提取的过程。在第一篇的文章中已经简单介绍了SAGAGIS的相关概念以及如何使用SAGAGIS加载影像和进行分割。TexturalFeatures提取过程：（1）将影像的各个波段分别导出为单独影像（这一步是由于我是在服务器上进行，所以需要导出，软件上没有必要将每个波段都导出为
Python训练营打卡Day8(2025.4.27) 2301_80505456 python 算法开发语言
知识点见示例代码字典的简单介绍标签编码连续特征的处理：归一化和标准化至此，常见的预处理方式都说完了作业：对心脏病数据集的特征用上述知识完成，一次性用所有的处理方式完成预处理，尝试手动完成，多敲几遍代码。由于所给数据集已是处理过的数据集，以下将按所给数据集的处理情况对连续特征进行归一化和标准化。首先观察数据，需处理数据共有5列，分别是：age,trestbps,chol,thalach,oldpea
oracle控制文件快照,Oracle快照控制文件理解
##Oracle快照控制文件??快照控制文件(snapshotcontrolfile)，顾名思义就是Oracle控制文件的一个副本或者备份。快照控制文件并不多见，在使用RMAN的时候这个快照控制文件才会被使用。控制文件简单介绍控制文件是Oracle的重要组成部分，记录了当前数据库的结构信息，同时也包含数据文件，日志文件，归档的信息。记录数据库当前的SCN。1.什么是快照控制文件1)为什么要有快照控
核心骨架: 小程序双线程架构风铃喵游从零搭建小程序框架架构小程序架构前端
本节简介从本小节开始，我们将实现小程序架构的核心逻辑:双线程架构，开始之前我们先简单介绍下双线程架构以及选择双线程架构的原因;小程序在渲染过程中，将逻辑代码的执行和页面逻辑的渲染分割开，各自独立在一个线程内运行，及小程序的双线程运行架构;采用双线程运行的小程序的优势主要有:JS逻辑的独立运行不会影响UI的渲染，性能更优安全性:JS逻辑独立运行，避免利用一些浏览器api操作DOM，执行动态脚本等，方
PythonOCC【快速入门】
目录简单介绍环境小例子简单介绍pythonOCC也就是opencascade的python封装版本，是由tpaviot制作并发行的。pythonOCC是python语言构架的3DCAD/CAE/PLM开发框架，它提供了如下功能：复杂曲面的操作，信息转换（STEP,IGES,STL格式），用户界面可视化（基于wxpython库或者qt库），jupyternootbook生成等。环境https://a
Python训练营-Day11 m0_72314023 Python训练营 python 机器学习深度学习
DAY11常见的调参方式超参数调整专题1知识点回顾1.网格搜索2.随机搜索（简单介绍，非重点实战中很少用到，可以不了解）3.贝叶斯优化（2种实现逻辑，以及如何避开必须用交叉验证的问题）4.time库的计时模块，方便后人查看代码运行时长#LightGBM-网格优化print("\n---3.网格搜索优化LightGBM(训练集->测试集)---")importlightgbmaslgbfromskl
【深入理解SpringCloud微服务】深入理解nacos配置中心（一）——宏观理解nacos配置中心原理黄俊懿 spring cloud 微服务 java 架构分布式 spring boot nacos
【深入理解SpringCloud微服务】深入理解nacos配置中心（一）——宏观理解nacos配置中心原理简单介绍原理分析客户端启动服务端启动配置新增或修改客户端监听配置变更并刷新nacos既是一个注册中心也是一个配置中心，它是二合一的。作为注册中心的原理和源码，前面的文章已经介绍过，今天开始分析nacos作为配置中心的原理和源码。简单介绍nacos配置中心的作用就是在微服务架构中负责集中管理各个
《深度学习》—— PyTorch的介绍及PyTorch的CPU版本安装张小生180 人工智能深度学习 pytorch
文章目录一、PyTorch的简单介绍二、pytorch的CPU版本安装三、torch、torchvision、torchaudio三个库的介绍一、PyTorch的简单介绍PyTorch是一个由FacebookAI实验室开发的深度学习框架，它基于Python，并提供了高效的GPU加速和灵活的模型定义能力。1.PyTorch的基本特点动态计算图：PyTorch采用动态计算图的方式，这意味着计算图是在运
JAVA自定义注解以及应用布朗克168 java小知识集锦 java 注解自定义注解
目录一、简单介绍1、什么是Java自定义注解2、自定义注解的定义语法二、Java代码中如何使用1、使用自定义注解2、通过反射访问自定义注解三、如何在springboot项目应用1、创建自定义注解2、创建切面类（Aspect）来处理注解3、在控制器（Controller）或服务（Service）方法中使用自定义注解一、简单介绍1、什么是Java自定义注解注解（Annotation）是Java5.0引
机器学习-三大SOTA Boosting算法总结和调优小新学习屋机器学习机器学习 boosting 集成学习决策树人工智能
参考书籍：《机器学习公式推导和代码实现》书籍页码：P197～205简介除了深度学习适用的文本、图像、语音、视频等非结构化数据，对于训练样本较少的结构化数据，Boosting算法仍是第一选择。XGBoost、LightGBM、CatBoost是目前经典的SOTABoosting算法算法对比维度XGBoostLightGBMCatBoos说明算法的继承性是对GBDT的改进是对XGBoost的改进是对X
泛型编程之完美转发发如雪-ty 模板与泛型编程 c++算法开发语言
首先简单介绍一下几个概念（1）直接调用：比如从main()主函数中调用funcLast()函数，这其实就叫做直接调用。（2）转发：从main()函数中调用funcMiddle()函数，通过funcMiddle()函数调用funcLast()函数，这就叫做转发，funcMiddle()函数被当作一个跳板函数。一般情况下跳板函数都写成一个函数模板。templatevoidfunc(T¶m){c
RAII和智能指针--C++ 望你可喜 c++开发语言
一、前言我们知道，c/c++的内存，对程序员来说，是裸露的，所以可以拿到真实的地址，所以容易造成各种内存问题。比如：野指针：未初始化或已经被释放的指针；空指针：指向空地址的指针；内存泄漏：在使用完动态分配的内存后没有释放（即delete或free）；悬挂指针：指向已经释放内存的指针；等等......二、RAII简介在认识智能指针前，我们先了解一下RAII，我简单介绍一下，RAII（Resource
电子电气架构 --- SOVD功能简单介绍汽车电子实验室思考车载总线类型汽车行业架构电气电子架构开发的应对策略电子电气架构开发语言 ECU刷写与busoff原则 SOVD功能简单介绍
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：简单，单纯，喜欢独处，独来独往，不易合同频过着接地气的生活，除了生存温饱问题之外，没有什么过多的欲望，表面看起来很高冷，内心热情，如果你身边有这样灵性的人，一定要好好珍惜他们眼中有神有光，干净，给人感觉很舒服，有超强的感知能力有形的无形的感知力很强，能感知人的内心变化喜欢独处，好静，
C++ Vector的使用(上) 叶羽西 C++c++开发语言
注：这里以C++11版本为基础，简单介绍vector的特性和常见使用。目录vector简介vector特性vector的定义vector对象的构造和初始化1.构造一个空的vector2.构造一个容量大小为n的vector3.构造一个vector，初始值为指定的数据片段4.拷贝构造一个vector对象5.移动构造一个vector对象6.直接使用列表初始化&构造vector对象vector中元素的遍历
git和解决冲突代码杂货铺子 git gitlab
安装包：Git-Downloadsgit小乌龟：TortoiseGit–WindowsShellInterfacetoGit简单介绍git一般指git还有gitlab,实际工程使用时依据项目建立的位置或者需要使用到的特性不同，可以自行选择，基础功能都差不多。git安装后会提供类似shell一样的命令行管理工具，直接在git工程所在的目录右键鼠标单击打开就可以。TortoiseGit是提供了一个类似
入门pytorch-联邦学习四代机您发多少 pytorch 人工智能 python
本文联邦学习的代码引用于https://github.com/shaoxiongji/federated-learning本篇文章相当于带大家读一遍联邦学习的代码，同时加深了大家对联邦学习和Pytorch框架的理解。这里想简单介绍一下联邦学习。联邦学习说白了，就是假如有NNN个数据拥有者F1,...,FN{F_1,...,F_N}F1,...,FN，他们希望使用这些数据来训练机器学习模型，但是又各
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l

xgboost简单介绍_XGBOOST模型介绍

你可能感兴趣的:(xgboost简单介绍)