浅笑古今

XGBoost调参笔记

将之前XGBoost的笔记整理在CSDN上。

一、通用参数

一、这些参数用来控制XGBoost的宏观功能。

1、booster[默认gbtree] 选择每次迭代的模型，有两种选择： gbtree：基于树的模型 gbliner：线性模型

2、silent[默认0] 当这个参数值为1时，静默模式开启，不会输出任何信息。一般这个参数就保持默认的0，因为这样能帮我们更好地理解模型。

3、nthread[默认值为最大可能的线程数] 这个参数用来进行多线程控制，应当输入系统的核数。如果你希望使用CPU全部的核，那就不要输入这个参数，算法会自动检测它。还有两个参数，XGBoost会自动设置，目前你不用管它。接下来咱们一起看booster参数。

二、booster参数尽管有两种booster可供选择，我这里只介绍tree booster，因为它的表现远远胜过linear booster，所以linear booster很少用到。

1、eta[默认0.3] 和GBM中的 learning rate 参数类似。通过减少每一步的权重，可以提高模型的鲁棒性。典型值为0.01-0.2。

2、min_child_weight[默认1] 决定最小叶子节点样本权重和。和GBM的 min_child_leaf 参数类似，但不完全一样。XGBoost的这个参数是最小样本权重的和，而GBM参数是最小样本总数。这个参数用于避免过拟合。当它的值较大时，可以避免模型学习到局部的特殊样本。但是如果这个值过高，会导致欠拟合。这个参数需要使用CV来调整。

3、max_depth[默认6] 和GBM中的参数相同，这个值为树的最大深度。这个值也是用来避免过拟合的。max_depth越大，模型会学到更具体更局部的样本。需要使用CV函数来进行调优。典型值：3-10

4、max_leaf_nodes 树上最大的节点或叶子的数量。可以替代max_depth的作用。因为如果生成的是二叉树，一个深度为n的树最多生成n2个叶子。如果定义了这个参数，GBM会忽略max_depth参数。

5、gamma[默认0] 在节点分裂时，只有分裂后损失函数的值下降了，才会分裂这个节点。Gamma指定了节点分裂所需的最小损失函数下降值。这个参数的值越大，算法越保守。这个参数的值和损失函数息息相关，所以是需要调整的。

6、max_delta_step[默认0] 这参数限制每棵树权重改变的最大步长。如果这个参数的值为0，那就意味着没有约束。如果它被赋予了某个正值，那么它会让这个算法更加保守。通常，这个参数不需要设置。但是当各类别的样本十分不平衡时，它对逻辑回归是很有帮助的。这个参数一般用不到，但是你可以挖掘出来它更多的用处。

7、subsample[默认1] 和GBM中的subsample参数一模一样。这个参数控制对于每棵树，随机采样的比例。减小这个参数的值，算法会更加保守，避免过拟合。但是，如果这个值设置得过小，它可能会导致欠拟合。典型值：0.5-1

8、colsample_bytree[默认1] 和GBM里面的max_features参数类似。用来控制每棵随机采样的列数的占比(每一列是一个特征)。典型值：0.5-1

9、colsample_bylevel[默认1] 用来控制树的每一级的每一次分裂，对列数的采样的占比。我个人一般不太用这个参数，因为subsample参数和colsample_bytree参数可以起到相同的作用。但是如果感兴趣，可以挖掘这个参数更多的用处。

10、lambda[默认1] 权重的L2正则化项。(和Ridge regression类似)。这个参数是用来控制XGBoost的正则化部分的。虽然大部分数据科学家很少用到这个参数，但是这个参数在减少过拟合上还是可以挖掘出更多用处的。

11、alpha[默认1] 权重的L1正则化项。(和Lasso regression类似)。可以应用在很高维度的情况下，使得算法的速度更快。

12、scale_pos_weight[默认1] 在各类别样本十分不平衡时，把这个参数设定为一个正值，可以使算法更快收敛。

三、学习目标参数这个参数用来控制理想的优化目标和每一步结果的度量方法。

1、objective[默认reg:linear] 这个参数定义需要被最小化的损失函数。最常用的值有： binary:logistic 二分类的逻辑回归，返回预测的概率(不是类别)。 multi:softmax 使用softmax的多分类器，返回预测的类别(不是概率)。在这种情况下，你还需要多设一个参数：num_class(类别数目)。 multi:softprob 和multi:softmax参数一样，但是返回的是每个数据属于各个类别的概率。

2、eval_metric[默认值取决于objective参数的取值] 对于有效数据的度量方法。对于回归问题，默认值是rmse，对于分类问题，默认值是error。典型值有： rmse 均方根误差(∑Ni=1ϵ2N−−−−−√) mae 平均绝对误差(∑Ni=1|ϵ|N) logloss 负对数似然函数值 error 二分类错误率(阈值为0.5) merror 多分类错误率 mlogloss 多分类logloss损失函数 auc 曲线下面积

3、seed(默认0) 随机数的种子设置它可以复现随机数据的结果，也可以用于调整参数

Python的XGBoost模块有一个sklearn包，XGBClassifier。这个包中的参数是按sklearn风格命名的。会改变的函数名是：

1、eta -> learning_rate

2、lambda -> reg_lambda

3、alpha -> reg_alpha

二、引入必要包

编译环境python2.7

import numpy as np
import pandas as pd
from xgboost.sklearn import XGBClassifier
from sklearn import  metrics  
import xgboost as xgb 
from sklearn.grid_search import GridSearchCV 

from sklearn.preprocessing import MinMaxScaler   #最大最小归一化
from sklearn.preprocessing import StandardScaler   #标准化
from sklearn.model_selection import train_test_split     #划分数据集
from sklearn.model_selection import cross_val_score  
import matplotlib.pyplot as plt

三、读入文件并划分数据集

data=pd.read_csv('D:\data.csv',header=None) 
#0-10列为特征
X=data.iloc[:,:11]
#第11列为标签                           
y=data.iloc[:,11] 
params=[ 1, 4,  6, 7, 8, 9,10]
X=X[params]
mydict={5:0,6:1}
y=y.replace(mydict)
'''
data= pd.read_csv("G:/feature_code/wine_data.csv",header=None)
#0-10列为特征
X=data.iloc[:,:13]
#第11列为标签                           
y=data.iloc[:,13] 
'''

#划分训练集和测试集  
X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.3,random_state=0) 
#此处采用最大最小归一化， 可以换成StandardScaler()归一化方法,如果用StandardScaler()方法的话，则不能使用MultinomialNB()模型
ss=MinMaxScaler()
#ss=StandardScaler()                           
X_train=ss.fit_transform(X_train)
X_test=ss.transform(X_test)

四、参数调优的一般方法

第一步：确定学习速率和tree_based 参数调优的估计器数目

为了确定boosting参数，我们要先给其它参数一个初始值。咱们先按如下方法取值：

1、max_depth = 5 :这个参数的取值最好在3-10之间。我选的起始值为5，但是你也可以选择其它的值。起始值在4-6之间都是不错的选择。

2、min_child_weight = 1:在这里选了一个比较小的值，因为这是一个极不平衡的分类问题。因此，某些叶子节点下的值会比较小。

3、gamma = 0: 起始值也可以选其它比较小的值，在0.1到0.2之间就可以。这个参数后继也是要调整的。

4、subsample, colsample_bytree = 0.8: 这个是最常见的初始值了。典型值的范围在0.5-0.9之间。

5、scale_pos_weight = 1: 这个值是因为类别十分不平衡。

评分函数如下，cvresult.shape[0]是其中我们用的树的个数，cvresult的结果是一个DataFrame.

def tun_parameters(train_x,train_y):  #通过这个函数，确定树的个数
    xgb1 = XGBClassifier(learning_rate=0.1,n_estimators=1000,max_depth=5,min_child_weight=1,gamma=0,subsample=0.8,  
                         colsample_bytree=0.8,objective= 'binary:logistic',scale_pos_weight=1,seed=27)  
    modelfit(xgb1,train_x,train_y)  

def modelfit(alg,X, y,useTrainCV=True, cv_folds=5, early_stopping_rounds=50):
    if useTrainCV:
        xgb_param = alg.get_xgb_params()
        xgtrain = xgb.DMatrix(X, label=y)
        cvresult = xgb.cv(xgb_param, xgtrain, num_boost_round=alg.get_params()['n_estimators'], nfold=cv_folds,
            metrics='auc', early_stopping_rounds=early_stopping_rounds)
        alg.set_params(n_estimators=cvresult.shape[0])

    #Fit the algorithm on the data
    alg.fit(X, y,eval_metric='auc')

    #Predict training set:
    dtrain_predictions = alg.predict(X)
    dtrain_predprob = alg.predict_proba(X)[:,1]

    #Print model report:
    print "\nModel Report"
    print "Accuracy : %.4g" % metrics.accuracy_score(y, dtrain_predictions)
    print "AUC Score (Train): %f" % metrics.roc_auc_score(y, dtrain_predprob)

    feat_imp = pd.Series(alg.booster().get_fscore()).sort_values(ascending=False)
    feat_imp.plot(kind='bar', title='Feature Importances')
    plt.ylabel('Feature Importance Score')
    plt.show()
    print ('n_estimators=',cvresult.shape[0])
tun_parameters(X_train,y_train)

得到的结果如下：

Model Report
Accuracy : 0.9932
AUC Score (Train): 0.999483

('n_estimators=', 149)

由以上可以得知，n_estimators在149附近得分较高，这里我们定为160。

第二步： max_depth 和 min_child_weight 参数调优

param_test1 = {
  'max_depth':range(3,10,1),
 'min_child_weight':range(1,6,1)
}
gsearch1 = GridSearchCV(estimator = XGBClassifier(learning_rate =0.1, n_estimators=160, max_depth=5,
min_child_weight=1, gamma=0, subsample=0.8,colsample_bytree=0.8,\
 objective= 'binary:logistic', nthread=8,scale_pos_weight=1, seed=27), 
 param_grid = param_test1,scoring='roc_auc',n_jobs=-1,iid=False, cv=5)
gsearch1.fit(X_train,y_train)
gsearch1.grid_scores_, gsearch1.best_params_,     gsearch1.best_score_

输出结果：

([mean: 0.82976, std: 0.03871, params: {'max_depth': 3, 'min_child_weight': 1},
  mean: 0.82267, std: 0.03838, params: {'max_depth': 3, 'min_child_weight': 2},
  mean: 0.82381, std: 0.03256, params: {'max_depth': 3, 'min_child_weight': 3},
  mean: 0.82485, std: 0.03624, params: {'max_depth': 3, 'min_child_weight': 4},
  mean: 0.82675, std: 0.03886, params: {'max_depth': 3, 'min_child_weight': 5},
  mean: 0.83304, std: 0.03457, params: {'max_depth': 4, 'min_child_weight': 1},
  mean: 0.82880, std: 0.03161, params: {'max_depth': 4, 'min_child_weight': 2},
  mean: 0.82728, std: 0.03785, params: {'max_depth': 4, 'min_child_weight': 3},
  mean: 0.82573, std: 0.03456, params: {'max_depth': 4, 'min_child_weight': 4},
  mean: 0.82602, std: 0.03530, params: {'max_depth': 4, 'min_child_weight': 5},
  mean: 0.84278, std: 0.03508, params: {'max_depth': 5, 'min_child_weight': 1},
  mean: 0.83271, std: 0.03385, params: {'max_depth': 5, 'min_child_weight': 2},
  mean: 0.83704, std: 0.03842, params: {'max_depth': 5, 'min_child_weight': 3},
  mean: 0.83135, std: 0.03563, params: {'max_depth': 5, 'min_child_weight': 4},
  mean: 0.83296, std: 0.03596, params: {'max_depth': 5, 'min_child_weight': 5},
  mean: 0.84567, std: 0.03272, params: {'max_depth': 6, 'min_child_weight': 1},
  mean: 0.84004, std: 0.03596, params: {'max_depth': 6, 'min_child_weight': 2},
  mean: 0.84208, std: 0.03857, params: {'max_depth': 6, 'min_child_weight': 3},
  mean: 0.83590, std: 0.03457, params: {'max_depth': 6, 'min_child_weight': 4},
  mean: 0.83589, std: 0.03384, params: {'max_depth': 6, 'min_child_weight': 5},
  mean: 0.84671, std: 0.03359, params: {'max_depth': 7, 'min_child_weight': 1},
  mean: 0.84859, std: 0.03605, params: {'max_depth': 7, 'min_child_weight': 2},
  mean: 0.83874, std: 0.03580, params: {'max_depth': 7, 'min_child_weight': 3},
  mean: 0.83764, std: 0.03310, params: {'max_depth': 7, 'min_child_weight': 4},
  mean: 0.83819, std: 0.03368, params: {'max_depth': 7, 'min_child_weight': 5},
  mean: 0.85194, std: 0.02960, params: {'max_depth': 8, 'min_child_weight': 1},
  mean: 0.84527, std: 0.03501, params: {'max_depth': 8, 'min_child_weight': 2},
  mean: 0.84182, std: 0.03419, params: {'max_depth': 8, 'min_child_weight': 3},
  mean: 0.84404, std: 0.03891, params: {'max_depth': 8, 'min_child_weight': 4},
  mean: 0.83545, std: 0.03571, params: {'max_depth': 8, 'min_child_weight': 5},
  mean: 0.85286, std: 0.03072, params: {'max_depth': 9, 'min_child_weight': 1},
  mean: 0.84223, std: 0.03226, params: {'max_depth': 9, 'min_child_weight': 2},
  mean: 0.84194, std: 0.03670, params: {'max_depth': 9, 'min_child_weight': 3},
  mean: 0.83782, std: 0.03854, params: {'max_depth': 9, 'min_child_weight': 4},
  mean: 0.83986, std: 0.03436, params: {'max_depth': 9, 'min_child_weight': 5}],
 {'max_depth': 9, 'min_child_weight': 1},
 0.8528642989777853)

第三步：gamma参数调优

param_test3 = {  
    'gamma': [i / 10.0 for i in range(0, 5)]  
}  
gsearch3 = GridSearchCV(  
    estimator=XGBClassifier(learning_rate=0.1, n_estimators=160, max_depth=9, min_child_weight=1, gamma=0,  
                            subsample=0.8, colsample_bytree=0.8, objective='binary:logistic', nthread=8,  
                            scale_pos_weight=1, seed=27), param_grid=param_test3, scoring='roc_auc', n_jobs=-1,  
    iid=False, cv=5)  
gsearch3.fit(X_train,y_train)  
gsearch3.grid_scores_, gsearch3.best_params_, gsearch3.best_score_

([mean: 0.85286, std: 0.03072, params: {'gamma': 0.0},
  mean: 0.85098, std: 0.03405, params: {'gamma': 0.1},
  mean: 0.84811, std: 0.03470, params: {'gamma': 0.2},
  mean: 0.84774, std: 0.03139, params: {'gamma': 0.3},
  mean: 0.85163, std: 0.03478, params: {'gamma': 0.4}],
 {'gamma': 0.0},
 0.8528642989777853)

第四步：调整subsample 和 colsample_bytree 参数

param_test4 = {  
    'subsample': [i / 10.0 for i in range(6, 10)],  
    'colsample_bytree': [i / 10.0 for i in range(6, 10)]  
}  
  
gsearch4 = GridSearchCV(  
    estimator=XGBClassifier(learning_rate=0.1, n_estimators=160, max_depth=9, min_child_weight=1, gamma=0.0,  
                            subsample=0.8, colsample_bytree=0.8, objective='binary:logistic', nthread=8,  
                            scale_pos_weight=1, seed=27), param_grid=param_test4, scoring='roc_auc', n_jobs=-1,  
    iid=False, cv=5)  
  
gsearch4.fit(X_train,y_train)  
gsearch4.grid_scores_, gsearch4.best_params_, gsearch4.best_score_

([mean: 0.85143, std: 0.02386, params: {'subsample': 0.6, 'colsample_bytree': 0.6},
  mean: 0.84930, std: 0.03307, params: {'subsample': 0.7, 'colsample_bytree': 0.6},
  mean: 0.85171, std: 0.02794, params: {'subsample': 0.8, 'colsample_bytree': 0.6},
  mean: 0.84891, std: 0.03152, params: {'subsample': 0.9, 'colsample_bytree': 0.6},
  mean: 0.85143, std: 0.02386, params: {'subsample': 0.6, 'colsample_bytree': 0.7},
  mean: 0.84930, std: 0.03307, params: {'subsample': 0.7, 'colsample_bytree': 0.7},
  mean: 0.85171, std: 0.02794, params: {'subsample': 0.8, 'colsample_bytree': 0.7},
  mean: 0.84891, std: 0.03152, params: {'subsample': 0.9, 'colsample_bytree': 0.7},
  mean: 0.84747, std: 0.03242, params: {'subsample': 0.6, 'colsample_bytree': 0.8},
  mean: 0.85011, std: 0.03286, params: {'subsample': 0.7, 'colsample_bytree': 0.8},
  mean: 0.85286, std: 0.03072, params: {'subsample': 0.8, 'colsample_bytree': 0.8},
  mean: 0.85603, std: 0.03126, params: {'subsample': 0.9, 'colsample_bytree': 0.8},
  mean: 0.85209, std: 0.03343, params: {'subsample': 0.6, 'colsample_bytree': 0.9},
  mean: 0.84802, std: 0.03122, params: {'subsample': 0.7, 'colsample_bytree': 0.9},
  mean: 0.84961, std: 0.03265, params: {'subsample': 0.8, 'colsample_bytree': 0.9},
  mean: 0.85207, std: 0.03004, params: {'subsample': 0.9, 'colsample_bytree': 0.9}],
 {'colsample_bytree': 0.8, 'subsample': 0.9},
 0.856033966896773)

第五步：正则化参数调优 reg_alpha和reg_lambda(这里只调了reg_alpha)

param_test6 = {  
 'reg_alpha':[1e-5,1e-4,1e-3, 1e-2, 0.1, 1, 100]  
}  
gsearch6 = GridSearchCV(estimator = XGBClassifier( learning_rate =0.1, n_estimators=160, max_depth=9, min_child_weight=1, 
    gamma=0.0, subsample=0.9, colsample_bytree=0.8, objective= 'binary:logistic', nthread=8, 
    scale_pos_weight=1,seed=27), param_grid = param_test6, scoring='roc_auc',n_jobs=-1,iid=False, cv=5)  
gsearch6.fit(X_train,y_train)  
gsearch6.grid_scores_, gsearch6.best_params_, gsearch6.best_score_

上述训练过程中，可以针对具体参数进行更细致的调优。用以上调好的参数代入模型，并降低模型学习率learning_rate=0.01增大n_estimators=5000，如果计算能力允许的条件下，可以进一步降低学习率。训练好的模型的准确率和AUC得分相对于之前都有提高。

def tun_parameters2(train_x,train_y):  #通过这个函数，确定树的个数
    xgb1 = XGBClassifier(learning_rate =0.01, n_estimators=5000, max_depth=9, min_child_weight=1, 
    gamma=0.0, subsample=0.9, colsample_bytree=0.8,reg_alpha= 1e-05, objective= 'binary:logistic', nthread=8,
    scale_pos_weight=1,seed=27)
    modelfit(xgb1,train_x,train_y)  
tun_parameters2(X_train,y_train)

Model Report
Accuracy : 0.9989
AUC Score (Train): 0.999979

('n_estimators=', 630)

切记：

特征决定上限，调参只是帮助我们逼近这个上限而已

c++自学日记 day11 清风0407 c++开发语言
1、多态：多态的基本概念多态是C++面向对象三大特性之一多态分为两类静态多态:函数重载和运算符重载属于静态多态，复用函数名动态多态:派生类和虚函数实现运行时多态静态多态和动态多态区别：静态多态的函数地址早绑定-编译阶段确定函数地址动态多态的函数地址晚绑定-运行阶段确定函数地址总结：多态满足条件有继承关系子类重写父类中的虚函数多态使用条件父类指针或引用指向子类对象重写：函数返回值类型函数名参数列表完
2023-04-07 爱学习的阿布
备考中医助理医师，时间规划和必备干货！备考中医助理医师这些干货内容你一定要知道，第一次考中医执业助理医师的可能对被考科目的重难点知识点还不是太了解，尤其是自学的同学可能会摸不着重点，今天我就来跟大家细说一下备考中医助理医师的那些干货内容我将分别从以下方面给大家介绍1.考试时间安排2.备考阶段技巧和方法3.备考中医助理医师重要知识点干货内容一.考试时间安排2月1-2月15进行网上报名2月20-3月5
Matlab自学笔记六十四：求解自变量带有约束条件的方程
1.说明有一些方程由于实际问题的需要，需要设置一些限制约束条件，例如x>0等，若使用Matlab编程求解，首先尝试使用符号运算求解（符号运算可参考文章54：Matlab自学笔记五十四：符号数学工具箱和符号运算、符号求解、绘图），简单的约束条件可以在声明sym变量的时候直接写出，复杂的约束条件可能需要使用assume设置假设条件（符号变量假设条件的用法请参考文章56：Matlab快速上手五十六：详解
盘点学霸让人目瞪口呆的神仙操作！这样的学霸你怕了吗？饿到成功后
一个班上有学渣就有学霸。学渣想必大家都见过，学霸也见过不少。那么极致的学霸大家见过吗？他们由于天赋太好，成绩奇高，常常会做出一些让人目瞪口呆的神仙操作。今天小编就来分享学霸们让人目瞪口呆的神仙操作，一起来看看吧！一星学霸：上课酣然大睡，还能得到老师的允许不知道大家见过这样的学霸吗？他们认为老师为了照顾大多数同学以至于讲课进度以及深度不够，于是抽课余、夜晚的时间进行自学。这类学霸们不仅对于本学期的知
C语言自学日记（三）变量与常量
初学者肯定很懵逼，变量是什么？常量是什么？在数学中，令x=1或者令x=1.10在纸上一写便是，但我们要是在C语言中应该怎么办？在这里我们写一段简单的两端代码#includeintmain(){intx;x=1;return0;}int是什么，如果对前文了解的，应该能明白这是一种数据类型，名为整数类型，它的语法是：数据类型变量名；看到这里，我们就可以对变量做一个简单的介绍，确定目标并提供存放的空间。
想学配音怎么自学，配音小白如何接单配音就业圈
自学配音：从零基础到接单实战的指南在声音的广阔世界里，配音不仅是语言的艺术，更是情感的传递者。如果你怀揣着对配音的热爱与梦想，想要从零开始自学并最终踏上接单之路，那么请跟随这份详尽而有力的指南，一步步解锁你的声音魅力。配音兼职接单推荐公众号，配音新手圈，声优配音圈，新配音兼职圈，配音就业圈，鼎音副业，有声新手圈，每天更新各种的配音任务，新手小白也可以接单。1、配音新手圈这是一个公众号配音新手圈里面
FPGA自学——整体设计思路 Sunrise黎 fpga自学 fpga 学习
FPGA自学——整体设计思路1.设计定义写一套硬件描述语言，能够在指定的硬件平台上实现响应的功能根据想要实现的功能进行设定（如：让LED一秒闪烁一次）2.设计输入方法：编写逻辑：使用verilog代码描述逻辑画逻辑图使用IP3.分析综合（EDA）逻辑门级别的电路内容：对所写的逻辑描述的内容进行分析4.功能仿真1.目的：使用专门的仿真工具进行仿真，验证设计的逻辑功能能够实现2.仿真工具：models
劝你别瞎自学！2025AI大模型路线图，手把手教你！大模型新人必看，少走三年弯路就靠这篇！ AGI大模型老王人工智能程序员 chatgpt AI产品经理大模型 AI 大模型学习
这两年，大模型从实验室里的高冷研究，走到每个程序员、学生、转行者的聊天框和职业规划表里。几乎每天都有人来问我："师兄，我是做后端的，能不能转大模型？""我在看一些课程，不知道该学哪些才有用？""我试着搭了个模型，发现全是坑，是不是我不适合？"今天这篇文章，我不打算讲那些泛泛而谈的大模型原理，我就站在一个“老转行人+老程序员+老训练营主理人”的角度，跟你聊聊：大模型怎么转？适合哪些人？哪些方向对新手
感恩日记（D655）康盟家具
2023年8月5日张静芳的感恩日记255：1、感恩全家人都有自己喜欢的运动项目，晚上都各自进行着自己的运动，既健身又让生活充满活力。先生喜欢打篮球，每天晚上的主要娱乐项目就是到楼下球场打篮球。大宝以前是学校足球的运动员，进入中学后，学校没有足球队，大宝又自学了篮球，现在在学校虽然学习非常紧张，但孩子还是会坚持运动，到球场打球。彤宝昨晚刚到家，今天晚上就开启了游泳项目，晚饭后休息片刻便到楼下泳池游泳
人脸识别实战：使用Python OpenCV 和深度学习进行人脸识别(2)
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新Python全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课
书读一半，课上几节，蓄力明天再战！ Joey琳爱读书
先打预防针，我今天又要水文了。先说上课，相比现在的学习状态和精气神，我知道，之前的几节课是水过去了。网课上到23点。之前要是晚上听课，脑子容易稀里糊涂的，而且不就就想睡觉。今天倒是清醒得很，一个手机，一本原题；一个人的房间，一节课的时间。明明白白地过来了，果真有学习方法就是不一样，效率提升不少。（不过知识付费贵，特别羡慕自学就能行的人）。今天晚上是休战了，写到这里已经23：31了。明天继续努力，学
大师兄，是我的男闺蜜一叶悠
难忘青葱岁月01“大师兄”，是他让我喊的。严格地说，也不算是师兄吧。我考入师范时，他正好毕业，回家乡做老师。我师范毕业时，他从军已经一年。我工作一年后，大师兄来到我任教的学校从教。在这之前，我俩谁也不认识谁。他来到我们学校时，我正为了备战自学考试，自己一个人住在安静的学校宿舍里。他来了，也要求住在学校宿舍里。那时候，学校宿舍是一个个民房，我的房子在西，他的房子在东。通过厨房的窗户，我们俩可以对话！
又是昏昏噩噩的一天惠风和畅m
今天八月十七号，儿子在家自学，早上六点半起床背英语单词去了，我昏昏沉沉的到六点五十起床，强迫自己做早饭：小米粥，腊肠炒白菜，又热了一块馍，蒸了两个鸡蛋。吃完饭开始摆弄电脑，一个儿子用着哩，我只好把那台旧电脑弄出来试试，开始还可以，到九点的时候，突然上不了网了。无聊，又开始刷手机视频。十点，儿子出来问：“中午做啥饭？”我说：“蒸米饭，可以吗？”“什么菜？”他问。“红烧肉，凉拌黄瓜”我答。“那你现在做
数据结构自学笔记（二）：时间复杂度与空间复杂度
时间复杂度和空间复杂度知识点一、知识点描述时间复杂度核心定义：描述算法时间开销随问题规模nnn增长的趋势，用大O符号表示（忽略常数、低阶项和系数）。大O规则：只看最高阶项（如O(n2+n)→O(n2)O(n^2+n)\rightarrowO(n^2)O(n2+n)→O(n2)）。忽略系数（如O(5n3)→O(n3)O(5n^3)\rightarrowO(n^3)O(5n3)→O(n3)）。常数项记
数据结构自学笔记（四）：单链表，双链表，循环链表和静态链表
根据提供的图片内容，整理链表核心知识点笔记如下：一.单链表定义：通过指针串联节点的线性结构，每个节点包含数据域和指向后继节点的指针。typedefstructLNode{ElemTypedata;//数据域structLNode*next;//指针域（指向后继结点）}LNode,*LinkList;//LinkList为单链表头指针类型特性：带头结点：空表判断L->next==NULL，操作统一不
想学配音怎么自学，怎么才能进入配音行业声优配音圈
一、自学配音的步骤自学配音是一种提升自身技能的有效方法，具体步骤如下：兼职副业推荐公众号，配音新手圈，声优配音圈，新配音兼职圈，配音就业圈，鼎音副业，有声新手圈，每天更新各种远程工作与在线兼职，职位包括：写手、程序开发、剪辑、设计、翻译、配音、无门槛、插画、翻译、等等。。。每日更新兼职。1.了解配音基础知识，包括发音、节奏等；2.学习模仿各种声音和语调，提高自己的音色变化能力；3.多观察、多倾听，
自学软件测试需要学什么？ AIZHINAN 软件测试软件测试面试自学软件测试软件测试培训转行软件测试
软件测试是一个系统化的领域，需要掌握测试理论、工具、编程、环境配置、业务流程等多方面知识。以下是系统化的学习路径，涵盖从入门到进阶的核心内容：软件测试视频教程，从入门到精通（完整版）零基础小白也可学！一、测试理论基础1.测试基础概念软件测试的定义、目的（质量保障、缺陷预防）。测试流程：需求分析→测试计划→用例设计→执行→缺陷管理→报告。常见术语：黑盒/白盒测试、回归测试、冒烟测试、Alpha/Be
自学中医笔记（一）牧子与羊笔记中医
我的中医自学笔记Q&A自学原因：最开始我也不太信中医，我室友也说中医太玄学了。由于我从小一直都很瘦，吃饭每次都吃得少，上大学那会儿171cm最多也才101斤，而且一年胃病要犯好几次，后来无意中收获了一篇中医调理脾胃的方子，后来食欲变好了，大学毕业时候终于上了110斤，胃病之后就没有再复发过，所以也是从这里开始改变了我对中医的看法，使我产生了极大的兴趣。学记录笔记之前我也基本了解过一些中医中的术语，
想学配音怎么自学，没有基础怎么学配音声优配音圈
一、自学配音的方法自学配音的方法有很多种，可以通过观看配音教学视频、参加配音培训班、阅读相关教材等方式进行学习。兼职副业推荐公众号，配音新手圈，声优配音圈，新配音兼职圈，配音就业圈，鼎音副业，有声新手圈，每天更新各种远程工作与在线兼职，职位包括：写手、程序开发、剪辑、设计、翻译、配音、无门槛、插画、翻译、等等。。。每日更新兼职。此外，还可以通过模仿优秀配音演员的表演，不断练习来提高自己的配音技能。
读名老中医之路笔记（一）岳美中：无恒难以做医生 weixin_33937499
岳美中：无恒难以做医生岳美中先生虽然处于流离颠沛的年代中，通过不断的刻苦学习，终成一代名医。岳老从《衷中参西录》、《歌头汤诀》、《药性赋》一路走到《伤寒论》《金匮要略》，后又学习唐代祛疾利器《千金》、《外台》等书，他的读书经验：一、对中华古典文化的学习，培养读书的能力和习惯二、读书宁涩勿滑，对经典著作每个字句要读懂掌握，强调对经典著作熟读甚至必须背诵三、自学必当知道自己的短处，每个人都有他的优点，
我的自学中医笔记 hbxncjs 中医其他经验分享
藏象之心系统形态描述古代的形态描述跟现代差不多心居肺管之下，隔膜之上，心象尖圆形，如莲蕊，外有赤黄裹脂，是为心包络——【类经图骥·经络】心与内外环境的联系不讲心的主要生理功能心主血脉心气推动和调控血液在脉中运行，流注全身，发挥营养和滋润的作用要素：血、脉、心气主血：营养、心生血（心生血这个概念用的不多）肉桂可补心阳，补阳来促进化气主脉：心气推动与调控心脏的搏动和脉管的舒缩，使脉道通利。血正常运行的
我的90天PPT修行历程舞动_Echo
大家好，我是PPT营销力50期超越梦想最666组的黄玉丽看到我的名字你们应该能感受到我本是软妹子But，你们知道吗~提前嘚瑟一下我居然打卡了一次线下演讲秀的总统筹这其中的飞跃让我忍不住回过头看看自己究竟做了什么起源自工作以来，一直在修炼自己负责公司对外分享的PPT一次成功的商业分享不仅需要演讲者本身的能力更需要ppt视觉传达力的冲击在PPT学习道路上一直孤军奋战自学过程中水平持续保持稳定因此一直在
不要为了恋爱而恋爱…… 小呆先生
18年秋，9月12日，小呆如愿进入了大学，大学的一切事物无不吸引着他，进入大学意味着自由，脱离了高中老师的步步紧逼，离开的父母的管束，自由的空气让小呆喜出望外……他对许多事物都充满了好奇，他不知所以的加入了学生会，也加入了学生社团，本来他想在学生会学点有用的东西，结果发现并不能学到什么，只是多了许多无休无止的来自学长学姐的任务，他的时间被学生会的事物占满，咋一看好像活的很充实，但其实小呆自己清楚，
暑期自学嵌入式——Day02（C语言阶段）一位搞嵌入式的 genius 嵌入式自学专栏 linux 嵌入式C语言
点关注不迷路哟。你的点赞、收藏，一键三连，是我持续更新的动力哟！！！主页：一位搞嵌入式的genius-CSDN博客https://blog.csdn.net/m0_73589512?spm=1000.2115.3001.5343目录Day02→数据类型（上）数据类型分类基本数据类型整形数据类型字符型数据类型实型数据类型构造数据类型特殊数据类型布尔类型详解基本概念使用注意事项预处理分析知识小结Day
暑期自学嵌入式——Day03（C语言阶段）一位搞嵌入式的 genius 嵌入式自学专栏 c语言开发语言 linux 嵌入式C语言
个人主页：一位搞嵌入式的genius-CSDN博客https://blog.csdn.net/m0_73589512?spm=1010.2135.3001.5343点关注不迷路哟。你的点赞、收藏，一键三连，是我持续更新的动力哟！！！目录Day03：输入输出(上)Day03→嵌入式开发输入输出（上）知识纲要数据输出1）C语言IO特性2）字符输出函数（putchar）例题：putchar函数应用3）编
暑期自学嵌入式——Day04（C语言阶段）一位搞嵌入式的 genius 嵌入式自学专栏嵌入式C语言 linux
点关注不迷路哟。你的点赞、收藏，一键三连，是我持续更新的动力哟！！！目录C语言控制语句控制语句if（上）一、控制语句分类1.基本结构与学习要求2.分支语句3.循环语句4.学习方法建议二、分支语句：if-else详解1.if语句概述2.if语句的常见形式（1）简化形式（省略else）（2）阶梯形式（elseif多分支）3.应用案例：输入分数评级题目要求设计思路与代码实现关键解析4.if语句的嵌套形式
级别的认识及定义无缠01
本吾自学缠论以来最搞不懂的就是级别，级别先是分单根K线、K线包容关系、分型、笔、线段、中枢、走势类型（为了区分叫结构级别）。之后又说了级别可分为1min、5min、15min、30min、60min、日、周、月、季、年（叫周期级别）。之后的背驰的判别就只是后面的时间周期了。不过缠论中也有解释这两者级别的区别。真正的级别是单根K线、K线包容关系、分型、笔、线段、中枢、走势类型。而时间周期只是不同级别
【自学linux】计算机体系结构和操作系统第二章 java攻城狮k 跟着QS50自学编程 linux 系统架构 unix 服务器
操作系统第一讲-介绍操作系统本门课程使用unix和linux作为案例讲解操作系统是如何工作的。首先学习给虚拟机安装和管理一个典型的linux系统，虚拟机运行在windows下。我们讨论操作系统是什么、它们在计算机环境中的使用和用一点篇幅回顾一下Unix系统的历史。一、介绍1、什么是操作系统(operatingsystemorO/S)?一种典型的大型软件，允许计算机硬件用户：1）运行各式各样的软件(
做自媒体自学好，还是花钱去培训好呢？兔子和铃铛
我认为首先你要清晰自己的目标，是想创业还是当做兴趣，或者是想找到一份工作。如果你只是兼职，基于自己的兴趣，那我个人认为自学就足够了，如果你想要创业，或者找工作，那你可能需要更深入的学习和系统的知识体系。目前无非就是四种学习方式如果你时间和金钱充足，且自律意识差，那可以寻找本地的线下机构学习。如果你没有特别充分的时间，但是学习能力强，自律性高，那你可以自学如果你金钱比较充足，自律意识较差，自学效率不
UI 组件 | Button 测试开发小白变怪兽
最近在与其他自学CocosCreator的小伙伴们交流过程中，发现许多小伙伴对基础组件的应用并不是特别了解，自己在编写游戏的过程中也经常对某个属性或者方法的用法所困扰，而网上也没有比较清晰的用法讲解，所以准备对常用的UI组件常用用法进行一个总结，方便自己和其他小伙伴们查看，下面正文开始（注：属性介绍部分大部分内容我会取自官方文档）。Button（按钮）组件Button组件可以响应用户的点击操作，当
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本

XGBoost调参笔记

一、通用参数

二、引入必要包

三、读入文件并划分数据集

四、参数调优的一般方法

切记：

你可能感兴趣的:(自学)