云流寂川

Kaggle竞赛——桑坦德银行客户满意度预测（四）

模型训练与评估

读取数据

#加载数据集
dataset = 'Normal'
train = pd.read_pickle('./data/santander-customer-satisfaction/output/train_normal.pkl')
test = pd.read_pickle('./data/santander-customer-satisfaction/output/test_normal.pkl')
X_train = train.drop(['ID','TARGET'],axis=1)
y_train = train['TARGET'].values
X_test = test.drop('ID',axis=1)
test_id = test['ID']

del train,test

#划分数据集
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, stratify=y_train, test_size=0.15)
X_train.shape, X_val.shape, X_test.shape

我们分别输出训练集、验证集、测试集的shape：

((64617, 336), (11403, 336), (75818, 336))

定义AUC函数和调参函数

ROC:接收器工作曲线
AUC(Area Under the Curve):ROC曲线下面积

接下来我们定义ROC曲线绘制函数

global i
i = 0

def plot_auc(y_true,y_pred,label,dataset = dataset):
    '''
    给出y_true和y_pred时绘制ROC曲线
    dataset:告诉我们使用了哪个数据集
    label:告诉我们使用了哪个模型，若label是一个列表，则绘制所有标签的所有ROC曲线
    '''
    if (type(label) != list) & (type(label) != np.array):
        print("\t\t %s on %s dataset \t\t \n" % (label, dataset))
        auc = roc_auc_score(y_true, y_pred)
        logloss = log_loss(y_true, y_pred)  #-(ylog(p) + (1-y)log(1-p)))
        label_1 = label + ' AUC=%.3f' % (auc)

        # 绘制ROC曲线
        fpr, tpr, threshold = roc_curve(y_true, y_pred)
        sns.lineplot(fpr, tpr, label=label_1)
        x = np.arange(0, 1.1, 0.1)  # 绘制AUC=0.5的直线
        sns.lineplot(x, x, label="AUC=0.5")
        plt.title("ROC on %s dataset" % (dataset))
        plt.xlabel('False Positive Rate')
        plt.ylabel("True Positive Rate")
        plt.legend(bbox_to_anchor=(1.05, 1), loc=2, borderaxespad=0.)  # 设置图例在图形外
        plt.show()
        print("在 %s 数据集上 %s 模型的 logloss = %.3f  AUC = %.3f" % (dataset, label, logloss, auc))

        # 创建结果数据框
        result_dict = {
            "Model": label,
            'Dataset': dataset,
            'log_loss': logloss,
            'AUC': auc
        }
        return pd.DataFrame(result_dict, index=[i])

    else:
        # 绘制ROC曲线
        plt.figure(figsize=(12, 8))
        for k, y in enumerate(y_pred):
            fpr, tpr, threshold = roc_curve(y_true, y)
            auc = roc_auc_score(y_true, y)
            label_ = label[k] + ' AUC=%.3f' % (auc)
            sns.lineplot(fpr, tpr, label=label_)

        x = np.arange(0, 1.1, 0.1)
        sns.lineplot(x, x, label="AUC=0.5")
        plt.title("Combined ROC")
        plt.xlabel('False Positive Rate')
        plt.ylabel("True Positive Rate")
        plt.legend(bbox_to_anchor=(1.05, 1), loc=2,borderaxespad=0.)
        plt.show()

继续定义调参函数

def find_best_params(model, params, cv=10, n_jobs=-1, X_train=X_train):
    """
    使用随机搜索RandomizedSearchCV调参，返回最佳模型
    """
    random_cv = RandomizedSearchCV(model,
                                   param_distributions=params,
                                   scoring='roc_auc',
                                   n_jobs=n_jobs,
                                   cv=cv,
                                   verbose=2)
    random_cv.fit(X_train, y_train)
    print("最佳的AUC得分为：%.3f" % (random_cv.best_score_))
    print("最佳的参数为：%s" % (random_cv.best_params_))
    return random_cv.best_estimator_

随后，我们将使用不同分类模型进行分类，并评估效果。

逻辑回归

逻辑回归我们主要调整的参数有：

正则化方式：L1和L2
惩罚系数C
是否拟合截距

# 初始化模型并设置参数
model_lr = LogisticRegression(class_weight='balanced')
params = {
    'penalty': ['l2', 'l1'],
    'C': [10.**i for i in np.arange(-3, 3, 1)],
    'fit_intercept': [True, False],
}
# 超参数寻优
find_best_params(model_lr, params)

得到的最佳超参数为：

Fitting 10 folds for each of 10 candidates, totalling 100 fits
最佳的AUC得分为：0.798
最佳的参数为：{'penalty': 'l2', 'fit_intercept': True, 'C': 0.001}

# 拟合调参后的模型
model_lr = LogisticRegression(C=0.001, class_weight='balanced')
model_lr.fit(X_train, y_train)
#存储结果并绘制ROC曲线
labels = []
y_preds = []
y_pred = model_lr.predict_proba(X_val)[:,1]

label = "Logistic Regression"
labels.append(label)
y_preds.append(y_pred)
i = 0
result = plot_auc(y_val, y_pred, label, dataset)
result_df = result
del result

获得的ROC曲线如下图所示：

在 Normal 数据集上 Logistic Regression 模型的 logloss = 0.533  AUC = 0.814

决策树（Decision Trees）

下面需要介绍决策树调参常用的四个参数及其意义

max_depth：限制树的最大深度，大于这个深度的，全部剪掉
min_samples_leaf：在节点分支时，表示分支后的节点至少要含有至少min_samples_leaf 个样本，否则这个节点就不分
min_samples_split：在节点分支时，表示这个节点本身必须含有至少min_samples_split个样本，否则这个节点就不分，注意和上面一个参数区分，上面是讲这个节点分支后的节点的含有样本最小个数，而这个参数是将这个节点还没分之前自己本身所含有的样本最小个数
max_features：在节点分裂时，考虑的最大的特征数量，也就是在每一个节点分支划分时，并不是所有的都特征都考虑，而是考虑一部分，大于max_features 的特征都将被舍弃

model_dt = DecisionTreeClassifier(class_weight='balanced')
params = {
    'max_depth':[10,100,500,1000,-1],
    'min_samples_split':[2,5,10,100,-1],
    'min_samples_leaf':[1,3,5,7,10],
    'max_leaf_nodes':[100,500,1000,5000,-1]
}
find_best_params(model_dt,params)

Fitting 10 folds for each of 10 candidates, totalling 100 fits
最佳的AUC得分为：0.707
最佳的参数为：{'min_samples_split': 100, 'min_samples_leaf': 7, 'max_leaf_nodes': 5000, 'max_depth': 1000}

model_dt = DecisionTreeClassifier(class_weight='balanced',max_depth=10,
                                  max_leaf_nodes=500,
                                  min_samples_leaf=10,
                                  min_samples_split=5)
model_dt.fit(X_train,y_train)
cc_model_dt = CalibratedClassifierCV(model_dt,cv='prefit')
cc_model_dt.fit(X_train,y_train)

CalibratedClassifierCV概率校准原理?

执行分类时, 我们经常希望不仅可以预测类标签, 还要获得相应标签的概率. 这个概率给你一些预测的信心. 一些模型可以给你贫乏的概率估计, 有些甚至不支持概率预测. 校准模块可以让您更好地校准给定模型的概率, 或添加对概率预测的支持.
对于不用于模型拟合的新数据, 应进行概率校准. 类 CalibratedClassifierCV 使用交叉验证生成器, 并对每个拆分模型参数对训练样本和测试样本的校准进行估计. 然后对折叠预测的概率进行平均. 已经安装的分类器可以通过:class:CalibratedClassifierCV 传递参数 cv =”prefit” 这种方式进行校准. 在这种情况下, 必须手动注意模型拟合和校准的数据是不相交的.

1、什么是概率校准？为什么需要概率校准？

众所周知，对于一个分类模型而言，其主要的任务预测未知样本属于哪个预定义的类别。但在某些场景中，我们不仅希望得到样本的类别标签，也希望知道这样分类的把握有多大。例如，银行在对客户进行评分时，并不满足于识别出该用户是否存在信用风险，更希望能够确定客户存在信用风险的概率，以便计算客户违约带来的期望损失，使得银行能够准备充足的资本以应对风险。
我们知道，有一些模型本身的输出可以代表概率，如逻辑回归和朴素贝叶斯模型；但一些复杂的非线性机器学习算法是无法直接进行概率预测的。因此，有必要对分类结果进行再学习以得到概率，这就是通常意义上说的概率校准。
事实上，概率校准不仅能够将非概率分类模型的输出转化为概率，而且也能够对概率分类模型的结果进行进一步修正。例如，在经过概率校准的逻辑回归模型输出的所有概率为0.8的样本中，大约有80%的样本实际上确实属于正例——在校准之前，可能结果并不是这样。

下面给出一篇博客，他将概率校准原理讲解的通俗易懂：

概率校准原理及其实现

我们回到决策树的模型训练过程，在model_dt拟合数据并进行概率校准之后，我们在测试集上进行分类并输出ROC曲线：

y_pred = cc_model_dt.predict_proba(X_val)[:, 1]
label = "Decision Tree Classifier"
labels.append(label)
y_preds.append(y_pred)

i += 1
result = plot_auc(y_val, y_pred, label)
result_df = result_df.append(result)
del result

结果如下：

在 Normal 数据集上 Decision Tree Classifier 模型的 logloss = 0.146  AUC = 0.778

此时我们已经拥有了两个模型的分类数据：

随机森林（Random Forest）

同样的我们使用交叉验证的方法进行一个寻参调优的过程：

model_rf = RandomForestClassifier(class_weight='balanced')
params = {
    'n_estimators': [1000, 2000],
    'max_depth': [1000, 2000],
    'min_samples_split': [100, 500],
    'min_samples_leaf': [3, 5],
    'max_leaf_nodes': [100, 250]
}
find_best_params(model_rf, params, cv=3)

得到的最佳参数为：

Fitting 3 folds for each of 10 candidates, totalling 30 fits
最佳的AUC得分为：0.817
最佳的参数为：{'n_estimators': 1000, 'min_samples_split': 500, 'min_samples_leaf': 3, 'max_leaf_nodes': 250, 'max_depth': 1000}

我们继续基于最佳参数进行模型拟合：

model_rf = RandomForestClassifier(bootstrap=True, ccp_alpha=0.0, class_weight='balanced',
                                  criterion='gini', max_depth=2000, max_features='auto',
                                  max_leaf_nodes=250, max_samples=None,
                                  min_samples_leaf=3, min_samples_split=500,
                                  min_weight_fraction_leaf=0.0, n_estimators=2000,
                                  n_jobs=10, oob_score=False, random_state=42,
                                  verbose=0, warm_start=False)
model_rf.fit(X_train, y_train)
cc_model_rf = CalibratedClassifierCV(model_rf, cv='prefit')
cc_model_rf.fit(X_train, y_train)

画出ROC曲线：

y_pred = cc_model_rf.predict_proba(X_val)[:, 1]
label = "Random Forest Classifier"
labels.append(label)
y_preds.append(y_pred)

i += 1
result = plot_auc(y_val, y_pred, label)
result_df = result_df.append(result)
del result

在 Normal 数据集上 Random Forest Classifier 模型的 logloss = 0.137 AUC = 0.833
采用bagging集成的随机森林AUC值达到了0.833，是目前最高的，说明集成法确实能给当前的分类问题的效果带来提升，下面我们还可以考虑两种boosting集成算法的分类效果

XGBoost模型(XGBClassifier)

由于XGB的调参过程较为复杂，这里我们直接采用调好的最优参数进行训练

model_xgb = xgb.XGBClassifier(n_jobs=-1,
                              nthread=-1,
                              scale_pos_weight=1.,
                              learning_rate=0.01,
                              colsample_bytree=0.5,
                              subsample=0.9,
                              objective='binary:logistic',
                              n_estimators=1000,
                              reg_alpha=0.3,
                              max_depth=5,
                              gamma=5,
                              random_state=42)
#%%
%%time
eval_metric = ['error', 'auc']
eval_set = [(X_train, y_train), (X_val, y_val)]
model_xgb.fit(X_train, y_train, eval_set=eval_set,
              eval_metric=eval_metric, early_stopping_rounds=50, verbose=20)

early_stopping_rounds表示早停次数为50，即在50次内验证集AUC不再提升我们就停止迭代
verbose表示每20次显示一次结果

特别的，在训练过程中，我们分别打印出每20次迭代的训练结果，这里我们仅打印前两百次

[0]		validation_0-error:0.03957	validation_0-auc:0.75894	validation_1-error:0.03955	validation_1-auc:0.77028
[20]	validation_0-error:0.03957	validation_0-auc:0.81460	validation_1-error:0.03955	validation_1-auc:0.81464
[40]	validation_0-error:0.03957	validation_0-auc:0.82008	validation_1-error:0.03955	validation_1-auc:0.81856
[60]	validation_0-error:0.03957	validation_0-auc:0.82172	validation_1-error:0.03955	validation_1-auc:0.82104
[80]	validation_0-error:0.03957	validation_0-auc:0.82368	validation_1-error:0.03955	validation_1-auc:0.82384
[100]	validation_0-error:0.03957	validation_0-auc:0.82574	validation_1-error:0.03955	validation_1-auc:0.82560
[120]	validation_0-error:0.03957	validation_0-auc:0.82612	validation_1-error:0.03955	validation_1-auc:0.82554
[140]	validation_0-error:0.03957	validation_0-auc:0.82678	validation_1-error:0.03955	validation_1-auc:0.82569
[160]	validation_0-error:0.03957	validation_0-auc:0.82786	validation_1-error:0.03955	validation_1-auc:0.82654
[180]	validation_0-error:0.03957	validation_0-auc:0.82922	validation_1-error:0.03955	validation_1-auc:0.82750
[200]	validation_0-error:0.03956	validation_0-auc:0.83156	validation_1-error:0.03955	validation_1-auc:0.82869

训练结束后我们输出一下最优的AUC得分和迭代次数：

model_xgb.best_score, model_xgb.best_iteration

(0.842974, 902)

为了便于直观的展现AUC的变化过程，我们直接绘制AUC随迭代次数增加的变化折线图：

# 基于迭代次数的调参曲线
results = model_xgb.evals_result_
auc_train = results['validation_0']['auc']
auc_val = results['validation_1']['auc']
fig, ax = plt.subplots(figsize=(10, 6))
epochs = len(auc_val)
ax.plot(range(0, epochs), auc_train, label='Train')
ax.plot(range(0, epochs), auc_val, label='Test')
ax.legend()
plt.title(model_xgb.__class__.__name__ + ' ' + 'AUC')
plt.ylabel('auc')
plt.show()
print("验证集上最大AUC：%.3f" % (max(auc_val)))
print("最优迭代次数epochs：%i" % (auc_val.index(max(auc_val))))

验证集上最大AUC：0.843
最优迭代次数epochs：902

接下来绘制XGBoost模型的ROC曲线：

在 Normal 数据集上 XGBoost Classifer 模型的 logloss = 0.134  AUC = 0.843

LGB模型（LightGBM）

LGB模型我们采用与上面同样的策略

model_lgb = lgb.LGBMClassifier(n_jobs=-1,
                               nthread=-1,
                               scale_pos_weight=1.,
                               learning_rate=0.01,
                               colsample_bytree=0.5,
                               subsample=0.8,
                               objective='binary',
                               n_estimators=1000,
                               reg_alpha=0.3,
                               max_depth=7,
                               random_state=42)
eval_metric = ['binary_logloss', 'auc']
eval_set = [(X_train, y_train), (X_val, y_val)]
model_lgb.fit(X_train, y_train, eval_set=eval_set,
              eval_metric=eval_metric, early_stopping_rounds=50, verbose=20)
# 基于迭代次数的调参曲线
results = model_lgb.evals_result_
auc_train = results['training']['auc']
auc_val = results['valid_1']['auc']
fig, ax = plt.subplots(figsize=(10, 6))
epochs = len(auc_val)
ax.plot(range(0, epochs), auc_train, label='Train')
ax.plot(range(0, epochs), auc_val, label='Test')
ax.legend()
plt.title(model_lgb.__class__.__name__ + ' ' + 'AUC')
plt.ylabel('auc')
plt.show()
print("验证集上最大AUC：%.3f" % (max(auc_val)))
print("最优迭代次数epochs：%i" % (auc_val.index(max(auc_val)) + 1))


#模型拟合
y_pred = model_lgb.predict_proba(X_val)[:, 1]
label = "LightGBM Classifer"
labels.append(label)
y_preds.append(y_pred)

i += 1
result = plot_auc(y_val, y_pred, label)
result_df = result_df.append(result)
del result

至此，我们已经完成了模型训练和评估的全部工作，我们可以将模型结果进行一个汇总。

模型结果汇总

模型训练结果

我们可以看出，采用三种集成模型给AUC带来了很大的提升，其中LGB模型在Normal数据集上的表现最佳，AUC达到了0.844

####模型ROC曲线汇总

绘制前50个重要性得分最高的特征排序图

Jetson Orin NX Super安装TensorRT-LLM u013250861 #LLM/部署&推理 elasticsearch 大数据搜索引擎
根据图片中显示的JetsonOrinNXSuper系统环境（JetPack6.2+CUDA12.6+TensorRT10.7），以下是针对该平台的TensorRT-LLM安装优化方案：一、环境适配调整基于你的实际配置：JetPack6.2（含CUDA12.6,TensorRT10.7）Python3.10.12aarch64架构需选择适配的TensorRT-LLM版本。由于官方预编译包可能未覆盖此
大白话解释深度学习中多尺度特征融合及其意义来自宇宙的曹先生深度学习人工智能
想象一下，你正在看一幅城市街道的照片。在这张照片中，你可能会看到：远处的小汽车，它们在图像中看起来很小。近处的大巴士，它们在图像中看起来很大。还有一些行人，他们可能在不同的距离上，大小各异。假设你想训练一个计算机程序来识别和分割这些不同的物体（汽车、巴士、行人）。如果这个程序只能在一个固定的尺度上“看”图像，比如说只能处理大物体，它可能会错过那些远处的小汽车，因为这些小汽车在图像中占据的像素很少。
SpringBoot多数据源动态切换方案：AbstractRoutingDataSource详解 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot多数据源动态切换
想要了解大模型，看懂这一篇就够了！大模型工作流程及核心参数介绍！ Gq.xxu qwen3 vllm transforms 大语言模型部署深度学习人工智能
若想深入探究大模型核心参数的效果与作用，就务必先弄清大模型的工作流程，明确核心参数在流程各阶段的效能与功能，知晓其具体含义。一，大模型的工作流程大模型运行时的工作原理可以概括为输入处理→特征提取→模型推理→结果生成四个核心阶段，整个过程融合了深度学习架构、自然语言处理技术以及分布式计算能力。从用户输入到大模型输出，整个工作的处理流程如下：输入文本→分词→嵌入+位置编码→Transformer多层处
「源力觉醒创作者计划」_以FastDeploy为例部署ERNIE-4.5-21B大模型全流程实践 cooldream2009 大模型基础 AI技术文心大模型 FastDeploy
目录前言1环境准备与依赖安装1.1硬件要求1.2Python环境与pip升级2下载ERNIE-4.5模型权重2.1安装HuggingFaceCLI工具2.2设置国内镜像加速（可选）2.3下载模型文件3安装FastDeploy与Paddle推理引擎3.1安装PaddlePaddle-GPU版本3.2安装FastDeploy-GPU4启动ERNIE-4.5本地服务4.1启动OpenAI兼容API服务4
Python打卡：Day46 剑桥折刀s python打卡 python
importtorchimporttorch.nnasnnimporttorch.optimasoptimimporttorchvisionfromtorchvisionimportdatasets,transformsfromtorch.utils.dataimportDataLoaderfromtorch.utils.tensorboardimportSummaryWriterimportnu
深度学习-Tensor
Tensor张量：与numpy中的ndarray不同之处：tensor可以在GPU或其他专用硬件上运行，以加速计算。一、Tensor初始化1.直接从数据中创建data=[[1,2],[3,4]]x_data=torch.tensor(data)2.从numpy数组创建np_array=np.array(data)x_np=torch.from_numpy(np_array)3.从另一个Tensor
为什么在 macOS 中运行 Python 项目必须使用虚拟环境？ coding随想 Python macos python 开发语言
为什么在macOS中运行Python项目必须使用虚拟环境？在macOS上开发Python项目时，虚拟环境（VirtualEnvironment）是一个不可或缺的工具。无论你是初学者还是资深开发者，理解虚拟环境的意义和使用方法，都是提升开发效率和项目稳定性的关键。本文将从macOS的特殊性出发，深入浅出地解释为什么在macOS中运行Python项目必须使用虚拟环境。一、macOS系统Python的局
扣子智能体5：使用Python异步执行工作流并获取执行结果呆萌的代Ma 大模型 python 扣子
使用python异步执行工作流的步骤有3步：异步执行工作流，获取工作流的execute_id，之后就能根据这个id查询工作流的执行情况如果execute_id=“Success”，就表示工作流执行完毕执行完毕后，打印output，就是大模型最后的全部示例代码fromloguruimportloggerimportrequestsimportjsondefrun_coze_ai(coze_api_t
MCP客户端请求MCP服务器资源的Python SDK实现 AI天才研究院计算 AI人工智能与大数据 Python实战 python 开发语言 ai 服务器
我将为您提供一个详细的指南，说明如何使用PythonSDK让MCP客户端请求MCP服务器的资源。MCP客户端请求MCP服务器资源的PythonSDK实现核心概念ModelContextProtocol(MCP)是一个标准化协议，允许应用程序以标准化的方式为大语言模型(LLM)提供上下文，将提供上下文的关注点与实际的LLM交互分离。MCP中的资源(Resources)是一种核心原语，允许服务器暴露数
基于存算一体架构的实时深度学习推理优化瑕疵热点资讯架构深度学习人工智能
博客主页：瑕疵的CSDN主页Gitee主页：瑕疵的gitee主页⏩文章专栏：《热点资讯》基于存算一体架构的实时深度学习推理优化基于存算一体架构的实时深度学习推理优化基于存算一体架构的实时深度学习推理优化引言存算一体架构的核心优势1.能效比突破2.实时性保障架构设计与实现技术1.存储单元创新2.硬件加速器设计3.电路级优化深度学习推理优化策略1.模型压缩技术2.硬件-软件协同优化3.运行时调度典型应
python中提示‘pyinstaller‘ 不是内部或外部命令，也不是可运行的程序或批处理文件。
一、出现这个问题的原因：来自于首先安装这个pyinstaller的时候，没有将D:\01_SoftWare\python3.9.13\Scripts或者D:\01_SoftWare\python3.9.13或者是D:\01_SoftWare\python3.9.13\Lib添加到环境变量中，那需要做的第一步就是添加下系统的环境变量。这样就可以了。到这里，可能一部分人，再次安装就好了，但是这边尝试看
第十篇：Python 进阶-内存管理程序员勇哥 Python全套教程 python jvm 开发语言
第十篇：Python进阶-内存管理1.垃圾回收机制引用计数原理引用计数是Python垃圾回收机制中最基本的一种方式。其核心思想是：每个对象都维护一个引用计数，记录当前指向该对象的引用（变量）的数量。当对象的引用计数变为0时，意味着没有任何变量指向该对象，Python解释器会立即回收该对象所占用的内存空间。例如，考虑以下代码：a=[1,2,3]#创建一个列表对象，并将其引用赋值给变量a，此时列表对象
Python 三方库 python-dotenv wohu007 #标准库和三方库 python python-dotenv
1.简介在一些项目中，处于安全性的要求，一般不将密码，key等放入到配置文件中。然而这些代码又是上传在git等平台上。为了方便管理。一般采用系统变量的方式来实现。从而实现配置和代码分开。2.安装pipinstallpython-dotenv3.使用目录结构及代码.├──.env└──demo.py.env内容REDIS_HOST="127.0.0.1"PWD="/home/wohu"你可以使用单词
Python自动化测试基础知识心一 Python自动化测试 python 开发语言
Python自动化测试基础知识一、自动化测试基础概念1.什么是自动化测试使用脚本和工具代替人工执行测试用例的过程通过编写代码来模拟用户操作，验证系统功能核心目标是提高测试效率，减少重复劳动2.自动化测试的优势高效率：可快速执行大量测试用例可重复：相同测试可反复执行，结果一致准确性：避免人为错误覆盖率：可执行难以手动测试的复杂场景持续集成：易于与CI/CD流程集成3.自动化测试的适用场景回归测试性能
python进阶之数据结构与算法--入门-二叉树小白piao 数据结构与算法python篇数据结构算法二叉树 python
二叉树概念：之前已经提及了关于树的概念，要想知道之前讲了什么请关注，前边文章里都有提及。这里不做赘述。二叉树是具有以下属性的有序树：1、每个节点最多有两个孩子节点2、每个孩子节点被命名为左子节点和右子节点3、对于每个节点的孩子节点，在顺序上，左子节点优先于右子节点4、若子树的根为内部节点v的左子节点或者右子节点，则该子树相应地被称为节点v的左子树或者右子树5、若每个节点都有零个或者两个节点，则这样
Python进阶 - 关键字 Global 和 Return 孤寒者 Python全栈系列教程 python global return
目录：每篇前言：一、`return`的角色与机制二、`global`关键字与命名空间三、函数多值返回的高级模式四、`global`vs`nonlocal`vs返回值五、最佳实践与反模式总结每篇前言：作者介绍：【孤寒者】—CSDN全栈领域优质创作者、HDZ核心组成员、华为云享专家Python全栈领域博主、CSDN原力计划作者本文已收录于Python全栈系列教程专栏：《Python全栈系列教程》热门专
Python Set() 完全指南：从入门到精通 2501_91537435 python python 开发语言
PythonSet()完全指南：从入门到精通Set（集合）是Python中一种非常有用的内置数据类型，它提供了高效的成员检测和消除重复元素的功能。本文将带你全面了解Python中的set()，从基础概念到高级用法。一、什么是Set？Set是Python中的一种无序、可变、不重复元素的集合数据类型。它类似于数学中的集合概念，支持并集、交集、差集等操作。#创建一个setfruits={'apple',
一文读懂Python+Pytest+Allure+Jenkins+Gitee自动化测试框架，手把手教你搭建
Python+Pytest+Allure+Jenkins+Gitee自动化测试框架一、框架整体架构1.技术栈分工Python：测试脚本开发语言Pytest：测试用例管理和执行引擎Allure：测试报告生成与展示Jenkins：持续集成和任务调度Gitee：代码版本管理和触发机制2.数据流向Gitee代码提交→Jenkins触发构建→Pytest执行用例→生成Allure结果→Jenkins收集报告
【vue】用conda配置nodejs，一键开通模版使用权温择之 conda
特此鸣谢我的好同学@重中之重的特级教学，非常之好用一、conda环境下载安装二、创建包含nodejs的conda环境创建一个新环境：condacreate-n【自定义环境名字】python=3.9condacreate-nmy_nodejs_envpython=3.9激活新环境：condaactivate【环境名字】condaactivatemy_nodejs_env下载安装nodejs：cond
大模型API密钥的环境变量配置（大模型API KEY管理）（将密钥存储在环境变量）（python-dotenv）（密钥管理）环境变量设置环境变量 Dontla 大模型LLM python 开发语言
文章目录大模型API密钥的环境变量配置：安全与最佳实践引言安全风险代码泄露风险版本控制暴露环境变量的优势安全隔离跨环境一致性环境变量配置方法Linux/macOS配置Windows配置开发框架集成Node.js使用dotenvPython使用python-dotenv最佳实践.env文件管理环境变量模板容器环境配置安全增强措施密钥轮换机制秘密管理服务集成总结大模型API密钥的环境变量配置：安全与最
操作系统领域的新宠儿：鸿蒙应用深度剖析操作系统内核探秘操作系统内核揭秘 harmonyos 华为 ai
操作系统领域的新宠儿：鸿蒙应用深度剖析关键词：鸿蒙操作系统、微内核架构、分布式软总线、ArkUI框架、DevEcoStudio、跨设备开发、全场景生态摘要：本文深度剖析华为鸿蒙操作系统的核心技术架构与应用开发体系，从微内核设计、分布式协同技术、UI框架创新到全场景开发工具链展开分析。通过数学模型解析分布式一致性算法，结合Python代码演示核心调度逻辑，并以实战案例演示跨设备应用开发流程。探讨鸿蒙
NumPy-随机数生成详解 GG不是gg numpy numpy
NumPy-随机数生成详解一、随机数生成的基础：伪随机数与种子1.伪随机数的本质2.种子的设置：确保结果可复现二、常用随机数生成函数1.均匀分布随机数2.正态分布随机数3.整数随机数4.其他常用分布三、随机数生成的进阶操作1.随机排列与洗牌2.控制随机数的维度与形状四、随机数生成的应用场景1.数据增强2.蒙特卡洛模拟3.随机初始化参数五、注意事项NumPy作为Python数值计算的核心库，提供了功
python namedtuple转为dict 链池 python 开发语言
python相关学习资料：搭建私人助理大模型需要什么环境？006_指法标准_键盘正位_你好世界_hello_world_单引号_双引号一张图生成指定动作的动态视频,MagicAnimate本地部署Pythonnamedtuple转为dict的方法作为一名经验丰富的开发者，我很高兴能够帮助刚入行的小白们解决编程问题。今天，我们将一起学习如何将Python中的namedtuple转换为dict。这个过
Python namedtuple 详解：作用与使用方法
文章目录一、什么是namedtuple主要特点：二、namedtuple的作用1.替代普通元组，提高代码可读性2.替代简单类，减少样板代码3.作为轻量级数据结构三、基本使用方法1.创建namedtuple类型2.创建实例3.访问字段4.不可变性测试四、高级特性与方法1._asdict()-转换为有序字典2._replace()-创建新实例并替换字段3._fields-查看字段名4._make()-
探秘`nanomsg-python`: Python中的高效通信库
探秘nanomsg-python:Python中的高效通信库nanomsg-pythonnanomsgwrapperforpythonwithmultiplebackends(CPythonandctypes)shouldsupport2/3andPypy项目地址:https://gitcode.com/gh_mirrors/na/nanomsg-python在Python的世界里，找到一个既能满
Springboot和Python之间通过RabbitMQ进行双向异步消息交互demo示例同心圆码农后端 java-rabbitmq spring boot python
SpringBoot后端和Python算法之间解耦设计，采用通过消息总线RabbitMQ进行双向异步交互，以下是一个demo样例，罗列出了实现该功能需要做的工作，包括软件安装、RabbitMQ基本介绍、Springboot后端demo代码、Pythondemo代码、运行流程以及调试遇到问题软件安装Win10本地需要安装RabbitMQ，作为Springboot后端和Python模块通讯的消息中间件
Python词法分析器：从概念到实践凡狗蛋
本文还有配套的精品资源，点击获取简介：Python词法分析器是编程语言处理的关键环节，负责将源代码解析为有意义的标记或符号序列。本简介详细介绍了词法分析、正则表达式、分词、词法规则、词法分析器生成器以及编译原理等核心概念，并展示了如何使用Python内置的re模块和第三方库ply实现词法分析器，为进一步理解编程语言的工作原理和构建自定义编程语言打下基础。1.词法分析器的作用与目的词法分析器是编译器
Python打卡：Day27 剑桥折刀s python打卡 python
deflogger(func):defwrapper(*args,**kwargs):#打印函数开始执行的日志print(f"开始执行函数:{func.__name__}")print(f"参数:args={args},kwargs={kwargs}")#执行原函数并获取返回值result=func(*args,**kwargs)#打印函数执行结束的日志print(f"函数{func.__name
【Python进阶篇面向对象程序设计(5) 异常处理】 nananaij python pycharm 开发语言
文章目录1、基础异常类（所有异常的父类）2、异常类型总结3、异常处理（1）try......except语句：捕获和处理异常（2）try......except......else语句（3）try......except......finally语句（4）raise语句（5）assert语句：调试断言1、基础异常类（所有异常的父类）BaseException：所有内置异常的基类（不建议直接捕获）。
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam