风度78

【机器学习基础】Lasso 和 Ridge回归中的超参数调整技巧

在这篇文章中，我们将首先看看Lasso和Ridge回归中一些常见的错误，然后我将描述我通常采取的步骤来优化超参数。代码是用Python编写的，我们主要依赖scikit-learn。本文章主要关注Lasso的例子，但其基本理论与Ridge非常相似。

起初，我并没有真正意识到需要另一个关于这个主题的指南——毕竟这是一个非常基本的概念。然而，当我最近想要确认一些事情时，我意识到，市面上的很多文章要么太学术化，要么太简单，要么就是完全错误。一个很常见的混淆来源是，在sklearn中总是有十多种不同的方法来计算同一件事情。

所以，废话少说，下面是我对这个话题的两点看法。

快速的理论背景回顾

Lasso和Ridge都是正则化方法，他们的目标是通过引入惩罚因子来正则化复杂的模型。它们在减少过拟合、处理多重共线性或自动特征工程方面非常出色。这听i来似乎有点神奇，但通过训练使模型更努力地拟合数据，我们得到一个更好的对底层结构的了解，从而对测试数据有了更好的泛化和更好的拟合。

LinearRegression

根据sklearn的公式，这是线性回归模型中最小的表达式，即所谓的普通最小二乘:

其中X矩阵为自变量，w为权重即系数，y为因变量。

Ridge

Ridge回归采用这个表达式，并在平方系数的最后添加一个惩罚因子:

这里α是正则化参数，这是我们要优化的。该模型惩罚较大的系数，并试图更平均地分配权重。用外行人的话来说，这就是Ridge模型所做的:

X1，我们看到你做得很好，如果不是因为惩罚的因素，我们会很重视你。但是X2只比你们差一点点，如果我们在你们俩之间均分权重，我们会得到更低的惩罚，从而得到更好的总分。

Lasso

Lasso做了类似的事情，但使用绝对值之和(l1范数)的权重作为惩罚。

注: sklearn提供公式中还有一个n_samples,这是观察的数量,并且应该改变X和y。我发现没有解释这是为什么,也许是为了比较不同模型。

Lasso将开始降低不那么重要的变量的系数，也有可能将系数降低到0。通俗的说:

X1，你对总分数的最小贡献会被注意到。但是，根据最新的罚分，我们将不得不将你从回归中移除。

Elastic Net

值得注意的是，您还可以将同一模型中的两个惩罚与Elastic Net结合起来。您需要在那里优化两个超参数。在本指南中，我们将不讨论此选项。

所需要的类库

以下是需要的所有库的列表：

 import pandas as pd
 import numpy as np
 import matplotlib.pyplot as plt
 import seaborn as sns
 from sklearn.metrics import \
     r2_score, get_scorer
 from sklearn.linear_model import \
     Lasso, Ridge, LassoCV,LinearRegression
 from sklearn.preprocessing import \
     StandardScaler, PolynomialFeatures
 from sklearn.model_selection import \
     KFold, RepeatedKFold, GridSearchCV, \
     cross_validate, train_test_split

三个秘诀

在本节中，我们将讨论一些常规技巧和常见错误，以避免涉及正则化回归。这些示例使用的是波士顿住房数据，您可以从Kaggle下载数据。

 column_names = \
     ['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE',\
      'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV']
 data = pd.read_csv("../datasets/housing.csv", \
     header=None, delimiter=r"\s+", names=column_names)
 y = data['MEDV']
 X = data.drop(['MEDV'], axis = 1)

秘诀一：缩放自变量

如标题所示：需要缩放变量以进行正则回归。（我们知道，像缩放这样的线性变换不会对原始线性回归的预测产生影响。）很明显，如果您仔细查看一下公式，为什么必须对正则回归进行缩放：变量恰好在很小的范围内，其系数会很大，因此，由于惩罚会受到更大的惩罚。反之亦然，大规模变量将获得较小的系数，并且受惩罚的影响较小。Lasso and Ridge都是如此。

假设您执行以下操作。

（同样，该示例没有缩放比例，将不会产生正确的结果，请不要这样做。此外，请注意，除了缩放比例以外，还有其他问题，我们将在近期内再次讨论。）

 # 错误，不要使用
 cv = RepeatedKFold(n_splits=10, n_repeats=3, random_state=1)
 lasso_alphas = np.linspace(0, 0.2, 21)lasso = Lasso()
 grid = dict()
 grid['alpha'] = lasso_alphas
 gscv = GridSearchCV( \
     lasso, grid, scoring='neg_mean_absolute_error', \
     cv=cv, n_jobs=-1)
 results = gscv.fit(X, y)print('MAE: %.5f' % results.best_score_)
 print('Config: %s' % results.best_params_)

结果如下：

 MAE: -3.37896
 Config: {'alpha': 0.01}

但是，如果事先缩放X变量，通常会获得更好的分数。要缩放，我们可以使用sklearn的StandardScaler。此方法使变量以0为中心，并使标准偏差等于1。

 sc = StandardScaler()X_scaled = sc.fit_transform(X)
 X_scaled = pd.DataFrame(data = X_scaled, columns = X.columns)

如果在上面的代码块中用X_scaled替换X，我们将得到：

 MAE: -3.35080
 Config: {'alpha': 0.08}

是的，没有太大的改进，但这是由于许多因素，我们将在后面看到。最重要的是，波士顿的住房数据是一个很好的，经过量身定制的线性回归的示例，因此我们不能做太多改进。

总结：在进行正则化之前，使用StandardScaler缩放自变量。无需调整因变量。

秘诀二：当Alpha等于零时…

如果在Lasso和Ridge中为alpha参数选择0，则基本上是在拟合线性回归，因为在公式的OLS部分没有任何惩罚。

由于计算复杂性，sklearn文档实际上不建议使用alpha = 0的参数运行这些模型。因为他可能引起算问题，但我还没有遇到过这种情况，因为它总是给出与LinearRegression模型相同的结果。

总结：选择alpha = 0毫无意义，这只是线性回归。

秘诀三：多次尝试

在上面的示例中，我们浏览了一系列Alpha，对它们进行了全部尝试，然后选择了得分最高的Alpha。但是，像往常一样，当您使用GridSearchCV时，建议进行多次尝试。找到最高Alpha的区域，然后进行更详细的检查。

以我的经验，尤其是在使用Lasso时，选择最低的非零参数是一个常见的错误，而实际上，最佳参数要小得多。请参阅下面的示例。

注意：当然，我们永远不会使用网格搜索方法找到实际的最佳数字，但是我们可以足够接近。

您还可以可视化结果。这是未缩放版本的样子：

对于每个Alpha，GridSearchCV都适合模型，我们选择了Alpha，其中验证数据得分（例如，RepeatedKFold中测试折叠的平均得分）最高。在此示例中，您可以看到0到0.01之间可能没有疯狂的峰值。当然，这仍然是错误的，因为我们没有缩放。

这是缩放版本的图：

再次看起来不错，在0.07和0.09之间可能没有任何奇怪的事情发生。

总结：可视化是你的朋友，请观察alpha曲线。确保您选择的Alpha位于漂亮的“弯曲”区域。

秘诀四：仔细考虑您的计分方法

您可能很想以其他方式进行计算以检查结果。如前所述，sklearn通常有很多不同的方法来计算同一件事。首先，有一个LassoCV方法将Lasso和GridSearchCV结合在一起。

您可以尝试执行以下操作以获得最佳Alpha（示例中不再使用未缩放的版本）：

 lasso = LassoCV(alphas=lasso_alphas, cv=cv, n_jobs=-1)
 lasso.fit(X_scaled, y)
 print('alpha: %.2f' % lasso.alpha_)

结果如下：

 alpha: 0.03

等一下，难道不是上面的0.08的相同数据的Alpha吗？是的。差异的原因是什么？LassoCV使用R²得分，您无法更改它，而在更早的时候，我们在GridSearchCV对象中指定了MAE（正负MAE，但这只是为了使我们最大化并保持一致）。这是为什么说上个代码错误的原因：

 scoring='neg_mean_absolute_error'

问题是，sklearn有数十种计分方法，您也可以选择max_error来衡量模型的性能。但是，该模型针对平方差进行了优化。但是我认为使用从平方差得出的任何东西都更加一致。，因为LassoCV使用R²，所以也许这是一个好的信号？

“在一个基础上进行优化，然后在另一个基础上进行性能比较”实际上在上面的图表中是很明显的。注意绿线的评分高了很多。那是因为这是训练的成绩。在正常情况下，施加惩罚因素后，它的性能不应更好。

通常，这就是您将看到的曲线的形状。训练数据得分立即下降，验证数据得分上升一段时间，然后下降：

总结:使用R²或另一个基于差异的平方模型作为回归的主要评分。

本文的方法

在这一节中，我将介绍我用来准备数据和拟合正则化回归的方法。

在得到X和y之前，我不会详细说明数据。我使用来自美国县级国家健康排名数据收集的一个版本来生成下面的结果，但对于这个示例来说，这真的无关紧要。

因此，假设您有一个漂亮而干净的X和y，下一步是使用方便的train_test_split留出一个测试数据集。如果想让结果重现，可以为my_random_state选择任何数字。

 X_train , X_test, y_train, y_test = train_test_split(
     X, y, test_size=1000, random_state=my_random_state)

下一步是包含多项式特性。我们将结果保存在多边形对象中，这很重要，我们将在以后使用它。

 poly = PolynomialFeatures(
     degree = 2, include_bias = False, interaction_only = False)

这将产生变量的所有二阶多项式组合。需要注意的是，我们将include_bias设置为False。这是因为我们不需要截距列，回归模型本身将包含一个截距列。

这是我们转换和重命名X的方法。它假设您将X保存在一个pandas DataFrame中，并且需要进行一些调整以保持列名可用。如果你不想要名字，你只需要第一行。

 X_train_poly = poly.fit_transform(X_train)
 polynomial_column_names = \
     poly.get_feature_names(input_features = X_train.columns)
 X_train_poly = \
     pd.DataFrame(data = X_train_poly, 
         columns = polynomial_column_names )
 
 X_train_poly.columns = X_train_poly.columns.str.replace(' ', '_')
 X_train_poly.columns = X_train_poly.columns.str.replace('^', '_')

完成这一步后，下一步是扩展。在引入多项式之后，这就更加重要了，没有缩放，大小就会到处都是。

 sc = StandardScaler()
 
 X_train_poly_scaled = sc.fit_transform(X_train_poly)
 X_train_poly_scaled = pd.DataFrame( \
         data = X_train_poly_scaled, columns = X_train_poly.columns)

棘手的部分来了。如果我们想要使用测试数据集，我们需要应用相同的步骤。

但是，我们不需要再次适合这些对象。好吧，对于poly无所谓，但是对于sc，我们想要保留用于X_train_poly的方法。是的，这意味着测试数据不会完全标准化，这很好。我们用transform代替fit_transform。

 X_test_poly = poly.transform(X_test)
 X_test_poly_scaled = sc.transform(X_test_poly)

您可能想知道如何生成上面使用的图。我使用两个函数，构建在上面列出的库之上。第一个函数绘制一个图:

 def regmodel_param_plot(
     validation_score, train_score, alphas_to_try, chosen_alpha,
     scoring, model_name, test_score = None, filename = None):
     
     plt.figure(figsize = (8,8))
     sns.lineplot(y = validation_score, x = alphas_to_try, 
                  label = 'validation_data')
     sns.lineplot(y = train_score, x = alphas_to_try, 
                  label = 'training_data')
     plt.axvline(x=chosen_alpha, linestyle='--')
     if test_score is not None:
         sns.lineplot(y = test_score, x = alphas_to_try, 
                      label = 'test_data')
     plt.xlabel('alpha_parameter')
     plt.ylabel(scoring)
     plt.title(model_name + ' Regularisation')
     plt.legend()
     if filename is not None:
         plt.savefig(str(filename) + ".png")
     plt.show()

第二个本质上是一个网格搜索，带有一些额外的东西:它也运行测试分数，当然还保存。

 def regmodel_param_test(
     alphas_to_try, X, y, cv, scoring = 'r2', 
     model_name = 'LASSO', X_test = None, y_test = None, 
     draw_plot = False, filename = None):
     
     validation_scores = []
     train_scores = []
     results_list = []
     if X_test is not None:
         test_scores = []
         scorer = get_scorer(scoring)
     else:
         test_scores = None
 
     for curr_alpha in alphas_to_try:
         
         if model_name == 'LASSO':
             regmodel = Lasso(alpha = curr_alpha)
         elif model_name == 'Ridge':
             regmodel = Ridge(alpha = curr_alpha)
         else:
             return None
 
         results = cross_validate(
             regmodel, X, y, scoring=scoring, cv=cv, 
             return_train_score = True)
 
         validation_scores.append(np.mean(results['test_score']))
         train_scores.append(np.mean(results['train_score']))
         results_list.append(results)
 
         if X_test is not None:
             regmodel.fit(X,y)
             y_pred = regmodel.predict(X_test)
             test_scores.append(scorer(regmodel, X_test, y_test))
     
     chosen_alpha_id = np.argmax(validation_scores)
     chosen_alpha = alphas_to_try[chosen_alpha_id]
     max_validation_score = np.max(validation_scores)
     if X_test is not None:
         test_score_at_chosen_alpha = test_scores[chosen_alpha_id]
     else:
         test_score_at_chosen_alpha = None
         
     if draw_plot:
         regmodel_param_plot(
             validation_scores, train_scores, alphas_to_try, chosen_alpha, 
             scoring, model_name, test_scores, filename)
     
     return chosen_alpha, max_validation_score, test_score_at_chosen_alpha

我不想在这里讲得太详细，我认为这是不言自明的，稍后我们会看到如何调用它的例子。

有一件事，我认为非常酷:sklearn有一个get_scorer函数，它根据sklearn字符串代码返回一个scorer对象。例如:

 scorer = get_scorer('r2')
 scorer(model, X_test, y_test)

现在我们有另外一种方法来计算相同的东西。

一旦建立了这样的进程，我们所需要做的就是为不同的alpha数组运行函数。

这个过程的一个有趣之处在于，我们也在绘制测试分数:

取训练数据集和alpha值;
进行交叉验证，保存培训和验证分数;
假设这是我们选择并拟合模型的alpha值，而不需要对整个训练数据进行交叉验证;
计算该模型将对测试数据实现的分数，并保存测试分数。

这不是您在“现实生活”中会做的事情(除非您参加Kaggle竞赛)，因为现在有了优化测试数据集的可能性。我们在这里仅仅是为了说明模型的性能。红线表示的是不同alpha的测试分数。

我们还需要一个交叉验证对象，这里没有一个好的答案，这是一个选项:

 cv = KFold(n_splits=5, shuffle=True, random_state=my_random_state)

为了说明我关于多步参数搜索的重要性的观点，让我们假设我们想要检查这些alpha:

 lasso_alphas = np.linspace(0, 0.02, 11)

运行函数后:

 chosen_alpha, max_validation_score, test_score_at_chosen_alpha = \
     regmodel_param_test(
         lasso_alphas, X_train_poly_scaled, y_train, 
         cv, scoring = 'r2', model_name = 'LASSO', 
         X_test = X_test_poly_scaled, y_test = y_test, 
         draw_plot = True, filename = 'lasso_wide_search')
 print("Chosen alpha: %.5f" % \
     chosen_alpha)
 print("Validation score: %.5f" % \
     max_validation_score)
 print("Test score at chosen alpha: %.5f" % \
     test_score_at_chosen_alpha)

结果

 Chosen alpha: 0.00200
 Validation score: 0.82310
 Test score at chosen alpha: 0.80673

这是否意味着我们找到了最优?你可以看一下图，看到一个漂亮的尖刺，但是它是否够高了。不完全是。如果我们在更细粒度的层面上运行它:

 lasso_alphas = np.linspace(0, 0.002, 11)

这是结果，请注意0.02，最右边的点是我们在上一个图表中出现峰值的地方:

 Chosen alpha: 0.00060
 Validation score: 0.83483
 Test score at chosen alpha: 0.82326

如果我们不进行详细的测试，我们就会选择一个能使整体检验R²降低2%的，我认为这很重要。

这篇文章的标题包括Ridge，除了理论介绍之外，我们还没有讨论过它。

原因很简单:它的工作方式与Lasso完全一样，您可能只是想选择不同的alpha参数，并在model_name参数中传递' Ridge '。Ridge也存在同样的问题(我不包括搜索alpha范围的部分):

你会注意到，我们根据蓝线选择的点似乎不再是红线的最佳点。没错，但我觉得这对Lasso 模型来说是个巧合。

总结

这就是我为Lasso和Ridge做超参数调整的方法。希望对大家有所帮助，再次介绍一下要点:

记住缩放变量;
alpha = 0是线性回归;
多步搜索最佳参数;
使用基于分数的平方差异来衡量表现。

作者：Mate Pocs

原文地址：https://towardsdatascience.com/hyperparameter-tuning-in-lasso-and-ridge-regressions-70a4b158ae6d

deephub翻译组

往期精彩回顾



适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载机器学习的数学基础专辑温州大学《机器学习课程》视频
本站qq群851320808，加入微信群请扫码：

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
深入剖析OpenJDK 18 GA源码：Java平台最新发展想法臃肿
本文还有配套的精品资源，点击获取简介：OpenJDK18GA作为Java开发的关键里程碑，提供了诸多新特性和改进。本文章深入探讨了OpenJDK18GA源码，揭示其内部机制，帮助开发者更好地理解和利用这个版本。文章还涵盖了PatternMatching、SealedClasses、Records、JEP395、JEP406和JEP407等特性，以及HotSpot虚拟机、编译器、垃圾收集器、内存模型
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
Java大厂面试实录：谢飞机的电商场景技术问答（Spring Cloud、MyBatis、Redis、Kafka、AI等）
Java大厂面试实录：谢飞机的电商场景技术问答（SpringCloud、MyBatis、Redis、Kafka、AI等）本文模拟知名互联网大厂Java后端岗位面试流程，以电商业务为主线，由严肃面试官与“水货”程序员谢飞机展开有趣的对话，涵盖SpringCloud、MyBatis、Redis、Kafka、SpringSecurity、AI等热门技术栈，并附详细解析，助力求职者备战大厂面试。故事设定谢
【超硬核】JVM源码解读：Java方法main在虚拟机上解释执行 HeapDump性能社区 java 开发语言后端 jvm
本文由HeapDump性能社区首席讲师鸠摩（马智）授权整理发布第1篇-关于Java虚拟机HotSpot，开篇说的简单点开讲Java运行时，这一篇讲一些简单的内容。我们写的主类中的main()方法是如何被Java虚拟机调用到的？在Java类中的一些方法会被由C/C++编写的HotSpot虚拟机的C/C++函数调用，不过由于Java方法与C/C++函数的调用约定不同，所以并不能直接调用，需要JavaC
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（Spring Boot、MyBatis、Kafka、Redis、AI等）来旺 Java场景面试宝典 Java Spring Boot MyBatis Kafka Redis 微服务 AI
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（SpringBoot、MyBatis、Kafka、Redis、AI等）互联网大厂技术面试不仅考察技术深度，更注重业务场景与系统设计能力。本篇以严肃面试官与“水货”程序员谢飞机的对话，带你体验音视频业务场景下的Java面试全过程，涵盖主流技术栈，并附详细答案解析，助你面试无忧。故事场景设定谢飞机是一名有趣但技术基础略显薄弱的程序员，这次应
【前端】jQuery数组合并去重方法总结
在jQuery中合并多个数组并去重，推荐使用原生JavaScript的Set对象（高效简单）或$.unique()（仅适用于DOM元素，不适用于普通数组）。以下是完整解决方案：方法1：使用ES6Set（推荐）//定义多个数组constarr1=[1,2,3];constarr2=[2,3,4];constarr3=[3,4,5];//合并数组并用Set去重constmergedArray=[...
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Java特性之设计模式【责任链模式】 Naijia_OvO Java特性 java 设计模式责任链模式
一、责任链模式概述顾名思义，责任链模式（ChainofResponsibilityPattern）为请求创建了一个接收者对象的链。这种模式给予请求的类型，对请求的发送者和接收者进行解耦。这种类型的设计模式属于行为型模式在这种模式中，通常每个接收者都包含对另一个接收者的引用。如果一个对象不能处理该请求，那么它会把相同的请求传给下一个接收者，依此类推主要解决：职责链上的处理者负责处理请求，客户只需要将
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
日历插件-FullCalendar的详细使用老马聊技术 JavaScript 前端 javascript
一、介绍FullCalendar是一个功能强大、高度可定制的JavaScript日历组件，用于在网页中显示和管理日历事件。它支持多种视图（月、周、日等），可以轻松集成各种框架，并提供丰富的事件处理功能。二、实操案例具体代码如下：FullCalendar日期选择body{font-family:Arial,sans-serif;margin:20px;}#calendar{max-width:900
xml解析小猪猪08 xml
1、DOM解析的步奏准备工作： 1.创建DocumentBuilderFactory的对象 2.创建DocumentBuilder对象 3.通过DocumentBuilder对象的parse(String fileName)方法解析xml文件 4.通过Document的getElem
每个开发人员都需要了解的一个SQL技巧 brotherlamp linux linux视频 linux教程 linux自学 linux资料
对于数据过滤而言CHECK约束已经算是相当不错了。然而它仍存在一些缺陷，比如说它们是应用到表上面的，但有的时候你可能希望指定一条约束，而它只在特定条件下才生效。使用SQL标准的WITH CHECK OPTION子句就能完成这点，至少Oracle和SQL Server都实现了这个功能。下面是实现方式： CREATE TABLE books ( id &
Quartz——CronTrigger触发器 eksliang quartz CronTrigger
转载请出自出处：http://eksliang.iteye.com/blog/2208295 一.概述 CronTrigger 能够提供比 SimpleTrigger 更有具体实际意义的调度方案，调度规则基于 Cron 表达式，CronTrigger 支持日历相关的重复时间间隔（比如每月第一个周一执行），而不是简单的周期时间间隔。二.Cron表达式介绍 1）Cron表达式规则表 Quartz
Informatica基础 18289753290 Informatica Monitor manager workflow Designer
1. 1）PowerCenter Designer：设计开发环境，定义源及目标数据结构；设计转换规则，生成ETL映射。 2）Workflow Manager：合理地实现复杂的ETL工作流，基于时间，事件的作业调度 3）Workflow Monitor：监控Workflow和Session运行情况，生成日志和报告 4）Repository Manager：
linux下为程序创建启动和关闭的的sh文件，scrapyd为例酷的飞上天空 scrapy
对于一些未提供service管理的程序每次启动和关闭都要加上全部路径，想到可以做一个简单的启动和关闭控制的文件下面以scrapy启动server为例，文件名为run.sh： #端口号，根据此端口号确定PID PORT=6800 #启动命令所在目录 HOME='/home/jmscra/scrapy/' #查询出监听了PORT端口
人--自私与无私永夜-极光
今天上毛概课,老师提出一个问题--人是自私的还是无私的,根源是什么? 从客观的角度来看,人有自私的行为,也有无私的
Ubuntu安装NS-3 环境脚本随便小屋 ubuntu
将附件下载下来之后解压，将解压后的文件ns3environment.sh复制到下载目录下（其实放在哪里都可以，就是为了和我下面的命令相统一）。输入命令： sudo ./ns3environment.sh >>result 这样系统就自动安装ns3的环境，运行的结果在result文件中，如果提示 com
创业的简单感受 aijuans 创业的简单感受
2009年11月9日我进入a公司实习，2012年4月26日，我离开a公司，开始自己的创业之旅。今天是2012年5月30日，我忽然很想谈谈自己创业一个月的感受。当初离开边锋时，我就对自己说：“自己选择的路，就是跪着也要把他走完”，我也做好了心理准备，准备迎接一次次的困难。我这次走出来，不管成败
如何经营自己的独立人脉 aoyouzi 如何经营自己的独立人脉
独立人脉不是父母、亲戚的人脉，而是自己主动投入构造的人脉圈。“放长线，钓大鱼”，先行投入才能产生后续产出。现在几乎做所有的事情都需要人脉。以银行柜员为例，需要拉储户，而其本质就是社会人脉，就是社交！很多人都说，人脉我不行，因为我爸不行、我妈不行、我姨不行、我舅不行……我谁谁谁都不行，怎么能建立人脉？我这里说的人脉，是你的独立人脉。以一个普通的银行柜员
JSP基础百合不是茶 jsp 注释隐式对象
1,JSP语句的声明 <%! 声明 %> 　　声明：这个就是提供java代码声明变量、方法等的场所。表达式 <%= 表达式 %> 　　这个相当于赋值，可以在页面上显示表达式的结果，程序代码段/小型指令　<% 程序代码片段 %> 2,JSP的注释
web.xml之session-config、mime-mapping bijian1013 java web.xml servlet session-config mime-mapping
session-config 1.定义： <session-config> <session-timeout>20</session-timeout> </session-config> 2.作用：用于定义整个WEB站点session的有效期限，单位是分钟。 mime-mapping 1.定义： <mime-m
互联网开放平台（1） Bill_chen 互联网 qq 新浪微博百度腾讯
现在各互联网公司都推出了自己的开放平台供用户创造自己的应用，互联网的开放技术欣欣向荣，自己总结如下： 1.淘宝开放平台(TOP) 网址：http://open.taobao.com/ 依赖淘宝强大的电子商务数据，将淘宝内部业务数据作为API开放出去，同时将外部ISV的应用引入进来。目前TOP的三条主线： TOP访问网站：open.taobao.com ISV后台：my.open.ta
【MongoDB学习笔记九】MongoDB索引 bit1129 mongodb
索引可以在任意列上建立索引索引的构造和使用与传统关系型数据库几乎一样,适用于Oracle的索引优化技巧也适用于Mongodb 使用索引可以加快查询,但同时会降低修改,插入等的性能内嵌文档照样可以建立使用索引测试数据 var p1 = { "name":"Jack", "age&q
JDBC常用API之外的总结白糖_ jdbc
做JAVA的人玩JDBC肯定已经很熟练了，像DriverManager、Connection、ResultSet、Statement这些基本类大家肯定很常用啦，我不赘述那些诸如注册JDBC驱动、创建连接、获取数据集的API了，在这我介绍一些写框架时常用的API，大家共同学习吧。 ResultSetMetaData获取ResultSet对象的元数据信息
apache VelocityEngine使用记录 bozch VelocityEngine
VelocityEngine是一个模板引擎，能够基于模板生成指定的文件代码。使用方法如下： VelocityEngine engine = new VelocityEngine();// 定义模板引擎 Properties properties = new Properties();// 模板引擎属
编程之美-快速找出故障机器 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; public class TheLostID { /*编程之美假设一个机器仅存储一个标号为ID的记录，假设机器总量在10亿以下且ID是小于10亿的整数，假设每份数据保存两个备份，这样就有两个机器存储了同样的数据。 1.假设在某个时间得到一个数据文件ID的列表，是
关于Java中redirect与forward的区别 chenbowen00 java servlet
在Servlet中两种实现： forward方式：request.getRequestDispatcher(“/somePage.jsp”).forward(request, response); redirect方式：response.sendRedirect(“/somePage.jsp”); forward是服务器内部重定向，程序收到请求后重新定向到另一个程序，客户机并不知
[信号与系统]人体最关键的两个信号节点 comsci 系统
如果把人体看做是一个带生物磁场的导体,那么这个导体有两个很重要的节点,第一个在头部,中医的名称叫做百汇穴, 另外一个节点在腰部,中医的名称叫做命门如果要保护自己的脑部磁场不受到外界有害信号的攻击,最简单的
oracle 存储过程执行权限 daizj oracle 存储过程权限执行者调用者
在数据库系统中存储过程是必不可少的利器，存储过程是预先编译好的为实现一个复杂功能的一段Sql语句集合。它的优点我就不多说了，说一下我碰到的问题吧。我在项目开发的过程中需要用存储过程来实现一个功能，其中涉及到判断一张表是否已经建立，没有建立就由存储过程来建立这张表。 CREATE OR REPLACE PROCEDURE TestProc IS fla
为mysql数据库建立索引 dengkane mysql 性能索引
前些时候，一位颇高级的程序员居然问我什么叫做索引，令我感到十分的惊奇，我想这绝不会是沧海一粟，因为有成千上万的开发者（可能大部分是使用MySQL的）都没有受过有关数据库的正规培训，尽管他们都为客户做过一些开发，但却对如何为数据库建立适当的索引所知较少，因此我起了写一篇相关文章的念头。最普通的情况，是为出现在where子句的字段建一个索引。为方便讲述，我们先建立一个如下的表。
学习C语言常见误区如何看懂一个程序如何掌握一个程序以及几个小题目示例 dcj3sjt126com c 算法
如果看懂一个程序，分三步 1、流程 2、每个语句的功能 3、试数如何学习一些小算法的程序尝试自己去编程解决它，大部分人都自己无法解决如果解决不了就看答案关键是把答案看懂，这个是要花很大的精力，也是我们学习的重点看懂之后尝试自己去修改程序，并且知道修改之后程序的不同输出结果的含义照着答案去敲调试错误
centos6.3安装php5.4报错 dcj3sjt126com centos6
报错内容如下: Resolving Dependencies --> Running transaction check ---> Package php54w.x86_64 0:5.4.38-1.w6 will be installed --> Processing Dependency: php54w-common(x86-64) = 5.4.38-1.w6 for
JSONP请求 flyer0126 jsonp
使用jsonp不能发起POST请求。 It is not possible to make a JSONP POST request. JSONP works by creating a <script> tag that executes Javascript from a different domain; it is not pos
Spring Security（03）——核心类简介 234390216 Authentication
核心类简介目录 1.1 Authentication 1.2 SecurityContextHolder 1.3 AuthenticationManager和AuthenticationProvider 1.3.1 &nb
在CentOS上部署JAVA服务 java--hhf java jdk centos Java服务
本文将介绍如何在CentOS上运行Java Web服务，其中将包括如何搭建JAVA运行环境、如何开启端口号、如何使得服务在命令执行窗口关闭后依旧运行第一步：卸载旧Linux自带的JDK ①查看本机JDK版本 java -version 结果如下 java version "1.6.0"
oracle、sqlserver、mysql常用函数对比[to_char、to_number、to_date] ldzyz007 oracle mysql SQL Server
oracle &n
记Protocol Oriented Programming in Swift of WWDC 2015 ningandjin protocol WWDC 2015 Swift2.0
其实最先朋友让我就这个题目写篇文章的时候，我是拒绝的，因为觉得苹果就是在炒冷饭，把已经流行了数十年的OOP中的“面向接口编程”还拿来讲，看完整个Session之后呢，虽然还是觉得在炒冷饭，但是毕竟还是加了蛋的，有些东西还是值得说说的。通常谈到面向接口编程，其主要作用是把系统设计和具体实现分离开，让系统的每个部分都可以在不影响别的部分的情况下，改变自身的具体实现。接口的设计就反映了系统
搭建 CentOS 6 服务器(15) - Keepalived、HAProxy、LVS rensanning keepalived
（一）Keepalived （1）安装 # cd /usr/local/src # wget http://www.keepalived.org/software/keepalived-1.2.15.tar.gz # tar zxvf keepalived-1.2.15.tar.gz # cd keepalived-1.2.15 # ./configure # make &a
ORACLE数据库SCN和时间的互相转换 tomcat_oracle oracle sql
SCN（System Change Number 简称 SCN）是当Oracle数据库更新后，由DBMS自动维护去累积递增的一个数字，可以理解成ORACLE数据库的时间戳，从ORACLE 10G开始，提供了函数可以实现SCN和时间进行相互转换；　　用途：在进行数据库的还原和利用数据库的闪回功能时，进行SCN和时间的转换就变的非常必要了；　　操作方法：　　1、通过dbms_f
Spring MVC 方法注解拦截器 xp9802 spring mvc
应用场景，在方法级别对本次调用进行鉴权，如api接口中有个用户唯一标示accessToken,对于有accessToken的每次请求可以在方法加一个拦截器，获得本次请求的用户，存放到request或者session域。 python中，之前在python flask中可以使用装饰器来对方法进行预处理，进行权限处理先看一个实例,使用@access_required拦截： ?

【机器学习基础】Lasso 和 Ridge回归中的超参数调整技巧

快速的理论背景回顾

所需要的类库

三个秘诀

本文的方法

总结

你可能感兴趣的:(python,机器学习,人工智能,深度学习,java)