落叶霜霜

[Python中常用的回归模型算法大全2：从线性回归到XGBoost]

文章目录

- 概要
- 多输出K近邻回归
- 集成算法回归
- 梯度提升决策树回归
- 随机森林回归

概要

回归分析在数据科学领域扮演着关键角色，用于预测数值型目标变量。本文深入探讨了几种常用的回归模型，包括多输出K近邻回归，决策树回归，集成算法回归，梯度提升决策树回归，随机森林回归，多输出随机森林回归，人工神经网络。

多输出K近邻回归

多输出K近邻回归：

多输出K近邻回归不需要使用MultiOutputRegressor作为外包装器，直接使用KNeighborsRegressor即可实现多输出回归。这种方法通过输入一个数据集X，其中包含除了目标变量（在这个例子中是’Adj Close’和’Open’）之外的所有特征，和包含两个目标变量的数据集Y。代码示例如下：

X = dataset.drop(['Adj Close', 'Open'], axis=1)
Y = dataset[['Adj Close', 'Open']]
from sklearn.neighbors import KNeighborsRegressor
model = KNeighborsRegressor()
model.fit(X, Y)
data_in = [[23.98, 22.91, 7.00, 7.00, 1.62, 1.62, 4.27, 4.25]]
yhat = model.predict(data_in)
print(yhat[0])  # 输出：[15.64999962, 16.64999962]
print(model.score(X, Y))  # 输出：1

决策树回归：

决策树是一种树状结构，每个叶子结点对应一个分类，非叶子结点对应某个属性上的划分。文章详细介绍了决策树的基本原理和生成过程。在这个例子中，使用DecisionTreeRegressor进行回归分析，代码如下：

X = dataset.drop(['Adj Close', 'Close'], axis=1)  
y = dataset['Adj Close'] 
from sklearn.tree import DecisionTreeRegressor  
regressor = DecisionTreeRegressor()  
regressor.fit(X_train, y_train)  
y_pred = regressor.predict(X_test)
# 输出预测结果
df = pd.DataFrame({'Actual': y_test, 'Predicted': y_pred})  
print(df.head(2))
# 输出模型评价指标
print(metrics.mean_absolute_error(y_test, y_pred))  
print(metrics.mean_squared_error(y_test, y_pred))
print(np.sqrt(metrics.mean_squared_error(y_test, y_pred)))
# 输出交叉验证和R2得分
dt_scores = cross_val_score(regressor, X_train, y_train, cv=5)
print("Mean cross validation score: {}".format(np.mean(dt_scores)))
print("Score without cv: {}".format(regressor.score(X_train, y_train)))
print('r2 score:', r2_score(y_test, regressor.predict(X_test)))

决策树回归是一种机器学习方法，采用树状结构来表示不同决策路径。在决策树中，每个叶子节点代表一个特定的输出值，而非叶子节点则表示对输入特征进行划分的规则。决策树的生成基于递归切割的方法，它通过寻找最佳的属性和切分点，使得在每个子区域内的输出值与实际观测值的差异最小化。在训练过程中，决策树不断地将空间区域划分为两个子区域，并确定每个子区域上的输出值，最终生成一个二叉树结构。

在实际应用中，我们可以使用Python中的DecisionTreeRegressor类来创建并训练决策树回归模型。首先，我们准备了输入特征X和对应的目标值y。模型训练完成后，可以用该模型进行预测，生成实际值和预测值的比较。为了评估模型的性能，我们使用了多个指标，包括平均绝对误差、均方差、均方根误差以及R²分数（决定系数）。此外，为了确保模型的泛化性能，我们还进行了交叉验证，检查模型在不同数据子集上的表现。

通过这些评估指标，我们可以全面了解决策树回归模型的性能，并确认它在预测任务中的准确度和可靠性。

X = dataset.drop(['Adj Close', 'Close'], axis=1)  
y = dataset['Adj Close'] 
# 划分训练集和测试集略 
# 模型实例化
from sklearn.tree import DecisionTreeRegressor  
regressor = DecisionTreeRegressor()  
# 训练模型
regressor.fit(X_train, y_train)
# 回归预测
y_pred = regressor.predict(X_test)
df = pd.DataFrame({'Actual':y_test, 'Predicted':y_pred})  
print(df.head(2))

          Actual  Predicted
Date                         
2017-08-09   12.83      12.63
2017-11-14   11.12      11.20

模型评价

from sklearn import metrics 
# 平均绝对误差
print(metrics.mean_absolute_error(
    y_test, y_pred))  
# 均方差
print(metrics.mean_squared_error(
    y_test, y_pred))
# 均方根误差
print(np.sqrt(
    metrics.mean_squared_error(
      y_test, y_pred)))

0.0924680893617
0.0226966010212
0.1506539114039

交叉验证

from sklearn.model_selection import cross_val_score
dt_fit = regressor.fit(X_train, y_train)
dt_scores = cross_val_score(
    dt_fit, X_train, y_train, cv = 5)

print("Mean cross validation score: {}".format(np.mean(dt_scores)))
print("Score without cv: {}".format(dt_fit.score(X_train, y_train)))

Mean cross validation score: 0.99824909037
Score without cv: 1.0

from sklearn.metrics import r2_score

print('r2 score:', r2_score(y_test, dt_fit.predict(X_test)))
print('Accuracy Score:', dt_fit.score(X_test, y_test))

r2 score: 0.9989593390532074
Accuracy Score: 0.9989593390532074

集成算法回归

集成算法回归是一种通过整合多个独立评估器的方法来提高模型性能的技术。其中，装袋法（Bagging）和提升法（Boosting）是两种常见的集成学习方法。

装袋法（Bagging）：

装袋法的核心思想是构建多个相互独立的评估器，然后通过平均或多数表决的原则来决定集成评估器的结果。随机森林是装袋法的代表模型。在随机森林中，多个决策树被并行构建，最终的预测结果是所有决策树预测结果的平均值。

提升法（Boosting）：

提升法中，基评估器是相关的，是按顺序一个一个构建的。其核心思想是通过结合多个弱评估器的力量，一次次对难以评估的样本进行预测，从而构成一个强评估器。Adaboost和梯度提升树（GBDT）是提升法的代表模型。在Adaboost中，每个样本的权重根据前一轮模型的错误进行调整，使得之前被错误分类的样本在下一轮中得到更多的关注，从而提高整体模型的准确性。

Adaboost基本性质
能在学习过程中不断减少训练误差，即在训练数据集上的训练误差率。且误差率是以指数数率下降的。

X = dataset[['Open', 'High', 'Low', 'Volume']].values
y = dataset['Buy_Sell'].values
# 划分训练集与测试集略
from sklearn.ensemble import AdaBoostClassifier
ada = AdaBoostClassifier(n_estimators=180, random_state=0)
ada.fit(X_train, y_train)

y_pred_proba = ada.predict_proba(X_test)[:,1]
ada.feature_importances_

array([ 0.18888889,  0.15      ,
        0.26666667,  0.39444444])

模型评价

ada.predict(X_test)
ada.score(X, y)
from sklearn.metrics import roc_auc_score
ada_roc_auc = roc_auc_score(y_test, y_pred_proba)
print('ROC AUC score: {:.2f}'.format(ada_roc_auc))

在给定的示例中，使用了AdaBoostClassifier进行分类任务。首先，通过提供输入特征X和对应的目标标签y，训练了AdaBoost模型。然后，使用测试集进行预测，并计算了模型的ROC AUC分数，该分数用于评估模型在分类任务中的性能。通过不断调整基评估器的权重，AdaBoost模型能够逐渐减少训练误差，提高模型的预测准确性。

梯度提升决策树回归

BDT（Gradient Boosting Decision Tree）简介

GBDT，又称MART（Multiple Additive Regression Tree），是一种迭代的决策树算法。该算法由多棵决策树组成，所有树的结论累加起来作为最终答案。它在提出初期就和SVM一起被认为是泛化能力较强的算法。

在GBDT中，采用平方误差损失函数时，每一棵回归树学习的是之前所有树的结论和残差，拟合得到当前的残差回归树。提升树即是整个迭代过程生成的回归树的累加。

GBDT工作原理

GBDT利用加法模型和前向分步算法实现学习的优化过程。每一步的优化很简单，例如在使用平方损失函数时，学习残差回归树。

简单来说，每一次的计算都是为了减少上一次的残差。GBDT在残差减少（负梯度）的方向上建立一个新的模型。

GBDT的特点

GBDT的优点在于可以相对少的调参时间内得到较高的准确率。它可以灵活处理各种类型的数据，包括连续值和离散值，具有广泛的应用范围。同时，GBDT具有较强的鲁棒性，对异常值的影响较小。

然而，GBDT也有其缺点。它的弱学习器之间存在依赖关系，难以并行训练数据。在使用GBDT前，通常需要先处理好缺失值。

GBDT的应用

在实际应用中，我们可以使用Scikit-Learn库中的GradientBoostingRegressor来构建GBDT模型。例如，在金融领域，我们可以使用GBDT来预测股票价格。以下是一个示例代码：

from sklearn.ensemble import GradientBoostingRegressor

# 准备数据
X = dataset[['Open', 'High', 'Low', 'Volume']].values
y = dataset['Adj Close'].values

# 划分训练集与测试集（略）

# 构建GBDT模型
gb = GradientBoostingRegressor(max_depth=4, n_estimators=200, random_state=2)

# 训练模型
gb.fit(X_train, y_train)

# 预测测试集标签
y_pred = gb.predict(X_test)

# 计算RMSE
from sklearn.metrics import mean_squared_error as MSE
mse_test = MSE(y_test, y_pred)
rmse_test = mse_test**(1/2)
print('Test set RMSE of GBDT: {:.3f}'.format(rmse_test))

随机森林回归

随机森林是一种集成学习方法，它以决策树为基础构建多个模型，并通过集体智慧做出预测。在随机森林中，样本随机采样（有放回），同时，对于每个树的节点分裂时，特征也是从全部特征中随机选择的子集。这种随机性的引入增加了模型的多样性，提高了模型的泛化性能。

算法流程

样本随机采样：从训练集中有放回地随机选择一定数量的样本，用于构建决策树。
特征随机选择：对于每个树的节点分裂，随机选择一部分特征，再从中选择最优特征进行划分。
多棵决策树构建：重复上述两个步骤，构建多棵决策树，形成随机森林。
预测：对于新数据，每棵决策树都进行预测，分类任务使用简单投票法，回归任务使用简单平均法，得到最终的预测结果。

优点

抗过拟合：样本和特征的随机性减少了模型的过拟合风险。
鲁棒性：随机性使得模型对噪声数据具有很好的鲁棒性，提高了泛化性能。
处理高维数据：不需要特征选择，能够处理高维数据，并展现哪些特征比较重要。
抗缺失值：对缺失值不敏感，即使有大量特征缺失，仍能保持准确度。
并行化训练：树与树之间独立，便于并行化训练，提高了训练速度。

缺点

相似决策树：可能生成很多相似的决策树，降低了模型的多样性。
处理小数据：在小数据或低维数据上表现可能不如其他模型。
计算速度：构建多个决策树可能较慢，尤其是树的数目很大时。

XGBoost回归

XGBoost（Extreme Gradient Boosting）是一种高效的提升树算法，属于集成学习的一部分。它通过将多个树模型集成在一起，形成一个强大的回归模型。这些树模型都是基于CART（Classification and Regression Trees）回归树构建的。

回归树生成过程

节点分裂：从根节点开始，选择最优特征和切分点进行节点分裂。
分裂条件：选择使平方误差最小的特征和切分点，直到满足停止条件（如节点样本数小于阈值）为止。
树的生长：递归地在子节点上重复上述步骤，生成完整的回归树。

XGBoost的核心思想

XGBoost不断地添加树，每次训练一个新树，该树负责拟合上次预测的残差。预测值是通过将样本落入每棵树的叶子节点，并用叶子节点的权重直接求和得到的。

与GBDT的区别

在XGBoost中，预测值不是由所有弱分类器上的预测结果加权求和得到的，而是直接由叶子节点的权重求和得到。这个权重表示了每个叶子节点上样本的回归取值。XGBoost通过目标函数，同时考虑了模型的偏差和方差，以找到最优的树模型。

优势

高效性：XGBoost具有高效的训练和预测速度，适用于大规模数据集。
灵活性：支持自定义损失函数和正则化项，能够适应不同问题类型。
准确性：通过多轮迭代，逐步改善模型性能，提供高精度的预测。

目标函数

XGBoost的目标函数包含两部分：偏差（模型误差）和方差（模型复杂度）。通过在这两者之间取得平衡，XGBoost能够生成具有良好泛化性能的回归模型。

【网络安全 | 扫描子域+发现真实IP】CloakQuest3r安装使用详细教程秋说网安渗透工具使用教程(全)web安全子域名扫描渗透工具
原创文章，禁止转载。本文仅作学习交流使用，不得用于非法渗透，笔者不承担任何责任。文章目录简介功能介绍执行流程限制安装步骤可选功能：SecurityTrailsAPI使用示例简介CloakQuest3r是一款强大的Python工具，专为揭示受Cloudflare及类似服务保护的网站真实IP地址而设计。Cloudflare作为广泛应用的Web安全与性能优化服务，其防护机制可隐藏网站的实际IP，而Clo
C# 牵手DeepSeek：打造本地AI超能力步、步、为营 c#人工智能开发语言
一、引言在人工智能飞速发展的当下，大语言模型如DeepSeek正掀起新一轮的技术变革浪潮，为自然语言处理领域带来了诸多创新应用。随着数据隐私和安全意识的提升，以及对模型部署灵活性的追求，本地部署DeepSeek成为众多开发者和企业关注的焦点。对于C#开发者而言，将DeepSeek模型本地部署并集成到C#项目中，不仅能充分发挥C#语言在Windows平台开发的优势，还能实现高度定制化的人工智能应用，
Pulsar官方文档学习笔记——架构概览咚伢学习笔记架构云原生 zookeeper 分布式
架构概览在最高配置下，pulsar服务应该由一个或多个pulsar集群组成。一个pulsar集群可以包括如下组件一个或多个broker。broker会将生产者的消息分派给消费者。与pulsar配置存储通信来协调各种任务。将消息存储在BookKeeper实例中（也可以叫bookie）。并且依赖zk集群执行一些特定的任务一个BookKeeper集群，由多个bookies组成。可以持久化消息（企业级分布
量化投资策略的生命周期：从设计到淘汰云策量化量化投资自动化交易程序化炒股量化炒股 miniQMT 量化交易 QMT 量化投资 deepseek
推荐阅读：《程序化炒股：如何申请官方交易接口权限？散户可以申请吗？》量化投资策略的生命周期：从设计到淘汰量化投资，这个听起来既神秘又充满科技感的领域，其实离我们并不遥远。它就像是金融市场中的“算法猎人”，通过数学模型和计算机程序来寻找投资机会。那么，一个量化投资策略是如何从无到有，再到最终被淘汰的呢？让我们一起探索这个策略的生命周期。1.策略的诞生：设计阶段1.1灵感的火花量化投资策略的诞生往往始
微软正则表达式库的实现与应用江卓尔
本文还有配套的精品资源，点击获取简介：正则表达式是一种用于文本处理的强大工具，在Windows环境下微软提供了相应的支持。本项目涉及的微软正则表达式库可能是一个内部或第三方开发的框架，以C++实现。regexpr2.cpp和syntax2.cpp文件可能包含核心匹配算法和语法解析处理，而reimpl2.h、regexpr2.h和syntax2.h可能定义了实现细节、API接口和语法定义。resta
Python进程知多少我的身前一尺是我的世界 Python python进程 python多进程 python进程共享内存 python服务器进程 python进程通信
目录目标Python版本官方文档概述进程（Process）的基本概念进程之间的通信方法进程同步进程间共享状态实战创建进程的基本语法创建进程并传递复杂的参数进程同步&进程通信共享内存基于服务器进程实现共享基于队列实现进程安全生产者&消费者模型（基于队列）生产者&消费者模型（基于管道）目标掌握进程的基本概念和使用方法，包括：创建进程、进程同步、进程间共享状态、进程通信。Python版本Python3.
vue2学习笔记4 - 深入学习模板语法：插值语法和指令语法我是飞鸟呀 Vue 学习笔记 vue.js
前言在vue2学习笔记2-老规矩，从HelloWorld开始，了解Vue实例和模板-CSDN博客我们提到过，容器中的代码叫做Vue模板，它们遵循HTML规范，只是混入了特殊的Vue语法。这些特殊的Vue语法除了上一次我们提到的插值语法外，还有指令语法。插值语法，可以使用js表达式，读取vue实例data中的数据。但是能实现的功能比较单一，而且，也仅限于标签体中的文本替换。如果想要与元素的属性绑定，
Kubernetes-v1.26.3(kubeadm)部署 wxwopt kubelet
1.k8s基础系统环境配置1.1.环境准备CentOSLinuxrelease7.9.2009(Core)IPHOSTNAME操作系统192.168.10.131k8s-master01CentOS7.9192.168.10.132k8s-master02CentOS7.9192.168.10.133k8s-node01CentOS7.9注意：集群安装时会涉及到三个网段：宿主机网段：就是安装k8s
算法与数据结构（二叉树中的最大路径和） a_j58 数据结构
题目思路这道题我们可以考虑用递归来解决。首先设计一个maxPath函数用来递归计算二叉树中一个节点的最大贡献值，具体来说，就是以该节点为根节点的子树中寻找以该节点为起点的一条路径，使得该路径上的节点值之和最大。如果该节点为空，则最大贡献值为0。如果非空，最大贡献值就等于节点值与其子节点中的最大贡献值之和过程分析假设二叉树如下递归步骤：1.节点20：左子树：空，leftGain=0。右子树：空，ri
常见排序算法陆鳐LuLu 排序算法算法数据结构
常见的排序算法可以分为以下几类：1.比较排序冒泡排序（BubbleSort）时间复杂度：O(n²)空间复杂度：O(1)原理：重复遍历数组，比较相邻元素并交换，直到没有需要交换的元素为止。选择排序（SelectionSort）时间复杂度：O(n²)空间复杂度：O(1)原理：每次从未排序部分选择最小（或最大）的元素，放到已排序部分的末尾。插入排序（InsertionSort）时间复杂度：O(n²)空间
C语言排序算法只有月亮知道排序算法 c语言算法
这篇文章总结一下C语言数据结构中常见的几种排序算法。1.直接插入排序直接插入排序的算法思想是，从第二个元素开始，逐个将元素插入到已排序部分。对于每个待插入元素，从后向前扫描已排序部分，找到合适的位置并插入voidInsertSort(int*a,intn){for(inti=1;i=0)//挨个遍历判断大小{if(temp1){gap/=2;//当gap为1时，就为直接插入排序for(inti=0
Kubernetes kubelet inotify summer_west_fish #容器云 Kubernetes kubernetes kubelet java
在Kubernetes中，kubelet是运行在每个节点上的关键组件，负责管理Pod和容器的生命周期。kubelet使用多种机制来监控和管理容器的文件系统事件，其中一种机制是利用Linux的inotify接口。1.什么是inotify？inotify是一个Linux内核子系统，用于监控文件系统事件。它允许应用程序注册对特定文件或目录的监控，并在这些文件或目录发生变化时接收通知。inotify是一种
python 开启https服务魔兽-SS python python https 开发语言
importjsonfromflaskimportFlask,Response,requestimportosapp=Flask(__name__)#设置SSL证书路径ssl_cert_path=os.path.join(os.path.dirname(__file__),'certs','self.crt')ssl_key_path=os.path.join(os.path.dirname(__
自动化办公|xlwings与pandas交互游客520 自动化 python从入门到出家实用代码 pandas excel python 自动化
1.介绍在数据分析和Excel自动化中，pandas作为Python处理数据的强大库，而xlwings则可以高效操作Excel。将pandas与xlwings结合使用，可以实现从Excel读取数据到DataFrame、将DataFrame写入Excel以及Excel的自动化处理。2.从Excel读取数据到PandasDataFrame2.1读取整个表格importxlwingsasxwimport
Linux上用C++和GCC开发程序实现两个不同PostgreSQL实例下单个数据库中多个Schema稳定高效的数据迁移到其它PostgreSQL实例 weixin_30777913 c++数据库开发语言 postgresql 服务器
设计一个在Linux上运行的GCCC++程序，同时连接三个不同的PostgreSQL实例，其中两个实例中分别有两个数据库中多个Schema的表结构分别与第三实例中两个数据库中多个Schema个结构完全相同，同时复制两个实例中两个数据库中多个Schema里的所有表的数据到第三个实例中两个数据库中多个Schema里，使用以下快速高效的方法，加入异常处理，支持每隔固定时间重试一定次数，每张表的复制运行状
因果推断在智能广告中的实践 AI天才研究院计算 AI大模型应用入门实战与进阶大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA 计算 AI大模型应用
非常感谢您提出这个有趣的话题。让我们一步步设计一个关于"因果推断在智能广告中的实践"的系统架构。这个项目将涉及复杂的数据分析、机器学习和广告投放系统，我们需要仔细考虑各个方面以确保系统的有效性和可扩展性。文章目录因果推断在智能广告中的实践-系统架构设计1.需求分析1.1功能需求1.2非功能性需求2.系统概述2.1高层次系统描述2.2主要组件及关系2.3系统核心流程3.详细架构设计3.1数据收集模块
周志华机器学习西瓜书第五章神经网络-学习笔记(超详细) Sodas（填坑中....）周志华西瓜书——详细笔记附例题图解机器学习神经网络学习人工智能数据挖掘算法
在机器学习中，神经网络一般指的是"神经网络学习"，是机器学习与神经网络两个学科的交叉部分。所谓神经网络，目前用的最广泛的一个定义是"神经网络是由具有适应性的简单单元组成的广泛并行互连的网络，它的组织能够模拟生物神经系统对真实世界物体做出交互反应"。神经网络是一门重要的机器学习技术。它是目前最为火热的研究方向--深度学习的基础。学习神经网络不仅可以让你掌握一门强大的机器学习方法，同时也可以更好地帮助
控制服务和守护进程上邪o_O Redhat Linux 知识点 linux
守护进程(Daemon)是什么？列举一些常见的守护进程。守护进程（Daemon）是在Linux系统中一种长期运行在后台的进程，它通常在系统启动时被启动，并且在系统关闭前一直保持运行状态。守护进程不与特定的终端关联，因此不会受到用户登录或注销的影响，其主要目的是为系统或用户提供特定的服务。httpd：用于提供Web服务，当用户在浏览器中访问网站时，httpd守护进程负责处理HTTP请求并返回相应的网
编程小白冲Kaggle每日打卡（17）--kaggle学堂：＜机器学习简介＞随机森林 AZmax01 编程小白冲Kaggle每日打卡机器学习随机森林人工智能
Kaggle官方课程链接：RandomForests本专栏旨在Kaggle官方课程的汉化，让大家更方便地看懂。RandomForests使用更复杂的机器学习算法。介绍决策树给你留下了一个艰难的决定。一棵有很多叶子的深树会被过度拟合，因为每一个预测都来自它叶子上少数房子的历史数据。但是，叶子很少的浅树表现不佳，因为它无法在原始数据中捕捉到尽可能多的区别。即使是当今最复杂的建模技术也面临着欠拟合和过拟
Ubuntu系统下交叉编译nasm linux运维交叉编译
一、交叉编译nasm1.下载源码下载nasm：https://www.nasm.us/pub/nasm/releasebuilds/下载并解压源码。wgethttps://www.nasm.us/pub/nasm/releasebuilds/2.16.03/nasm-2.16.03.tar.gztar-xvzfnasm-2.16.03.tar.gzcdnasm-2.16.03mkdirnasmbu
注意力机制：让机器学会“挑重点” 人工智能计算机视觉
注意力机制：让机器学会“挑重点”前言在日常生活中，我们总是无意识地选择性地关注某些信息，而忽略其他部分。比如，听音乐时，我们可能会更关注旋律或歌词；阅读文章时，我们会优先留意标题和核心观点。这种“选择性关注”的能力，正是注意力机制的核心思想。而在人工智能领域，注意力机制则是一种让机器在处理大量数据时，能够自动识别并聚焦于关键信息的技术。注意力机制的工作原理注意力机制的工作流程可以简化为三个主要步骤
JWT token工具类 HPF_99 springboot jwt tokenization spring boot
头部（header，一般使用base64加密）JWT的头部有两部分信息：声明类型，这里是JWT声明加密的算法，通常直接使用HMACSHA256载荷（payload）该部分一般存放一些有效的信息（如用户名）。iss：JWT的签发者sub:JWT所面向的用户aud:接收该JWT的一方exp(expires):什么时候过期，时间戳iat(issuedat):在什么时候签发的签名（signature）前面
Matlab 大量接单 matlabgoodboy matlab 开发语言
分享一个matlab接私活、兼职的平台1、技术方向满足任一即可2、技术要求3、最后技术方向满足即可MATLAB：熟练掌握MATLAB编程语言，能够使用MATLAB进行数据处理、机器学习和深度学习等相关工作。机器学习、深度学习、强化学习、仿真、复现、算法、神经网络、建模、图像识别、数据挖掘、数据获取、爬虫、数据分析、目标检测、算法创新、因子分析、相关分析、方差分析、判别分析、方程分析、线性回归、中介
AI数据分析：用DeepSeek做数据清洗 atbigapp.com 数据分析大模型应用 AI工具人工智能数据分析数据挖掘 deepseek prompt
在当今数据驱动的时代，数据分析已成为企业和个人决策的重要工具。随着人工智能技术的快速发展，AI驱动的数据分析工具正在改变我们处理和分析数据的方式。本文将着重介绍如何使用DeepSeek进行数据清洗。数据清洗是数据分析的基础，其目的是确保数据的准确性、完整性和一致性。常见的数据问题包括：缺失值：数据中的某些字段为空。重复值：数据中存在重复记录。异常值：数据中存在明显偏离正常范围的数值。不一致性：数据
百度搜索语法羊羊一洋百度
百度搜索作为中国最大的搜索引擎，其搜索语法与谷歌搜索类似，但也有一些特有的功能。以下是一些基本的百度搜索语法：1.双引号(`""`)：用来搜索精确的短语或句子。例如，搜索`"人工智能"`会找到包含完整短语"人工智能"的结果。2.减号(-)：用来排除搜索结果中的特定词汇。例如，搜索`手机-iphone`会找到包含"手机"但不包含"iphone"的结果。3.加号(+)：用来确保搜索结果中包含特定的词汇
一篇文章搞懂C#中的泛型类/泛型方法/泛型接口方程式sunny C#c#
一篇文章搞懂C#中的泛型类/泛型方法/泛型接口链接:源码提起泛型类，很多人就头疼，我也头疼。在C#中这个概念很重要，重要的向定义一个int数值类型一样，但是这个内容又不像if···else那样容易理解。我花费了两天的时间，把整个知识点梳理了一遍，希望讲清楚，也当给自己做个笔记。泛型类（GenericClasses）泛型类是一种可以处理多种数据类型的数据结构或算法模板。它允许在定义类时使用一个或多个
【登月计划】DAY 4 中期 --《排产“阿尔法狗”大揭秘！美的如何用APS算法碾压对手》泛泛不谈 0-2岁智能制造工程师启蒙制造经验分享需求分析
目录四、乐高教学：APS系统核心模块与排产算法1.APS系统定位与价值2.APS核心模块拆解模块1：产能建模引擎（排产的“地基”）模块2：排产算法库（排产的“大脑”）模块3：动态响应模块（排产的“应急部队”）3.家电行业典型排产规则规则1：交货期优先（DueDateFirst）规则2：最小化换型时间（SMED优化）规则3：瓶颈资源最大化利用4.APS系统数据流（家电行业协同网络）5.APS实施避坑
如何在VSCode中使用OpenAI WeiLai1112 DeepSeek vscode ide 编辑器
如何在VSCode中使用OpenAI：从集成到应用场景详解人工智能（AI）正在改变软件开发的方式，而OpenAI提供的强大模型可以帮助开发者提升编码效率、优化工作流并自动化繁琐任务。本文将详细介绍如何在VSCode（VisualStudioCode）中使用OpenAI，集成后可以做哪些事情，以及如何充分发挥OpenAI的能力来提高生产力。1.在VSCode中使用OpenAI，可以做什么？将Open
Android构建系统 - 03 编译执行流程 Mr.pyZhang 构建系统 android linux
文章目录执行编译Linux内核编译make编译系统选择编译命令makem..makemmmmma...其他命令代码搜索导航指令makeclean/update-apiMakefile分类解析过程树根节点droid`/Makefile``main.mk``droid`droidcore节点.imgfilesmodules_to_install`INSTALLED_ANDROID_INFO_TXT_T
使用Semantic Kernel：对DeepSeek添加自定义插件归-途机器学习 oneapi 机器学习
SemanticKernel介绍SemanticKernel是一个SDK，它将OpenAI、AzureOpenAI等大型语言模型与C#、Python和Java等传统编程语言集成在一起。SemanticKernel通过允许您定义插件来实现这一点。为什么需要添加插件？大语言模型虽然具有强大的自然语言理解和生成能力，但它们通常是基于预训练的模型，其功能受限于训练时所接触的数据和任务。为大语言模型添加插件
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st