数据派THU

独家 | 用XGBoost入门可解释机器学习

作者：Scott Lundberg

翻译：和中华

校对：张一然

本文长度为4300字，建议阅读8分钟

本文为大家介绍用XGBoost解释机器学习。

这是一个故事，关于错误地解释机器学习模型的危险以及正确解释所带来的价值。如果你发现梯度提升或随机森林之类的集成树模型具有很稳定的准确率，但还是需要对其进行解释，那我希望你能从这篇文章有所收获。

假定我们的任务是预测某人的银行财务状况。模型越准确，银行就越赚钱，但由于该预测要用于贷款申请，所以我们必须要提供预测背后的原因解释。在尝试了几种类型的模型之后，我们发现XGBoost实现的梯度提升树能提供最佳的准确率。不幸的是，很难解释为何XGBoost做出某个决策，所以我们只有两种选择：要么退回到线性模型，要么搞清楚如何解释XGBoost模型。没有数据科学家愿意在准确率上让步，于是我们决定挑战自己，去解释复杂的XGBoost模型（本例中，是6棵深达1247层的树）。

经典的全局特征重要性度量

首先一个显而易见的选择是使用XGBoost中Python接口提供的plot_importance()方法。它给出一个简单明了的柱状图，表示数据集中每个特征的重要性（复现结果的代码在Jupyter notebook中）。

图：该模型在经典的成人普查数据集上被训练用于预测人们是否会报告超过5万美元的收入（使用logistic loss），上图是执行xgboost.plot_importance(model)的结果

仔细看一下XGBoost返回的特征重要性，我们发现年龄在所有特征中占统治地位，成为收入最重要的预测指标。我们可以止步于此，向领导报告年龄这个直观且让人满意的指标是最重要的特征，紧随其后的是每周工作时长和受教育程度这些特征。但是，作为一名好的数据科学家，我们查询了一下文档，发现在XGBoost中衡量特征重要性有3个选项：

1. Weight。某个特征被用于在所有树中拆分数据的次数

2. Cover。同上，首先得到某个特征被用于在所有树中拆分数据的次数，然后要利用经过这些拆分点的训练数据数量赋予权重

3. Gain。使用某个特征进行拆分时，获得的平均训练损失减少量

这些是在任何基于树的建模包中都能找到的重要性度量。Weight是默认选项，因此我们也试试另外两种方法，看看有何不同：

图：运行xgboost.plot_importance,并使用参数 importance_type=’cover’和’gain’的结果

结果令人诧异，对于XGBoost提供的3个选项，特征重要性的排序都大不相同。对于cover方法，资本收益似乎是收入最重要的预测指标，而对于gain方法，关系状态特征独占鳌头。不知道哪种方法最好的情况下，依靠这些度量来报告特征重要性，这很让人不爽。

什么因素决定了特征重要性度量的好坏？

如何比较两种特征归因（feature attribution）方法并不明显。我们可以在诸如数据清洗，偏差检测等任务上测量每种方法的最终用户性能。但这些任务仅仅是特征归因方法质量的间接度量。这里，定义两个我们认为任何好的特征归因方法都应遵循的属性：

1. 一致性（Consistency）。当我们更改模型以使其更多依赖于某个特征时，该特征的重要性不应该降低。

2. 准确性（Accuracy）。所有特征重要性的和应该等于模型的总体重要性。例如，如果重要性由R^2值来衡量，则每个特征的归因值加起来应该等于整个模型的R^2。

如果一致性不满足，那我们就无法比较任意两个模型的特征重要性，因为此时分配到更高的归因并不意味着模型对此特征有更多依赖。

如果准确性不满足，那我们就不知道每个特征的归因是如何合并起来以代表整个模型的输出。我们不能简单的对归因进行归一化，因为这可能会破坏该方法的一致性。

当前的归因方法是否一致且准确？

回到之前银行数据科学家的工作。我们意识到一致性和准确性很重要。实际上，如果一个方法不具备一致性，我们就无法保证拥有最高归因的特征是最重要的特征。因此，我们决定使用两个与银行任务无关的树模型来检查各个方法的一致性：

图：在两个特征上的简单树模型。咳嗽显然在模型B中比模型A中更重要。

模型的输出是根据某人的症状而给出的风险评分。模型A仅仅是一个用于发烧和咳嗽两个特征的简单“and”函数。模型B也一样，只不过只要有咳嗽症状，就加10分。为了检查一致性，我们需要定义“重要性”。此处，我们用两种方式定义重要性：

1) 作为当我们移除一组特征时，模型预期准确率的变化。

2) 作为当我们移除一组特征时，模型预期输出的变化。

第一个定义度量了特征对模型的全局影响。而第二个定义度量了特征对单次预测的个性化影响。在上面简单的树模型中，当发烧和咳嗽同时发生时对于两种定义，咳嗽特征在模型B中明显都更重要。

银行例子中的Weight，cover和gain方法都是全局特征归因方法。当在银行部署模型时，我们还需要针对每个客户的个性化说明。为了检查一致性，我们在简单的树模型上运行6种不同的特征归因方法：

1. Tree SHAP。我们提出的一种新的个性化度量方法。

2. Saabas。一种个性化的启发式特征归因方法。

3. Mean( |Tree SHAP| )。基于个性化Tree SHAP平均幅度的一种全局归因方法。

4. Gain，上述XGBoost使用的相同方法，等同于scikit-learn树模型中使用的Gini重要性度量。

5. 拆分次数(Split Count)。代表XGBoost中紧密相关的’weight’和’cover’方法，但使用’weight’方法来计算。

6. 排列（Permutation）。当在测试集中随机排列某个特征时，导致模型准确率的下降。

图：使用6种不同方法对模型A和B做特征归因。截止发文时间，这些方法代表了文献中所有关于树模型的特征归因方法。

从图上可知，除了permutation方法外，其余方法都是不一致的。因为它们在模型B中比在模型A中给咳嗽分配的重要性更少。不一致的方法无法被信任，它无法正确地给最有影响力的特征分配更多的重要性。细心的读者会发现，之前我们在同一模型上使用经典的归因方法产生矛盾时，这种不一致已经显现。对于准确性属性呢？事实证明，Tree SHAP，Sabaas和 Gain 都如先前定义的那样准确，而permutation和split count却不然。

令人惊讶的是，诸如gain(Gini重要性)之类广泛使用的方法居然会导致如此明显的不一致。为了更好地理解为何会发生这种情况，我们来仔细看看模型A和B中的gain是如何计算的。简单起见，我们假设每个叶子节点中落有25%的数据集，并且每个模型的数据集都具有与模型输出完全匹配的标签。

如果我们用均方误差MSE作为损失函数，则在模型A中进行任何拆分之前，MSE是1200。这是来自恒定平均预测20的误差。在模型A中用发烧特征拆分后，MSE降到了800，因此gain方法将此400的下降归因于发烧特征。然后用咳嗽特征再次拆分，会得到MSE为0，gain方法会把这次800的下降归因于咳嗽特征。同理，在模型B中，800归因于发烧，625归因于咳嗽。

图：模型A和模型B的gain（又称基尼重要性）得分计算。

通常，我们期望靠近树根的特征比叶子节点附近的特征更重要（因为树就是贪婪地被构造的）。然而gain方法偏向于将更多的重要性归因于较低的拆分。这种偏见导致了不一致性，即咳嗽应该更重要时（在树根处拆分），给它归因的重要性实际却在下降。个性化的Saabas方法（被treeinterpreter包所使用）在我们从上到下遍历树时计算预测的差异，它也同样受偏见影响，即偏向较低的拆分。随着树加深，这种偏见只会加剧。相比之下，Tree SHAP方法在数学上等价于对特征所有可能的排序上的预测差异求均值，而不仅仅是按照它们在树中的位置顺序。

只有Tree SHAP既一致又准确这并不是巧合。假设我们想要一种既一致又准确的方法，事实证明只有一种分配特征重要性的方法。详细介绍在我们最近的NIPS论文中，简单来讲，从博弈论中关于利润公平分配的证明引出了机器学习中特征归因方法的唯一结果。在劳埃德·沙普利（Lloyd Shapley）于1950年代推导出它们之后，这些唯一的值被称为沙普利值（Shapley values）。我们在这里使用的SHAP值是把与Shapley值相关的几种个性化模型解释方法统一而来的。Tree SHAP是一种快速算法，可以精确地在多项式时间内为树计算SHAP值，而不是在传统的指数运行时间内（请参阅arXiv）。

充满信心地解释我们的模型

扎实的理论依据和快速实用的算法相结合，使SHAP值成为可靠地解释树模型（例如XGBoost的梯度提升机）的强大工具。有了这个新方法，让我们回到解释银行XGBoost模型的任务：

图：全局Mean( |Tree SHAP| )方法应用到收入预测模型上。x轴是当某个特征从模型中’隐藏’时模型输出的平均幅度变化（对于此模型，输出具有log-odds单位）。详细信息，请参见论文。但是“隐藏”是指将变量集成到模型之外。由于隐藏特征的影响会根据其他隐藏特征而变化，因此使用Shapley值可迫使一致性和准确性。

图上可看出，关系特征实际上是最重要的，其次是年龄特征。由于SHAP值保证了一致性，因此我们无需担心之前在使用gain或split count方法时发现的种种矛盾。不过，由于我们现在有为每个人提供的个性化说明，我们还可以做的更多，而不只是制作条形图。我们可以在数据集中给每个客户绘制特征重要性。shap Python包使此操作变得容易。我们首先调用shap.TreeExplainer（model）.shap_values（X）来解释每个预测，然后调用shap.summary_plot（shap_values，X）来绘制以下解释：

图：每个客户在每一行上都有一个点。点的x坐标是该特征对客户模型预测的影响，而点的颜色表示该特征的值。不在行上的点堆积起来显示密度（此示例中有32,561个客户）。由于XGBoost模型具有logistic loss，因此x轴具有log-odds单位（Tree SHAP解释了模型的边距输出变化）。

这些特征按mean（| Tree SHAP |）排序，因此我们再次看到关系这个特征被视为年收入超过5万美元的最强预测因子。通过绘制特征对每个样本的影响，我们还可以看到重要的异常值影响。例如，虽然资本收益并不是全局范围内最重要的特征，但对于部分客户而言，它却是最重要的特征。按特征值着色为我们显示了一些模式，例如，年纪较浅会降低赚取超过 5万美元的机会，而受高等教育程度越高，赚取超过5万美元的机会越大。

我们可以停下来将此图展示给老板，但这里咱们来更深入地研究其中一些特征。我们可以通过绘制年龄SHAP值（log odds的变化）与年龄特征值的关系来实现：

图：y轴是年龄特征改变多少每年赚取5万美元以上的log odds。x轴是客户的年龄。每个点代表数据集中的一个客户。

在这里，我们看到了年龄对对收入潜力的明显影响。请注意，与传统的部分依赖图（其显示当更改特征值时的平均模型输出）不同，这些SHAP依赖图显示了相互影响。即使数据集中的许多人是20岁，但年龄对他们的预测的影响程度却有所不同，正如图中20岁时点的垂直分散所示。这意味着其他特征正在影响年龄的重要性。为了了解可能是什么特征在影响，我们用受教育的年限给点涂上颜色，并看到高水平的教育会降低20岁时的年龄影响，而在30岁时会提高影响：

图：y轴是年龄特征改变多少每年赚取5万美元以上的log odds。x轴是客户的年龄。Education-Num是客户已接受的教育年限。

如果我们对每周的工作小时数做另一个依赖图，我们会发现，多投入时间工作的好处在每周约50个小时时达到瓶颈，而如果你已婚，则额外工作不太可能代表更高收入：

图：每周工作时间与工作时间数对收入潜力的影响。

解释你自己的模型

这篇文章整个分析过程旨在模拟你在设计和部署自己的模型时可能要经历的过程。shap包很容易通过pip进行安装，我们希望它可以帮助你放心地探索模型。它不仅包含本文涉及的内容，还包括SHAP交互值，模型不可知的SHAP值估算，以及其他可视化。还有很多notebooks来展示在各种有趣的数据集上的各种功能。例如，你可以在一个notebook中根据体检报告数据来分析你将来最可能的死亡原因，这个notebook解释了一个XGBoost死亡率模型。对于Python以外的其他语言，Tree SHAP也已直接合并到核心XGBoost和LightGBM软件包中。

原文标题：

Interpretable Machine Learning with XGBoost

原文链接：

https://towardsdatascience.com/interpretable-machine-learning-with-xgboost-9ec80d148d27

编辑：于腾凯

校对：汪雨晴

译者简介

和中华，留德软件工程硕士。由于对机器学习感兴趣，硕士论文选择了利用遗传算法思想改进传统kmeans。目前在杭州进行大数据相关实践。加入数据派THU希望为IT同行们尽自己一份绵薄之力，也希望结交许多志趣相投的小伙伴。

翻译组招募信息

工作内容：需要一颗细致的心，将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生，或在海外从事相关工作，或对自己外语水平有信心的朋友欢迎加入翻译小组。

你能得到：定期的翻译培训提高志愿者的翻译水平，提高对于数据科学前沿的认知，海外的朋友可以和国内技术应用发展保持联系，THU数据派产学研的背景为志愿者带来好的发展机遇。

其他福利：来自于名企的数据科学工作者，北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴。

点击文末“阅读原文”加入数据派团队~

转载须知

如需转载，请在开篇显著位置注明作者和出处（转自：数据派ID：DatapiTHU），并在文章结尾放置数据派醒目二维码。有原创标识文章，请发送【文章名称-待授权公众号名称及ID】至联系邮箱，申请白名单授权并按要求编辑。

发布后请将链接反馈至联系邮箱（见下方）。未经许可的转载以及改编者，我们将依法追究其法律责任。

点击“阅读原文”拥抱组织

python导包樱木之 python 开发语言
python导包在python导包中碰到了相对路径和绝对路径的问题，本文主要根据这两个方面就python导包问题进行讲解。本文目录：python导包三种方法python解释器加载包的路径参考：暂无。python导包三种方法三种导包方法及引用方法如下：#假设文件解释如下，我们在my_main.py文件中要加载tools.py中的print1()方法root|-my_main.py|-www|-ymz
python的导包使用 power_kai python
1、查看文件的创建时间importtimeimportosprint（time.localtime(os.path.getatime('E:\\a.txt'))）2、查看文件的修改时间print（time.localtime(os.path.getmtime('E:\\a.txt'))）3、pickle数据转换模块,这个写入的文件是一个二进制文件，普通文本编辑器打开是乱码importpickle#
python 导包 amaicsdn python
__init__.pyisneededunderthepackagewhereyouwanttoputyourownpyfilesorthisdirectorywontberecongnisedasapythonpackage__init__.pycanbeemptyfileusefillpathyoucanaccessthedefinedmethodmethodunder__init__.pyc
爬虫获取 item_get_video 接口数据：小红书笔记视频详情的深度解析 API快乐传递者小红书API API 爬虫笔记音视频
在当今内容驱动的互联网时代，小红书作为国内领先的社交电商平台，其笔记视频内容成为品牌营销、内容创作和用户体验的重要组成部分。通过爬虫技术获取小红书笔记视频详情，不仅可以帮助开发者更好地理解用户需求，还能为电商运营、内容推荐和数据分析提供强大的支持。本文将详细介绍如何使用Python爬虫获取小红书item_get_video接口的返回数据，并对其数据结构进行详细解析。一、item_get_video
【Conda与Pip的完美融合】在Conda环境中优雅使用pip指南 2401_85702623 conda pip python
标题：【Conda与Pip的完美融合】在Conda环境中优雅使用pip指南Conda是一个强大的包管理器和环境管理器，广泛用于Python社区，尤其是在数据科学和机器学习领域。尽管Conda本身可以处理大多数包的安装和管理，但有时我们可能仍需使用pip来安装特定的Python包。本文将详细解释如何在Conda环境中使用pip，包括配置、安装包、环境管理等，确保您可以充分利用这两个工具的优势。1.C
【Python 基础教程】Python中的输入输出 2401_84139711 python microsoft 开发语言
====================================================================在每一门编程语言中的都会有输入输出流这一说,通过输入输出流可以使我们写的程序与外界进行交互。当然了我们写程序的目的也就是对数据流进行处理,处理之后或对其进行保存,或将其释放。今天主要学习一下Python中的输入输出流,会对标准输入输出流、文件输入输出流展开介绍。一
第七章Solr：企业级搜索应用 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
第七章Solr：企业级搜索应用1.背景介绍1.1搜索引擎的重要性在当今信息时代,数据量呈指数级增长,海量数据中蕴含着极其宝贵的信息和知识。然而,如何快速、准确地从大数据中检索出所需的信息,一直是企业和组织面临的巨大挑战。传统的数据库查询方式已经无法满足现代搜索需求,因此高效的搜索引擎应运而生。1.2什么是SolrApacheSolr是一个高性能、可扩展、云就绪的企业级搜索平台,由Apache软件基
Python 中的导包（import）：从入门到实践 | 搞计算机的研究生们求你们看看吧迪菲赫尔曼 Python python 开发语言 import 导包基础教程编程语言
Python中的导包（import）：从入门到实践在Python中，如果我们想使用其他人或自己写的功能（函数、类等），最常见的方式就是“导包”（import）。导包就相当于“拿来一个工具箱”，把里面的工具（代码）借来使用。本文将从基础到稍微进阶的层面，为你详细介绍Python的导包方式与常见用法。一、为什么要导包？举个生活中的例子：如果你要砍木头，需要一把斧子或电锯；如果你要拔钉子，需要钳子或起子
python keyerror列名报错_keyerror weixin_39870199 python keyerror列名报错
ValueError：传入参数不是调用者所期望的(从书上所得，输入的参数不是数字而是字母)TypeError：传入参数的类型不符合IndexError：传入的参数个数不满足AttributeError：访问对象的某属性无效KeyError：访问字典的无效关键字IOError：无法打开文件最近接到一个使用python写一个解析yaml文件，并根据内容配置指定对应的shell来执行(比如bat、pow
【python】Python中常见的KeyError报错分析景天科技苑 python 开发语言 python报错 KeyError
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，前后端开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi，flask等框架，linux，shell脚本等实操
Python 常用函数全解析，轻松提升编码效率 yang789022 python 开发语言 windows
Python常用函数全解析，轻松提升编码效率Python常用函数全解析，轻松提升编码效率1.基础内置函数1.1`print()`与`input()`1.2`len()`、`type()`与`isinstance()`2.数学与数值处理函数2.1`abs()`、`round()`与`pow()`2.2`divmod()`与`max()/min()`3.序列与迭代相关函数3.1`range()`与`e
全自动文章生成发布构建 PyAIGCMaster 我的学习笔记 python
单机版、定时生成文章和分平台发布，以下是优化后的解决方案及代码示例：---###**推荐方案：APScheduler+内置调度逻辑**选择**APScheduler**是最佳方案，原因：1.**轻量级**：纯Python实现，无需额外服务（如Redis/CeleryWorker）。2.**精准调度**：支持Cron式定时任务（如每天3点生成、8点发布）。3.**单机友好**：直接嵌入代码中，适合打
金融租赁系统的创新发展与市场竞争力提升探讨红点租赁系统开发其他
内容概要随着经济的快速发展，金融租赁系统逐渐成为金融市场中不可或缺的一环。它不仅提供了灵活的资金解决方案，还促进了企业的资本结构优化与资源配置效率。因此，了解该系统的市场背景与发展现状至关重要。在现今环境下，新兴技术如人工智能、大数据和区块链等正加速推动金融租赁的创新。通过这些技术，不仅可以优化业务流程，提升运营效率，还可以增强风险管理能力。例如，利用数据分析可以实时监测租赁资产的风险，从而采取相
OmniParser V2 安装与使用教程 Leaton Lee OmniParser V2 人工智能 deepseek
1.环境准备操作系统：支持Windows/macOS/Linux。Python版本：确保已安装Python3.7或更高版本。包管理工具：使用pip（Python自带）。安装环境：condacreate-n"omni"python==3.12condaactivateomnipipinstall-rrequirements.txt确保您已将V2权重下载到weights文件夹中（确保标题权重文件夹名为
解决Python中递归报错的问题硫酸锌01 Python python
1、问题背景Duringhandlingoftheaboveexception,anotherexceptionoccurred:有没有见到过这个报错？当出现这个报错的时候，意味着报错信息特别特别地长，难以关注到有效信息。那么这种报错是如何产生的？以及如何设计才能避免产生这种冗长的报错？2、我的需求如果我有一个Python的多维数组列表：lst=[[[1,2],[3,4]],[[5,6],[7,8
蓝桥杯Python赛道备赛——Day6：算术（二）（数学问题） SKY YEAM 蓝桥杯备赛蓝桥杯 python 职场和发展
本期博客是蓝桥杯备赛中算术（数学问题）的第二期，包括：快速幂算法、逆元（模意义下的倒数）、组合数计算和排列数计算。每一种数学问题都在给出定义的同时，给出了其求解方法的示例代码，以供低年级师弟师妹们学习和练习。前序知识：（1）Python基础语法算术（二）（数学问题）一、快速幂算法二、逆元（模意义下的倒数）三、组合数计算四、排列数计算一、快速幂算法1.定义：快速计算大指数幂的算法。2.算法原理：二进
蓝桥杯Python赛道备赛——Day1：基础算法 SKY YEAM 蓝桥杯备赛蓝桥杯 python 算法
本博客就蓝桥杯中的基础算法（这一部分说是算法，但更是一些简单的操作）进行罗列，包括：枚举、模拟、前缀和、差分、二分查找、进制转换、贪心、位运算和双指针。每一个算法都在给出概念解释的同时，给出了示例代码，以供低年级师弟师妹们学习和练习。前序知识：（1）Python基础语法（2）PythonOOP（面向对象编程）基础算法（操作）一、枚举二、模拟三、前缀和四、差分五、二分查找六、进制转换七、贪心八、位运
如何用python做一个小程序进行炒股？大懒猫软件 python 小程序开发语言
使用Python分析股票的完整程序以下是一个完整的Python程序，展示如何获取股票数据、进行数据清洗、计算技术指标、并进行简单的价格走势分析。1.安装必要的库首先，确保安装了必要的库：bash复制pipinstallrequestspandasmatplotlibyfinance2.获取股票数据使用yfinance库获取股票数据。yfinance是一个流行的库，可以方便地从雅虎财经获取股票数据。
数据集格式转换——json2txt、xml2txt、txt2json【复制就能用】 kay_545 YOLO11改进有效涨点 python 人工智能机器学习
秋招面试专栏推荐：深度学习算法工程师面试问题总结【百面算法工程师】——点击即可跳转本专栏所有程序均经过测试，可成功执行专栏地址：YOLO11入门+改进涨点——点击即可跳转欢迎订阅目录json2txt脚本xml2txttxt2json
蓝桥杯Python赛道备赛——Day7：动态规划（基础） SKY YEAM 蓝桥杯备赛蓝桥杯 python 动态规划
本博客就蓝桥杯中所涉及的动态规划基础问题进行讲解，包括：递推、记忆化搜索、最长公共子序列（LCS）和最长上升子序列（LIS）。每一种动态规划问题都在给出定义的同时，给出了其求解方法的示例代码，以供低年级师弟师妹们学习和练习。前序知识：（1）Python基础语法动态规划（基础）一、递推（迭代法）二、记忆化搜索（递归+缓存）三、最长公共子序列（LCS）四、最长上升子序列（LIS）一、递推（迭代法）定义
链上赋能：智能合约重塑供应链管理 Echo_Wish 前沿技术人工智能智能合约 linux 运维
链上赋能：智能合约重塑供应链管理供应链是现代经济活动的核心，而复杂的供应链环节常常面临诸多挑战：数据孤岛、信息不透明、操作低效甚至信任危机。这些问题不仅增加了运营成本，还导致资源浪费。随着区块链技术的兴起，供应链管理迎来了新的解决方案，其中智能合约（SmartContract）作为区块链的重要组成部分，正在颠覆传统的供应链管理模式。在本文中，我将结合Python开发与智能合约，探讨智能合约在供应链
量子计算+AI：未来AI Agent的计算范式 AI天才研究院计算 ChatGPT DeepSeek RL 强化学习 agent agi 推理模型智能驾驶
量子计算+AI：未来AIAgent的计算范式关键词：量子计算，人工智能，AIAgent，量子算法，量子机器学习，量子优化，量子数据处理摘要：量子计算和人工智能（AI）的结合正在改变AIAgent的计算范式。通过量子计算的超强算力和独特性质，AIAgent在数据处理、算法优化和决策能力方面展现出巨大潜力。本文将详细探讨量子计算与AI结合的核心概念、算法原理、系统架构，并通过实际案例展示量子AIAge
AI人工智能深度学习算法：在量子计算中的应用 AI天才研究院 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着科技的不断发展，人工智能和量子计算成为了当今世界的热门话题。人工智能的深度学习算法在处理大规模数据和复杂任务方面取得了显著的成果，而量子计算则具有强大的并行计算能力和高效的信息处理能力。将人工智能与量子计算相结合，为解决一些具有挑战性的问题提供了新的思路和方法。本文将探讨人工智能深度学习算法在量子计算中的应用，包括其背景、意义和应用场景。2.核心概念与联系在人工智能中，深度学习是一
《量子门与AI神经元：计算世界的奇妙碰撞》程序猿阿伟人工智能量子计算
在当今科技飞速发展的时代，量子计算和人工智能作为前沿领域，正不断颠覆我们对计算和智能的认知。量子门操作和AI中的神经元计算过程，分别作为这两大领域的核心机制，看似处于不同维度，却有着千丝万缕的联系，它们之间的区别与关联，犹如一把钥匙，为我们打开了通往更高级计算与智能世界的大门。量子门操作是量子计算的基础，它利用量子力学的奇妙特性，如叠加和纠缠，对量子比特进行操控。量子比特，作为量子信息的基本单元，
批量将将xlsx转为csv，将csv转为csv utf-8 Znnjcidmslz 数据 python pandas
csv转换为csvutf-8将csv格式文件批量转换为csvutf-8格式文件，以下为使用Python处理的代码：importosimportpandasaspd#存有文件的路径current_path=os.getcwd()#current_path=os.path.dirname('G:/weather_output2')#转换之后存放的路径为“UTF8”，会检查当前路径是否有，没有就创建ut
1.4使用pandas读取和写入Excel文件的基本操作林伽一 python处理excel pandas excel python
读取和写入Excel文件是使用Python处理Excel的基本操作。在Python中，可以使用不同的库来实现这些操作，例如pandas、openpyxl等。以下是读取和写入Excel文件的基本操作示例：读取Excel文件使用pandas库读取Excel文件非常方便。下面的示例演示了如何使用pandas读取Excel文件：importpandasaspd#读取Excel文件df=pd.read_ex
Python与C ++开发匿名捐赠1对1管理APP Geeker-2025 python c++
开发一款用于**匿名捐赠1对1管理**的App，结合Python和C++的优势，可以实现高效的后端数据处理、实时的捐赠监控以及用户友好的前端界面。以下是一个详细的开发方案，涵盖技术选型、功能模块、开发步骤等内容。##技术选型###后端（Python）-**编程语言**：Python-**Web框架**：Django或Flask-**数据库**：PostgreSQL或MySQL-**实时通信**：W
自建智能算力中心 vs 第三方算力租赁：AI企业的算力博弈与最优解
人工智能的爆发式增长正在重塑全球产业格局。从ChatGPT到DeepSeek，从自动驾驶到智能医疗，AI模型的训练和推理需求呈现指数级增长。在这场技术革命中，算力已成为企业竞争的“命脉”。然而，面对动辄数亿元的硬件投入和复杂的运维挑战，AI企业正面临一个关键抉择：自建智能算力中心，还是选择第三方算力租赁？本文将从成本、效率、风险及适用场景等维度展开深度分析，为企业提供决策参考。一、成本对比：重资产
python颜色参数_python matplotlib:plt.scatter() 大小和颜色参数详解 weixin_39926311 python颜色参数
语法plt.scatter(x,y,s=20,c='b')大小s默认为20，s=0时点不显示；颜色c默认为蓝色。为每一个点指定大小和颜色有时我们需要为每一个点指定大小和方向，以区分不同的点。这时，可以向s和c传入列表。如：importmatplotlib.pyplotaspltimportnumpyasnpx=list(range(1,7))plt.scatter(x,x,s=10*np.arra
Python中scatter()函数--转载 1361976860 python
原博地址：http://blog.csdn.net/anneqiqi/article/details/64125186最近开始学习Python编程，遇到scatter函数，感觉里面的参数不知道什么意思于是查资料,最后总结如下：1、scatter函数原型2、其中散点的形状参数marker如下：3、其中颜色参数c如下:4、基本的使用方法如下：[python]viewplaincopy#导入必要的模块i
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS