秃顶的码农

联邦学习-安全树模型SecureBoost之Decision Tree

联邦学习-安全树模型 SecureBoost之Desicion Tree

文章目录

联邦学习-安全树模型 SecureBoost之Desicion Tree
1 联邦学习背景
2 Decision Tree
- 2.1 决策树的定义
- 2.2 决策树基础
- - 2.2.1 熵
  - 2.2.2 条件熵
  - 2.2.3 信息增益
- 2.3 剪枝策略
- 2.4 ID3算法
- - 2.4.1 ID3算法构建决策树方案
  - 2.4.2 ID3算法优缺点总结
- 2.5 C4.5算法
- - 2.5.1 C4.5算法构建决策树方案
  - 2.5.2 C4.5算法优缺点总结
- 2.6 CART算法
- - 2.6.1分类树
  - - 2.6.1.1 基尼指数
    - 2.6.1.2 分类树的生成
  - 2.6.2 回归树
3 自我介绍

1 联邦学习背景

鉴于数据隐私的重要性，国内外对于数据的保护意识逐步加强。2018年欧盟发布了《通用数据保护条例》（GDPR），我国国家互联网信息办公室起草的《数据安全管理办法(征求意见稿)》因此数据在安全合规的前提下自由流动，成了大势所趋。这些法律法规的出台，不同程度的对人工智能传统处理数据的方式提出更多的挑战。

AI高度发展的今天，多维度高质量的数据是制约其进一步发展的瓶颈。随着各个组织对于数据的重视程度的不断提升，跨组织以及组织内部不同部门之间的数据合作将变得越来越谨慎，造成了数据大量的以孤岛的形式存在

联邦学习的本质是基于数据隐私保护一种分布式机器学习技术或机器学习框架。它的目标是在保证数据隐私安全及合法合规的基础上，在模型无损的前提实现共同建模，提升AI模型的效果，进行业务的赋能。

那么既然是建模，在工业界最近若干年比较出名的大致可以分为GBDT和神经网络了，但是由于联邦学习的特性，需要对用户的特征与Label进行隐私安全保护，所以需要采用同态加密、秘钥分享、差分隐私等隐私计算手段保障安全。但是基于此带来了比较大的挑战，神经网络的复杂运算，指数、对数等会给建模提出非常大的难题，以目前的硬件与软件加密技术还是非常困难的，但是对于GBDT来说，只需要进行简单的同态运算就解决，所以本篇文章会和大家分享下联邦学习的安全树模型-Secure Boost。

BTW，目前神经网络虽然比较难做安全屏障，无法很好的做到计算性能与模型性能的Balance，但是经过笔者长期的思考，已经有了一个自己认为靠谱的方案，后续会逐步验证，如果最终验证靠谱，会和大家Share出来一起分享。

由于树模型相对来说知识较多，所以无法一步到位解决清晰SecureBoost，故本文章分成以下主题来进行，主要的脉络就是：决策树 -> 集成方法Bagging & Boosting -> GBDT -> XGBoost -> Secure Boost Tree。希望读者可以通过这一系列文章，对联邦学习的SecureBoost方法有一个整体的全方位的掌握。

其实，对于树模型系列来说，笔者以前做算法的时候，也在大量的使用，并且觉得自己是理解到位的，但是在我写联邦学习安全树模型的时候，发现很多的地方并没有理解透彻，有很多细节是没有考虑到的，写着写着就会发现自己的理论厚度不够，细节没有吃透。后来也花了大量的精力和时间去充电，这个事情也让我明白了，很多东西你看起来懂了，其实并没有懂，只有去真正的用心的去做过一遍，你才有些懂了，无论做什么事情脚踏实地才是最重要的。

2 Decision Tree

2.1 决策树的定义

什么是决策树呢？决策树是一种监督学习方法，既可以用来处理分类问题也可以处理回归问题。

以职场为例吧，目前整个公司有一个比较难的行业技术领域要破局，这个时候职场里面很多没有躺平的同事都希望自己可以能够解决这个问题，但是既然是行业技术难题，就不是所有人可以解决的。基于此首先要考虑的是这个事情，自己是否有勇气去做，然后考虑自己是否有能力去做，如果自己没有能力去做，自己是否可以和牛人一起合作去做这个事情，如果牛人自己就搞定，那就没他什么事情了。

下面笔者分别介绍下决策树相关的知识。

2.2 决策树基础

为了下面更好的描述生成决策树的相关算法，先介绍下一些基本概念。

2.2.1 熵

熵这个词在各个学科都有涉及，熵的概念是由德国物理学家克劳修斯于1865年所提出，泛指某些物质系统状态的一种量度，某些物质系统状态可能出现的程度。在信息论与概率统计中，熵（entropy）是表示随机变量不确定性的变量。假设X是个取有限个值的离散型的随机变量，其概率分布为
$P(X=x_i) = p_i, i=1,2,...,n$
那么随机变量X的熵的定义为：
$-\sum_i^np_ilogp_i$

从上的定义可知，熵越大随机变量的不确定性越强，那么从特征重要度的角度来说，该特征越不具备较强的表征分裂能力。

2.2.2 条件熵

假设随机变量（X，Y），他们的联合分布如下：
$P(X=x_i, Y=y_j)=p_{ij}, i = 1,2,...,n; \quad j=1,2,...,m$

那么，我们定义条件熵H（Y|X）表示在已知随机变量X的条件下随机变量Y的不确定性，也就说在X给定条件下Y的条件概率分布的熵对X的数学期望：
$H(Y|X)=\sum_i^np_iH(Y|X=x_i)$

2.2.3 信息增益

特征A对训练数据集D的信息增益g（D，A），那么信息增益定义为集合D的经验熵H（D）与特征A给定条件下关于D的条件熵H（D|A）之差，即
$g (D, A) = H (D) - H (D ∣ A)$

如果信息增益越大，那么就是指分完之后的信息熵越小，那也就意味着分完之后的数据趋向于稳定，而越稳定的数据，意味着我们能更好地预测数据。

设训练数据集为D，则|D|表示样本容量，即样本的个数。
$假设该批样本总共有K个分类定义为c_k,k=1,2,...,K，则|C_k|定义为属于C_k的样本个数，则\sum_{k=1}^K|C_k|=|d|，设$

$特征A有n个不同的取值，{a_1,a_2, ...,a_n}。则根据特征A的取值将D划分成n个子集D_1,D_2,...,D_n,|D_i|为D_i的样本$

$个数，\sum_{i=1}^n|D_i|= |D|。同时定义子集D_i中属于C_k的样本的集合为D_{ij}，则D_{ij} = D_i \cap C_k,$

$D_{ik}|定义为D_{ik}的样本个数。$

那么根据上述描述，特征A对数据集D的经验条件熵H（D|A）
$\sum_{i=1}^n \frac{D_i}{D}\ \sum_{k=1}^K \frac{D_{ik}}{D_i} \ \log_2{ \frac{D_{ik}}{D_i} \ }$

信息增益准则的一个问题在于它会偏爱那些具有很多取值的特征，而忽略其与分类的相关性。例如，考虑这么一个场景，假设我们在处理一个二分类的任务，且每个样本有一个唯一的ID。此时若选择这个ID作为特征进行节点分裂的时候，将会获得较大的信息增益，因为他能准确的分类所有的训练样本，但是，这样的分类结果却无法泛华，不能对位置样例进行预测。这个时候就可以采用信息增益率来解决。ID3算法采用的是信息增益，而C4.5采用的是信息增益率，后续会详细介绍。

2.3 剪枝策略

对于决策树来说，经常可以观察到这样一种现象：相对于一棵在训练集表现的不是那么好的决策树，一棵在训练集上表现的十分完成的决策树的泛化能力更差。这种现象就是“过拟合”，本质原因在于学习器在学习的过程中把训练特征中的一个非朴素特质当做了潜在的真实分布造成的。也就是说，学习器学习的太好了，把一些噪音也血流量进去。

针对决策树来说，为了防止“过拟合”造成较差的泛化能力，常用策略就是使用“剪枝”老进行去噪，进而学到更加朴素的特质，学到数据的本质。常用的剪枝方案有以下两种：

预剪枝：在树的生成阶段进行剪枝。
后剪枝：在树生成后，在检查需要去掉哪些分支。

2.4 ID3算法

ID3算法最早是由罗斯昆（J. Ross Quinlan）于1975年在悉尼大学提出的一种分类预测算法，算法的核心是“信息熵”。ID3算法通过计算每个属性的信息增益，认为信息增益高的是好属性，每次划分选取信息增益最高的属性为划分标准，重复这个过程，直至生成一个能完美分类训练样例的决策树。

决策树的技术核心在于树的节点的分裂思想，ID3算法采用在分裂节点采用信息增益准则进行特征选择，进而递归的进行整棵树的构建。ID3算法是一种贪心算法，用来构造决策树。ID3算法起源于概念学习系统（CLS），以信息熵的下降速度为选取测试属性的标准，即在每个节点选取还尚未被用来划分的具有最高信息增益的属性作为划分标准，然后继续这个过程，直到生成的决策树能完美分类训练样例。

2.4.1 ID3算法构建决策树方案

首先，从根节点开始，针对节点计算所有可能特征的信息增益。
然后，选择信息增益最大的特征作为节点的特征进行分裂。
然后，针对这个信息增益最大的特征，根据盖特征的不同取值简历子节点。
然后，在对子节点重复上面的过程。
最后，知道所有特征的信息增益均很小达到阈值或者没有特征可以选择为止。

2.4.2 ID3算法优缺点总结

模型结构：N叉树，如果特征的取值较多，计算量非常可观。
模型目标：适合处理分类问题。
特征相关：没有给出连续型特征的处理方法，适合处理离散型特征，对于缺失的特征没有需要在预处理阶段自行解决缺失值问题。
模型优化：没有模型的剪纸优化操作，容易发生过拟合。
内存消耗：随着样本的特征空间维度迅速膨胀。
计算效率：N叉树，随着样本的特征空间进行分支，计算耗时较高。

2.5 C4.5算法

C4.5算法是由Ross Quinlan开发的用于产生决策树的算法。该算法是对Ross Quinlan之前开发的ID3算法的一个扩展。C4.5算法产生的决策树可以被用作分类目的，因此该算法也可以用于统计分类。C4.5算法与ID3算法类似，如上面所说，C4.5相对于ID3算法进行了改进，在数的生成过程中使用了信息增益比进行特征的选择，其他的基本是一致的。

2.5.1 C4.5算法构建决策树方案

请参考ID3算法，有些不一样的地方是对连续特征进行离散化。

2.5.2 C4.5算法优缺点总结

模型结构：N叉树，如果特征的取值较多，计算量非常可观。
模型目标：适合处理分类问题。
特征相关：连续特征离散化（离散化的方法，针对M个特征，有M-1个特征选择，也要进行特征取值排序，每个候选的分割阈值点的值为上述排序后的属性值中两两前后连续元素的中点，相当于离散特征变多）。支持处理离散型特征，对于缺失的特征征值以一定的概率划分到不同的节点。
模型优化：悲观剪枝策略进行树的剪枝。
内存消耗：需要对特征值进行排序，内存操作，容易OOM。
计算效率：N叉树，随着样本的特征空间进行分支，并且需要多次扫描与排序，计算耗时较高。

2.6 CART算法

熟悉机器学习算法与框架的朋友，都会有这样的感受，那就是很多算法都是在寻求算法和工程的平衡，既要良好的算法效果，也有较高的计算效率，二者是缺一不可的。

CART树相对于ID3和C4.5做了一些简化处理，它使用了了二叉树而不是多叉树，进而提高生成决策树的效率，减少运算量。并且分类树通过Gini系数作为变量的不纯度量，减少大量的对数运算耗时。

2.6.1分类树

下面我来介绍下基于CART的分类树。CART作为分类树时，特征属性可以是连续类型也可以是离散类型，树的节点分裂策略基于基尼指数，接下来就先介绍下基尼指数。

2.6.1.1 基尼指数

定义：在分类问题中，假设有K个类，样本点属于第K个类的概率为pk，则概率分布的基尼指数为
$\sum_{k=1}^Kp_k(1-P_k) = 1 - \sum_{k=1}^K{p_k}^2$

对于给定的样本集合D来说，其基尼指数为：
$\sum_{k=1}^K{( \frac{|C_K|}{|D|} \ )}^2$

那么，在特征A条件下，结合D的基尼指数为，D1和D2为按照特征A的某个取值进行切分后的两个范围。
$KaTeX parse error: Undefined control sequence: \ at position 74: …|D|} Gini(D_2) \̲ ̲$

基尼指数Gini代表数据的不确定性，Gini（D，A）表示经过特征A=a分裂后集合D的不确定性，那么和信息增益不一样的是，基尼指数越小代表模型的不纯度却低，特征约好。

2.6.1.2 分类树的生成

CART分类树采用基尼指数进行二叉树的分裂，枚举所有特征的所有可能切分点进行计算，选取基尼指数最小的分裂点，降低模型的不纯度。同时对于决策树建立后做预测的方式，CART分类树采用叶子节点里概率最大的类别作为当前节点的预测类别。

2.6.2 回归树

回归树的特征基本是连续型的，利用平方误差最小化准则。

流程如下：对于任意特征A，依次计算所有可能的分裂点取值，通过该取值将样本数据划分成D1和D2两部分，通过MSE的方式计算各自的Loss并相加（回归树输出不是类别，它采用的是用最终叶子的均值或者中位数来预测输出结果。），进而选择损失最小的特征取值，然后进行节点分裂，并且重新划分各自节点的数据集，然后递归执行本过程即可。

$\min\limits_{j,s}[\min\limits_{C1}\sum_{x_i \in R_1(j,s)}(y_i - c_1)^2 + \min\limits_{C1}\sum_{x_i \in R_2(j,s)}(y_j - c_2)^2 ]$

其中，气氛便利为j，切分点为s，将数据集切分为C1和C2两部分，我们通过上述算法找到损失最小的。

CART树的优缺点

模型结构：使用二叉树的形式，提升决策树整理效率。
模型目标：支持分类树与回归树。
特征相关：采用代替测试来估计缺失值，并且特征可以在各层之间反复使用。
模型优化：使用剪枝践行优化，基于代价复杂度的方式进行剪枝。
计算代价：分类树采用Gini系数的方式减少复杂运算。

3 自我介绍

个人介绍：杜宝坤，京东联邦学习从0到1构建者，带领团队构建了京东的联邦学习解决方案，实现了电商营销领域支持超大规模的工业化联邦学习解决方案，支持超大规模样本PSI隐私对齐、安全的树模型与神经网络模型等众多模型，建模不受限，同时带领团队实现了业务侧的落地，开创了新的业务增长点，产生了显著的业务经济效益。

个人喜欢研究技术。基于从全链路思考与决策技术规划的考量，研究的领域比较多，从架构、大数据到机器学习算法与框架均有涉及。欢迎喜欢技术的同学和我交流，邮箱：[email protected]

AI人工智能领域知识图谱在深度学习中的应用拓展
AI人工智能领域知识图谱在深度学习中的应用拓展关键词：知识图谱、深度学习、神经网络、图嵌入、知识表示学习、推理机制、应用场景摘要：本文深入探讨了知识图谱与深度学习的融合应用，系统性地分析了知识图谱在深度学习中的关键技术路径和应用场景。文章首先介绍了知识图谱的基本概念和表示方法，然后详细阐述了知识图谱与深度学习结合的多种技术路线，包括图神经网络、知识嵌入和推理机制等。接着通过具体案例展示了知识图谱增
设计与实现淘客返利APP的数据安全与隐私保护：架构师的实践经验
设计与实现淘客返利APP的数据安全与隐私保护：架构师的实践经验大家好，我是阿可，微赚淘客系统及省赚客APP创始人，是个冬天不穿秋裤，天冷也要风度的程序猿！数据安全与隐私保护的重要性在淘客返利APP中，数据安全与隐私保护是至关重要的。用户数据不仅涉及个人隐私，还可能包含敏感信息，如身份证号、银行卡号等。一旦数据泄露，不仅会损害用户利益，还会对平台的声誉造成严重影响。因此，设计和实现一个安全可靠的数据
C2远控篇&Golang&Rust&冷门语言&Loader加载器&对抗优势&减少熵值特征
#C2远控-ShellCode-认知&环境1.创建工程时关闭SDL检查2.属性->C/C++->代码生成->运行库->多线程(/MT)如果是debug则设置成MTD3.属性->C/C++->代码生成->禁用安全检查GS4.关闭生成清单属性->链接器->清单文件->生成清单选择否#C2远控-ShellCode-分析&提取ShellCode的本质其实就是一段可以自主运行的代码。它没有任何文件结构，它不
鸿蒙(HarmonyOS)应用开发实战——自定义安全键盘案例 CTrup HarmonyOS 移动开发鸿蒙开发 harmonyos 安全音视频移动开发鸿蒙开发组件化
往期知识点整理鸿蒙（HarmonyOS）北向开发知识点记录~被裁员后，踏上了鸿蒙开发求职之路持续更新中……介绍金融类应用在密码输入时，一般会使用自定义安全键盘。本示例介绍如何使用TextInput组件实现自定义安全键盘场景，主要包括TextInput.customKeyboard绑定自定义键盘、自定义键盘布局和状态更新等知识点。效果图预览实现思路1.使用TextInput的customKeyboa
第二十五节：Linux 运维职业规划与学习路径指南厚衣服_3 Linux基本操作详解运维 linux 学习
第二十五节：Linux运维职业规划与学习路径指南随着云计算、容器化、自动化运维的快速发展，Linux运维工程师已经成为技术岗位中的重要角色之一。要想在运维领域长期发展，不仅要掌握扎实的基础技能，更要有清晰的职业规划和学习路径。一、Linux运维职业方向概览职业方向技术关键词基础运维工程师Linux、Shell、网络、服务部署、安全配置自动化运维/DevOpsAnsible、Docker、Jenki
EasyFeature软件特性四：星云空天大模型智绘中勘人工智能深度学习信息可视化
随着智能遥感进入新纪元，数据处理与模型效率的挑战日益成为应用落地的关键瓶颈。EasyFeature软件以星云空天大模型为核心，构建了基于人机智能提示学习的多模态系统。通过海量高质量数据预训练，集成了包括遥感场景分类、快速目标检测、地物分类、变化检测等在内的丰富模型库，提供端到端的智能解译能力。EasyFeature完全实现国产化自主可控，涵盖全栈软硬件支撑与训推一体化流程，确保高效安全。其极简安装
使用SQL-Ollama与自然语言交互SQL数据库的指南 antja_ 数据库 sql
#使用SQL-Ollama与自然语言交互SQL数据库的指南##技术背景介绍随着人工智能技术的发展，能够使用自然语言与SQL数据库交互的需求越来越大。这种技术可以帮助用户轻松访问和操作数据库，而无需深刻理解SQL语法。SQL-Ollama是一个专门设计的模板，利用Zephyr-7b模型，通过Ollama在本地运行推理，使这一过程变得简单而高效。##核心原理解析SQL-Ollama通过将自然语言转换为
八股文——JAVA基础：字符串拼接用“+” 还是 StringBuilder? Hellyc 八股文自用 java 开发语言
java中仅有两个操作符的重载就是用于字符串的拼接操作的：+与+=操作符+底层使用的是StringBuilder来进行实现的，+用于拼接的缺陷在于使用StringBuilder，本身线程不安全，其次在循环中使用+来拼接，会导致重复创建StringBuilder对象，导致空间的浪费。而在循环中使用StringBuilder就不会出现这个问题。
String字符串与StringBuffer、StringBuilder的区别以及String的不可变性是什么 Hellyc java 开发语言
String字符串是八个基本数据类型之一，其底层实现是通过字符数组来进行实现的，也就是abc的字符数组与abc的字符串是完全相等的。StringBuilder与StringBuffer都继承相同的父类AbstractStringBuilder,这两个方法都提供了一些字符串的基本操作，比如append()使两个字符串进行相加。其中String与StringBuffer是线程安全的，StringBui
什么是对称加密和非对称加密 MonkeyKing.sun 网络服务器运维
对称加密和非对称加密是现代密码学中的两大核心技术体系，它们用于保护数据的机密性、完整性和安全性，是构建区块链、电子支付、SSL、VPN、数字签名等系统的基础。一、什么是对称加密（SymmetricEncryption）？定义：加密和解密使用同一把密钥，称为“对称密钥”。工作原理：明文+密钥→加密算法→密文密文+同样密钥→解密算法→明文示例算法：算法简要说明AES（高级加密标准）最常用、快速、安全D
Python爬虫实战：研究MarkupSafe库相关技术 ylfhpy 爬虫项目实战 python 爬虫开发语言 MarkupSafe
1.引言1.1研究背景与意义随着互联网数据量的爆炸式增长，网页内容自动提取与分析技术在信息检索、舆情监控、数据挖掘等领域的需求日益凸显。网络爬虫作为获取网页内容的核心工具，能够自动化采集互联网信息。然而，直接渲染爬取的网页内容存在安全隐患，特别是跨站脚本攻击（XSS）风险。攻击者可能通过注入恶意脚本窃取用户信息或破坏网站功能。MarkupSafe作为Python的安全字符串处理库，能够有效处理不可
Python爬虫实战：研究sanitize库相关技术 ylfhpy 爬虫项目实战 python 爬虫网络开发语言安全 sanitize
1.引言1.1研究背景与意义在当今数字化时代，互联网已成为人们获取信息、交流互动的重要平台。随着Web2.0技术的发展，用户生成内容(UGC)、社交媒体嵌入、第三方插件等功能极大丰富了网页的内容和交互性，但也带来了严峻的安全挑战。根据Web应用安全联盟(WAS)的统计数据，2025年全球范围内因网页安全漏洞导致的数据泄露事件超过15万起，造成的经济损失高达250亿美元。其中，跨站脚本攻击(XSS)
python网络安全实战_基于Python网络爬虫实战 weixin_39907850 python网络安全实战
文件的操作：一般都要使用os模块和os.path模块importos.pathos.path.exists('D:\\Python\\1.txt')#判断文件是否存在abspath(path)#返回path所在的绝对路径dirname(p)#返回目录的路径exists(path)#判断文件是否存在getatime(filename)#返回文件的最后访问时间getctime(filename)#返回
零信任架构——重构企业安全边界的新范式月_o9 网络安全
零信任架构——重构企业安全边界的新范式（字数：998）传统边界的崩塌与信任危机防火墙与VPN构筑的“城堡护城河”模型在云原生与远程办公时代彻底瓦解。当数据散布于公有云、边缘设备与SaaS平台，当供应链攻击可穿透层层防护，“内部可信”的假设已成为最大安全漏洞。零信任（ZeroTrust）的核心哲学正是：永不信任，持续验证（NeverTrust,AlwaysVerify）。它并非单一技术，而是以身份为
文心大模型4.5及X1重磅上线，真实测评
2025年3月16日，人工智能领域迎来一场重要盛事——百度文心大模型4.5如期正式发布。与此同时，百度还惊喜推出了另一款全新模型——文心大模型X1。目前，文心大模型4.5和X1已在文心一言官网（https://yiyan.baidu.com/）正式上线，并免费向用户开放。其中，文心大模型4.5面向企业用户和开发者，用户可以通过登录百度智能云千帆大模型平台，轻松调用文心大模型4.5的API接口，快速
面向隐私保护的机器学习：联邦学习技术解析与应用 Blossom.118 机器学习与人工智能机器学习人工智能深度学习 tensorflow python 神经网络 cnn
在当今数字化时代，数据隐私和安全问题日益受到关注。随着《数据安全法》《个人信息保护法》等法律法规的实施，企业和机构在数据处理和分析过程中面临着越来越严格的合规要求。然而，机器学习模型的训练和优化往往需要大量的数据支持，这就产生了一个矛盾：如何在保护数据隐私的前提下，充分利用数据的价值进行机器学习模型的训练和优化？联邦学习（FederatedLearning）作为一种新兴的隐私保护技术，为解决这一问
人工智能-基础篇-10-什么是卷积神经网络CNN（网格状数据处理：输入层，卷积层，激活函数，池化层，全连接层，输出层等） weisian151 人工智能人工智能 cnn 神经网络
卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种专为处理网格状数据（如图像、视频、音频）设计的深度学习模型。它通过模拟生物视觉机制，从原始数据中自动提取多层次的特征，最终实现高效的分类、检测或生成任务。1、核心概念与原理1、生物视觉启发局部感受野：模仿人类视觉皮层神经元仅响应局部区域刺激的特性，每个神经元关注输入数据的局部区域（如图像的一小块区域）。权值共享：同一
python系列教程246——多态人工智能AI技术 python系列教程 python 开发语言
朋友们，如需转载请标明出处：https://blog.csdn.net/jiangjunshow声明：在人工智能技术教学期间，不少学生向我提一些python相关的问题，所以为了让同学们掌握更多扩展知识更好地理解AI技术，我让助理负责分享这套python系列教程，希望能帮到大家！由于这套python教程不是由我所写（有时候有空也会参与编写），所以不如我的人工智能教程风趣幽默，学起来比较枯燥；但它的知
Python 解析 AI 在能源管理与智能电网中的应用头发在线失联 python 人工智能开发语言
```htmlPython解析AI在能源管理与智能电网中的应用Python解析AI在能源管理与智能电网中的应用随着全球对可持续发展的重视和能源需求的不断增长，能源管理与智能电网技术正在成为研究和实践的重要领域。在这个背景下，人工智能（AI）作为一项前沿技术，正被广泛应用于能源管理与智能电网中，以提高效率、优化资源分配并减少环境影响。本文将探讨Python如何在这一领域中发挥作用，并解析其具体应用场
如何实现聊天模型响应流式处理 yunwu12777 langchain
在现代人工智能应用中，流式处理聊天模型的响应成为一种常见需求，特别是在需要实时输出或大规模处理时。本文将详细介绍如何在Python中实现聊天模型的同步和异步流式处理，使用langchain库中提供的ChatAnthropic模型作为示例。技术背景介绍流式处理是指从模型逐步获取输出，而不是等待整个输出完成。这对于处理长文本生成或需要动态响应的应用场景特别有用。langchain库中的聊天模型实现了R
autobank渗流分析计算教程_高土石坝坡稳定性分析 Oliverzzzhang
原标题：基于滑弧动力有限元耦合法的高土石坝坝坡稳定性分析摘要:为研究高土石坝坝坡的稳定性，以某水电站高土石坝坝坡为例，采用条分法与有限元法耦合的计算方法进行分析，选取3个典型断面，对其设计工况和校核工况下的上下游断面的安全系数进行计算。计算结果表明:(1)下游坝坡最小安全系数比上游大，设计工况安全系数比校核工况安全系数大;(2)3个断面在各工况下取得最小值的时刻近似，符合坝坡稳定的计算规律;(3)
银行家算法后会无期77 算法算法
文章目录银行家算法概述银行贷款案例A再次申请50万，能批准吗？B再次申请40万，能批准吗？或者C申请20万，能批准吗？安全序列和不安全序列多维度资源分配操作系统资源分配银行家算法总结数据结构银行家算法的步骤安全性算法步骤死锁的避免银行家算法概述银行家算法（Banker’sAlgorithm）是一个避免死锁（Deadlock）的著名算法，是由艾兹格·迪杰斯特拉在1965年为T.H.E系统设计的一种避
中华人民共和国网络安全法周周记笔记网络安全安全
链接:中华人民共和国网络安全法.pdf总则：明确立法目的是保障网络安全，维护网络空间主权和国家安全等，规定了本法适用范围，强调国家坚持网络安全与信息化发展并重的方针，确定了相关部门的网络安全监督管理职责，还对网络运营者义务、网络使用规范等作出原则性规定。网络安全支持与促进：国家建立和完善网络安全标准体系，扶持重点网络安全技术产业和项目，推进网络安全社会化服务体系建设，鼓励开发网络数据安全保护和利用
AI人工智能助力空间智能领域提升运营效率 AI智能探索者 AI Agent 智能体开发实战人工智能网络 ai
AI人工智能助力空间智能领域提升运营效率关键词：AI人工智能、空间智能领域、运营效率、智能算法、数据驱动摘要：本文聚焦于AI人工智能在空间智能领域的应用，旨在探讨其如何助力该领域提升运营效率。首先介绍了空间智能领域的背景和相关概念，阐述了AI在其中的核心作用和原理。接着详细讲解了相关核心算法，并结合数学模型进行分析。通过项目实战案例展示了AI在空间智能领域的具体应用和实现方式。同时探讨了实际应用场
人工智能的发展历程与未来展望唐骁虎 ai
人工智能的发展历程与未来展望一、人工智能的起源与早期发展1.1人工智能的定义与概念起源人工智能（AI）的定义与概念起源可追溯至20世纪中叶，当时一群具有远见的科学家和工程师开始探索机器是否能够模拟人类智能行为。1956年，在达特茅斯会议上，约翰·麦卡锡首次提出了“人工智能”这一术语，标志着该领域的正式诞生。AI的定义涉及创建能够执行需要人类智能的任务的机器，如视觉感知、语音识别、决策和语言翻译等。
DeepSeek：AI驱动的效率革命与实战案例解 weixin_45788582 人工智能 ai DeepSeek
在人工智能技术的浪潮中，DeepSeek作为一款专注实现AGI（通用人工智能）的先锋工具，正通过其强大的自然语言处理（NLP）与分布式计算能力，重新定义高效办公的边界。以下通过技术解析与实战案例，展现DeepSeek如何赋能个人与企业，开启职场效率革命。一、技术革新：DeepSeek的核心竞争力深度学习赋能DeepSeek的技术架构基于BERT、Transformer等先进深度学习模型，通过构建复
如何让人工智能使你的工作效率一日千里南风过闲庭人工智能 ai python
1.自动化重复性任务1.1识别并自动化日常任务提高工作效率的首要步骤是识别日常工作中重复性高且耗时的任务。根据麦肯锡全球研究院的报告，知识工作者大约有40%的时间花费在此类任务上。通过自动化这些任务，员工可以将更多时间投入到需要创造性思维和复杂决策的工作上。数据支持：一项针对500名知识工作者的调查显示，通过自动化日常任务，平均每天可以节省2小时的工作时间。这些任务包括数据录入、文件整理、邮件分类
AI驱动的智能电网:平衡供需提高效率 AI智能应用 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
智能电网，AI，机器学习，预测模型，优化算法，供需平衡，能源效率1.背景介绍随着全球能源需求的不断增长和可再生能源的快速发展，传统电网面临着越来越多的挑战。传统的电网结构是集中式供电，难以适应分布式能源的接入和负荷需求的波动性。智能电网应运而生，它利用先进的通信技术、传感器网络和数据分析技术，实现电网的自动化、智能化和可视化，从而提高电网的可靠性、效率和安全性。人工智能（AI）作为一种新兴技术，在
RoomGPT: 人工智能驱动的室内设计革命 m0_56734068 人工智能
RoomGPT:用AI重新定义室内设计在当今数字化时代,人工智能正在改变各个行业的面貌,室内设计领域也不例外。RoomGPT作为一款革命性的AI驱动室内设计工具,正在彻底改变人们对室内空间进行创意和改造的方式。本文将深入探讨RoomGPT的工作原理、使用方法以及它为室内设计行业带来的变革。RoomGPT简介RoomGPT是一个开源项目,由GitHub用户Nutlope开发。它允许用户上传任何房间的
多模态融合相机L3CAM moonsims 人工智能
多模态融合相机L3CAML3CAM是Beamagine公司推出的多模态传感器融合技术，结合了激光雷达（LiDAR）和可见光摄像头，旨在为自动驾驶、工业机器人和其他需要精确环境感知的应用场景提供高效、安全的解决方案。L3CAM技术参数L3CAM结合了LiDAR和可见光摄像头，使其能够提供三维空间感知及图像级别的环境识别能力激光雷达部分（LiDAR）探测范围：大约200米（具体范围根据不同环境和反射面
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(