镰刀韭菜

【可解释性机器学习】可解释机器学习简介与特征选择方法

特征选择：Feature Importance、Permutation Importance、SHAP

1. Introduction
- 什么是可解释机器学习（Explainable ML）？
- 为什么需要Explainable ML?
- 直接使用一些可以interpretable的模型不好吗？
2. Local Explanation
- 方法案例1：基于滑动窗口
- 方法案例2：基于梯度
3. Global Explanation
- 方法案例1：Activation Maximization
- 方法案例2：利用Generator
4. 用另一个explainable的模型来explanation
- 方法案例1：Local Interpretable Model agnostic-Explanation (LIME)
- 方法案例2：决策树正则化
5. 建模之后的可解释性方法
- Feature Importance
- Permutation Importance
- SHAP(SHapley Additive exPlanation)
参考资料

1. Introduction

什么是可解释机器学习（Explainable ML）？

Explainable ML要求模型不但要给出结果，还要对结果背后的原因做出解释。这种解释可以分为Local Explanation、Global Explanation、用另一种Explainable的模型来Explanation等方法。

Local Explanation: 为什么觉得这个图片是一只猫？（单一解释某个输入）需要对输入图像进行分析，以了解模型是根据对输入图像的哪个部分判断它是一只猫？输入图像的哪些区域改变会对判断结果产生较大的影响？（解释整个模型）
Global Explanation：你觉得一只猫应该看起来是什么样子？需要对模型进行反推，来解释学到的知识，比如模型通过生成算法输出一只猫应该具有的样子。
用另一种Explainable的模型来explanation：复杂的AI模型，如神经网络，表征能力强，但其是一个black box，难以解释；而简单的线性模型是white box，表征能力强，但易解释。因此这种方法的思想就是利用线性模型来逼近AI模型的局部进行解释。

为什么需要Explainable ML?

比如利用ML模型帮助筛选简历、判断犯人能否获得假释、是否要给某人提供贷款…，在很多领域中，不能直接草率的利用ML模型给出的结果，还需要了解它是出于什么样的动机预测出这样的结果。如果能做到这点，我们才能更信任我们的模型，甚至可以针对同一件事对不同领域的人做出personalized的解释。

直接使用一些可以interpretable的模型不好吗？

一些可以被很好解释的模型，如线性模型，决策树等，对于很复杂的任务可能表现并不好；
利用一些集成学习的方法，如XGBoost等，可以提升模型的能力，但是又让这些原本很好解释的模型不那么好解释了；
神经网络具有更为强大的表现能力，所以我们重点就过渡到如何让神经网络变得可解释。

2. Local Explanation

思想： $\rightarrow components \{x_1, x_2,...,x_n\}$
将模型输入的object拆分为components，去除或者调整某个component的值，如果这个component的改变能导致模型发生很大的决策改变，这个component就是重要的。

方法案例1：基于滑动窗口

参考论文：

Zeiler, M.D., Fergus, R. (2014). Visualizing and Understanding Convolutional Networks. In: Fleet, D., Pajdla, T., Schiele, B., Tuytelaars, T. (eds) Computer Vision – ECCV 2014. ECCV 2014. Lecture Notes in Computer Science, vol 8689. Springer, Cham. https://doi.org/10.1007/978-3-319-10590-1_53

思想：在输入图像上滑动一个灰色方块进行局部区域的遮挡，观察哪些位置被灰色方块遮挡后能导致模型错误判断。
如下图所示：红色和蓝色分别代表低错误率和高错误率，当灰色方块挡住博美犬脸部、轮胎、狗的身体时，明显可以看到模型的错误率很高，那么我们可以认为这些部分是模型进行判断时的主要依据。

那么问题来了，我们该如何选择方块的大小，以及如何选择方块的颜色？

方法案例2：基于梯度

参考论文：

Simonyan, Karen, Andrea Vedaldi and Andrew Zisserman. “Deep Inside Convolutional Networks: Visualising Image Classification Models and Saliency Maps.” CoRR abs/1312.6034 (2013): n. pag.

思路： $\{x_1, ..., x_n,...,x_N\}\rightarrow \{x_1, ...,x_n+\Delta x,...,x_N\}$ $y_k\rightarrow y_k+ \Delta y$
对每个输入像素增加一个扰动 $\Delta x$ ，对应输入类型概率 $y_k$ 会产生一个 $\Delta y$ 的改变。可以计算输入扰动 $\Delta x$ 对输出扰动 $\Delta y$ 产生的影响。
$|\frac{\Delta y}{\Delta x}|\Rightarrow |\frac{\partial y_k}{\partial x_n} |$
其实就是计算每个像素的偏导数，可以以此画一个saliency map。如下图所示，其中亮度高（白）的值代表偏导数值高的地方，亮度低(黑)的值代表偏导数值低的地方，根据saliency map来观察哪些像素值是模型觉得比较重要的部分。

那么问题来了：

该方法存在梯度饱和的情况。比如判断一张图片是不是大象，大象的鼻子长度可能是个关键因素，即如果图片中鼻子长度超过一个阈值后，就会被判为大象了，那么这时求输出对鼻子长度的偏导数，结果就很小。若用这种方法进行判断，得到的结果可能是鼻子长度对于判断图片是否为大象没有很大影响。这显然不是合理的解释。可能的解决办法参考下列论文：

Sundararajan, M., Taly, A., & Yan, Q. (2016). Gradients of Counterfactuals. ArXiv, abs/1611.02639.
Shrikumar, A., Greenside, P., & Kundaje, A. (2017). Learning Important Features Through Propagating Activation Differences. International Conference on Machine Learning.

该方法可能被恶意攻击。如下边上图所示，我们得到的saliency map能够解释模型是根据火车的部分来进行判断的，但这下图中加上某些noise之后，模型就完全注意到云彩的部分了。具体可以参考这篇论文：

Ghorbani, A., Abid, A., & Zou, J.Y. (2017). Interpretation of Neural Networks is Fragile. AAAI Conference on Artificial Intelligence.

3. Global Explanation

思想： $x*=arg max_x y_i$
就是让模型告诉我们，针对某一类别最大可能的概率值，输入应该是什么样子的。

方法案例1：Activation Maximization

思路：利用这个思想我们对于手写数字的任务，画出对于每个数字类别，模型认为最可能的输入是什么样子的。但是从下面左图可以看到，画出的理想输入图像类似于噪声。
于是，对模型增加一个约束，要求生成的图片不仅要使 $y_i$ 最大，还要像一个数字。即
$x*=arg max_x y_i + R(x)$
针对手写图像识别的任务，可以设计 $R(x)=-\sum_{i,j}|x_{ij}|$ ，得到的结果如下右图所示。

那么问题来了，这里的 $R (x)$ 针对不同的任务需要被精心设计和调参，可以参考下面论文：

Yosinski, J., Clune, J., Nguyen, A.M., Fuchs, T.J., & Lipson, H. (2015). Understanding Neural Networks Through Deep Visualization. ArXiv, abs/1506.06579.

方法案例2：利用Generator

思路如下图所示：

利用一些生成算法，如VAE、GAN等，训练好一个图像生成器。因为对于生成器来说，能够输入一个随机向量 $z$ 生成图片 $x = G (z)$ ，再利用方法1的思想，那么问题就变为： $argmax_x y_i \rightarrow z*=arg max_z y_i$
整体思想其实就是把方法1的约束 $R (x)$ 用一个生成器进行替代。至于如何调整输入，得到一个比较好的结果，可以参考下面论文：

Nguyen, A.M., Clune, J., Bengio, Y., Dosovitskiy, A., & Yosinski, J. (2016). Plug & Play Generative Networks: Conditional Iterative Generation of Images in Latent Space. 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 3510-3520.

那么问题来了，该方法需要花费大量时间训练和调试GAN模型。

4. 用另一个explainable的模型来explanation

思想如下图所示：

用一些容易解释的模型（如Linear Model, Decision Tree等）去模拟复杂的模型(如神经网络)，从而进行解释。但是简单的模型往往表征能力有限，并不足以完全模拟高度非线性的模型，只能去模拟复杂模型的局部特性。因此这种方法其实也是属于Local Explanation。

方法案例1：Local Interpretable Model agnostic-Explanation (LIME)

Ribeiro, M., Singh, S., & Guestrin, C. (2016). “Why Should I Trust You?”: Explaining the Predictions of Any Classifier. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.

思路如下图所示：

利用局部线性化的思想，以上图最简单的一维情况为例，假设要对样本 $x_0$ 进行解释，那就在它的附近采样一些样本，再用一个线性的模型去拟合这些样本在待解释模型中的输出。
那么问题是：

如何定义“附近”？——比如下图1中，“附近”的定义就比较好，下图2中“附近”的定义就太大了。

LIME应用在图像中的例子：

比如，想解释模型为什么会把这张图片判断成青蛙？
利用一些方法把对这个图像进行segmentation——也就是说不关心某个像素点的解释性，而是关心某个区域的解释性。

然后把随机丢掉一些segments的图像输入我们到待测模型，得到相应的输出结果。
得到一组输入输出后，用其训练一个线性模型——这里要注意的是：如果直接用线性模型去拟合的话，参数量会太多(可以联想下用一个全连接而不用CNN去做图像分类的例子)。因此，可以先用一些方法从图像中提取出一个低维度的向量，再输入到线性模型中。
如果我们的segmentation的数量是M，那么这个低维向量的大小就是 $x_1, ..., x_m,...,x_M$ ，其中：
$x_m=\begin{cases}0 & \text{ Segment } m \text{ is deleted } \\1 & \text{ Segment } m \text{ exists } \end{cases}$
根据线性模型的权重做出解释：
$y=w_1x_1+...+w_mx_m+...+w_Mx_M+b$
如果 $w_m\approx 0$ ，对应的segment与青蛙没有关系；
如果 $w_m >0$ , 对应的segment表明这是青蛙；
如果 $w_m <0$ ，对应的segment表明这不是青蛙。

方法案例2：决策树正则化

Wu, M., Hughes, M.C., Parbhoo, S., Zazzi, M., Roth, V., & Doshi-Velez, F. (2017). Beyond Sparsity: Tree Regularization of Deep Models for Interpretability. AAAI Conference on Artificial Intelligence.

思路：LIME的思想是利用一个linear model去解释，那么我们也可以采取non-linear、interpretable的决策树来解释。如下图所示：

先来考虑决策树，如果一个决策树很深、很复杂，它也可以拟合很复杂的关系(可以想想一下单个决策树不加任何限制也是能够过拟合的)，但是这样以来这个决策树就会变得很难解释。因此，需要限制决策树的复杂程度 $O(T_\theta)$ ，比如树的平均深度。

5. 建模之后的可解释性方法

首先，根据上文所描述的内容可知，模型通常会考虑以下问题：

哪些特征在模型看来是最重要的？
从大量的记录整体来考虑，每一个特征如何影响模型的预测？
关于某一条记录的预测，每一个特征是如何影响到最终的预测结果的？

所以，选择一个可解释的机器学习模型必须能够满足可靠性、易于调试、能够启发特征工程思路、并可以指导后续数据采集的方向，同时指导人为决策，最终建立模型和人之间的新人。
因此，这里介绍三种可解释的特征选择方法，分别是:

特征重要性，也就是模型自带的feature importance评分
Permutation Importance
SHAP

当然，还有很多其他方法，部分依赖图(PDP)和个体条件期望图(ICE)、局部可解释不可知模型（LIME）、RETAIN、逐层相关性传播（LRP）。这里主要介绍特征选择过程中的可解释方法。

Feature Importance

特征重要性的作用，顾名思义，就是快速的知道哪些因素是比较重要的，但是不能得到这个因素对模型结果的正负向影响，同时传统方法对交互效应的考量会有些欠缺。

如果想要知道哪些变量比较重要的话。可以通过模型的feature_importances_方法来获取特征重要性。例如XGBoost的feature_importances_可以通过特征的分裂次数或利用该特征分裂后的增益来衡量。

计算方法是：Mean Decrease Impurity。思想：一个特征的意义在于降低预测目标的不确定性，能够更多的降低这种不确定性的特征就更重要。即特征重要性计算依据某个特征进行决策树分裂时，分裂前后的信息增益（基尼系数）.
示例如下：使用XGBoost对iris鸢尾花数据集进行分类

Permutation Importance

容易想到，在训练模型的时候可以直接输出特征重要性，但这个特征对整体的预测效果有多大影响？可以用Permutation Importance（排列重要性）进行计算。
Permutation Importance的思想：基于“置换检验”的思想对特征重要性进行检测，一定是在model训练完成后，才可以计算的。简单来说，就是改变数据表格中某一列的数据的排列，保持其余特征不动，看其对预测精度的影响有多大。

计算步骤：
①用上全部的特征，训练一个模型；
②验证集预测得到得分（score）；
③验证集的一个特征列的值进行随机打乱，预测得到得分；
④将上述得分做差即可得到该特征列对预测的影响；
⑤依次将每一列特征按照上述方法执行，得到每一列特征对预测的影响程度。

使用ELI5库可以进行Permutation Importance的计算。ELI5是一个可以对各类机器学习模型进行可视化和调试Python库，并且针对各类模型都有统一的调用接口。ELI5中原生支持了多种机器学习框架，并且也提供了解释黑盒模型的方式。

结果分析：

靠近上方的绿色特征，表示对模型预测较为重要的特征；
为了排除随机性，每一次 shuffle 都会进行多次，然后取结果的均值和标准差；
±后面的数字表示多次随机重排之间的差异值。

可以根据自定义的阈值选择Weight较大的特征。

SHAP(SHapley Additive exPlanation)

以上都是全局可解释性方法，那局部可解释性，即单个样本来看，模型给出的预测值和某些特征可能的关系，这就可以用到SHAP。当然shap也有全局可解释性。

SHAP 属于模型事后解释的方法，它的核心思想是计算特征对模型输出的边际贡献，再从全局和局部两个层面对“黑盒模型”进行解释。SHAP构建一个加性的解释模型，所有的特征都视为“贡献者”。对于每个预测样本，模型都产生一个预测值，SHAP value就是该样本中每个特征所分配到的数值。基本思想：计算一个特征加入到模型时的边际贡献，然后考虑到该特征在所有的特征序列的情况下不同的边际贡献，取均值，即某该特征的SHAPbaseline value

SHAP(SHapley Additive exPlanation)是Python开发的一个"模型解释"包，可以解释任何机器学习模型的输出。

注意：在SHAP中进行模型解释需要先创建一个explainer。其中SHAP支持很多类型的explainer，例如deep、gradient、kernel、linear、tree、sampling等，上述代码中以tree为例，因为它支持常用的XGB、LGB、CatBoost等树集成算法。

（1）可视化一个prediction解释，如果不想用JS，则传入matplotlib=True:

shap.initjs()
shap.force_plot(explainer.expected_value[1], shap_values[1][j], df.iloc[j,:])

结果分析：
①base value：全体样本Shap平均值，模型在数据集上的输出均值0.5671；
②f(x)：当前样本的Shap输出值，模型在单个样本的输出值1.76；
③正向作用的特征：petal length (cm)取值为3.5，petal length(cm)取值为1，具有正向影响;长度表示特征影响的程度。
④反向作用的特征：sepal length (cm)取值为5，sepal width (cm) 取值为2，具有有负向影响。
⑤引起预测降低的特征值是蓝色的，最大的影响源自 sepal length (cm)=5 的时候，但 petal length (cm)= 3.5 的值则对提高预测的值具有比较有意义的影响；所有特征共同作用下预测结果为1.76，计算公式为： $0.5670767 + 3.51.423280 + 0.790364 - 50.906990 - 2.0 * 0.116189$ 。

（2）可视化全局解释，即多个预测的解释：

shap.initjs()
shap.force_plot(explainer.expected_value[1], shap_values[1], df) #鼠标可以放图上面显示具体数值

解释Output value（单个样本）和Base value（全体样本Shap平均值)的差异，以及差异是由哪些特征造成的。红色是起正向作用的特征，蓝色是起负向作用的特征。

（3）为每个样本绘制其每个特征的SHAP值。这可以更好地理解整体模式，并允许发现预测异常值。下图中描述的就是整体特征重要性。

下图描述shap_values取值为1的情况，每一行代表一个特征，横坐标为SHAP值，一个点代表一个样本，颜色表示特征值（红色为高，蓝色为低）。

每个点是一个样本（人），图片中包含所有样本
X轴：样本按Shap值排序
Y轴：特征按Shap值排序
颜色：特征的数值越大，越红

(4)排除所有特征的影响，描述age和capital_gain的关系

至于后续更详细的用法，请详见接下来的博客！

参考资料

[1] 可解释机器学习(Explainable ML)总结
[2] Visualizing and Understanding Convolutional Networks
[3] Deep Inside Convolutional Networks: Visualising Image Classification Models and Saliency Maps
[4] 可解释性机器学习_Feature Importance、Permutation Importance、SHAP

【V5.0 - 视觉篇】AI的“火眼金睛”：用OpenCV量化“第一眼缘”，并用SHAP验证它的“审美” 爱分享的飘哥 AI 人工智能 opencv 计算机视觉
系列回顾：在上一篇《给AI装上“写轮眼”：用SHAP看穿模型决策的每一个细节》中，我们成功地为AI装上了“透视眼镜”，看穿了它基于数字决策的内心世界。但一个巨大的问题暴露了：它的世界里，还只有数字。它能理解“时长60秒”，却无法感受画面的震撼。它是一个强大的“盲人数学家”。计算机视觉我们没有必要为每个视频进行切帧，可以针对开头的视频或者中间关键点视频进行切帧，让计算机识别。承上启下：“现在，我们来
文本lint工具：textlint全面指南包椒浩Leith
文本lint工具：textlint全面指南textlintThepluggablenaturallanguagelinterfortextandmarkdown.项目地址:https://gitcode.com/gh_mirrors/te/textlint项目介绍textlint是一款可插拔的文本和Markdown语法检查工具，专为JavaScript编写，旨在解决自然语言文本校对的难题。与专注于
基于SpringBoot的餐厅点餐系统的设计与实现毕设小助手 spring boot 后端 java
收藏关注不迷路//项目拿到就可以直接使用，但是用于作业或者毕设需要自己懂代码之后进行自行修改//支持毕设定制//远程支持//可联系博主----------同类型文章可以联系博主----------争取每天三篇，有需要的用户可以关注查看哦~今日第三篇-发布的文章皆有源码，私信联系可获取源码~本项目设计与实施了一个基于SpringBoot的餐厅点餐系统，探讨了该系统在提高点餐效率、优化订单管理和提升顾
python多线程高级锁知识：Semaphore信号量、Barrier栅栏在线程中的使用、高级event事件网小鱼的学习笔记 Python python 开发语言
Semaphore信号量Semaphore信号量可以翻译为信号量，这个信号量代表了最多允许线程访问的数量，可以使用Semaphore(n)设定，n是信号数量，这是一个更高级的锁机制，Semaphore管理一个计数器，每次使用acquire计数器将会减一，表示可以允许线程访问的数量少了一个，使用release计数器加1，表示可允许线程访问的数量多了一个，只有占用信号量的线程数量超过信号量时候才会阻塞
产品背景知识——Region和Zone 爱吃芝麻汤圆 #产品背景知识分布式
产品背景知识——Region和Zone一、基本定义1.Region（区域）含义：通常指较大范围的地理区域，可包含多个物理位置或数据中心。例子：在云计算中，如AWS的“亚太地区（东京）”“北美地区（弗吉尼亚）”就是不同的region，每个region是一个独立的地理区域，包含多个可用区（zone）。地图服务中，“华东地区”“欧洲地区”也属于region范畴。2.Zone（可用区/区域）含义：范围小于
pyhton气象探空图绘制
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、探空图绘制总结前言提示：这里可以添加本文要记录的大概内容：探空图是通过探空仪器测得的实时数据绘制而成的。探空仪器通常搭载在探空气球上，随着气球升空，仪器会测定不同高度和经纬度的温度、气压、空气湿度等数据，并通过无线电信号将这些数据发送回地面。地面接收系统接收到这些数据后，进行处理和分析，最终绘制成探空图‌。提示：以下是
java运行python脚本同时实现传参响应接收小天丶1 java python java 开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、java部分示例二、python代码示例前言提示：这里可以添加本文要记录的大概内容：主要帮助从事java开发却涉及一些计算操作的时候发现没有python库更高效的解决方式提示：以下是本篇文章正文内容，下面案例可供参考一、java部分示例//调用Python脚本//pythonl路径pythonl路径Stringpyth
【MongoDB】基础知识全面解析：从入门到核心概念韩悸桉数据库 mongodb 数据库
一、MongoDB是什么？MongoDB是一种开源文档型NoSQL数据库，以灵活的JSON格式（BSON）存储数据，无需固定表结构，适合处理半结构化和非结构化数据。与传统关系型数据库（如MySQL）相比，它具有以下特点：灵活的数据模型：文档结构可动态调整，适应业务需求变化。水平扩展性：支持分片集群，轻松应对海量数据存储。高性能读写：通过索引优化和内存缓存提升查询效率。二、核心概念与术语对比Mong
AppML 案例简介沐知全栈开发开发语言
AppML案例简介引言AppML，全称为“应用程序机器学习”，是一种将机器学习技术与移动应用开发相结合的技术框架。它旨在简化移动应用的机器学习功能集成，使得开发者无需深入了解复杂的机器学习算法，即可将强大的AI功能引入他们的应用中。本文将简要介绍AppML的一些成功案例，展示其在不同领域的应用和价值。AppML案例一：健康监测应用案例概述：一款名为“HealthMate”的健康监测应用利用AppM
Android Jetpack架构组件(四)之LiveData xiangzhihong8 深入Android应用开发
一、LiveData简介LiveData是Jetpack架构组件Lifecycle库的一部分，是一个可感知生命周期的可观察容器类(Observable)。与常规的可观察类不同，LiveData具有生命周期感知能力，这意味着它具有感知应用组件（如Activity、Fragment或Service）的生命周期的能力，并且LiveData仅更新处于活跃生命周期状态的应用组件观察者。因此，LiveData
关于java通过背景图生成图片 a未来永远是个未知数 #java的图片处理 java java intellij-idea maven spring boot 图像处理
目录对接部分（碎碎念，可跳过）引入本地jar包文件路径错误尝试解决方案开发部分获取字体的方法关于二维码的生成关于在背景图上添加内容关于在背景图上写字关于在背景图上叠加图片关于保存图片第一次尝试第二次尝试第三次尝试最终方案关于文件读取为MultipartFile类型关于BufferedImage转MultipartFile最近用到了需要生成图片的开发，作为一个没有接触过这个的后端，实在头秃，记录一下
UE5 - 制作《塞尔达传说》中林克的技能 - 18 - 磁力抓取器月忆铭 UE5 -塞尔达中的技能制作 ue5 游戏程序
让我们继续《塞尔达传说》中林克技能的制作！！！UE版本：5.6.0VS版本：2022本章节的核心目标：磁力抓取器先让我们看一下完成后的效果：18_磁力抓取器大纲如下：引言功能架构与核心逻辑物理材质与场景配置代码实现：从识别到操控操作说明1.引言在《塞尔达传说》中，林克的磁力抓取器（magnesis）是极具特色的交互技能，可识别并操控金属物体。本文基于UE5，从代码实现角度，详细拆解磁力抓取器核
【Java】已解决java.sql.SQLRecoverableException异常屿小夏 java 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
深度学习流体力学【干货】人工智能交叉前沿技术，人工智能深度学习 python 机器学习
深度学习作为一种新兴的机器学习技术，为流体科学的研究提供了新的思路和方法。通过对大量数据的学习和分析，深度学习模型可以自动提取特征和模式，为流体科学中的复杂问题提供解决方案。然而，深度学习在流体科学中的应用还面临一些挑战，需要进一步研究和探索。未来，深度学习与传统流体力学方法的结合将成为流体科学研究的重要方向，多模态数据的融合、模型的可解释性、实时预测和控制等将是深度学习在流体科学中发展的重点。相
【Linux】写时拷贝——干货解析代码程序猿RIP Linux linux 运维服务器
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录一、写时拷贝核心概念1.什么是写时拷贝？2.COW解决的问题二、写时拷贝工作原理1.内存管理基础结构2.COW工作流程3.页表状态变化图示初始状态（共享只读）子进程写入后（写时拷贝）三、写时拷贝的优势分析1.性能优势对比2.实际性能数据3.资源利用率提升四、内核实现深度解析1.COW核心代码逻辑2.关键数据结构五、应用场景与最
【Linux】环境变量——干货讲解代码程序猿RIP Linux linux
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录一、环境变量核心概念1.什么是环境变量？2.环境变量的存储结构3.常见环境变量及作用二、环境变量管理命令1.查看环境变量2.设置环境变量3.删除环境变量4.变量操作技巧三、环境变量在编程中的应用1.C语言获取环境变量的三种方式方法1：main函数参数方法2：extern声明environ方法3：getenv获取特定变量2.环境
使用GPU进行机器学习训练时，如果GPU-Util计算核心满载工作但是显存占用较少，应该如何优化？十子木机器学习深度学习人工智能
是否需要优化？如果任务运行正常：无需干预（GPU设计本就是优先榨干计算性能）。如果出现卡顿或效率低下：增大batch_size：提升显存占用，减少数据搬运次数（但需避免OOM）。启用混合精度：torch.cuda.amp可减少显存占用并加速计算。检查CPU到GPU的数据流：避免频繁的小数据拷贝（如DataLoader的num_workers设置）。
机器学习中为什么要用混合精度训练十子木机器学习机器学习人工智能
目录FP16与显存占用关系机器学习中一般使用混合精度训练：FP16计算+FP32存储关键变量。FP16与显存占用关系显存（VideoRAM，简称VRAM）是显卡（GPU）专用的内存。FP32（单精度浮点）：传统深度学习默认使用32位浮点数每个参数占用`4字节`例如：1亿参数的模型→约400MB显存FP16（半精度浮点）：每个参数占用`2字节`（直接减半）相同模型→约200MB显存双精度浮点（FP6
基于HTML的悬窗可拖动记事本孤水寒月 html css 前端
基于HTML的悬窗可拖动记事本这款记事本全部使用HTML+CSS+JS实现，可以在浏览器中实现悬浮可拖动的记事本，所有内容存储在浏览器中，清除缓存后将会丢失记事本内容效果展示实现代码Note+×保存删除//拖动逻辑constdraggableWindow=document.getElementById('draggableWindowNote');constdragHeader=doc
D-FINE使用pth权重批量推理可视化图片悠悠海风代码调试深度学习人工智能 python 目标检测计算机视觉
关于D-FINE相关的内容可参考下面这篇博客：论文解读：ICLR2025|D-FINE_d-fine:redefineregressiontaskindetrsasfine--CSDN博客文章浏览阅读949次，点赞18次，收藏28次。D-FINE是一款功能强大的实时物体检测器，它将DETRs中的边界框回归任务重新定义为细粒度分布细化（FDR），并引入了全局最优定位自蒸馏（GO-LSD），在不引入额
入门pytorch-联邦学习四代机您发多少 pytorch 人工智能 python
本文联邦学习的代码引用于https://github.com/shaoxiongji/federated-learning本篇文章相当于带大家读一遍联邦学习的代码，同时加深了大家对联邦学习和Pytorch框架的理解。这里想简单介绍一下联邦学习。联邦学习说白了，就是假如有NNN个数据拥有者F1,...,FN{F_1,...,F_N}F1,...,FN，他们希望使用这些数据来训练机器学习模型，但是又各
数据结构day6——内核链表 LZA185 数据结构数据结构链表
在Linux内核开发中，链表是最基础且重要的数据结构之一。与普通链表不同，Linux内核采用了一种非常巧妙的"通用链表"设计，它不直接包含数据，而是将数据结构嵌入其中，从而实现了一种高度灵活、可复用的链表机制。本文将深入解析Linux内核链表的设计思想、实现原理及应用场景。一、传统链表的局限性传统链表的实现方式通常是将数据直接包含在节点结构中：//传统链表节点结构typedefstructStud
Apache Seata ＜ 2.3.0 raft反序列化漏洞墨菲安全 Apache Seata 反序列化漏洞 CVE-2025-32897
【高危】ApacheSeata<2.3.0raft反序列化漏洞漏洞描述ApacheSeata(incubating)是一款开源的分布式事务解决方案，用于在微服务架构下提供高性能和简单易用的分布式事务服务。受影响版本中，SeataServer的Raft模块的CustomDeserializer直接通过Class.forName()加载用户可控的类名，未做安全校验，攻击者可借此利用服务端已有的恶意链实
数据结构day7——文件IO LZA185 数据结构数据结构
一、标准IO的起源与概念标准IO（StandardInput/Output）是由DennisRitchie在1975年设计的一套IO库，后来成为C语言的标准组成部分，并被ANSIC所采纳。它是对底层文件IO的封装，提供了更便捷、可移植的文件操作接口。核心特点：设备抽象：将输入输出设备抽象为文件操作标准输入设备：默认是键盘（/dev/input）标准输出设备：默认是显示器跨平台性：任何支持标准C的系
设计模式之上下文对象设计模式 Code Monkey’s Lab 设计模式设计模式
目录一、模式介绍二、架构设计三、Demo示例四、总结一、模式介绍上下文对象（ContextObject）模式最早由《CoreJ2EEPatterns》第二版提出，其核心目标是在多层或多组件间共享与当前作用域（如一次请求、一次会话、一次业务流程）相关的所有状态和服务，消除各组件对底层环境细节（如协议、线程、本地存储等）的直接依赖，从而提高系统的可复用性、可维护性和可测试性。ContextObject
python内置函数——enumerate() Believer_abby python内置函数 python
说明：emumerate()函数用于将一个可遍历的序列（如列表，元组或字符串）组合为一个索引序列，同时列出数据和数据下标，一般用在for循环中。语法：enumerate(sequence,[start=0])参数：sequence：表示一个序列、迭代器或其他支持迭代的对象；start：下标起始位置，默认为0。使用：seasons=['spring','summer','fall','winter'
SoK: A Critical Evaluation of Efficient Website Fingerprinting Defenses
2023攻击和防御模型防御评估准确度、精确度和召回率：使用准确率来评估攻击模型在多类别封闭世界设置中的性能，但在二进制开放世界设置中使用精确率和召回率防御策略：（1）增加虚拟流量、（2）增加流量延迟、（3）将流量从一个流移到另一个流固定速率发送流量F，随机抽样以添加填充R，修改流量以产生与目标流量样本或模式的碰撞C，将流量分成多个流S，使用对抗性扰动来欺骗机器学习模型AF：（1）（2）BuFLO,
电子词典开源项目源代码完全解析
本文还有配套的精品资源，点击获取简介：电子词典作为数字化学习工具，已由传统硬件发展为可定制的开源软件应用。本源代码提供深入理解其工作机制的机会，包括用户界面设计、词典数据库、查询引擎、翻译算法等。源代码通常由主流编程语言编写，涉及到数据结构与算法、UI设计、数据库管理、自然语言处理、本地化与多语言支持、版本控制、软件工程、API接口以及开源社区的协作和交流。1.电子词典工作原理和定制功能电子词典工
Python中filter()函数详解有奇妙能力吗 Python 知识分享 python 开发语言
什么是filter()？filter()是Python内置的一个函数，它的作用是：从一个可迭代对象（如列表、元组等）中筛选出符合条件的元素，生成一个新的迭代器。你可以把它理解成一个“过滤器”：你给它一堆数据和一个筛选条件，它会帮你把符合这个条件的数据挑出来。基本语法filter(函数,可迭代对象)第一个参数是一个函数，它用来判断每个元素是否符合条件。第二个参数是一个可迭代对象，比如列表、元组、字符
SmartDV推出先进的H.264和H.265视频编码器和解码器IP 电子科技圈 h.264 h.265 音视频
向全球市场提供灵活、高度可配置、可定制的半导体设计知识产权（IP）和验证IP（VIP）的开发商SmartDV™Technologies近日宣布：公司现已提供即刻可用的H.264和H.265视频编码器和解码器IP解决方案。针对每一种技术，SmartDV都提供了所有三种配置的IP产品，包括H.264的基本配置（Baseline）、主流配置（Main）和高性能配置（High）版本，以及H.265的主流（
关于旗正规则引擎规则中的上传和下载问题何必如此文件下载压缩 jsp 文件上传
文件的上传下载都是数据流的输入输出，大致流程都是一样的。一、文件打包下载 1.文件写入压缩包 string mainPath="D:\upload\"; 下载路径 string tmpfileName=jar.zip; &n
【Spark九十九】Spark Streaming的batch interval时间内的数据流转源码分析 bit1129 Stream
以如下代码为例（SocketInputDStream）： Spark Streaming从Socket读取数据的代码是在SocketReceiver的receive方法中，撇开异常情况不谈(Receiver有重连机制，restart方法，默认情况下在Receiver挂了之后，间隔两秒钟重新建立Socket连接)，读取到的数据通过调用store(textRead)方法进行存储。数据
spark master web ui 端口8080被占用解决方法 daizj 8080 端口占用 spark master web ui
spark master web ui 默认端口为8080，当系统有其它程序也在使用该接口时，启动master时也不会报错，spark自己会改用其它端口，自动端口号加1，但为了可以控制到指定的端口，我们可以自行设置，修改方法： 1、cd SPARK_HOME/sbin 2、vi start-master.sh 3、定位到下面部分
oracle_执行计划_谓词信息和数据获取周凡杨 oracle 执行计划
oracle_执行计划_谓词信息和数据获取(上) 一：简要说明在查看执行计划的信息中，经常会看到两个谓词filter和access，它们的区别是什么，理解了这两个词对我们解读Oracle的执行计划信息会有所帮助。简单说，执行计划如果显示是access，就表示这个谓词条件的值将会影响数据的访问路径（表还是索引），而filter表示谓词条件的值并不会影响数据访问路径，只起到
spring中datasource配置 g21121 dataSource
datasource配置有很多种，我介绍的一种是采用c3p0的，它的百科地址是： http://baike.baidu.com/view/920062.htm  <bean name="propertiesConfig" class="org.springframework.b
web报表工具FineReport使用中遇到的常见报错及解决办法（三）老A不折腾 finereport FAQ 报表软件
这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、repeated column width is largerthan paper width：这个看这段话应该是很好理解的。比如做的模板页面宽度只能放
mysql 用户管理墙头上一根草 linux mysql user
1.新建用户 //登录MYSQL@>mysql -u root -p@>密码//创建用户mysql> insert into mysql.user(Host,User,Password) values(‘localhost’,'jeecn’,password(‘jeecn’));//刷新系统权限表mysql>flush privileges;这样就创建了一个名为：
关于使用Spring导致c3p0数据库死锁问题 aijuans spring Spring 入门 Spring 实例 Spring3 Spring 教程
这个问题我实在是为整个 springsource 的员工蒙羞如果大家使用 spring 控制事务，使用 Open Session In View 模式， com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.
百度词库联想 annan211 百度
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>RunJS</title&g
int数据与byte之间的相互转换实现代码百合不是茶位移 int转byte byte转int 基本数据类型的实现
在BMP文件和文件压缩时需要用到的int与byte转换,现将理解的贴出来; 主要是要理解;位移等概念 http://baihe747.iteye.com/blog/2078029 int转byte; byte转int; /** * 字节转成int,int转成字节 * @author Administrator *
简单模拟实现数据库连接池 bijian1013 java thread java多线程简单模拟实现数据库连接池
简单模拟实现数据库连接池实例1： package com.bijian.thread; public class DB { //private static final int MAX_COUNT = 10; private static final DB instance = new DB(); private int count = 0; private i
一种基于Weblogic容器的鉴权设计 bijian1013 java weblogic
服务器对请求的鉴权可以在请求头中加Authorization之类的key，将用户名、密码保存到此key对应的value中，当然对于用户名、密码这种高机密的信息，应该对其进行加砂加密等，最简单的方法如下： String vuser_id = "weblogic"; String vuse
【RPC框架Hessian二】Hessian 对象序列化和反序列化 bit1129 hessian
任何一个对象从一个JVM传输到另一个JVM，都要经过序列化为二进制数据(或者字符串等其他格式，比如JSON)，然后在反序列化为Java对象，这最后都是通过二进制的数据在不同的JVM之间传输(一般是通过Socket和二进制的数据传输)，本文定义一个比较符合工作中。 1. 定义三个POJO Person类 package com.tom.hes
【Hadoop十四】Hadoop提供的脚本的功能 bit1129 hadoop
1. hadoop-daemon.sh 1.1 启动HDFS ./hadoop-daemon.sh start namenode ./hadoop-daemon.sh start datanode 通过这种逐步启动的方式，比start-all.sh方式少了一个SecondaryNameNode进程，这不影响Hadoop的使用，其实在 Hadoop2.0中，SecondaryNa
中国互联网走在“灰度”上 ronin47 管理灰度
中国互联网走在“灰度”上（转）文/孕峰第一次听说灰度这个词，是任正非说新型管理者所需要的素质。第二次听说是来自马化腾。似乎其他人包括马云也用不同的语言说过类似的意思。灰度这个词所包含的意义和视野是广远的。要理解这个词，可能同样要用“灰度”的心态。灰度的反面，是规规矩矩，清清楚楚，泾渭分明，严谨条理，是决不妥协，不转弯，认死理。黑白分明不是灰度，像彩虹那样
java-51-输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。 bylijinnan java
public class PrintMatrixClockwisely { /** * Q51.输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。例如：如果输入如下矩阵： 1 2 3 4 5 6 7 8 9
mongoDB 用户管理开窍的石头 mongoDB用户管理
1:添加用户第一次设置用户需要进入admin数据库下设置超级用户（use admin） db.addUsr({user:'useName',pwd:'111111',roles:[readWrite,dbAdmin]}); 第一个参数用户的名字第二个参数
[游戏与生活]玩暗黑破坏神3的一些问题 comsci 生活
暗黑破坏神3是有史以来最让人激动的游戏。。。。但是有几个问题需要我们注意玩这个游戏的时间，每天不要超过一个小时，且每次玩游戏最好在白天结束游戏之后，最好在太阳下面来晒一下身上的暗黑气息，让自己恢复人的生气 &nb
java 二维数组如何存入数据库 cuiyadll java
using System; using System.Linq; using System.Text; using System.Windows.Forms; using System.Xml; using System.Xml.Serialization; using System.IO; namespace WindowsFormsApplication1 {
本地事务和全局事务Local Transaction and Global Transaction(JTA) darrenzhu java spring local global transaction
Configuring Spring and JTA without full Java EE http://spring.io/blog/2011/08/15/configuring-spring-and-jta-without-full-java-ee/ Spring doc -Transaction Management http://docs.spring.io/spri
Linux命令之alias - 设置命令的别名，让 Linux 命令更简练 dcj3sjt126com linux alias
用途说明设置命令的别名。在linux系统中如果命令太长又不符合用户的习惯，那么我们可以为它指定一个别名。虽然可以为命令建立“链接”解决长文件名的问题，但对于带命令行参数的命令，链接就无能为力了。而指定别名则可以解决此类所有问题【1】。常用别名来简化ssh登录【见示例三】，使长命令变短，使常用的长命令行变短，强制执行命令时询问等。常用参数格式：alias 格式：ali
yii2 restful web服务[格式响应] dcj3sjt126com PHP yii2
响应格式当处理一个 RESTful API 请求时，一个应用程序通常需要如下步骤来处理响应格式：确定可能影响响应格式的各种因素，例如媒介类型，语言，版本，等等。这个过程也被称为 content negotiation。资源对象转换为数组，如在 Resources 部分中所描述的。通过 [[yii\rest\Serializer]]
MongoDB索引调优（2）——[十] eksliang mongodb MongoDB索引优化
转载请出自出处：http://eksliang.iteye.com/blog/2178555 一、概述上一篇文档中也说明了，MongoDB的索引几乎与关系型数据库的索引一模一样，优化关系型数据库的技巧通用适合MongoDB，所有这里只讲MongoDB需要注意的地方二、索引内嵌文档可以在嵌套文档的键上建立索引，方式与正常
当滑动到顶部和底部时，实现Item的分离效果的ListView gundumw100 android
拉动ListView，Item之间的间距会变大，释放后恢复原样； package cn.tangdada.tangbang.widget; import android.annotation.TargetApi; import android.content.Context; import android.content.res.TypedArray; import andr
程序员用HTML5制作的爱心树表白动画 ini JavaScript jquery Web html5 css
体验效果：http://keleyi.com/keleyi/phtml/html5/31.htmHTML代码如下： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"><head><meta charset="UTF-8" > <ti
预装windows 8 系统GPT模式的ThinkPad T440改装64位 windows 7旗舰版 kakajw ThinkPad 预装改装 windows 7 windows 8
该教程具有普遍参考性，特别适用于联想的机器，其他品牌机器的处理过程也大同小异。该教程是个人多次尝试和总结的结果，实用性强，推荐给需要的人！缘由小弟最近入手笔记本ThinkPad T440，但是特别不能习惯笔记本出厂预装的Windows 8系统，而且厂商自作聪明地预装了一堆没用的应用软件，消耗不少的系统资源（本本的内存为4G，系统启动完成时，物理内存占用比
Nginx学习笔记 mcj8089 nginx
一、安装nginx 1、在nginx官方网站下载一个包，下载地址是： http://nginx.org/download/nginx-1.4.2.tar.gz 2、WinSCP(ftp上传工
mongodb 聚合查询每天论坛链接点击次数 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 18 */ { "_id" : ObjectId("5596414cbe4d73a327e50274"), "msgType" : "text", "sendTime" : ISODate("2015-07-03T08:01:16.000Z"
java术语（PO/POJO/VO/BO/DAO/DTO） Luob. DAO POJO DTO po VO BO
PO(persistant object) 持久对象在o/r 映射的时候出现的概念,如果没有o/r映射,就没有这个概念存在了.通常对应数据模型(数据库),本身还有部分业务逻辑的处理.可以看成是与数据库中的表相映射的java对象.最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合.PO中应该不包含任何对数据库的操作. VO(value object) 值对象通
算法复杂度 Wuaner Algorithm
Time Complexity & Big-O： http://stackoverflow.com/questions/487258/plain-english-explanation-of-big-o http://bigocheatsheet.com/ http://www.sitepoint.com/time-complexity-algorithms/