煎饼证

【Uplift】因果推断基础篇

https://zhuanlan.zhihu.com/p/362311467

文章目录

- Uplift与因果推断
- 相关、因果、辛普森悖论
- 因果图
- - 基本结构
  - 前门、后门准则
- 基本假设
- 关键指标
- 倾向性得分、Matching等
- 增量建模面临的问题
- 符号、名词定义梳理
- 参考文献

Uplift与因果推断

因果推断(Causal Inference)研究如何更加科学识别变量间的因果关系，是Uplift Modeling的理论基础。

在通常的预测任务中，我们拟合的实际是Y与X的相关关系，X甚至可以是Y的结果，如GDP和发电量之间可能有一系列复杂的关系，但只要二者相关就可以互相预测。

在另一些场景中则有所区别，如预测任务要指导干预(Treatment)决策时，我们所能掌控的只有Treatment变量，此时我们希望知道的是执行干预与否的效果差异(通常看增量，uplift)，目的是决策是否执行或执行何种干预。如在“发券&下单”的问题中，用户的历史订单数对下单率预估有较大帮助，但对是否发券的指导意义可能会大打折扣。

本文概述与Uplift相关或有助于理解Uplift Modeling的因果推断相关的理论知识。

相关、因果、辛普森悖论

**相关和因果：**理解因果关系首先是和相关关系做区分，因果关系要求“原因”先于并导致“结果”，而相关关系对顺序不做要求。参考材料中提到了很多示例，如“溺水死亡人数与冰激凌销量正相关”，显然二者不是因果关系，而是由“气温(或季节)”联系起来的相关关系。

另一个很有名的现象是辛普森悖论(Simpson Paradox)。下面是[1]中一个例子，看“吃药”和“康复”二者的关系。如下表，从男性或女性分别看，都可以观察到吃药是有效的，但整体看会得到吃药是无效的结论。

导致该问题的原因是这里“是否康复”除了受到“吃药”的影响，也会受到“性别”的影响，此时“性别”就是一个混淆变量(Confounder)。

用一个直观的几何表示如下，“Men”整体的康复率高于“Women”，且“Women+Treat”的康复率低于“Men+No Treat”，因此当“吃药”组中“Women”比例高而“安慰剂”组中“Men”比例高时，可能出现这样的结果。

用下文提到的因果图表示为，此时单独一个Drug判断康复是不准确的

再扩展一个例子，X是运动量，Y是胆固醇量，每个实线椭圆表示一个年龄组，分组看运动有效减少了胆固醇；而从虚线的全局数据看则相反。此时“年龄”变为一个混淆变量，干扰估计结果。

因果图

因果图对于理解因果关系很有帮助，这里列举三个基本结构。同样取自[1]中的一些例子(注：极端情况相关性可能有差异)。最后简单介绍前门准则和后门准则。

基本结构

链状结构(Chain)：XY、XZ、YZ都相关；给定Y时，XZ无关。
$P (Z = z ∣ X = x, Y = c) = P (Z = z ∣ Y = c)$

叉状结构(Fork)：XY、XZ、YZ都相关，但YZ不为因果；给定X时，YZ不相关。

对撞结构(Collider)：XZ、YZ相关，XY不相关；给定Z时，XY相关

前门、后门准则

后门准则(back-door)：存在变量集合Z，①Z中节点不为X的后代；②Z阻断所有XY之间指向X的路径。此时XY的因果作用可识别
$P(y|do(X)=x)=\sum_{z}P(y|x,z)P(z)$
前门准则(front-door)：存在变量集合Z，①Z切断所有X到Y的直接路径；②X到Z无后门路径；③所有Z到Y的后门路径被X切断。此时，若P(x,z)>0，则XY的因果作用可识别
$P(y|do(X)=x)=\sum_{z}P(z|x)\sum_{x'}P(y|x',z)P(x')$
示例如下[3]

基本假设

在进行因果效应估计前，有3个常用的基本假设。

假设1：SUTVA(Stable Unit Treatment Value Assumption)，样本之间独立、每种Treatment只有单版本(一个干预手段有多种选择的算多个Treatment)

假设2：Ignorability(可忽略性假设)，给定背景变量X下，Treatment的分配W与潜在结果Y无关，即
$W\perp(Y(W=0),Y(W=1))|X$
假设3：Positivity，对每个值X，Treatment的分配概率非确定性的
$P(W=w|X=x)>0,\forall\ w\ and\ x$

关键指标

本节介绍几个因果效应估计的常用指标。当我们要评估treatment的整体效应时，通常看ATE、CATE指标；当我们要具体到个体去评估干预效应时，看ITE，Uplift Modeling通常就是建模ITE。

ATE(Average Treatment Effect,平均干预效应)，定义为treated和control的潜在结果之差的均值。注:ACE(Average Causal Effect,平均因果效应)含义类似。
$\text{ATE}=\mathbb{E}[Y(W=1)-Y(W=0)]$
CATE(Conditional Average Treatment Effect,条件平均干预效应)，定义为给定 $X = x$ 时的分组中，treated和control的潜在结果的期望之差。
$\text{CATE}=\mathbb{E}[Y(W=1)|X=x]-\mathbb{E}[Y(W=0)|X=x]$
ITE(Individual Treatment Effect,个体干预效应)，定义为独立样本的treated和control的潜在结果的差值。
$\text{ITE}_i=Y_i(W=1)-Y_i(W=0)$

倾向性得分、Matching等

Propensity score(倾向性得分)，为了消除Confounder的影响，准确估计因果效应，此时我们可以依据X做数据分层再评估ATE，但当X为连续变量时则很难分层，或分层后数据不足以估计。对该问题Rosenbaum and Rubin提出了倾向性得分的概念[3]，实际是一种降维手段，定义为：
$e (X) = P (W = 1 ∣ X)$
其中：

① $X\perp W|e(X)$ ；

②若X能够满足强可忽略性假定，且 $0 < e ( X ) < 1 0，则 W ⊥ ( Y ( 1 ) , Y ( 0 ) ) ∣ e ( X ) , 0 < e ( X ) < 1 W\perp(Y(1),Y(0))|e(X),0。$

其含义是若给定X能够满足Ignorability，则给定一个一维变量 $e (X)$ 也可以，倾向得分是最“粗糙”的变量。最后，对得到的倾向性得分可以做“分层”，评估每一层的因果效应并加权平均即可。
$\widehat{\text{ATE}}=\frac{1}{N}\sum_{i=1}^{n}[\frac{Y_iW_i}{\hat{e}(X_i)}-\frac{Y_i(1-W_i)}{1-\hat{e}(X_i)}]$

Matching，估计ATE首先碰到的问题是“counterfactual(反事实)”的问题，我们可以通过集合之间的统计差异来代替，即在理想状态时选择随机试验得到的数据直接计算；而另一个问题是“confounder bias(混淆变量偏差)”的问题，在无随机试验数据或无法进行随机试验时，可以利用Matching得到相近的样本以减少偏差问题。

Matching方法就是“采样”相似样本，利用与目标样本最相似的几个样本聚合作为该样本的“反事实”结果。具体实施中，首先选择一个距离度量方法(如欧式距离、马氏距离、倾向性得分距离)，然后采样并计算ATE。

如采用最近邻方法，在control组样本中，为每个treated样本采样一个最相似样本组成新control组，再根据上述公式计算ATE。

增量建模面临的问题

上面有提到过，因果效应估计或增量建模时，我们会遇到两个问题。

反事实(counterfactual)。实际数据中，我们只有真实发生的样本结果，而缺失了其他treatment的结果，此时我们只能通过既有数据集，通过数据集整体来估计因果效应。

混淆变量偏差(confounder bias)。实际数据大多并非来源于随机试验，此时我们需要利用倾向性得分分层、Matching等方法来减少偏差。

符号、名词定义梳理

最后摘录综述论文中的一些名词定义

1. Unit，指因果效应研究中的原子个体

2. Treatment，指施加在unit上的行为

3. Potential outcome，指对每个unit-treatment对的潜在结果

4. Observed outcome，指实际观察到的结果

5. Conterfactual outcome，指unit在施加其他(非实际)treatment时会得到的结果

6. Pre-treatment variables，指不受treatment影响的变量，也称为背景变量

7. Post-treatment variables，指受treatment影响的变量，如中间结果

8. Confounders，指同时影响treatment分配及结果的变量，如开头例子中的性别

9. Propensity score，倾向性得分，定义为给定 $X = x$ 时，treatment的概率

参考文献

[1]B站【因果推断入门】：https://www.bilibili.com/video/BV15J411L7xW

[2]Causal Inference in Statistics: A Primer :http://bayes.cs.ucla.edu/PRIMER/primer-ch1.pdf

[3]因果推断简介（丁鹏）:https://yao-lab.github.io/2009.fall.pku/lecture10_DingP_causal091101.pdf

[4]A Survey on Causal Inference：https://arxiv.org/abs/2002.02770

[5]更多参考资料：https://zhuanlan.zhihu.com/p/358582762

你可能感兴趣的:(uplift,modeling,算法,uplift,因果推断,causal,增量建模)

《九鼎风水师》第八百一十二章有事找先峰老师
尚文龙这一刻明白，如果白天的时候，江飞燕没有在自己的身边，自己根本不可能发现龙脉汇聚之地的通道。更加简单一点的来说，如果不是自己站在江飞燕旁边，自己根本察觉不到那宫殿院子的异常之处，自己根本看不到那诡异的宫服。“没有想到，自己居然是得到飞燕的福泽！”尚文龙微微笑了一下。同时也明白过来。江家为什么宁愿江家断了传承，也不愿江飞燕学习风水了。世间万物，皆有因果，总有一饮一啄。这天运之人，从这种结果来看，
2023-07-28 仁德上人
为什么不能心甘情愿地认账呢？文/仁德上人既然要认帐，心甘情愿地认帐要比被迫无奈地认账好得多。可为什么自己不能心甘情愿地认帐，而非要无奈被迫地烦恼认账呢？这其中的原因就是因为自己不明白因果的真实性，总想按照自己的意思来决定自己的思想行为，不明白有很多事情并不是按照自己的意思。每一位菩萨都能够亲自体会，很多事情的到来是违背自己的意思，无奈被迫地认账，还不如心甘情愿地认账好。因为被迫无奈地认账是痛苦烦恼
Floyd最短路算法自由的dream 算法详解算法
Floyd算法是什么？Floyd算法（弗洛伊德算法）是一种求最短路的方法，别急着叫难，实际上这一个算法非常简单，虽然它用的是DP思想。好了，现在开始介绍它的原理。Floyd的原理啊说到Floyd算法，那么得讲讲最短路，最短路，是指从一个图中一个点到别的点的最短路径，有人就会问：“哎，这个图有距离吗？”问这种问题的人就是不懂图的人，一条边的权值，就是这一条边的长度，根据出发点划分，最短路可以分成单源
人工神经网络的拓扑结构,神经网络的神经元结构快乐的小蓝猫神经网络深度学习人工智能 rnn
bp神经网络BP（BackPropagation）网络是1986年由Rumelhart和McCelland为首的科学家小组提出，是一种按误差逆传播算法训练的多层前馈网络，是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系，而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法，通过反向传播来不断调整网络的权值和阈值，使网络的误差平方和最小。BP神经
动态规划入门（LIS模板）
动态规划是一种通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法能用动态规划解决的问题，需要满足三个条件：最优子结构，无后效性和子问题重叠目录最长上升子序列（LIS）基本思路最长上升子序列贪心优化（二分优化）合唱队形参加算法竞赛！最长上升子序列（LIS）基本思路在做这种类型的题目时我们需要注意明确题目要求的状态一般来说题目问什么，我们的dp[]数组就可以用来表示什么状态之间的转移变换当下状
3.17 补题（字符串，模拟） ZZZS0516 算法 c++
目录E-书法（字符串操作，移动指针）题目描述思路分析代码实现G-女神节的魔法花园（思维）题目描述思路分析代码实现H-KNN算法(模拟，排序)题目描述思路分析代码实现E-书法（字符串操作，移动指针）链接：书法来源：2025常熟理工学院天梯选拔赛题目描述在计算机上打字就是赛博书法，键盘如同笔，输入框就像纸，在键盘上输入一个个指令，就可以在输入框中写下自己想写的文字。现在你需要体验一次计算机的生活，目前
Deepoc大模型重构核工业智能基座：混合增强架构与安全增强决策技术 Deepoch 人工智能创业创新科技自动化学习
面向复杂系统的高可靠AI赋能体系构建Deepoc大模型通过多维度技术突破，显著提升核工业知识处理与决策可靠性。经核能行业验证，其生成内容可验证性提升68%，关键参数失真率99.999%）。动态可信度评估系统：基于贝叶斯神经网络实时量化模型不确定性，为关键决策提供置信度评分（如堆芯功率控制置信区间±0.05%）。二、核心突破：物理增强型智能算法创新机理与数据双驱动建模神经微分方程求解器：将中子输运方
SWOT分析的那些事（上）常思行
1、从麻将说起麻将我们都熟悉，你抓一副牌之后，先要看看自己的牌，看看其他三家都打什么牌。然后，在自己的头脑中迅速就形成一副牌。这就是所谓的“愿景”，它是你准备“和牌”的方向。比如一条龙，比如对对和。一切战略都是要出于这个愿景，是围绕这个愿景展开的。除了“愿景”之外，其实你还要不断地进行观察，看其他三家都在打什么牌，看看别人都出过什么牌，进而推断还有什么牌没有出，还有多少潜在的机会。抓机会，顺应潮流
章节十四：乱序中的“指挥家”：堆排序奥义 - (堆排序 / Heap Sort) 杨小扩常用算法详解算法
各位老铁，阿扩又来啦！前面我们聊了各种数据结构和算法，从基础的排序查找，到复杂的图算法、动态规划，再到巧妙的Trie树和布隆过滤器。今天，我们要再次回到排序算法的舞台，但这次的主角，可不是简单的“冒泡”或“选择”，而是一位在乱序中能高效组织、精准定位的“指挥家”——堆排序(HeapSort)！你可能听说过快速排序、归并排序，它们都是O(NlogN)级别的排序算法。堆排序也同样拥有这个优秀的性能，而
万界星空科技锂电池MES解决方案
万界星空科技的锂电池MES（制造执行系统）解决方案专注于提升锂电池生产过程的智能化、自动化和精细化管理水平，针对行业的高复杂性和严格的质量追溯需求，提供了一套全面的功能模块和定制化服务。以下是其核心内容及优势：一、核心功能模块1.生产调度与计划管理•根据订单需求、产能状况和物料供应，自动生成动态生产计划，支持基于优先级或资源的排程算法，实时调整以应对变化，确保高效执行。•集成APS（高级计划排程系
。。。。看毛片算法_(:з」∠)_ /FZU - 2275 StrongerIrene #日常刷题
参考1:链接“这个是我当时学的时候学长推荐我看的”（然而太长了。。。。。我看不懂……最后好难受_(:з」∠)_饭也不要吃的）然后看了精简版的...然后就明白了_(:з」∠)_【有关解释】（part）（1）模式串向右移动的位数为：失配字符所在位置-失配字符对应的next值next数组各值的含义：代表当前字符之前的字符串中，有多大长度的相同前缀后缀。此也意味着在某个字符失配时，该字符对应的next值会
python实现自动化sql布尔盲注(二分查找) 海星船长丶 python 自动化 sql 网络安全 web安全
为了优化自动化布尔盲注的代码，我们可以使用二分查找来减少猜测次数，从而提高效率。以靶场sqli为例：importrequests#目标URLurl="http://127.0.0.1/sqli/Less-8/index.php"#要推断的数据库信息（例如：数据库名）database_name=""#字符集（可以根据需要扩展）charset="abcdefghijklmnopqrstuvwxyzAB
客流分析核心算法 trajectory_event_analyzer数据结构风吹落叶花飘荡 python 后端算法数据结构网络
客流分析核心算法trajectory_event_analyzerV4.py数据结构文章目录客流分析核心算法trajectory_event_analyzerV4.py数据结构一、算法描述1、描述2、客流分析模块trajectory_event_analyzerV4.py解析1.分层统计：2.状态一致性检查：3.区域状态统计：4、客流状态统计5.ReID集成：6.数据清理机制：二、核心模块解释1、
大学专业科普 | 计算智能、信息学与大数据鸭鸭鸭进京赶烤大数据
一、专业背景随着信息技术的飞速发展，数据的产生速度呈爆炸式增长，传统数据处理技术已经无法满足如此庞大的数据量和复杂的数据类型，大数据专业应运而生，旨在培养能够应对大数据挑战的专业人才。二、主要课程内容数学基础课程高等数学、概率论与数理统计、线性代数是大数据分析的核心数学基础，为数据处理、算法优化和模型构建提供必要的理论支持。计算机基础课程数据结构与算法、计算机网络、操作系统是大数据技术的重要支撑，
大学专业科普 | 人工智能、物联网和云计算技术鸭鸭鸭进京赶烤人工智能物联网云计算 5G 信号处理信息与通信网络
一、专业概述人工智能专业是一门融合计算机科学、数学、信息学等多学科知识的交叉学科。它旨在培养学生掌握人工智能领域的基本理论、方法和技能，以应对人工智能在各个领域的应用需求和发展挑战。二、主要课程基础课程：包括高等数学、线性代数、概率论与数理统计、离散数学等数学基础课程，为人工智能算法提供理论支撑；以及数据结构、算法设计与分析、计算机组成原理、操作系统、计算机网络等计算机科学基础课程，帮助学生理解人
解读一个大学专业——信号与图像处理
专业定义与核心内容维度内容定义研究如何采集、处理、分析和理解一维信号（语音、雷达、脑电）和二维/三维图像（医学、遥感、工业视觉）。关键词数字信号处理（DSP）、图像处理、计算机视觉、模式识别、压缩感知、深度学习、GPU加速、嵌入式系统。技术栈MATLAB/Python+OpenCV/PyTorch+DSP/FPGA+GPU（CUDA）第五届先进算法与信号、图像处理国际学术会议（AASIP2025）
一个故事蔡晓玥小太阳
01这次回家听我婆婆讲了一个惨烈的因果故事。当事人现在也才五六十岁，是镇上一个开诊所的医生。夫妻二人生下两个女儿后一直想再生个儿子，结果第三个生下来还是女儿，于是他们就亲自将这个出生没多久的女儿活活溺死在洗澡盆里。第四胎果然生了个儿子。这个儿子从小乖巧，聪明听话。长大后长得也一表人才，身高1米80左右。从小到大读书从来不让家长操心，他读北京航空航天大学一直读到博士毕业，在北京娶了媳妇。医生夫妇出钱
Pad Token技术原理与实现指南 Takoony AI
目录概述理论基础：第一性原理分析技术实现机制工程最佳实践性能优化策略常见问题与解决方案技术发展趋势附录1.概述1.1文档目的本文档旨在深入阐述深度学习中PadToken的技术原理、实现机制及工程应用，为算法工程师提供全面的理论指导和实践参考。1.2适用范围自然语言处理模型开发序列数据批处理优化深度学习系统架构设计高性能计算资源管理1.3核心问题研究问题:为什么深度学习模型需要将变长序列统一到固定长
淘宝商城四面（附架构面试专题）及B2C商城架构项目实战分享！风平浪静如码
一面主要问题如下（主要注重基础，问得很深很广，压力面试）：首先自我介绍数据结构算法的基本问题，如排序算法，二叉树遍历，后序遍历非递归，图的最短路径问题对一个数组进行绝对值排序的算法java中hashmap的底层实现java中垃圾回收机制GC原理等介绍自己的项目，数据库中用到的数据结构数据模型，死锁的概念（问的应该是数据库的死锁），如何避免死锁?乐观锁和悲观锁?一致性hash算法项目中业务对象的关联
京东百亿补贴活动是什么？京东百亿补贴是什么意思测评君高省
这个活动是为回馈用户联合商家进行的商品补贴活动，旨在让消费者购买到极具性价比的商品。这一活动正式上线于2023年3月6日，是京东在电商市场竞争愈发激烈的情况下，谋求增量最直接的方式之一。通过“百亿补贴”，京东希望能够为用户提供更好的购物体验，同时也促进了电商行业的价格竞争。此外，京东还不断迭代和优化这一活动，例如通过推出玩法，为用户提供更多的选择和福利，进一步让利给消费者。这些举措体现了京东在维护
Doris实战——拈花云科的数据中台实践吵吵叭火大数据 #Doris 数据仓库大数据
目录前言一、业务背景二、数据中台1.0—Lambda三、新架构的设计目标四、数据中台2.0—ApacheDoris4.1新架构数据流转4.2新架构收益五、新架构的落地实践5.1模型选择5.1.1Unique模型5.1.2Aggregate模型5.2资源管理5.3批量建表5.4计算实现5.4.1实时计算5.4.2准实时计算通过JavaUDF生成增量/全量数据基于Doris的大表优化DorisBork
【华为OD机试真题 Python语言】135、采样过滤 | 机试真题+思路参考+代码解析 KFickle 华为od python 华为华为OD机试真题采样过滤
文章目录一、题目题目描述输入输出样例1二、思路参考三、代码参考作者：鲨鱼狼臧个人博客首页：鲨鱼狼臧专栏介绍：2024华为OD机试真题，使用Python进行解答，专栏每篇文章都包括真题，思路参考，代码分析，思路参考超过百字，欢迎大家订阅学习一、题目题目描述在做物理实验时，为了计算物体移动的速率，通过相机等工具周期性的采样物体移动距离。由于工具故障，采样数据存在误差甚至相误的情况。需要通过一个算法过滤
MATLAB在工业缺陷检测中的应用
本文还有配套的精品资源，点击获取简介：缺陷检测、伤痕检测、瑕疵检测和划痕检测是工业自动化和质量控制中至关重要的环节，MATLAB作为一种高级编程环境，在图像处理和计算机视觉任务中扮演了重要角色。本文详细介绍了如何使用MATLAB实现这些检测过程，包括图像采集、预处理、特征提取和决策制定等步骤。通过介绍内置图像处理工具箱中的应用，色彩转换技术、边缘检测算法以及形态学操作等方法，我们阐述了如何识别和处
10、区块链技术及其应用吃瓜不吐籽595 解密《质量4.0与数字化转型》区块链比特币去中心化
区块链技术及其应用1.区块链简介区块链技术作为一种分布式账本，近年来受到了广泛关注。它不仅仅是一种技术革新，更是一种思维模式的转变。区块链的核心在于其去中心化、不可篡改和透明的特性，使得它在多个领域都有广泛的应用前景。区块链的基本概念区块链本质上是一个共享的、不可变的数字账本，记录了所有参与者之间的交易。每个区块包含了一系列交易记录，并通过加密算法与前一个区块相连，形成一条链。这种结构确保了数据的
【缺陷检测】基于计算机视觉实现电路板智能检测系统附Matlab代码 matlab科研助手计算机视觉 matlab 人工智能
✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。往期回顾关注个人主页：Matlab科研工作室个人信条：格物致知,完整Matlab代码及仿真咨询内容私信。内容介绍随着信息技术的飞速发展和电子产品的日益普及，印刷电路板（PCB）作为电子产品的核心组件，其质量直接关系到整个系统的性能和可靠性。传统的电路板检测主要依赖人工目检，存在效率低下
学习嵌入式第六天缺口212 学习算法数据结构
一.数组的排序1.冒泡排序冒泡排序是一种简单的排序算法，其核心思想是通过重复遍历待排序的数组，每次比较相邻的两个元素，如果它们的顺序错误就把它们交换过来，直到没有元素需要交换为止。从数组的第一个元素开始，依次比较相邻的两个元素。如果前一个元素大于后一个元素，则交换这两个元素。每完成一轮遍历，最大的元素会“冒泡”到数组的末尾。之后缩小遍历范围（不再考虑已排好的末尾元素），重复上述过程，直到所有元素有
华为OD机试2025B卷真题题库目录｜机考题库 + 算法考点详解（Python/JS/C/C++）
专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华为OD往常的操作，B卷题目是由往
时间轮算法
据说是复杂度O(1)的牛逼算法，所以抽时间学习学习。现在要实现一个定时器，这个定时器控制很多任务。该怎么做呢？第一反应是任务做成一个队列，属性有个时间，每次计时后将该属性减1，到0的时候就执行。这种方式可行，但是效率不高，因为每次都要遍历所有任务，所以时间复杂度是O(N)。优化的方法是什么呢？有点类似哈希表，增加一个时间队列，同时将任务预先排放在一个时间队列中。如果是100秒的时间范围，那么就是1
一文看懂NTP协议 Neolock 网络协议网络协议 ntp 网络
最近碰到一个NTP协议相关的题，卡了很久，才发现一直在用的NTP协议完全不了解他的原理，遂学习并总结一下1.NTP概述NTP（NetworkTimeProtocol）是一种用于同步计算机系统时钟的网络协议，旨在通过分层架构和精密算法，将设备时间同步至全球协调时间（UTC），精度可达毫秒甚至微秒级。其核心目标是通过减少时钟偏差和网络延迟影响，确保分布式系统的时间一致性2.NTP分层架构（Stratu
GDPR/等保2.0合规指南：企业商城系统必备的10大安全机制万米商云安全数据库网络
在数字经济全球化与数据主权博弈的双重背景下，企业商城系统作为承载用户隐私、交易数据与商业机密的核心载体，需同时满足欧盟《通用数据保护条例》（GDPR）与中国《网络安全等级保护2.0》的复合合规要求。本文从技术实现视角，解析企业商城系统必备的10大安全机制及其实施要点。一、全链路加密传输1、HTTPS强制部署采用OV/EV型SSL证书实现TLS1.3协议升级，支持国际RSA2048位或国密SM2算法
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他