郑瀚Andrew.Hann

计算法 -- 从数据中自动实现寻找因果关系的算法过程

1. 为什么会提出因果关系计算法

在文章的开始，我们来讨论一个话题：哪些药一起服用会产生不良反应？

针对这个问题，传统的观察法和分析法做法可能如下：

用随机试验来测试药品，但是这种方法并不能给我们提供多少信息，因为这些试验往往会避免让参与者同时服用多种药物
用模拟实验来预测药物之间的相互作用，但是这样的实验需要有大量的背景知识才能完成
用实验的方法对一些药物组合之间的相互作用进行测试，但考虑到这种实验需要的成本和时间，它可能只适用于少数几种可能的药物组合

上述这些方法的共同缺点就是：实际操作层面比较复杂、费力，不能通过计算机自动化完成。

例如笔者在上篇文章中讨论的观察法，其用于理论研究方面是没有问题的，但是一旦要将其用于工程实践，就显得捉襟见肘了。

为了解决这个问题，学者提出了计算法，计算法本质上是一种数据挖掘驱动、从海量数据中自动寻找因果关系的有效方法。

举个例子来说，

以美国为例，一种药物上市之后，一些疑似不良反应的事件会被病人、制药公司和医疗服务机构报告给食品及药品管理局（FDA），并被输入数据库。如果某人服用了一种抗过敏药物，几天后心脏病发作了，那么他或者他的临床医师就可以把这一情况报告给FDA。

当然，这些报告里所说的情况通常都是未经证实的。可能某个人的心脏病发作实际上是与药物无关的血块引起的，但仅仅是由于最近有新闻报道说出现了很多起药物引发心脏病的事件，因此将这个人的心脏病发作解释为该药物引发的不良反应似乎就很合理了。

很多情况都可能会导致数据出现虚假的因果关系。例如：

病人身上可能还有其他疾病引发了心脏病，比如未诊断出的糖尿病
数据本身也可能会出问题，比如样本被污染了或者症状被误诊了
事件发生的顺序可能因为观测原因被搞错了，比如心脏病是在吃药前就发生了
数据收集不完整，很多真正的不良反应可能并未报告给FDA，因为人们可能认为这些不良反应并不是服药引起的

即便有些报告所说的情况是错的，它们仍然可以帮助我们形成新的有待检验的假设。如果我们想要通过实验来验证这些不良反应，比如让一组病人服用各种药物组合，或者让每个病人分别服用每种药物，那我们可能要耽误很长时间才能找到这些药物之间的相互作用，从而导致更多病人可能出现药物不良反应。

相反，如果使用另一组来自医院的观察数据，我们就能准确地知道病人服用某种药物组合后会出现什么情况。当然，我们无法确定病人有没有服用医院给他们开的药，也无法确定同时服用两种药物的病人和其他病人有没有什么不同。

尽管这种类型的观测数据存在很多局限性，但是和传统观察法相比，计算法最大的优势是对先验领域知识的要求很低，我们不强制需要从某个具体的因果假设出发，然后再对这个假设进行评估，而是可以直接从数据中自动发现某种因果关系。

通过将计算能力和从数据中有效发现原因的各种方法进行结合，我们对数据的分析已经不再是一次只考察一个因果关系，而是通过对数据的挖掘同时揭示多种因果关系。

通过这些自动化的方法，我们还可以发现很多人们无法直接观察到的更加复杂的关系，比如，我们可能会发现一个让病人在中风后恢复意识的、由多个步骤（每个步骤又包含多个必要组成部分）组成的事件序列。

2. 什么样的数据适合用来推理因果关系 -- 因果结构搜索的假设前提

在考察推理方法之前，我们还要讨论一下使用这些方法需要输入的数据内容。这里所说的数据可能是指随时间变化的事件序列，比如一只股票价格每天发生的变化，也可能是指某个时间点上的事件序列。

不同的研究方法假设出的数据也有所不同，但有些特征几乎对所有研究方法都是一样的，而且这些特征还会影响我们从数据中得出的结论。

0x1：无隐藏的共同原因假设

1、共同原因假设原理

一个最重要且最普遍的假设就是：我们已经测量了正在进行因果推理的变量中的所有共同原因。这在图示模型法中也被称为因果关系的充分性。如果想要从一组变量中找出原因，那么我们必须确保测量了这些变量中的所有共同原因。

如果咖啡因是真正导致睡眠不足与心率上升的原因，而且这也是睡眠和心率之间的唯一底层联系，那么如果我们不测量咖啡因的摄入量，可能就会得出错误的结论，在咖啡因导致的两个结果（睡眠不足和心率上升）之间找到联系。

数据中缺少的原因叫做潜在变量，两个或两个以上的变量之间未测量到的原因可能会导致人们做出错误的推理，这样的原因被称为隐藏的共同原因或潜在的混杂因子。而由此导致的问题被称为混杂和遗漏变量偏差。

共同原因发现不足是观察性研究的主要局限之一，也是大多数计算法输入内容的主要局限之一。它不仅会导致人们在变量之前发现错误的联系，还会导致人们高估原因的强度。

2、共同原因和非共同原因对因果关系发现的影响

注意！我们并不一定非要假设每一个原因都要测量到，我们只需要测量那些共同的原因，如下图所示：

上图中，咖啡因不仅引起了睡眠的变化，还引起了心率的变化，它是心率和睡眠的共同原因。而白酒仅仅引起了睡眠的变化。如果没有白酒摄入量的数据，那么我们将无法找到引起睡眠变化的原因，但也不会因此就在其他变量之间（心率和睡眠）找到错误的关系。因为只要咖啡因的观测是完整的，即使白酒的观测不完全，至少我们会得出以下几个结论：

心率和睡眠之间不存在因果关系
心率和咖啡因之间存在因果关系

3、因果关系链中的间接原因缺失问题

还是继续上面咖啡因的例子，如果咖啡对睡眠的影响是通过一个中间变量（代理变量）引起的，它们之间的关系是咖啡因引起心率上升，而心率上升又导致睡眠减少，如下图所示：

如果我们不测量心率，最多只会找到一个间接的原因，而不是一个完整的因果结构。

4、如何规避共同原因缺失问题

为了规避有共同原因没有被测量到的情况，有一种可行的方法是找到与我们的观测数据一致的所有可能的模型，包括那些带有隐藏变量的模型。

比如说，如果我们在睡眠和心率之间发现了一个表面上的因果关系，并且知道这两个变量之间可能存在某些未测量到的共同原因，那么一个可能的模型就会包含一个能够引起这两个观察到的变量的隐藏变量。

这种方法的好处在于，所有能够解释这些数据的模型之间可能会存在一些共同的联系，这样一来，即便存在多种可能的因果结构，我们依然能够找出一些可能的联系。

0x2：典型分布假设

除了要确保找到了正确的变量集，我们还需要确保观察到的内容反映了观察对象的真实行为，这就是信息论中的充分统计量理论。

例如：

如果我们要考察【有没有报警系统，是导致抢劫案发生的原因】，那么我们的数据需要确保抢劫案的发生完全依赖于是否安装了报警系统，如果还有其他的依赖原因没有观测到或者没有被纳入考察范围，就会导致因果关系结构的错乱，这就是变量缺失问题。
如果我们要考察【学习时间，是SAT成绩的原因】，那么我们的数据需要确保覆盖了所有学习时间的学生的SAT成绩，否则就会出现我们在这篇文章里讨论过的抽样偏差问题，由于样本缺乏变化，我们可能无法找到事物之间的真正关联
如果我们要考察【跑步时间，是体重下降的原因】，那么我们要注意，跑步和体重下降之间存在两种关系，一种是跑步对体重下降有积极影响，另一种是跑步对体重下降有消极影响，因为跑步后会增大食欲和促进吸收。如果搜集到的数据分布得不好，因为这种抵消关系的存在，我们可能会错误地发现跑步和体重下降之间没有任何关系
如果我们要考察【某基因的表达，是某种生物显性特征的原因】，就会遇到所谓的优先权问题。当很多基因都能产生同一种显性特征时，即便我们让其中一个基因不起作用，这个显性特征依然会出现，这是很多具备自平衡能力的生物体都会具备的特征。这种现象会导致我们错误地发现原因和结果之间似乎并不存在因果依赖性
如果我们要考察【硬币是否有做手脚的的问题】，我们只抛10次硬币就是不够的，在小数的实验次数下很可能会出现罕见事件，只有在抛硬币次数接近无穷次时，实验结果才会真实地反映该硬币背后的真实概率分布。如果该硬币是一个标准硬币，那么正面朝上和反面朝上的次数比例会接近1：1。这就是大数定律问题。
如果我们要考察【能够判定一个文本文档是恶意文档的原因】，那么就要求我们能够获取到完全的“恶意样本全集”，这在理论上是合理的，但在实际工程中是很难做到了，恶意样本本质上是基于一种编程语言规范的无限字符串组合，总量和类别都是无限的

辛普森悖论表明，根据考察数据的不同（整体数据或小群体数据），会发现不同的因果结构。

因果推理取决于真实的依赖性关系，我们通常要假设我们观测到的数据是满足典型分布特性的，这种假设被称为忠实性原则，因为那些不能反映真正的潜在因果结构的数据在某种意义上是“不忠实的”。

0x3：稳定系统假设

上一节说道的典型集假设，我们在进行因果推理时往往会做出这样的假设：假设我们有足够多数据，假设我们看到的是由某个原因引起的某个结果出现的真正概率，而不是一个异常现象。

但是要注意的是，对于有些系统（比如那些非稳定性系统）而言，即便是一个无穷大的数据集也无法满足这个假设的要求。

例如，像股票平均收益这种时间序列数据，它本身是不稳定的，或者说系统本身可能就不具备任何可预测的规律性存在。这种情况下，我们不应该从观测数据中发现任何因果关系。

所以一般情况下，在进行因果推理前，我们必须假设这些关系是不会随着时间的变化而变化的

0x4：正确变量假设

对于因果推理活动来说，我们首先要确保我们测量了正确的事物，

如果我们手上掌握的是金融市场的数据，那我们研究的变量可能就是各个股票
如果在政治学领域，那我们研究的变量可能是竞选捐款额和通话量
如果在入侵检测领域，那我们研究的变量可能是表示服务器运行指标的各种统计量
对于共生多原因导致某结果的问题，单独考察单个变量可能无法找到任何关系，但如果同时考察所有的共生变量，则可能可以找到这种因果关系

我们不仅需要测量正确的事物，还需要确保描述这些事物的方式是正确的。例如，在某些研究中，肥胖症和肥胖可能属于一个类别，合在一起统计就行。但是对于那些致力于治疗肥胖症患者的研究来说，对肥胖症和肥胖的区分，就至关重要了。

0x5：时序不变性假设

如果变量之间的关系是随着时间而变化的，那么就可能出现这样的情况。变量在时间序列的一个时间段里是相互独立的，但在另一个时间段里却不尽然。在这种情况下，尽管变量之间的关系在一段时间内可能很强，但是当我们考察整个时间段，变量之间的关系可能会显得很弱。

3. 图解模型 -- 找到一个模型来了解数据中所有的因果关系

0x1：什么是图解模型

为了向别人描述某个因果关系，或者为了理解各个事物是如何组成一个整体的，我们常常会画一张因果结构图。

下面这个图形展示的是一个变量出现的概率是如何受另一个变量影响的。

这个图告诉我们以下几点信息：

广告和购买行为之间存在某种关系
广告和购买行为之间的关系是单向的，即广告影响购买行为，而不是购买行为影响广告

接下来看另一个因果概念图：

这个图告诉我们以下几点信息：

广告和购买行为之间存在某种关系
广告和购买行为之间的关系是单向的，即广告影响购买行为，而不是购买行为影响广告
天气和购买不存在任何关系，我们不能用天气影响或预测购买行为

0x2：图解模型能够表示因果关系的条件

尽管我们可以用图形来表示因果关系，但这并不意味着我们绘制的或者知道的每一个图解模型表示的都是因果关系。一个图解模型要能够具备表示因果关系，需要具备以下几个条件：

因果关系中的马尔可夫条件：一个变量的概率只取决于引起这个变量的原因
充分性原则：所有共同的原因都要测量到
忠实性原则：所使用的数据准确地反映了变量之间真正的依赖关系
变量描述正确性原则：变量的描述必须正确
典型集原则：观测数据的概率分布要保证充分性

1、充分性原则

假设广告不仅能够引起购买行为，还能提高品牌认知度，

如果我们没有用来表示广告的变量，还要试图从一组数据中推理出变量之间的关系，那我们可能会发现如下图所示的图形，

这会让我们错误地认为购买行为提高了品牌认知度，而实际上，这是一个伪因果性。

一般来说，任意数量的变量中都可能有一个共同的原因，如果这个原因没有被测量到的话，我们就无法保证由此推理出的关系是正确的。

另一种复杂的情况是出现决定性关系。比如说，每收到一封电子邮件，我的电脑都会发出声响，而电脑的声响又会让我的狗汪汪乱叫。

如果在出现声响的情况下，狗叫的概率为1，而在出现电子邮件的情况下，电脑发出声响的概率也为1。

尽管从图解模型图上，我们可以看到电子邮件和狗叫应该是相互独立的。但是如果仅从观测结果上，我们可以会错误地推导出电子邮件是声响和狗叫的共同原因，因为电子邮件的出现，都会100%伴随声响和狗叫的出现。

事实上，这个问题不仅是图示模型中存在的问题，也是大部分概率法中的一个难题。

2、变量描述正确性原则

如果广告变量表示的是“是否在电视台购买了广告空间”，但真正的原因却是“消费者看到广告的次数”，这可能会导致我们无法找到真正的因果关系。

3、忠实性原则

一个贝叶斯网网络包括两部分：

结构：各个变量之间的连接方式
条件性概率分布组合：这些组合不过是一些表格，这些表格让我们能够在给定原因变量值（真或假）出现的概率。例如广告和购买行为的例子：

对于贝叶斯网络中的每一个节点来说，我们都会有一个类似的表格。知道这个网络结构信息可以极大地简化我们的计算工作，因为每一个变量的值都是由其父级元素决定的。

相反，如果我们对变量之间的联系一无所知，就不得不将每一个变量都包含到表格的每一行之中。如果存在 N 个可以为真或为假的变量，那么我们就会有 2^N 行。

我们既可以从数据中了解变量之间的结构和各个变量出现的概率，也可以根据我们了解的信息构建一个结构，以此来了解各个变量发生的概率。

4、因果关系中的马尔可夫条件

只要知道一个变量的直接原因就能够预测这个变量，这个前提条件被称为因果关系中的马尔科夫条件。

在变量的直接原因已经给定的情况下，变量是独立于它的非衍生物的（衍生物指的是由变量导致的结果，以及由这些结果导致的结果，等等）。

这在贝叶斯网理论中被称为tail-to-head（证据迹），可以抽象为下图所示的结构：

这种结构代表的意思是：

c未知时：影响可以经过c从a流向b，a可以作为证据影响b的后验概率
c已知时：在c给定的条件下，a，b被阻断，是独立的。

还是用广告投入的例子来说明，

如果营销策和预算只能通过广告来影响购买行为，那么购买行为的发生概率则只取决于广告，广告是导致购买行为的直接原因。

一旦广告这个值确定了，那么其他的原因将不再重要了，换句话说，广告已经提供了预测购买结果的所有信息，除此之外，不再需要其他信息。所有的原因对购买行为的影响都要通过广告来实现。

从理论上说，如果我们能直接干预广告活动，那么无须对营销策略或预算做任何调整也能让购买行为发生变化，因为购买行为完全是由我们设定的广告值决定的。

0x3：从数据自动推理得到概率图形

1、将概率图示模型搜索问题转化为目标函数最优化问题

假设我们有一些关于某个公司雇员情况的数据，我们知道：

他们的工作时间
休假信息
部分生产指标

接下来的问题是，如何自动化地找到这些因素之间存在的因果关系网络呢？这个问题的本质上是，如何在所有的因果关系网络集合中，寻找到一个或一批和观测数据最匹配的拓朴结构（最大似然思想）。

显然，这个问题是一个最优目标搜索问题，那我们就可以借用优化理论里的目标函数优化理论来解决这个问题。

我们可以找一个指标来衡量一个模型对数据的描述能力，然后搜索可能的模型，找到在这个指标下得分最高的模型。这种方法叫作搜索评分法。

如果休假导致生产力提高是这个数据的唯一关系，那么带有这样一个（从休假指向生产力）的箭头的模型应该比包含其他关系的模型得分高，

如果实际情况是 V(休假) 导致 P(生产力)，那么第一个图形的得分应该是最高的

具体到操作层面，要想从候选模型中做出最优选择，我们还需要用一个方法来计算哪个图形与数据更相符。

用来评分的函数有很多，但从根本上来说，除了要避免将图形和特定数据集中的噪声过拟合，我们对数据的描述程度也存在一个平衡点。我们可以通过一个非常复杂的结构来完美解释数据集中的每一个点，但我们想要找到一个模型来描述各个变量之间更为普遍的关系（即泛化能力），而不是解释数据中的每一处噪声。

因此，当图形变得越来越复杂时，搜索空间会变得十分巨大。只要25个变量，我们得到的所有可能图形的数量（超过10¹¹⁰）就会让宇宙中所有原子的数量（估计只有10⁸⁰）相形见绌。

没有任何方法能让我们一一测试这些图形，我们必须寻找一个相对聪明的搜索策略，高效地进行拓朴搜索。

2、启发式因果拓朴搜索方法

假设我们一一测试了上图中的前三个图形，然后发现（c）的得分最高。接下来最好的策略是去研究与这个图形相近的其他图形，而不是随机想出第四个图形。

我们可以增加一个箭头、改变箭头的方向或者删除一个箭头，来看看图形的得分是如何变化的。这种方法本质上是一种启发式搜索的思想。

这种启发式搜索有存在很大的问题，就是“容易陷入局部最优”，因为也有可能最好的图形其实是（d），但由于我们使用了启发式策略，一直在优化第三个图形，并且在找到真正的结构之前就已经停止了测试工作，所以我们永远也没有机会测试到第四个图形。

但是如果我们不能测试到每一个图形，就无法确保最好的图形已经被测试了。

局部最优化陷阱

3、引入先验知识的拓朴搜索方法

先验知识可以简化待搜素的拓朴空间，如果我们知道性别只能是原因而绝不会是结果，那就可以避免测试所有将性别当做结果的图形。

如果我们对要寻找的结构有一定的先验了解，那么就能为整个图形组合设计出一个概率分布图，并且可以用它来引导我们找到那些更有研究价值的各种可能的结构。

4、基于约束法的拓朴搜索方法

除了采用更优秀的搜索方法去搜索海量的潜在图像集之外，我们还可以使用变量之间的依赖性来建构那个得分最高的图形。约束法就是这样一种搜索方法。

约束法通过不断重复测试变量之间的独立性，并在测试结果中增加、减少图形中的箭头，或者改变图形中箭头的方向。

其中有些方法是每次增加一个变量
还要一些方法一开始就已经将所有变量连接在一起，然后再一个一个地删除箭头

这其实就是贝叶斯网中的局部独立性假设，基于局部独立性假设，我们可以大大化简贝叶斯图的复杂拓朴结构，从而简化节点间的条件概率计算。

以下图为例，

如果我们发现在给定 C 的情况下，A 和 B 是相互独立的，那么就可以删除它们之间的连线，然后继续寻找变量之间的其他关系，看看还能删除哪些连线。

在真实的工程实践中，我们会发现变量之间完全相互独立的可能性不大，或多或少都会有一些相关性。而我们需要判断的是，应该在什么时候接受或拒绝变量之间相互独立的假设。

如果在给定B的情况下，A出现的概率和A本身出现的概率完全一样（即互信息为零），那么这两个变量之间就是相互独立的。

在实际研究中，我们需要选择一个统计学上的门槛（临界值），来决定是否接受基于这些测试而提出的条件独立性结论。

4. 因果衡量模型 -- 重点对每一个关系的强度进行分别评估的方法

0x1：因果衡量模型原理及优缺点

因果衡量模型，并不要求寻找一个与数据一致的或者能够对数据做出完美解释的图解模型，因果衡量模型更多地是侧重于研究局部，它主要研究的是量化各种因果关系强度的问题。例如：

如果休假可以提高生产力，但生产力不能导致休假，那么休假作为提高生产力的原因的强度应该很高；
反之，生产力提高作为放假的原因的强度应该很低

尽管相关性是对称的，但在衡量因果关系的显著性时，需要利用这些关系中的非对称性特征。在某种意义上，因果关系的显著性应该与原因对结果的解释程度相称，与原因作为一种干预手段能够带来某种结果的有效程度也相称。

如果休假只能偶尔提高生产力，而加班总是能够提高生产力，那么作为生产力提高的原因，加班的强度要高于休假的强度。

如果休假能够提高生产力的原因只是因为休假可以让员工在这家公司待得久一些，且有经验的员工的生产力更高，那么我们想要知道的是，经验对于提高生产力的重要性是否高于休假。也就是说，我们想要发现最直接的原因，这些原因在图形中是直接父级原因，而不是更遥远的祖父级原因。

如果可以用一种方法，以完全独立于其他任何无关变量的方式，去单独评估生产力提高的原因（局部评估），那么我们可以做更少的测试，并且可以同时进行这些测试，从而大大提高计算这些事情的计算程序的速度。

这种方法的局限性在于，如果没有一个结构来展示所有变量之间的联系，我们可能无法直接使用这些结论来进行预测。

假设我们发现党派的支持会让参议员们投票支持某些法案，而这些参议员所属选区选民的支持也会起到同样的效果。因果衡量模型并没有告诉我们这两种方案是如何相互作用的，也没有告诉我们如果这两种支持相加，是否会导致参议员支持某个法案的决心更强。

要想解决这个问题，可以去寻找更为复杂的关系，我么并不是要使用所有测量过的变量，而是要去建立各种联系（政党和选民对提案的支持的复合因果关系结构），而这往往是需要借助贝叶斯网那样的理论体系才能较好地解决的。

0x2：概率与因果关系的显著性

在给定原因的情况下，某个结果出现的条件性概率也可以用来衡量原因的显著性。

衡量原因强度的方法有很多，但这些方法的基本理念都是要以某种方式吸收其他信息来解释这些共同的原因，即信息论中的互信息概念。

例如，如果在休假和加班这两个变量都为真时，生产力提高的概率为 X%，而只有加班这一个变量为真实，生产力提高的概率也为 X%，那么知道休假信息也并不能提升我们预测生产力提高这一事件出现概率的准确性。换句话说，休假信息并不能为确定生产力提高这个结果提供更多的信息。

因此，要想量化某个原因的显著性，我们可以计算这个原因平均在多大程度上影响了其结果出现的概率。简单来说，就是在其他因素保持不变的情况下，这个原因出现和未出现时某个结果出现的概率会有多大的变化。

可以将各种情况出现的概率进行加权计算。如果在一个非常普遍的情况下，一个原因可以显著地提高某个结果出现的概率，那么这个原因的显著性比那些只在极少数情况下才能提高某个结果出现概率的原因要大得多。

要注意的是，因果衡量模型，同样也需要遵循前面讨论过的“因果结构搜索的假设前提”，这里不再赘述。

另一方面，由于在实践中总会出现一些噪声、失误和数据缺失的情况，所以我们不能假定不是原因的事物的显著性指标的值就一定为零。相反，我们经常需要确定哪些因果显著性指标的值具有统计意义。

比如说，有很多变量可能是某些变量的原因，但是它们之间又没有真正的因果关系，我们在计算这些变量的因果显著性指标的平均值时，会发现这些显著性值的分布看起来就像一个钟形曲线，就像吐下图中的灰色柱状图，

而当测试的数据集中存在一些真正的因果关系时，这些显著性会分布成另一种图形，例如上图中的黑色柱状图部门。

我们可以利用这种差异来判断显著性指标的哪些值应该被看成是具有因果关系的值。

0x3：因果关系的显著性计算方法

1、基于时间窗口的统计性方法

在有些计算因果关系的显著性方法中，可以在原因和结果之间指定一个时间间隔或时窗，以便计算原因的显著性。

如果与流感病人亲密接触后，接触者会在1-4天后出现流感症状，那么4天这个统计时间窗口，就能让我们计算出二者之间的因果显著性。

如果这种方法的问题在于，如果我们对引起流感的原因一无所知，怎样才能知道需要测试多大的时窗呢？如果我们测试的时间窗不对，我们可能就会错误一些真正的原因，或者只能找到真正窗的一个子集或超集。

在下图中，我么测试的时窗与真正的时窗重合了一部分，但也有不一样的地方，

如果测试的时窗太长，那么就会出现很多这样的情况：我们很期待某个结果出现，但是这个结果却没有出现。由于在原因为真的情况下结果并未出现，所以这些案例会对原因的显著性值造成不利影响
如果测试的时窗太窄，那么即便测试的潜在原因没有出现，某个结果可能也会出现。
随着测试时窗与真实时窗越来越接近，显著性值也会变大，并且最终会与真实的显著性值相一致

5. 还有什么自动因果发现方法？

因果推理的方法不止一种，目前还没有哪一种方法能够在所有案例中都准确无误地找到事件之间的因果关系。有些方法得出的结论更具普遍性，但是这些结论取决于那些实际上不一定为真的假设。只用一种因果搜索方法来解决问题都是不可行的，我们需要的是一个工具箱。

没有一种方法是完美的，所以一定要了解每一种方法的局限性，例如：

如果你的推理是建立在双变量格兰杰因果关系基础之上的，那么你应该意识到，你找到的只是一种单向相关性，同时还应该考虑一下多变量的方法
如果因果结构是已知的，而我们想要从一些数据中找出这个结构的各种参数（概率分布），这时贝叶斯网也许是一个很好的选择
如果时间是其中一个重要变量，那么使用动态贝叶斯网可能更合适
如果数据中包含大量变量，或者我们并不需要找出完整的关系结构，那么用于计算因果关系强度的方法比推理因果模型的方法的效率要更高

你可能感兴趣的:(计算法 -- 从数据中自动实现寻找因果关系的算法过程)

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说造命者说
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说我叫吴起，生于公元前440年的战国初期，正是群雄并起、天下纷争不断的时候。后人说我是军事家、政治家、改革家，是兵家代表人物。评价我一生历仕鲁、魏、楚三国，通晓兵家、法家、儒家三家思想，在内政军事上都有极高的成就。周安王二十一年（公元前381年），因变法得罪守旧贵族，被人乱箭射死。我出生在卫国一个“家累万金”的富有家庭，从年轻时候起就不甘平凡
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
想家爆米花机
也许不同于大家对家乡的思念，我对家乡甚至是疯狂的不舍。还未踏出车站就感觉到幸福，我享受这里的夕阳、这里的浓烈柴火味、这里每一口家常菜。我是宅女，我贪恋家的安逸。刚刚踏出大学校门，初出茅庐，无法适应每年只能国庆和春节回家。我焦虑、失眠、无端发脾气，是无法适应工作的节奏，是无法接受我将一步步离开家乡的事实。我不想承认自己胸无大志，选择再次踏上征程。图片发自App
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
谢谢你们，爱你们！鹿游儿
昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
小丽成长记（四十三）玲玲54321
小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
瑶池防线谜影梦蝶
冥华虽然逃过了影梦的军队，但他是一个忠臣，他选择上报战况。败给影梦后成逃兵，高层亡尔还活着，七重天失守......随便一条，即可处死冥华。冥华自然是知道以仙界高层的习性此信一发自己必死无疑，但他还选择上报实情，因为责任。同样此信送到仙宫后，知道此事的人，大多数人都认定冥华要完了，所以上到仙界高层，下到扫大街的，包括冥华自己，全都准备好迎接冥华之死。如果仙界现在还属于两方之争的话，冥华必死无疑。然而
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro