HDX柿子

反事实推理,特征分离,「因果表示学习」的最新研究都在讲何

感谢参考原文-http://bjbsair.com/2020-04-01/tech-info/18556.html

本文精选了几篇因果表示学习领域的最新文献，并细致分析了不同方法的基本架构，希望能帮助感兴趣的你对因果学习应用于机器学习的方向和可能一探究竟。

因果推理（Causal inference）是根据影响发生的条件得出因果关系结论的过程，是研究如何更加科学地识别变量间的因果关系（Causality）。在因果关系中，原因对结果负有部分责任，而结果又部分取决于原因。客观事物普遍存在着内在的因果联系，人们只有弄清事物发展变化的前因后果，才能全面地、本质地认识事物。基干事物发展的这种规律，在论证观点时，有时就可以直接从事物本身的因果关系中进行推论，这就叫因果推理法。几十年来，因果推理一直是统计学、计算机科学、教育学、公共政策和经济学等许多领域的重要研究课题。

为了解决观测数据因果推断中的这些问题，研究人员开发了各种框架，包括潜在结果框架（the potential outcome framework）（潜在结果框架也称为内曼-鲁宾潜在结果或鲁宾因果模型（the Rubin Causal Model））和结构因果模型（the structural causal model，SCM）。UCLA 教授 Judea Pearl 在他的著作《Causality: models, reasoning, and inference》[1] 中介绍了 RCM 和 SCM 的等价性，就应用来看，RCM 更加精确，而 SCM 更加直观。Judea Pearl 是因果关系模型的倡导者之一。

机器之心在 2018 年也有一篇对于他的论文的报道：https://cloud.tencent.com/developer/article/1119926，探讨了机器学习的理论局限性与因果推理的七大特性。来自 University at Buffalo、University of Georgia、Alibaba 和 University of Virginia 的几位学者在 AAAI 2020 中发表了一篇关于 RCM 因果推理方法的的文章《A Survey on Causal Inference》[2]，是第一篇对 RCM 和机器学习问题的综述，而关于 SCM 的介绍则主要可以参见 Judea Pearl 的综述《Causal inference in statistics: An overview》[3]。

而近年来，在以上提及的两个理论框架的基础上，机器学习领域的蓬勃发展促进了因果推理领域的发展。采用决策树、集成方法、深层神经网络等强大的机器学习方法，可以更准确地估计潜在结果。除了对结果估计模型的改进外，机器学习方法也为处理混杂问题提供了一个新的方向。借鉴近年来产生式对抗性神经网络等深度表征学习方法，通过学习所有协变量的平衡表征来调整共焦变量，使得在学习表征的条件下，处理任务独立于共焦变量。在机器学习中，数据越多越好。然而，在因果推理中，仅仅有更多的数据是不够的。拥有更多的数据只会有助于获得更精确的估计，但在因果推理的框架下，如果使用传统机器学习技巧，不能确保这些因果估计是正确和无偏的。

与传统的使用因果图连接随机变量来完成因果发现和推理假设任务的因果推理不同，近年来，关于**因果的表示学习（Causal Representation Learning）**问题吸引了越来越多的关注。因果表示学习是指从数据中学习变量，也就意味着，经过大数据学习，基于因果表示学习的机器学习算法或者能够超越传统的符号人工智能（symbolic AI）。它不要求人工划分的先验知识，就能从数据中学到信息。直接定义与因果模型相关的对象或变量，相当于直接提取真实世界的更详细的粗粒度模型。尽管经济学、医学或心理学中的每一个因果模型所使用的变量都是基本概念的抽象，但是要在存在干预的情况下使用粗粒度变量描述因果模型，仍然是非常困难的。

现有机器学习面临的另外一个困难是有效的训练数据。对于每个任务/领域，尤其以医学为例，只能掌握有限的数据。为了提高模型的效果，就必须想办法搜寻、汇集、重新使用或者人工编制数据的有效方法。这与目前由人类进行大规模标签工作的行业实践形成鲜明对比。因此，因果表示学习对人类和机器智能都是一项挑战，但它符合现代机器学习的总体目标，即学习数据的有意义表示，其中有意义表示稳健、可转移、可解释或公平。

在这篇文章中，我们选了几篇关于因果表示学习的最新文献，其中涉及了基于 SCM 和基于 RCM 的工作。我们主要分析了不同方法的基本架构，目的是对因果学习应用于机器学习的方向和可能一探究竟。

提取模块化结构（Learning modular structures）

因果表示学习的一个方向是提取模块化的结构，即世界的不同组件在一系列环境、任务和设置中存在，那么对于一个模型来说，使用相应的模块就是利用了有效的因果表示。例如，如果自然光的变化（太阳、云层等的位置）意味着视觉环境可以在几个数量级的亮度条件下出现，那么人类的神经系统中的视觉处理算法应该采用能够将这些变化因素化的方法，而不是建立单独的人脸识别器，比如说，适用于各种照明条件。如果大脑通过增益控制机制来补偿光照的变化，那么这个机制本身就不需要和导致亮度差异的物理机制有任何关系。Goyal 等针对这个方向，尝试将一组动态模块嵌入到一个递归神经网络中，由所谓的注意机制进行协调，这允许学习模块独立动态运行，同时也会存在相互影响。

论文地址：https://arxiv.org/pdf/1909.10893.pdf

RIM 中几个重要的概念：（1）**模块化：**机器学习中的生成模型可以看作是独立机制或「因果」模块的合成体，根据因果推理理论，模块化是对模型生成的变量进行局部干预（localized intervention）的先决条件。（2）**独立性：**独立性是因果推理的重要理论，即不同物体的运动或改变机制是相互独立的。（3）**稀疏性：**无需每次都对所有子系统付出同等的注意力，模型在制定决策或规划时，只考虑在当前时间节点存在强交互需求的子系统。

基于 RIM 架构学习得到的模型能够有效捕获真实世界中的组合生成结构（compositional generative structure）或因果结构（Causal structure），从而提升了模型完成不同任务的范化性能（这些任务大多数机制是相同的，只有一小部分机制发生变化）。RIM 整体架构见图 1。

图 1. RIM 架构

RIM 架构的一个步骤分为四个阶段（图 1 中的左图显示了两个步骤）。在第一阶段中，各个 RIM 生成一个用于从当前输入读取的查询 query。在第二阶段，使用基于注意力的竞争机制，根据编码的视觉输入选择要激活的 RIM（右图）（基于注意力得分，蓝色 RIM 处于活动状态，白色 RIM 保持非活动状态）。在第三阶段，单个激活 RIM 按照默认转换动态运行，而非激活 RIM 保持不变。在第四阶段，使用注意力机制在 RIMs 之间进行稀疏通信。

在 RIM 架构中，将模型划分为 k 个子系统，其中每个子系统都可以单独的捕获转换动态，具体的，每个子系统设置为一个循环独立机（RIM），每个 RIM 基于自身函数、利用训练数据自动学习。在时间 k，RIM 的状态为 h_(t,k)，参数为 θ_k。默认的机制是每个 RIM 专注于自身的小问题、单独处理自己的动态，根据决策任务的需要，与其他 RIM 进行交互。相较于传统的直接训练大型的系统，基于 RIM 架构能够节省计算消耗、提高系统的稳定性。

首先，对于未激活的 RIM（激活组为 St），其隐藏状态保持不变：

而对于激活的 RIM，运行一个独立的转换动态，将这些独立的转换动态记为 D_k，同时保证每个 RIM 都有自己的独立参数。以 LSTM 为例，激活的 RIM 响应于当前输入的注意力机制 A 的函数以下式更新

当输入与其相关时，激活并更新对应的 RIM，并为之分配所需要的表征和计算资源。如果训练数据是由一组独立的物理机制生成的，则其学习机制也是独立的。

注意力机制

这篇文章引入了注意力机制（attention mechanism）来选择：根据心理学研究显示，大脑对复杂实体进行并行处理的能力是有限的，许多代表视觉信息的大脑系统基于竞争（在整个视觉领域并行运行）来分配资源，以及这种分配通常还会受到来自更高大脑区域的反馈的影响，该理论在认知科学上称为差异竞争（biased competition）。基于内容的软注意力机制（content-based soft-attention mechanisms）对类型化的可互换对象集进行操作。这一思想目前广泛应用于最新的 transformer 的多头点乘自注意力模型，并在许多任务中获得了很好的效果。根据这个原理，软注意力机制计算一个 query（或称为 key）与对应的 key 矩阵的乘积，进行规范化处理之后，输出 softmax 值：

其中，softmax 应用于其参数矩阵的每一行，产生一组凸权重。作为结果，得到值 V 的凸组合。如果注意力集中在特定行的一个元素上（即 softmax 已饱和），则只需选择一个对象并将其值设置为结果中行 j 的值。请注意，键中的维度可以拆分为多个头（heads），然后分别计算它们的注意力矩阵和写入值。

当每个 RIM 的输入和输出是一组对象或实体（每一个都与键和值向量相关联）时，RIM 处理就变成了一个通用的对象属性的处理机器，它可以在类似于编程语言中变量的意义上操作「变量」：作为函数的可交换参数。因为每个对象都有一个密钥嵌入（可以理解为名字 name 或类型 type），所以相同的 RIM 处理可以应用于任何适合预期的「分布式类型」（由查询向量指定）的变量。然后，每个注意力的头对应于 RIM 计算的函数的一个类型参数。当对象的键与查询匹配时，它可以用作 RIM 的输入。而在常规的神经网络（没有使用注意力机制）中，神经元是以固定的变量（从前一层给它们输入的神经元）工作的。每个 RIM 有一组不同的查询嵌入，利用键值注意机制就可以动态选择哪个变量实例（即哪个实体或对象）将用作 RIM 动态机制的每个参数的输入。这些输入可以来自外部输入，也可以来自其它 RIM 的输出。因此，如果单个 RIM 可以用类型化参数表示这些「函数」，那么它们可以「绑定」到当前可用且最适合它的任何输入（根据它的注意力得分）：「输入注意力」机制将查看候选输入目标的键，并评估其「类型」是否与 RIM 期望的匹配（在查询中指定）。

自上而下的框架

该模型动态地选择与当前输入相关的 RIM，令每个 RIM 在处理实际输入实例和一个特殊的空输入之间做出选择，空输入完全由零组成，因此不包含任何信息。在每个步骤中，根据实际输入的 softmax 值来选择最优的 k_A 个 RIM。这些 RIMs 必须在每个步骤上竞争以从输入中读取数据，只有赢得这一竞争的 RIM 才能从输入中读取数据并更新其状态。

时间 t 的输入值 x_t 被视为一组元素，结构为一个矩阵的行（对于图像数据，它可以是 CNN 的输出）。首先连接生成一个全零行向量，以获得：

⊕表示行级级联操作。定义线性转换构造键（K=XW.^{k，每个输入元素一个，空元素一个）、值（V=XW.}v，每个元素一个）和查询（Q=RW_k.^q，每个 RIM 注意头一个），其中 R 是每行（r_i）与单个 RIM 的隐藏状态相对应的矩阵。W_v 是从一个从输入元素到相应的加权注意值向量的映射矩阵，W_k 为权重矩阵，它将输入映射到键。W_k.^q 是从 RIM 的每个隐藏状态映射到其查询的权重矩阵。此时注意力机制为：

为每个步骤选择前 k 个 RIMs 进行激活，这些步骤对空输入的关注最少，将此集合定义为 S_t。由于查询依赖于 RIM 的状态，这使得单个 RIM 只关注与特定 RIM 相关的部分输入，从而基于自上而下的注意过程实现选择性注意（如图 1 所示的架构）。

RIM 之间的交互

虽然在默认情况下 RIM 是独立运行的，但是注意力机制允许 RIM 之间共享信息。具体来说，允许激活的 RIM 读取所有其他 RIM（无论激活与否）。这是由于，虽然未激活的 RIM 与当前输入无关因而其值不应改变，但是，它们仍然可以存储与激活的 RIM 相关的上下文信息。为了实现 RIM 之间的交互，本文使用了一种残余连接的方法防止长序列上的梯度消失或爆炸问题 [4]：

实验分析

当 RIM 用于处理包含不同时间模式的序列时，能够实现专门化以便根据不同模式激活不同的 RIM。因此，当修改模式的子集（特别是那些与类标签无关的子集）时，RIM 具有很好的泛化性能，而大多数递归模型并不能很好地泛化这些变体。

表 1. 序列 MNIST 分辨率任务的实验结果

图 2. 预测弹跳球的运动

反事实推理（Counterfactual）

因果表示学习的另外一个有趣的研究方向是反事实推理在领域适应问题中的应用。统计学习理论中最基本的假设是训练数据和测试数据来自同一分布。然而，在大多数实际情况下，测试数据是从只与训练数据的分布相关但不完全相同的分布中提取的。在因果推理中，这也是一个很大的挑战，反事实分布一般会与事实分布不同。因此，有必要通过从实际数据中学习来预测反事实结果，从而将因果推理问题转化为领域适应问题。关于反事实推理的应用，我们找到两篇有趣的文章，分别遵循 SCM 和 RCM 架构进行分析，一篇聚焦图像处理问题，另一篇则探讨文本分析问题。

论文地址：https://arxiv.org/pdf/1812.03253.pdf

**基于 SCM 提取独立分离的表征。**在图像处理领域中，一些基本表征是问题不变的，或者说它们是可以被独立地干预 (intervention) 来实现，对于部分独立分离的表征进行处理和操作，仍然能够生成有效的图像，这些图像可以使用生成性对抗网络（a generative adversarial network，GAN）的鉴别器来训练。在极端情况下，还可以混合潜在向量，其中每个分量都是从另一个训练示例中计算出来的。对于遵循独立同分布（IID）的训练集，这些潜在向量具有统计独立的分量。在这样的架构中，编码器是一个识别或重建世界上因果驱动因素的反因果映射，解码器建立了低维潜在表示（驱动因果模型的噪声）和高维世界之间的联系。如果潜在表征重构了（驱动）真正因果变量的噪声，则通过对这些噪声（及其驱动机制）进行干预，能够生成有效的图像数据。

这篇文章提出了一个因果生成模型（A Causal Generative Model，CGM）框架。如图 2b 所示, 本质也是一个因果图模型，其基本假设前提仍然是因果原理的独立机制，即促成生成过程的因果机制相互之间无影响。因此，可以通过单独修改某些生成机制来研究直接干预神经网络模型的效果。具体到生成模型中，因果关系允许分析如果某些变量采用不同的值（称为「反事实值」,counterfactual），结果会如何改变，进而评估生成模型捕获因果机制的能力。CGM 框架如图 3 所示，其中，(a）给出生成映射和分离变换的图示，（b）为显示节点之间不同类型独立性的示例 CGM 的因果图，（c）为显示与分离变换 t 相关的潜在空间中的稀疏变换 t′的交换图，（d）为内在分离的图示。

图 3. CGM 框架

给定一个实现函数 g_M 的生成模型 M，该模型将潜空间 Z 映射到学习数据点所在的流形 y_M，嵌入到周围欧氏空间 Y 中。模型中的一个样本是通过从具有相互独立的分量、完全支持 z 的先前潜在变量分布中提取实现 z 来生成的。使用术语表示（representation）来指定从 y_M 到某个表示空间 R 的映射 r（也将 r（y）称为点 y∈y_M 的表示）。此外，假定 g_M 可逆，(g_M).^-1 为数据表示，记为潜在表示（latent representation）。假设生成模型是由一个非递归神经网络实现的，使用一个因果图形模型（即 SCM）来表示通过一系列操作实现映射 g_M 的计算图（因果语言中称为函数赋值, functional assignments）。除了潜在表示，还可以选择一组可能由因果图中的节点表示的多维内生（内部）变量（endogenous variables）(图 3b)，例如，映射 g_M 是由内生变量赋值 v_M 和内生映射 g_M 组成的：

这些变量的一个典型选择是在卷积神经网络的一个隐藏层中收集每个通道的输出激活图。对于潜在情况，使用了一些条件来保证 g_M 可逆的，进而定义了网络的内部表示。给定潜在变量和内生变量的典型维度选择，约束 V_k 的取值为比其欧氏周围空间 V_k 更小维度的子集 (V.^k)_M 中的值。

无监督独立：从统计原理到因果原理

经典的独立表征（disentangled representation）概念假设个体潜在变量「对现实世界的转变进行的稀疏编码」。虽然，所谓「现实世界的转变」这一概念是很难具象化的，但这种对统计概念不可知的洞察力，推动了有监督的方法实现分离表示，在这种方法中，相关的转变可以通过适当的数据集和训练程序得到明确的识别和操作。

相比之下，无监督的独立性表示学习则需要从未标记的数据中学习这种现实世界的转变。为了应对这一挑战，SOTA 方法试图通过个体潜在因素的变化来实现这种转换，并借助于一种分离的统计概念，在潜在因素之间实现条件独立。

通过操纵内部表示来实现独立

如图 3b 的 CGM 所示，与潜在变量相比，由于常见的延迟原因，由图形模型的内生变量编码的属性无法保证在统计上是独立的，但是仍然能够遵循独立性原则独立的干预数据。由图 3d 所示，其中分割节点表示在应用变换 T.^2 之前，在原始 CGM（3b）中计算 V2 的值。

发现深度模型中的模块性

我们不会详细介绍模型中的详细算法，但会简略介绍它的体系设计：模块性定义为能够实现任意独立转换的内部表示的结构属性。考虑一个标准的前向多层神经网络，选择「内生变量」作为给定层 L 的「通道」的所有输出激活的集合。令 E 为这些通道的子集，模块间杂交过程如图 4 所示。举两个潜在变量 z1 和 z2 的独立例子，它们将生成两个原始输出示例（y1，y2）=（gM(z1),gM(z2)）（称之为 Original1 和 Original2）。同时生成 Original2 时定义 v(z2) 收集由 E 索引的全部变量的值，以及 \tilde{v}（z1）表示在生成 Original 1 时由该层上所有其他内生变量获取的值的元组。假设选择模块化的结构\tilde{v}（z1）和 v（z2）将对其相应生成图像的不同方面进行编码，以便可以通过将层的输出值集合与特定元组分配来生成混合这些特征的混合示例，并将其发送至生成网络的下游部分。

图 4. 影响图的生成

衡量因果效应

其中 Y(z1) 是潜在输入 z1 生成的无干扰输出。绝对值内的差异可以解释为潜在结果框架中的单元级因果效应 (unit-level causal effect)，以及，求取这种期望近似于计算平均治疗效果（average treatment effect）。上式的输出 IM 与输出图像的尺寸相同时，通过颜色通道对其求取平均，从而得到一个灰度热图像素图。

模块和反事实图像的无监督检测

图 5 给出了一个在 CelebA 数据库上训练得到的 VAE 卷积层通道的表示 EIMs 示例，以及，图中通道实现了功能性的分级，例如一些影响更精细的面部特征（眼睛、嘴，…）和其他影响图像的背景或头发等等。这就说明，单个通道可以聚合形成模块，而这些模块对应于输出（人脸图像）的一个特定特征。

图 5. 生成影响图。VAE 在 CelebA 数据库上生成的影响图示例（颜色较浅的像素代表较大的方差，以及扰动对该像素的影响更大）

为了在无监督的情况下实现这种分组，使用 EIM 作为特征向量对通过进行聚类：首先对每个影响图进行预处理，方法是：（1）使用一个小的矩形滑动窗口进行算术平均，以在空间上平滑贴图；（2）在图像上的值分布的 75% 的百分位处对生成的贴图进行阈值化处理，以获得二值图像。在对图像进行降维后，得到一个（通道×像素）矩阵，然后用人工选择的秩 K 将其输入到一个非负矩阵分解（Non-negative Matrix Factorization，NMF）算法中，得到 S=WH。从得到的两个因子矩阵中，得到 K 聚类模板模式（通过根据图像维度重塑 H 的每一行得到），以及每一个模式对单个映射（在 W 中编码）贡献的权重表示。每个影响图都是一个基于模板模式的最大权重聚类。

实验分析

图 6. BigGAN 跨类杂交的示例。左：鸵鸟公鸡，右：考拉泰迪

论文地址：https://www.ijcai.org/Proceedings/2019/570

平衡因果表示学习

治疗效果 (treatment effect)，又称因果效应 (causal effect)，是指一个变量（即治疗）对另一个变量（即结果）的影响。如果对治疗进行干预，假设协变量不变（即这些协变量的条件），治疗效果被定义为结果的变化，其中协变量是与治疗和结果相关的变量或特征。在文本分析领域，大多数模型关注的是数值协变量，而如何处理具有文本信息的协变量来估计模型效果仍是一个悬而未决的问题。然而，在现实世界中，文本数据几乎无处不在，如临床治疗记录、电影评论、新闻、社交媒体帖子等。针对这一问题，这篇文章提出了一种基于条件治疗的对抗性学习匹配（conditional treatment-adversarial learning based matching，CTAM）方法。CTAM 融合了治疗对抗性学习，在学习表征时过滤掉与工具变量相关的信息，然后在学习表征之间进行匹配，以估计处理效果。

令 Z 和 Z’分别表示观察到的文本协变量 T 和非文本协变量 X 的潜在表示。在潜在表示中，Z’更接近工具变量，因此比结果 Y 更能预测治疗分配。任务目标是学习潜在的表征，过滤掉与仪器变量相关的信息。CTAM 的因果图表示为：

图 7. CTAM 因果图

CTAM 引入条件治疗对抗学习，以尽可能地消除潜在表征中与 Z’相关的信息。CTAM 框架的结构为：

图 8. CTAM 框架

CTAM 包含三个主要部分：文本处理、表示学习和条件处理鉴别器。通过文本处理组件，将原始文本转化为矢量化的表示 S，将 S 与非文本协变量 X 连接起来，构造一个统一的特征向量 C，然后将其输入到表示神经网络中，得到潜在表示 Z。在学习了表示之后，Z 和潜在结果 Y 一起被输入到条件治疗鉴别器中。在训练过程中，表示学习与条件治疗鉴别器进行极大极小博弈：通过阻止鉴别器进行正确的治疗，使表征学习过滤掉与结构变量相关的信息。

文本处理

文本处理过程将文本数据 T 转换为向量表示 S。这篇文章采用了 GloVe 单词嵌入方法 [6]，S 是一个文档中所有单词嵌入的平均值。

表示学习

条件处理鉴别器

条件处理鉴别器的输入是潜在表示 Z 和潜在结果 Y，输出是处理分配 W。判别条件只依赖于潜在表示 (latent representation) 的结果，这使得潜在表示只通过潜在的结果分布与治疗相关。也就是说，通过使用条件处理鉴别器，利用极大极小博弈，学习的潜在表示能够通过处理分配消除掉条件依赖。

条件处理鉴别器也是一种前馈神经网络 D，其目标是正确地预测治疗分配。条件处理鉴别器的损失用交叉熵来衡量：

由于此处的潜在结果仅适用于条件治疗鉴别器，而不是显示结果，因此将其命名为伪潜在结果。

条件治疗对抗性学习的目的是去除掉与近似工具变量有关的信息。近似工具变量指的是对治疗分配更具预测性的变量而不是结果，这种过滤策略相当于去除潜在表示和治疗分配之间的条件依赖。因此，通过训练一种对抗性学习模式来达到这一目标。鉴别器 D 执行极小极大博弈。鉴别器 D 一方面通过最小化上式给出正确的治疗；另一方面，向表示学习重新发送结果预测值进行训练，使上述损失最大化，过滤掉有利于鉴别器 D 的信息。当成功的「愚弄」了条件治疗鉴别器，就能够从潜在表示中消除掉增强治疗分配的信息，即，成功地过滤掉与结构变量相关的信息。

损失函数

CTAM 三层结构的完整损失函数为：

其中 L_D 为上文介绍的条件处理鉴别器的交叉熵损失，L_p 是群距离和伪结果预测损失之和：

L_p 中的第一项测量相同治疗下共享观察结果标签的记录之间的成对距离，第二项测量具有不同观察结果的记录之间的成对距离。最小化两项之间的差异会使得相似的记录彼此靠近，而使得表示空间中的不同记录彼此远离。第三项是伪结果预测损失，最小化它可以更好地预测条件治疗鉴别器的潜在结果。

模型训练

训练过程包括优化鉴别者、表示学习和伪结果预测者之间的极大极小博弈，可以看作：

以及三层更新过程为：

实验分析

表 2.News 新闻数据集中的实验结果

由表 2，CTAM 在 PEHE 和 E_ATE 指标下具有最好的性能，在 E_ATT 指标下性能与最佳基线方法 STM 相比类似。这一结果表明，条件治疗鉴别器能有效地滤除与近似工具变量有关的信息，从而减少治疗效果估计的偏差。

展望

现代机器学习的表示学习主要目标是学习到能够保持相关统计特性的数据表征。然而，这种做法没有考虑到变量的因果性质，也就是说，它不关心它分析或重建的变量的介入性质。本文介绍了 3 篇利用表征学习实现因果学习的目的，其中共同之处是如何在物理世界、有限的数据采集情况下，在表征中实现物理因果关系的特性分离（disentanglement）。这在数据有限，以及实验不能重复 (也就是 counterfactual）中尤其难办。为了解决这问题，第二三篇都采用了生成模型（generative model) 或者类似思想来在潜在空间「虚拟」一个独立的原因，而第一篇则着重利用了注意力机制来模拟大脑从上而下（top-down）的预测过程。总体来说，引入因果关系，将能够把表示学习提升到更高的层次：超越统计依赖结构的表征，向支持干预、规划和推理的模型迈进，实现康拉德·洛伦兹（Konrad Lorenz）的想象空间思维概念（thinking as acting in an imagined space）。这最终要求机器有能力反省自己的行为和设想其他的情况，即需要（幻想）自由意志。自我意志的生物学功能可能与在洛伦兹想象的空间中需要一个代表自己的变量有关，自由意志则可能是一种交流该变量所采取行动的手段，对社会和文化学习至关重要，虽然它是人类智能的核心，但目前，机器学习还无法真正的实现。本篇文章结合最新的研究成果分析了向已有的表示学习方法/模型中引入因果机制的效果，但实际上最困难的问题尚未得到解决，关于这一领域的基础性分析有待更深入的研究。

感谢参考原文-http://bjbsair.com/2020-04-01/tech-info/18556.html

本文精选了几篇因果表示学习领域的最新文献，并细致分析了不同方法的基本架构，希望能帮助感兴趣的你对因果学习应用于机器学习的方向和可能一探究竟。

提取模块化结构（Learning modular structures）

论文地址：https://arxiv.org/pdf/1909.10893.pdf

图 1. RIM 架构

首先，对于未激活的 RIM（激活组为 St），其隐藏状态保持不变：

注意力机制

自上而下的框架

时间 t 的输入值 x_t 被视为一组元素，结构为一个矩阵的行（对于图像数据，它可以是 CNN 的输出）。首先连接生成一个全零行向量，以获得：

RIM 之间的交互

实验分析

表 1. 序列 MNIST 分辨率任务的实验结果

图 2. 预测弹跳球的运动

反事实推理（Counterfactual）

论文地址：https://arxiv.org/pdf/1812.03253.pdf

图 3. CGM 框架

无监督独立：从统计原理到因果原理

通过操纵内部表示来实现独立

发现深度模型中的模块性

图 4. 影响图的生成

衡量因果效应

模块和反事实图像的无监督检测

图 5. 生成影响图。VAE 在 CelebA 数据库上生成的影响图示例（颜色较浅的像素代表较大的方差，以及扰动对该像素的影响更大）

实验分析

图 6. BigGAN 跨类杂交的示例。左：鸵鸟公鸡，右：考拉泰迪

论文地址：https://www.ijcai.org/Proceedings/2019/570

平衡因果表示学习

图 7. CTAM 因果图

CTAM 引入条件治疗对抗学习，以尽可能地消除潜在表征中与 Z’相关的信息。CTAM 框架的结构为：

图 8. CTAM 框架

文本处理

文本处理过程将文本数据 T 转换为向量表示 S。这篇文章采用了 GloVe 单词嵌入方法 [6]，S 是一个文档中所有单词嵌入的平均值。

表示学习

条件处理鉴别器

条件处理鉴别器也是一种前馈神经网络 D，其目标是正确地预测治疗分配。条件处理鉴别器的损失用交叉熵来衡量：

由于此处的潜在结果仅适用于条件治疗鉴别器，而不是显示结果，因此将其命名为伪潜在结果。

损失函数

CTAM 三层结构的完整损失函数为：

其中 L_D 为上文介绍的条件处理鉴别器的交叉熵损失，L_p 是群距离和伪结果预测损失之和：

模型训练

训练过程包括优化鉴别者、表示学习和伪结果预测者之间的极大极小博弈，可以看作：

以及三层更新过程为：

实验分析

表 2.News 新闻数据集中的实验结果

展望

你可能感兴趣的:(反事实推理,特征分离,「因果表示学习」的最新研究都在讲何)

微信小程序和uni-app的区别 cccv工程师微信小程序 uni-app notepad++
开发语言和框架：Uni-app：Uni-app使用Vue.js框架进行开发，利用Vue的语法和生命周期函数，开发者可以使用熟悉的前端技术栈。微信小程序：微信小程序使用自己的框架，基于WXML（类似于HTML）和WXSS（样式语言）进行开发，需要学习微信小程序独有的语法和组件。平台支持：Uni-app：Uni-app是一个跨平台开发框架，可以将一套代码编译成多个平台的应用，包括微信小程序、H5、Ap
吊打面试官之 HTTP 协议的前世今生 ~Maple~ 计算机网络 http 网络协议网络
1、HTTP的基本概念HTTP是超文本传输协议（HyperTextTransferProtocol），下面具体解释一下：协议：HTTP是一个用在计算机世界里的协议，它使用计算机能够理解的语言确立了一种计算机之间交流通信的方式（两个及以上的参与者），以及相关的各种控制和错误处理方式（行为约定和规范）。传输：HTTP是一个双向协议，比如A浏览器访问B服务器，使用HTTP协议来通信，数据就在A和B之间传
AI程序员大逃杀：从“码农”到“魔法师”的奇幻漂流 ——揭秘人工智能如何重塑程序员工作流 lifire_H 人工智能
当程序员遇上AI，是“饭碗不保”还是“原地飞升”？这场代码界的工业革命，正在让每个程序员经历从“流水线工人”到“科技魔法师”的奇幻蜕变。一、效率革命：当键盘遇上“读心术”1.需求分析：从“鸡同鸭讲”到“灵魂共鸣”还记得那些年被客户需求文档支配的恐惧吗？甲方爸爸一句“我想要五彩斑斓的黑”，就能让产品经理和程序员集体崩溃。现在，AI就像个自带翻译机的“需求捕手”——把客户支离破碎的诉求往WPSAI里一
啸叫抑制（AFS）从算法仿真到工程源码实现-第一节-效果演示 aflyingwolf_pomelo 语音信号处理算法人工智能
一、概述啸叫抑制算法也叫声反馈抑制，本专题我们讨论啸叫抑制算法的平台搭建，算法仿真和设备端的工程落地实现。完整记录一个扩声系统的搭建。更多资料和代码可以进入https://t.zsxq.com/qgmoN，同时欢迎大家提出宝贵的建议，以共同探讨学习。二、啸叫抑制算法视频演示啸叫抑制算法演示视频三、语谱图3.1产生啸叫效果3.2去啸叫后的效果四、总结这一节我们主要记录了啸叫抑制（去啸叫）算法的效果演
前端高级 CSS 用法实战指南 Real Man★ 前端 css
前端高级CSS用法实战指南CSS的高级用法能显著提升开发效率、优化页面性能并实现复杂的视觉效果。以下是现代CSS的核心高级技巧和实战案例，涵盖布局、动画、优化等方向：一、现代布局系统CSSGrid复杂布局场景：实现不规则网格（如杂志排版、仪表盘）。示例：定义网格模板与区域命名：css.container{display:grid;grid-template-columns:200px1fr300p
Python 学习第五册深度学习第1章什么是深度学习 weixin_38135241 python 学习深度学习人工智能
----用教授的方式学习。目录1.1人工智能、机器学习与深度学习1.1.1人工智能1.1.2机器学习1.1.3从数据中学习表示1.1.4深度学习之“深度”1.1.5用三张图理解深度学习的工作原理1.2深度学习之前：机器学习简史1.2.1概率建模1.2.2核方法1.2.3决策树、随机森林与梯度提升机1.2.4深度学习有何不同什么是深度学习？1.1人工智能、机器学习与深度学习三者关系：1.1.1人工智
axios 不带cookie,不接收带有axios发布请求的Set-Cookie标头 ze ran axios 不带cookie
IhaveaPHPScriptwhichsuccessfullyreturnssomesimpleHeadersaswellasaset-cookieheaderifcalleddirectlyinthebrowser(orbypostman).Icanreadtheresponse-headerslikethatfromchromedevTools.ButassoonasIcallitbyAxi
当细致剪裁遇上大语言模型：从数据匹配到卓越性能的奇幻之旅步子哥 AGI通用人工智能语言模型人工智能自然语言处理
在浩如烟海的人工智能技术中，构建和调教大语言模型（LLMs）的过程就像是一场精心策划的奇幻冒险。本文带您走进一个鲜为人知的领域——如何利用“量身定制”的数据，让模型在知识的海洋中游刃有余。我们将透过一篇最新的研究《TheBestInstruction-TuningDataareThoseThatFit》，探索如何通过选择与目标模型分布高度契合的数据来优化监督式微调（SFT）的效果，以及这一方法如何
MySQL 奇幻之旅：从基础探秘到高级应用魔法进阶的华夫饼进大厂 mysql 数据库
MySQL奇幻之旅：从基础探秘到高级应用魔法在数据库的神秘世界里，MySQL宛如一座蕴藏无尽宝藏的城堡，我怀揣着探索的热情与求知的渴望，踏上了这趟扣人心弦的学习征程。一、MySQL基础：城堡基石的雕琢（一）数据库与表的操作：构建数据的栖息之所数据库创建与管理：绘制数据城堡的蓝图：犹如精心绘制城堡的设计图，我熟练掌握了使用CREATEDATABASE语句创建数据库的魔法咒语，像CREATEDATAB
Linux_C编程—信号处理函数的返回 Aspirant-GQ Linux Linux 信号处理函数信号处理返回
文章目录信号处理函数执行完怎么办setjmp()/longjmp()sigsetjmp()/siglongjmp()信号处理函数执行完怎么办一般来讲，信号处理函数执行完毕都会正常返回，也可以调用其他函数返回到程序的主函数中。这里总结一下信号处理函数执行完毕后跳转到主函数中指定的位置的操作（有点类似goto语句，但goto不支持函数间的跳转，只能在一个函数中跳转），主要是通过俩对函数来实现的：set
WPF 属性值设置优先级详解她说彩礼65万 WPF wpf
在WPF中，依赖属性（DependencyProperty）的值可以通过多种方式设置，每种方式都有其特定的优先级。理解这些优先级对于正确地管理和预期控件的行为至关重要。以下是WPF中依赖属性值的优先级列表，从高到低排列：1.属性系统强制值这包括动画正在运行时的值、强制值等。动画是改变属性值的一种强大方式，当一个属性正在被动画影响时，动画设定的值将具有最高优先级。2.本地值直接在控件上设置的值，例如
解决后端的set-cookie无法写入浏览器的问题 yudaleng 前端 json javascript 后端 springboot
前言:最近做项目，遇到了set-cookie无法写入的问题。一开始以为是浏览器安全设置的问题导致无法写入cookie，后面发现并不是。在网上翻阅了许多文章，终于定位到了问题。写这篇文章用于记录一下，以免以后忘了。后端：1.后端需要配置好跨域2.响应头必须包含httpServletResponse.setHeader("Access-Control-Allow-Credentials","true"
HTTP Cookie header 中set-cookie格式 qq_35577990 fiddler selenium
Cookie相关的Http头有两个Http头部和Cookie有关：Set-Cookie和Cookie。Set-Cookie由服务器发送，它包含在响应请求的头部中。它用于在客户端创建一个CookieCookie头由客户端发送，包含在HTTP请求的头部中。注意，只有cookie的domain和path与请求的URL匹配才会发送这个cookie。Set-CookieHeaderSet-Cookie响应头
JavaScript闭包+函数内部的this指向落日九号 javascript
关于闭包，什么是闭包？闭包就是能够读取其他函数内部变量的函数。如果我们把闭包改称做闭包函数这样理解起来可能更容易一些。闭包就是能够读取其他函数内部变量的函数。例如在javascript中，只有函数内部的子函数才能读取局部变量，所以闭包可以理解成“定义在一个函数内部的函数“。在本质上，闭包是将函数内部和函数外部连接起来的桥梁。真正的定义闭包————英文连接闭包————中文连接Aclosure
基于Redis geo地理位置的物流路线规划系统实现方案 xiyubaby.17 缓存 redis
物流路线规划系统实现方案一、系统架构图数据存储层数据处理层业务服务层客户端RedisGEOPostgreSQL图数据库地理编码服务实时交通处理路线优化引擎距离计算服务路径规划服务订单管理服务物流管理系统司机APP客户门户客户端API网关业务服务层数据处理层数据存储层二、核心模块实现1.地理模型定义publicclassLocation{privateStringid;privateStringad
如何使用API接口对接电商系统？ API小爬虫 python 爬虫 java
在当今的电商时代，API接口成为了不同系统之间数据交互的重要桥梁。无论是大型电商平台还是小型电商创业公司，通过API接口实现数据的无缝对接，可以大大提高运营效率，优化用户体验。本文将详细介绍如何使用API接口对接电商系统，并提供具体的代码示例。一、了解API对接的基本概念1.1什么是API？API（应用程序编程接口）是一套预定义的规则和协议，用于构建和交互软件应用程序。通过API，不同的应用程序可
Linux：信号处理原理与实现「已注销」 linux 运维服务器
什么是信号信号本质上是在软件层次上对中断机制的一种模拟，其主要有以下几种来源：程序错误：除零，非法内存访问等。外部信号：终端Ctrl-C产生SGINT信号，定时器到期产生SIGALRM等。显式请求：kill函数允许进程发送任何信号给其他进程或进程组。目前Linux支持64种信号。信号分为非实时信号(不可靠信号)和实时信号(可靠信号)两种类型，对应于Linux的信号值为1-31和34-64。信号是异
操作系统——windows 时间海里的溺水者 windows
1.操作系统的介绍操作系统（OperatingSystem，简称OS）是管理和控制计算机硬件与软件资源的计算机程序，是直接运行在“裸机”上的最基本的系统软件，任何其他软件都必须在操作系统的支持下才能运行。2.操作系统的分类（主流操作系统）2.1.Windows简介：Windows是微软公司研发的操作系统，自1985年推出以来，已成为全球应用广泛的操作系统。Windows采用了图形用户界面，提升了系
总结Solidity 的数据类型一蓑烟雨，一任平生 web3 Solidity web3.0
数据类型在Solidity中，类型系统非常丰富，主要分为值类型（ValueTypes）和引用类型（ReferenceTypes）。此外，还有一些特殊类型和全局变量。一.值类型布尔型（bool）boolisActive=true;二.整数型（int/uint）int：带符号整数（可以是负数），uint：无符号整数（只能是非负数）指定位宽：int8到int256（步长为8位），默认int等于int25
vue-charts的使用，导入，配置，及常见错误一蓑烟雨，一任平生 vue3 vue.js echarts javascript
vue-charts作用：在使用echarts生成图表时，经常需要做繁琐的数据类型转化、修改复杂的配置项，v-charts的出现正是为了解决这个痛点。基于Vue2.0和echarts封装的v-charts图表组件，只需要统一提供一种对前后端都友好的数据格式设置简单的配置项，便可轻松生成常见的图表。第一步:下载npmiv-chartsecharts-S第二部:导入同时配置import{CanvasR
RocketMQ新消费者加入后的队列一致性保障机制详解慢德分布式设计 rocketmq
RocketMQ新消费者加入后的队列一致性保障机制详解RocketMQ作为一个高性能的分布式消息中间件，其消费者负载均衡机制是保障系统可扩展性和稳定性的关键。当新消费者加入消费组时，如何保证各个消费者之间的队列分配一致性是一个核心问题。下面将深入解析其详细原理和运作机制。消费模式与队列分配基础首先需要明确的是，在RocketMQ中，队列一致性问题主要出现在集群消费模式下。在这种模式中，一条消息只会
【HTTP 协议的前世今生】HTTP 1.0、HTTP 1.1 和 HTTP 2.0 春日安然 WEB 前端 http 网络服务器
本篇博客将从HTTP协议的概念出发，分别介绍HTTP协议各个版本的特点，以及对HTTP协议状态码和HTTPS协议进行说明。首先，我们先来了解下HTTP协议的概念。什么是HTTP协议HTTP协议的全称为HyperTextTransferProtocol（超文本传输协议)，是互联网上应用最为广泛的、构建在TCP协议之上的应用层协议。它用于客户端与服务器之间的通信，规定了客户端和服务器之间的通信格式，包
旧衣回收小程序开发，企业的双赢选择冠品网络科技小程序开发软件开发旧衣回收回收小程序
随着全球环保意识的提升和可持续发展理念的普及，越来越多的人开始关注衣物的可持续利用，旧衣回收市场逐渐成为一个备受关注的领域。旧衣回收不仅有助于减少资源浪费和环境污染，还为企业和商家带来了新的商业机会。目前，在数字化的趋势下，旧衣回收小程序作为便捷的回收方式，正在成为企业布局和人们回收的重要工具。1、解决传统回收模式的痛点传统的旧衣回收模式存在众多局限问题，例如回收点分散、回收流程繁琐、用户参与度低
健身房预约小程序开发，开启智能健身时代冠品网络科技小程序开发小程序小程序制作健身房预约小程序健身房预约系统
在移动互联网时代，人们的生活习惯发生了巨大改变，促使行业都在寻求数字化转型，线下健身房也不例外。传统的线下健身房预约方式已经不能满足用户的需求，数字化预约方式能够带来便捷、高效的体验，不仅可以提升用户体验，还可以为健身行业带来新的发展机遇。健身房预约系统带来的优势1、便捷预约用户无需拨打电话或到店咨询，只需通过小程序即可随时随地查看课程安排、教练信息、场馆情况等，并完成预约，提高了场馆的转化率。2
中频信号解析：瞬时相位信息的原理与应用小驴技术站 FPGA信号处理信号处理 matlab fpga开发
中频信号解析：瞬时相位信息的原理与应用引言在雷达信号处理（图1）、数字通信系统等工程领域，瞬时相位作为信号时频分析的核心参数，承载着调制信息解调、目标特征提取等关键功能。本文将从数学原理、信号处理价值、典型应用三个维度深入剖析瞬时相位的本质。发射机混频器本振信号中频信号ADC采样数字信号处理一、瞬时相位的基本概念瞬时相位是描述信号在某一时刻相位状态的重要参数，反映了信号在时间-频率域中的动态特性。
Nginx源码剖析--ngx_http_optimize_servers函数分析 gswen Nginx nginx 源码函数
前言本章将继续介绍HTTP模块初始化函数：ngx_http_block中的内容。将会涉及到server块的组织，监听端口的管理，以及ip地址和server块之间的组织关系。下面我们将从listen关键字说起，然后根据listen配置项以及它的解析函数了解nginx组织server块和监听端口的过程。最后在介绍ngx_http_optimize_servers函数。所有这些工作都是为了实现Nginx
解锁云原生后端开发新姿势：腾讯云大模型API深度整合实战 Loving_enjoy 实用技巧腾讯云
在云原生与AI技术深度融合的今天，如何将大模型能力无缝嵌入后端架构，已成为开发者构建下一代智能应用的核心命题。本文将深入解析腾讯云大模型API（如DeepSeek-R1/V3、混元大模型）与云原生技术的创新结合方案，通过架构设计、实战案例与高阶技巧，揭示一条从0到1构建AI增强型服务的完整路径。---##一、云原生与大模型的融合新范式###1.1技术趋势的双向奔赴云原生后端的核心优势在于弹性扩展、
百度2026届暑期实习生招聘内推开始啦，快来投递你心仪的职位吧 flying jiang 团队建设 java
百度2026届暑期实习生招聘内推开始啦，快来投递你心仪的职位吧（网申链接地址：https://dwz.cn/P2FZhMvx）点击链接自动填入内推码，get内推绿色通道~我的内推码：IZB4S3
Charles抓包神器全方位指南-从设置到会话捕获 2501_91093988 http udp https websocket 网络安全网络协议 tcp/ip
如何设置显示Request和Response大家好，我是watchpoints。别想太多，只管提问，所有问题，都会有答案。watchpoints既是我的GitHub用户名，也是我的微信用户名。如果我对某些内容的解释不够清楚，欢迎大家随时提问。现在，让我们来解答一个常见的问题：如何设置显示Request和Response？这个问题的答案其实就在Charles的设置中。无论是从官网下载的Charles
第十三届蓝桥杯大赛软件赛省赛 C/C++ 大学 B 组C题刷题统计我是小趴菜一枚算法蓝桥杯 c++c语言
问题描述小明决定从下周一开始努力刷题准备蓝桥杯竞赛。他计划周一至周五每天做aa道题目,周六和周日每天做bb道题目。请你帮小明计算,按照计划他将在第几天实现做题数大于等于nn题?输入格式输入一行包含三个整数a,ba,b和nn.输出格式输出一个整数代表天数。样例输入102099样例输出8评测用例规模与约定对于50%50%的评测用例,1≤a,b,n≤1061≤a,b,n≤106.对于100%100%的评
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To [email protected]:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to '[email protected]
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。