喜欢打酱油的老鸟

【深度学习】图网络——悄然兴起的深度学习新浪潮

https://mp.weixin.qq.com/s/mOZDN9u7YCdtYs6DbUml0Q

现实世界中的大量问题都可以抽象成图模型（Graph Model），也就是节点和连边的集合。从知识图谱到概率图模型，从蛋白质相互作用网络到社交网络，从基本的逻辑线路到巨大的Internet，图与网络无处不在。然而传统的机器学习方法很难处理图网络信息，这种缺陷大大限制了深度学习的应用领域。于是人们提出了图网络（Graph Network），一种基于图结构的广义人工神经网络，它可以直接对真实问题进行建模，又可以利用自动微分技术进行学习，甚至有望将多个传统人工智能领域进行融合。

本次AI&Society活动邀请了北京师范大学教授、集智俱乐部创始人张江及彩云科技首席科学家肖达对图网络的原理、应用领域，以及图网络近期两个火热的子领域

——关系推理和自注意力进行了分享。

本文是对张江老师和肖达老师演讲的回顾，扫描海报中的二维码即可观看录播。PC端也可以输入网站链接进行观看：

http://campus.swarma.org/gpac=381。

张江：Graph Network and Beyond

深度学习中，什么是最重要的？

我们知道，深度学习已经在很多领域都有成功的应用，比如图像，语音等，那么在深度学习中最本质的因素是什么呢？

实际上，我们可以这样理解：在以前，人类的知识被我们通过编程写成程序，处理问题。而现在，我们将人类的知识编码到神经网络中，它们变成了隐藏于网络结构、节点和大量数据中的信息。

从更深层次来看，我们可以将神经网络认为是一种可微分的编程，例如深度神经网络可以用背后的计算图机制作为支撑，进行反向传播。实际上，我们将符号计算与数值计算在神经网络优化过程中进行了融合。所以我们可以进行求导，求微分的操作。那么这就意味着，深度学习可以被应用于任何可微分的领域，甚至我们可以畅想：在未来，所有的可微分的事物都是可学习的。

深度学习的广泛应用

深度学习是怎么“玩”起来的？

让我们来回顾深度学习的运转过程：人类设置一个架构，为机器设置一个评价标准，接下来就可以让神经网络自动去学习，完成这个优化目标。

例如，图像中具有大量的平移和旋转不变性，而人类设置了卷积神经网络这种可提取多层次信息的架构，很好地将图像中的深层次信息学出来。对时间序列，我们也可以设计RNN的架构（及其变体）来学习到时间序列中的隐藏信息。当然，我们还有类似于Attention机制等更先进的架构去关注数据中的关联关系，又或者Deepmind推出的“可微分计算机”——它与冯诺伊曼的计算机体系完全不同，这可以让我们去学习整个冯诺伊曼的计算机体系。

图网络

当我们放眼大千世界事，我们会发现图像、语音、语言数据很规则，很方便处理，但很少。更多的情况下，我们有大量的非欧式的图网络数据，例如社交网络、脑影响网络等。能否对图网络进行处理呢？答案是显然的。

可微分计算机

在这篇最近非常火热的综述文章：relational inductive biases, deep learning, and graph networks 中，已经提到了一种框架将深度学习与贝叶斯网络进行了融合，其结果是产生了一种具有推理能力的概率图模型。但不仅如此，他们还提出了更多思路去结合深度学习与图网络，指明了在图网络领域应用深度学习的清晰方向。

在图网络中，有很多例子可以完成对现实世界的抽象。什么是图网络呢？本质上，它是对神经网络的扩充，我们知道，神经网络的结构很特殊，而他的学习方式也通过反向传播进行连边上的权重调整。而图网络则可以从多个角度对神经网络进行扩充，具体而言，任何一个图网络都包含节点、连边、全局信息这样三个大的信息单元，每个单元都可以被表征为一个向量。相比于深度学习只能更新权重，图网络的学习发生于每一个环节上，包括对连边状态的更新、节点状态的更新和全局信息的更新。在做完前馈运算之后，它也会进行反向传播学习，因为它的每一步计算都是可微分的。

我们可以这样理解图网络的学习能力：图网络将前馈的思路放在了每一个环节，连边、节点、全局信息就都可以在反馈过程中被调整，这就使得网络的整体架构变得可学习。

网络的节点、连边和全局信息

前文论文中提到的所谓的inductive bias，指的是人类对世界的先验知识，对应在网络中就是网络结构。图网络中的网络结构是固定不变的，我们可以将其理解为工程师放进去的一种先验的“偏见”，如果工程师认为A事件导致B事件发生，那么他就会在A、B之间放上一条连边，这就体现了A、B之间的因果关系，我们称之为推理能力。

图网络可以做什么？

例如我们将机械狗作为一个物理上的多体框架放在图网络上进行处理，首先，图网络可以将机械狗的每个机械结构作为一个实体，机械结构之间由关节相连，关节就可以被看做连边，而节点和连边之上都是带有信息的，这样我们就获得了一份图网络数据。每个节点上都可以有一组向量，而机械狗的运动就可以由所有的节点向量和连边向量来表示。当然，我们也可以加入更多的全局信息，例如从宏观状态上观察到的机械狗的运动信息等等。

用图网络表示机械狗

因此，我们对机械狗从各个角度进行了可微分描述，也建立了表示这些信息的图网络，接下来我们就可以学习机械狗的运动模式了。

怎样进行更高层的信息整合呢？在基本的图网络构建完成之后，我们可以在高层次对信息进行处理来完成更复杂的任务。例如，我们可以将多个图网络叠加在一起（每一个图网络都是同构的，但它们表征的信息并不同），这样我们就可以构建出多层的图网络，从而拟合复杂的运算过程。我们也可以将不同时间的图网络状态放入RNN架构中，从而完成对网络状态的预测，甚至我们可以将网络的输出作为自己的输入，进行后续状态的预测和生成。

图网络的高层信息整合

除了物理系统，我们也完全可以将这一套原理放在更宏观的架构之下，例如，我们可以用这一种框架去学习网络上的动力学过程，例如在社交网络上，每个人都是节点，而人们在社交网络上的观点是怎样传播的？在交通流中，交通信息（堵车程度，车速信息等）又该怎样传播？这一类问题都可以通过图网络来解决。

图卷积

为了能够更好的整合图网络信息，我们可以对图网络进行卷积操作，具体来说，我们可以应用图信号处理领域知识，对图数据进行傅立叶变换，将卷积的定义扩展到图数据上。最终，我们可以通过图网络上的简单矩阵相乘和线性映射来表示图卷积，从而对每一组向量的信息进行深层次提取。

对图网络进行卷积之后，我们很意外的发现，图网络竟然在完全随机化的初始条件下，完成了在表征空间下的标签聚类。实际上，这正是因为图卷积操作就是在捕获图网络上的邻域信息，而邻域信息也被包含于节点和连边的数值中。在经过非线性映射之后，我们可以将其理解为对各种特征进行强化和分散处理，使特征更为明显，从而更好地完成聚类。

使用图网络进行聚类

除此之外，我们还可以通过半监督学习来预测节点信息：通过已知节点的信息和图卷积方法运行图网络，标签信息就会在图数据上扩散，然后我们再用已知节点作为监督信息去调节，这就让整个网络上都拥有了标签信息，其准确度是非常高的，有些甚至可以超过80%。

此外，我们自己的研究组还做了网络上的SIR模型（传染病模型），这个模型的运作规律是：每个人有健康、染病和恢复三个状态，在每个时间步中，每个人都有一定的概率被他的邻居感染，被感染者也有一定的概率恢复健康。

图网络在SIR模型上的应用

在SIR的过程中，我们可以使用图网络进行学习，用当前时刻的状态去预测下一时刻的状态，其预测效果是非常好的。更有意思的是，我们可以用已知节点的信息去预测未知节点的信息，在网络结构状态已知，部分节点状态未知的情况下，所有的节点信息都可以被比较准确地恢复。

图网络上的注意力

除了卷积之外，图网络上的注意力也是一个有趣的研究方向，我们知道注意力机制现在已经被应用于图像、语言信息的处理中，现在注意力机制也被应用于图网络数据的处理中来。

在图卷积网络中，我们可以将注意力结构内嵌其中，在每次更新节点信息时，我们需要计算出网络的注意力、注意力表示节点和节点之间的关系权重，我们可以将其理解为每个节点在进行更新的过程中更应该关注谁，谁对这个节点来说更重要。

使用图网络进行融合推理

我们知道，贝叶斯网本身表示了随机变量间的因果关系。通常情况下，贝叶斯网络的图结构需要被人为建立，并且给出节点和连边的概率分布。在深度学习出现之前，我们用隐马尔可夫过程去完成语音的学习，我们会使用到信念传播算法。但现在我们可以从新的角度去学习：将节点和连边映射为图网络，在图网络上进一步学习节点和连边的关系的运算。

贝叶斯网络之父Judea Pearl和他的贝叶斯网络

如果图结构以及他们每个节点和连边上的概率分布都是可学习的，那么只要有部分节点的数据观测信息，我们就可以推测出整个网络的观测信息，而且这是很有可能做到的。仔细看来，这个过程很有可能蕴藏着远比其看起来更深刻的意义：

具体而言，现在的技术可以做到对不可微分领域的学习，这与传统的深度学习非常不同，我们不需要结构是可微分的，这就大大拓展了深度学习的可应用范围。怎样连接不可微的部分呢？我们可以通过Policy Gradient算法完成这样的连接。例如，我们有一个复杂的神经网络，在最后一步我们需要按照概率做一个选择，而概率选择会将梯度信息的中断。而Policy Gradient则可以通过概率期望替代评价函数，并非每次都获得回报，而是通过多次采样的期望收益进行反向传播。这就使得离散的选择变成了可传递梯度的架构。

使用Policy Gradient连接中断的梯度信息

Policy Gradient模型也是有一些弱点的：他们很难优化和收敛。除Policy Gradient之外，最近也有一种新兴技术：Gumbel Softmax，他们会在选择的过程中加入Gumbel分布的随机数，导致可以获得梯度不断的概率分布信息，最终的梯度就可以被反向传播回来。这就使得我们可以在经典的Softmax操作上加入Gumbel随机数，并通过参数调节，使得梯度并不中断，从而连接中断的微分操作。

总之，现在的深度学习领域也可以被扩大到任何数据结构上，而且在更多的结构上，人们都已经有方法去解决可微分、可传递梯度的问题，此外，我们还可以看到，现在的图网络应用已经扩展到各种领域，很多原本各自平行发展的架构，现在都已经可以通过图网络进行融合，人们将原来的先验信息和图网络深度学习方法进行融合，这使得“任何事物都是可学习的”变成了可能。

肖达：From Relational Reasoning to Memory and Attention

什么是关系推理问题：

我们可以通过几个例子直接感受关系推理是什么：

在1917年，认知心理学家做了一个实验，给一只母鸡两个颜色纸（浅色和深色），其中浅色放上稻谷，深色不放稻谷，经过训练，母鸡可以正确的选择浅色的纸。接下来，我们将深色的纸变为白色。这时母鸡竟然会选择白色，而不是有稻谷的浅色。

其中的一种解释是，母鸡会学了纸的颜色与是否有稻谷的抽象关系：浅色有稻谷，而深色没有稻谷，白色是最浅的颜色，所以母鸡会选择白色：

小鸡的“关系推理”

在人类的例子中，我们可以进行更复杂的推理。例如Bob比Tom高，Tom比Peter高，那么我们可以自然地计算出，Tom比Peter高。这个推理虽然并不复杂，但需要人类理解其中的抽象关系，才能够正确地完成推理过程（实际上，通常只有三四岁以上的小朋友才会逐步具备这种能力）：

用关系推理来理解谁更高

在语言学习的领域，研究发现孩子在学习语言的时候，具体的实体将会最早地被学习到（例如苹果，桌椅），而关系（例如叔叔）则会被稍晚学习到，而更复杂的if、otherwise等关系则要等到八岁才能够被正确地学习和应用。

在科学发现中，很多科研成果也是通过类似的类比推理的方法获得而来。卢瑟福认为原子和电子有吸引和旋转的关系——就像星星和太阳一样，他将太阳和星星的关系映射到原子核和原子上，这种映射我们称之为保结构映射。更具体来看，太阳和星星之间有这吸引关系，这种关系的推理也被映射到原子和电子中去——这意味着我们不但映射了位置关系，还映射了关于关系的关系（引力关系解释了位置关系）。

自然语言处理中的关系推理

在自然语言理解中，指代消解是一个很有趣的挑战，也是最能体现关系推理能力的场景之一，如图，其中的it到底指的是什么？这对于人类来说不难回答，但现有的深度学习结构并不能很好地处理其中的问题：

自然语言中的指代消解

而在关系推理的难题：智力测验中，我们会需要完成大量的规律、关系的探索和发现，如图：

复杂的关系推理问题

这个问题的做法是：从纵向来看，每一个方框都要比上一个方框中的五角星多一个，所以答案是A，可以看到，这个过程需要大量的关系推理，即使是人类完成这个问题也并不容易。

当前，我们已经通过深度学习在图像、语音等领域取得了很好的成就，但符号推理领域还尚未被攻克。在这两个领域之间很可能就是关系推理，到现在为止，人们对关系推理的尝试还没有取得具有大量突破性的进展。而今天分享的图网络算法是很有可能帮助我们在这个领域取得一些突破。

Memory & Attention

在翻译领域中，传统的编码-解码模型会用LSTM对句子进行编码和翻译。加入了Attention机制之后，每次生成一个目标语言的单词的时候，Attention机制都会关注到原文中的哪个位置更为重要，这就是Attention机制的原理。所以，我们也可以将Attention机制看做从Memory中的读操作。

通过Attention机制，我们可以解决很多实际问题，例如在描述大量实体状态的复杂问答过程中，我们可以通过Attention机制去关注到一个问题的多个对应答案，经过多次运算（也可以被称之为多步推理）之后，就可以将每一步需要关注的东西学到，从而找到最关键的答案。

使用Attention机制进行多步推理

在上图中：Attention机制在不同的循环步数中关注到了John的动作和位置信息，从而给出了正确答案。

Relation Network

什么是Relation Network呢，在传统的网络中，我们可以直接通过全连接网络对输入进行映射并输出。当然，我们也可以加上一些先验知识，对每个实体单独进行映射，然后在进行全连接的运算。更进一步，如果我们认为实体之间两两是有关系的，那么我们可以将实体的两两之间组成一个联结对，然后再分别进行映射，这个映射过程就是在检验实体之间的关系是否存在，并试图量化实体之间的关系。

具体而言，Relation Network可以被应用于很多地方，例如用图片回答问题：

Relation Network

在这个问题中，我们可以让Relation Network去将任意两个Object两两组合，形成联结对，再与问题的编码相结合，通过线性映射形成对问题和答案的表示，最终再映射为对问题的解答。选择问题答案的时候，我们同样可以将每个答案和问题去拼接，通过是否有关的映射之后再映射为最终答案。

回到前文中的智商测验的问题上，如果我们把智商检测问题交给机器处理，我们发现如果用CNN或者ResNet去处理的话，其效果并不如使用Relation Network进行处理达到的效果更优。Relation Network的处理该问题的核心原理是：把每个图片作为一个实体，将图片和备选答案也作为实体与剩下的给定图片进行组合，则可以一个比较大的概率发现其中的隐藏关系。

总体而言，一般的图网络的结构具有连边的更新、节点的更新和全局状态的更新这三步。在relation network中，我们对问题进行了化简：节点更新被丢弃，我们将直接进行连边更新和全局更新，其优点是结构相对简单，尤其是可以被模块化和插装。（如果将模块加入到CNN网络中，CNN网络也就可以拥有推理能力）但他也有一个缺点：由于任意实体之间都要建立联结对，所以其计算复杂度是很高的。

Self-Attention

self attention最早被应用于翻译领域，我们可以将其理解为类似于卷积的一种结构。对于卷积来说，我们会首先定义窗口大小，然后对窗口内的向量进行卷积操作。而self attention可以将这个过程变为动态的，我们可以认为她可以从任何位置抓取信息用于运算，而具体抓取信息的位置就是Attention 机制学习得到的。

因此，Self attention可以突破窗口大小的限制，完成很多长程连接上的信息提取，例如可以用self attention解决前文提到的指代消解问题：在self attention结构进行运算时，我们可以看到it在不同的语境下，关注到了不同的实体。

使用self attention解决指代消解问题

Transformer模型

Transformer模型是一个内嵌了self attention模型的网络架构，其目的是做出可以解决大量语言中的问题的通用模型。Transformer是怎样运作的呢？

假设一句话中有六个词，分别被称为X0，X1...X5。self attention需要在这六个词语之间建立联系，首先，每个词语将通过线性映射被映射为一个我们称为key 和value的向量，每一个query需要和其他key进行向量点积，其点积结果就可以被看作相关度，最终我们可以得到每个词语和其他哪个词语更为相关。

Transformer模型

在词语的相关度被建立之后，我们就可以基于相关关系去做信息传播了，多次重复这个过程，我们就可以对节点上的信息进行更新。值得一提的，是在self attention的结构中，我们默认是没有位置信息的，因此我们常常需要在处理时间序列时手动加入一些位置信息。

在翻译模型中，我们会在输入端和输出端多次进行前文的操作，即可获得更好的词语之间的关系结果，从而达到更好的翻译效果。

在RNN中，每个词都是按顺序输入的，因此任何两个节点的关系都是需要n步运算，在CNN中，由于多层的信息处理是树状结构，因此两个节点的距离是log(n)。而在self attention中，由于任何两个词语之间都有联系，所以它们建立关系只需要一步，在长文本序列中，长程连接上的信息经过越多步传播就越容易丢失，所以Transformer模型中的self attention架构可以对关系，尤其是长程关系进行更好的提取。

通过对基于self attention模型的Transformer模型的预训练，人们可以根据少量的迁移就能在不同的语言任务（阅读理解，翻译，情感计算等）中都取得很大的进展。

总体而言，传统的注意力机制建立的关系是1对1的，而Relation Network建立的关系是多对多的关系，self attention建立的关系则是1对k的：这意味着每个节点（词语）可以对应k个关系，k是可学习的参数。self attention的一个基本的模式是：建立全局关联，交换信息，局部整合，建立新的全局关联……循环往复这个过程，self attention架构将逐步准确的找到节点之间的关系信息，而无序关注节点的空间距离。

你可能感兴趣的:(人工智能,图网络,深度学习,自然语言处理)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
2023-04-17|篮球女孩长一木
1小学抑或初中阶段，在课外书了解到她的故事。“篮球女孩”。当时佩服她的顽强，也对生命多了一丝敬畏。今天刚好在公众号看到，长大后的“篮球女孩”。佩服之余又满是心疼。网络侵删祝那素未蒙面的女孩，未来一切顺遂。
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
在一台Ubuntu计算机上构建Hyperledger Fabric网络落叶无声9 区块链超级账本 Hyperledger fabric 区块链 ubuntu 构建 hyperledger fabric
在一台Ubuntu计算机上构建HyperledgerFabric网络Hyperledgerfabric是一个开源的区块链应用程序平台，为开发基于区块链的应用程序提供了一个起点。当我们提到HyperledgerFabric网络时，我们指的是使用HyperledgerFabric的正在运行的系统。即使只使用最少数量的组件，部署Fabric网络也不是一件容易的事。Fabric社区创建了一个名为Cello
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
ARM驱动学习之基础小知识 JT灬新一 ARM 嵌入式 arm开发学习
ARM驱动学习之基础小知识•sch原理图工程师工作内容–方案–元器件选型–采购（能不能买到，价格）–原理图（涉及到稳定性）•layout画板工程师–layout（封装、布局，布线，log）（涉及到稳定性）–焊接的一部分工作（调试阶段板子的焊接）•驱动工程师–驱动，原理图，layout三部分的交集容易发生矛盾•PCB研发流程介绍–方案，原理图(网表)–layout工程师（gerber文件）–PCB板
展现思维导图魅力，不断挖掘人生宝藏思维导图讲师Mandy
第13期最强思维导图训练营已经结束一周了，但是我依旧是感觉所有学员还在努力的学习，这些学员中有教师、学生、白领、公务员、宝妈等等，只要你努力，只要你想改变自己，任何行业，任何岗位都可以参与进来，28天足以让你见成效，在这28天中，我们的学员不仅仅是收获了一枚毕业证，最重要的是让自己的思维方式得到升级，今天的你为自己投资，明天的你就会感谢你今天的付出，我们来听一听来自13期最强思维导图训练营优秀学员
2019-11-04复盘——飞来山上千寻塔，闻说鸡鸣见日升。那一叶秋
1、大盘篇先上老图，看习惯了，也就知道走势了图1上证指数日线图还是那张老图，自己可以在自己的相关软件上画出来，快变盘了。2、个股篇未加仓、未减仓。分析量能的时候，突然发现这么一个东西：“放量突破年线，缩量回调。”合众科技日线图其实，最近的N只个股，在技术分析上，都到了变盘的临界时候。结合这么久的走势，特别是ZJH不断放开IPO的申请，本质上说是融资难度变大，或者说是为企业的融资开创便利。但现在市场
《在战“疫”中成长致敬生活》观后感梅子刘的刀
（作者：周晨）今天上午，我看了“我是接班人”网络大课堂《在战役中成长致敬生活》。有很多人拿出自己攒下的钱，默默地捐给了武汉，有几千块钱的、有几万块钱的，也有十几万块钱的。连小朋友也把自己的压岁钱捐给了武汉。有名环卫工人把自己五年的积蓄全部捐给了武汉。有名外卖小哥为医护人员买鞋子送吃的。还有已经治愈出院的新型肺炎病人捐了400毫升的血浆。还有位叫大树的叔叔，虽然他没有钱，但是他地里有蔬菜，捐了几大卡
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
中原焦点团队网络初中级30期阴丽丽坚持分享第三百八十八次2022.10.18分享约练次数（74）咨询师（6）来访者（53）观察者（15）阴丽丽
今天是忙碌的一天，一早起来，总想着找点把事情弄完，可总也弄不完。就这样弄着吧！孩子的事，自己的事都在那里搁置着，不想做，有点欧！今天总体还不错，只是在下午起床时走神了俩小时，也算是给自己的放松吧！今日难得1.儿子乖巧、听话，努力配合，一天下来也是忙忙碌碌，这真的很难得！2.儿子今天录的视频被班主任认可，这真的很难得3.我今天早上做核酸时，自己把教案整了一下，这真的很难得
网络编程基础记得开心一点啊网络
目录♫什么是网络编程♫Socket套接字♪什么是Socket套接字♪数据报套接字♪流套接字♫数据报套接字通信模型♪数据报套接字通讯模型♪DatagramSocket♪DatagramPacket♪实现UDP的服务端代码♪实现UDP的客户端代码♫流套接字通信模型♪流套接字通讯模型♪ServerSocket♪Socket♪实现TCP的服务端代码♪实现TCP的客户端代码♫什么是网络编程网络编程，指网络上
Java企业面试题3 马龙强_ java
1.break和continue的作用(智*图)break：用于完全退出一个循环（如for,while）或一个switch语句。当在循环体内遇到break语句时，程序会立即跳出当前循环体，继续执行循环之后的代码。continue：用于跳过当前循环体中剩余的部分，并开始下一次循环。如果是在for循环中使用continue，则会直接进行条件判断以决定是否执行下一轮循环。2.if分支语句和switch分
多子女家庭问题 3e5c5362403c
杨宁宁焦点解决网络初17中19坚持分享589天（2021.3.20）本周约练我1次，总计166次，读书打卡第256天案例督导收获：【家有老大篇】被爱与高期待下的独舞家里的第一个孩子往往集万千宠爱于一身。爸爸妈妈、爷爷奶奶、姥姥姥爷的目光都聚焦在他的身上。在这种光环下长大的孩子，就如小皇帝一般，衣来伸手、饭来张口。拥有爱的同时，也意味着拥有了更高的被期待，父母会花血本给你报各种各样的早教班，给你买各
父母教育孩子的方式，将影响孩子一生树英教育
为什么有些孩子总是充满自信与快乐？独立、有主见又坚强？而有些孩子却自卑、胆怯，软弱又过度依赖父母？为什么有些孩子总是健康、阳光又富于创造力？而有些孩子却悲观、孤僻又思想空乏？一个孩子的行为取决于孩子的思想，思想取决于环境和自己的认知，认知取决于教育。父母是孩子人生中的第一位教育者，父母养育孩子的方式，将决定他们人生的高度，影响他们的一生。网络图，侵权即删优秀的父母就像园丁，既要浇水施肥，又要修剪杂
自然语言处理_tf-idf _feivirus_ 算法机器学习和数学自然语言处理 tf-idf 逆文档频率词频
importpandasaspdimportmath1.数据预处理docA="Thecatsatonmyface"docB="Thedogsatonmybed"wordsA=docA.split("")wordsB=docB.split("")wordsSet=set(wordsA).union(set(wordsB))print(wordsSet){'on','my','face','sat',
2024.9.6 Python，华为笔试题总结，字符串格式化，字符串操作，广度优先搜索解决公司组织绩效互评问题，无向图 RaidenQ python 华为 leetcode 算法力扣广度优先无向图
1.字符串格式化name="Alice"age=30formatted_string="Name:{},Age:{}".format(name,age)print(formatted_string)或者name="Alice"age=30formatted_string=f"Name:{name},Age:{age}"print(formatted_string)2.网络健康检查第一行有两个整数m
戴容容中原焦点团队.网络初级第33期,坚持分享第19天 2022年3月9日 TessDai
《每个人眼中的世界都是不同的》“一千个人眼里有一千个哈姆雷特”世界是多元的,每个人都有自己的道理,人人按照自己的理解去看待这个世界的人和物.我们如此,其他人也是如此.因此,任何事情,我们要放下自己以为的真理,去理解他人认为的真理,只有同频方能共振.孩子在慢慢长大的过程中慢慢学会独立,甚至对抗.尤其当孩子处于青春期的时候,他们开始有很多自己独立的想法,和一些特立独行的做法,家长常常会觉得不可思议,觉
第1步win10宿主机与虚拟机通过NAT共享上网互通学习3人组大数据大数据
VM的CentOS采用NAT共用宿主机网卡宿主机器无法连接到虚拟CentOS要实现宿主机与虚拟机通信，原理就是给宿主机的网卡配置一个与虚拟机网关相同网段的IP地址，实现可以互通。1、查看虚拟机的IP地址2、编辑虚拟机的虚拟网络的NAT和DHCP的配置，设置虚拟机的网卡选择NAT共享模式3、宿主机的IP配置，确保vnet8的IPV4属性与虚拟机在同一网段4、ping测试连通性[root@localh
系统架构设计师需求分析篇二 AmHardy 软件架构设计师系统架构需求分析面向对象分析分析模型 UML和SysML
面向对象分析方法1.用例模型构建用例模型一般需要经历4个阶段：识别参与者：识别与系统交互的所有事物。合并需求获得用例：将需求分配给予其相关的参与者。细化用例描述：详细描述每个用例的功能。调整用例模型：优化用例之间的关系和结构，前三个阶段是必需的。2.用例图的三元素参与者：使用系统的用户或其他外部系统和设备。用例：系统所提供的服务。通信关联：参与者和用例之间的关系，或用例与用例之间的关系。3.识别参
网络通信流程记得开心一点啊服务器网络运维
目录♫IP地址♫子网掩码♫MAC地址♫相关设备♫ARP寻址♫网络通信流程♫IP地址我们已经知道IP地址由网络号+主机号组成，根据IP地址的不同可以有5钟划分网络号和主机号的方案：其中，各类地址的表示范围是：分类范围适用网络网络数量主机最大连接数A类0.0.0.0~127.255.255.255大型网络12616777214【(2^24)-2】B类128.0.0.0~191.255.255.255中
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include