猴猴猪猪

Machine Learning with Graphs 之 Page Rank

文章目录

一、 Overview
二、 Page Rank
- 2.1 overview
- 2.2 algorithm
- 2.3 how to solve
三、 Reference

一、 Overview

本节主要从矩阵的角度，来对graph进行分析与学习，当然之前所讲的eigenvector centrality以及katz index已经在算法中利用矩阵来进行节点或者边的features计算与设计，但除此之外，将graph视作一个矩阵，还能允许我们做更多的事，比如通过随机游走的方式来判断一个节点的重要性（PageRank），或者通过矩阵分解的方式来获得节点的embedding，当然随机游走，矩阵分解，节点特征从矩阵的角度来看彼此也是紧密联系着的。

二、 Page Rank

2.1 overview

PageRank, also known as Google Algorithm，是1998年，斯坦福大学博士生拉里·佩奇（lary page)和小伙伴谢尔盖·布林提出来的，主要是为了解决用户搜索结果的排序问题，并在此基础上研发了一款搜索引擎，即后来的巨无霸Google。
当然对于一个搜索引擎而言，往往需要有如下三步，而page rank主要关注的就是如何将一个重要并且可信的candidates排序在前面呈现在用户面前。当然这个步骤是可以与前面步骤并行的，即不依赖于前面的步骤，因此这也是Google检索速度快与准的一个原因。

Web can be regarded as a big graph, namely the web pages are the nodes and the hyperlinks are the edges.

如上所示，早期的互联网链接往往是navigational，即导航性质的，通过链接将分布在各处的网页彼此连接起来，如早期的门户网站，而今天的互联网连接，其性质更倾向于事务型，即往往用于发布，评论，点赞，购买等。比如知乎你的关注以及被关注，也可以组成一个graph。但无论是transanctional or navigational, 通常都将web视作一个有向图。
其他类似的信息网络，还包括论文引用，维基百科等，当初pagerank的提出也是受到了citations模式的启发。

既然我们已经知道了，web可以视作一个有向图，那么多对于浩如烟海的网页，我们怎样对web里面的page进行重要性排序呢？因为所有的pages并不是同等重要的。而后面我们所讨论的一系列算法，像本节的page rank, personalized pagerank, random walk with restart都是基于link analysis的方法。

其核心思想就是将links视作打分投票的依据，最naive的想法就是如果一个page拥有更多的边，它就拥有更高的得分，即重要性。当然，由于是一个有向图的关系，对于每一个节点而言，会涉及到in-coming links以及out-going links，这儿我们只将in-links作计票，因为out-links作弊空间太大了，不具备参考意义，对于一个node而言，它可以往外伸出无数条out-links，但是并不表明它很重要。
但又会遇到另外一个问题，即所有的links都拥有相同的分数吗？那显然也不是，往往将来自更重要的page的in-links置更大的得分，因为近朱者赤，你受到一个大v关注，或者你的论文被一个诺奖得主关注，那么你本身也就是大牛了。
因此计算page得分，本身是一个递归的问题，类似的思路是eigenvector centrality那一节已经讲过了，不做赘述，当然下面的很多思想也和eigenvector centrality一致，详情可见: https://blog.csdn.net/pku_langzi/article/details/121407331?spm=1001.2014.3001.5501

2.2 algorithm

一个page是重要的，当

它拥有更多的邻居节点
它的邻居很重要

在paper的原文是这样说的：

关于边的得分（vote）与节点的重要性（rank）有如下三条说明：

每一个边（link）的得分正比于它source page的重要性
如果page $i$ 的重要性是 $r_i$ ，并且它有 $d_i$ 条out-links，那么每一条link将获得 $r_i / d_i$ 得分，即被稀释了
page $j$ 的重要性 $r_j$ 是指向它的所有in-links的得分之和

我们称PageRank是一个flow model，而flow的正是这种rank得分
上述是对rank的定义以及边的vote的一个例子。
一个节点的rank得分 $r$ 的计算方式如上。
当然，为了求解这样一个问题，我们可以用高斯消元法来求每个page的rank，即n个方程，n个未知数，
但有时候没有唯一解，因此也可以加一些限制，比如上面让 y + a + m = 1
可以解得到 y = 2/5 , a = 2 / 5, m = 1 / 5
但显然当n很大时，这并不是一个非常优雅且便捷的方式。

那么如果用矩阵的思路来formulate这个问题呢？

这儿初始化了一个随机邻接矩阵¹ $M$ ，它的值 $M_{ij}$ 表示的是从 $j$ 向 $i$ 传递的得分（power）（⚠️这儿的方向，易理解成 i 到 j），初始化为 $M_{ij} = \frac{1}{d_j}$ ，是一个列随机矩阵，故 $M$ 的每个列向量之和是为1的。
在计算每个page的得分时，由于是一个递归的计算方式，因此与之前的eigen vector或者power vector类似，可以写成矩阵与向量的乘积形式，引入了一个rank vector $r$ 的概念，
$M.r\\ r_j =\underset{i \mapsto j } { \sum } { \frac{r_i}{d_i}}$
其中rank vector中的每一个元素（entry） $r_i$ 表示的就是page $i$ 的重要性，并且进行了归一化，让 $\underset{i}{\sum}r_i = 1$ 。

因此整个flow的过程，可以表征为上面矩阵与向量相乘的形式。

原文的一些说明：

这儿举了一个例子，对于这么一个简单的network，包含三个page，分别是 $y, a, m$ ，初始化flow矩阵 $M$ 为右上角所示的matrix。其中 $M_{ij}$ 表示的是 $\mapsto i$ 的边的得分，因为每个page的初始化重要性为1，因此对于每一个列而言，重要性1被出度 $d_j$ 所平分，分别传递给page $i$ 。比如 $M_{00}$ 表示的是从 $\mapsto y$ 的vote，为 $\frac{1}{2}$ ，因为y总共有两条outlinks，其中 $\mapsto y$ 分得 $\frac{1}{2}$ ，而 $\mapsto a$ 分得 $\frac{1}{2}$ 。对于这个随机矩阵或者叫转移矩阵而言，graph如果一旦固定，其就不会变的。
然后我们就可以分别计算三个page的rank
$r_y = r_y / 2 +r_a/2 \\ r_a = r_y /2+r_m \\ r_m = r_a / 2$
表示为矩阵向量的形式的话，就如右所示。

这儿可以与随机游走进行联系，想象这是一个随机的游走者（冲浪人），当 $t$ 时刻他位于page $i$ ，那么在 $t + 1$ 时刻，他将通过 $i$ 的out-links按均匀分布地随机走到下一个网页 $j$ ，并且无限地随机游走下去。如果让一个向量 $p (t)$ ，它的 $i^{th}$ 个位置的值表示在 $t$ 时刻访问page $i$ 的概率，所以整个 $p (t)$ 可以用来表示网页的一个概率分布。
那么 $t + 1$ 时刻达到各个网页的概率分布 $p (t + 1) = M . p (t)$ ，假设随机游走到达一个新的状态的分布满足
$p (t + 1) = M . p (t) = p (t)$
那么 $p (t)$ 是一个随机游走固定不变的分布（这儿有点困惑，感觉是个先有蛋还是先有鸡的问题），后面会证明其收敛性。
先前所讲的rank vector满足 $r = M . r$ ，因此r是一个固定不变的随机游走分布。

这个悠闲上网者看到转移矩阵M，他在想，这个M矩阵就代表了当前整个网络的拓朴结构，那么这个拓朴结构背后一定隐含了某种规律，这个规律就是每个网页的权重。这个规则“支撑”着网络成为今天我看到的样本。那我要努力去游走，让我的评价无限接近网络背后的真实规律。恩，加油，我一定行的！

其实 $p (t + 1) = M . p (t)$ 就是一个马尔可夫过程²

联系之前的eigenvector定义，可以发现这个rank vector与eigenvector是极其相似的，当时我们用power iteration来迭代收敛到eigenvector，并证明其收敛性以及矩阵 $A$ 最大的特征值对应的特征向量都我们所需的eigenvector（其每个entry都>0），只不过值得注意的地方在于，eigenvector是针对无向图的，而rank vectors是针对有向图的。

如果用eigenvector的思路来阐述的话，
$1 . r = M . r$
此时的rank vector $r$ 就是随机邻接矩阵 $M$ 在特征值为1的时候的特征向量。然后通过poser iteration的方式来求 $r$ 。
具体怎么求，可以参考我之前的博客对eigenvector推导的补充Machine Learning with Graphs 之 Traditional Methods for Machine Learning in Graphs，或者继续下面章节的学习。

上面这页ppt将random walk与eigenvector进行了联系与统一，但其实上面ppt有几点是略讲了的：

随机矩阵M一定存在特征值1吗？
特征值1对应的特征向量唯一吗？

对于第一点而言，回答是yes:

对于第二点而言，回答是no (后面的page rank算法，对下面所提的孤岛问题或者叫trap问题会做解决）

2.3 how to solve

通过迭代的方式，先初始化值，然后迭代，直到 $t + 1$ 时刻与 $t$ 时刻的经验误差小于 $\epsilon$ 。

More specifically, 经过不停的迭代迭代，直到
$\lvert r - r' \rvert < \epsilon$

那么灵魂三问：

它一定会收敛吗？
它收敛的值是我们想要的吗？
结果合理吗？
我们首先看naive的pagerank遇到的两个问题，就可以回答上面的灵魂三问：
dead ends
spider traps

其中spider trap指的是

其中dead end指的是：

见招拆招，为了跳出spider trap，那么在每一个时刻，这个随机游走的surfer下一步有两种选择

以 $\beta$ 的概率顺着link随机往下走
以 $1-\beta$ 的概率，跳到一个随机的网页

其中 $\beta$ 往往取值在0.8 - 0.9之间，这个 $\beta$ 也被称为阻尼系数，因此在一定数目的step之后，surfer将跳出spider trap。

其实spider trap不是致命的，因为至少它满足了随机矩阵的定义，而dead ends是某一列为0，那么必然会收敛到0.
为了避免dead ends，想到的方式是传送，对于dead-ends的page，让其有随机的概率跳转到任意的网页，概率之和为1。

那么此时这个Google Matrix其特征值1对应的特征向量唯一吗？

与上面证明所举的反例相比，前者是一个disconnected graph，而目前的G是一个强连接图strongly connected graph（并且是一个里面的值都>0的graph），因此目前可以回答是yes了，证明如下：

证明的思路是这样的，假设M的特征值1存在线性无关的特征向量v, w，那么对于任意的实数s和t，sv + tw也是在1的特征向量空间里面，首先证明了1对应的特征向量里面的值都是>0或者都是<0的，那么sv + tw就会导致该向量里面同时存在正数和负数，那么必然v,2是线性相关的，反正得到1对应的特征向量空间的唯一性
因此关键点就变成了证明1对应的特征向量里面的值都是>0或者都是<0的。证明如下：

不可能存在一个为0，其他为正的情况，要么全为0，要么全为或者全为负，因为特征向量不能为0向量，所以特征向量值要么全为正，要么全为负，即空间唯一性质。那么此时我们来回答前面的灵魂三问呢？

极限是否存在？
如果极限存在，它是否与初始值 $p_0$ 的选取有关？即收敛性是否初始值敏感？
如果极限存在，并且与的选取初始值 $p_0$ 无关，它作为网页排序的依据是否真的合理？

因为随机过程理论中有一个所谓的马尔可夫链基本定理 (fundamental theorem of Markov chains)，它表明在一个马尔可夫过程中，如果转移矩阵是素矩阵，那么上述前两个问题的答案就是肯定的。而随机性修正已经解决了上述第三个问题，因此所有问题就都解决了。

原文轻描淡写一句：we built a web search engine called Google. 殊不知将成为未来最伟大的科技公司。

三、 Reference

参考：PageRank算法初探

参考：谷歌背后的数学

参考： Math 443/543 Graph Theory Notes 6: Graphs as matrices and PageRank

参考：https://courses.helsinki.fi/sites/default/files/course-material/4545800/stochastic.pdf

参考：http://snap.stanford.edu/class/cs246-2012/slides/09-pagerank.pdf

随机矩阵
随机矩阵又叫做概率矩阵（probability matrix）、转移矩阵（transition matrix）、马尔科夫矩阵（markov matrix）等。
随机矩阵实际是非负矩阵(Nonnegative matrix)的一类，而非负矩阵是指矩阵元素都是非负(Nonnegative)的。
随机矩阵通常表示左随机矩阵（left stochastic matrix），即“列和”为1
对任意的随机矩阵，其谱半径是1，即最大特征值是1，其对应的特征向量里面的每个元素都>0 或都< 0。
随机矩阵的主特征值以及second largest eigenvalue的比值是幂法收敛速度的一个基本的衡量标准。 ↩︎
马尔可夫随机过程
马尔可夫过程，也称为马尔可夫链 (Markov chain)，是一类离散随机过程，它的最大特点是每一步的转移概率分布都只与前一步有关。而平稳马尔可夫过程则是指转移概率分布与步数无关的马尔可夫过程 (体现在我们的例子中，即 H 与 n 无关)。另外要说明的是，本文在表述上不同于佩奇和布林的原始论文，后者并未使用诸如 “马尔可夫过程” 或 “马尔可夫链” 那样的术语，也并未直接运用这一领域内的数学定理。 ↩︎

使用 NetworkX 进行图论分析与可视化 aiweker 跟我学python 图论 python
使用NetworkX进行图论分析与可视化NetworkX是一个用于创建、操作和研究复杂网络的Python库。它提供了丰富的图论算法和数据结构，适用于各种网络分析任务。本文将分点介绍NetworkX的主要功能，并通过代码示例进行详细说明。1.安装NetworkX在开始使用NetworkX之前，首先需要安装它。可以通过pip进行安装：pipinstallnetworkx2.创建图NetworkX支持多
数据结构、图论---数组模拟单链表邻接表 wow_awsl_qwq 数据结构数据结构图论链表
数组模拟链表或者所谓的邻接表，实际上都是静态链表，以数组下标模拟模拟内存地址，使得可以一开始就给数组分配好连续的一大片空间，而使用中的“内存分配”实际上就是变成了简单的idx++比赛中使用静态链表代替指针型链可以减少内存分配带来的时间消耗，并且使用方式也比较简单比赛中的单链表或者邻接表也可以用vector实现，达到动态内存分配的效果，其实就是类似于指针链表，不过使用方式也比较简单直观比如图论模型：
图论：以二维数组表示的连通图/树应如何表示？leetcode1042.不邻接种花坠金技术面算法图论算法 leetcode
1042.不邻接植花-力扣（LeetCode）容器在这道题中输入类似[[1,2],[3,4]]，这意味着花园1连通了花园2，花园3连通了花园4。那么该怎么根据这个输入，获取一个方便后面算法的表示呢？我们通常管这种存放邻居的数据格式叫做：邻接表通常我的思路是使用下列容器作为邻接表：哈希表，key就是花园i，value是与花园i接壤的其他所有花园。二维数组，第i个数组中的元素是与花园i接壤的其他所有花
图论——Prim算法水代码的程序猿力扣算法图论数据结构
53.寻宝（第七期模拟笔试）题目描述在世界的某个区域，有一些分散的神秘岛屿，每个岛屿上都有一种珍稀的资源或者宝藏。国王打算在这些岛屿上建公路，方便运输。不同岛屿之间，路途距离不同，国王希望你可以规划建公路的方案，如何可以以最短的总公路距离将所有岛屿联通起来（注意：这是一个无向图）。给定一张地图，其中包括了所有的岛屿，以及它们之间的距离。以最小化公路建设长度，确保可以链接到所有岛屿。输入描述第一行包
数组模拟邻接表 #图论旧物有情数据结构图论数据结构
文章目录为什么要用数组来模拟邻接表存储思路遍历思路树是特殊的图，因此邻接表可以存储图和树两种数据结构。为什么要用数组来模拟邻接表在算法设计当中，利用数组来代替结构体模拟各种数据结构会更加简单。存储思路给定如下数据,我们可以构造如下的一个邻接表请看代码/**idx:索引,代表数组哪个位置,是否连续不重要,因为我们的存储是链式的。h[idx]:顶点表,下标idx代表是哪个顶点,初始值全部为-1,代表没
二叉树的三种遍历【树的遍历】（C++实现）Binary Tree Traversal Vitalia 理论基础 c++树的遍历二叉树
图论入门【数据结构基础】：什么是树？如何表示树？之前我们有分别讲解二叉树的三种遍历的相关代码实现：⭐算法OJ⭐二叉树的前序遍历【树的遍历】（C++实现）BinaryTreePreorderTraversal⭐算法OJ⭐二叉树的中序遍历【树的遍历】（C++实现）BinaryTreeInorderTraversal⭐算法OJ⭐二叉树的后序遍历【树的遍历】（C++实现）BinaryTreePostord
笔记：代码随想录算法训练营day56:图论理论基础、深搜理论基础、98. 所有可达路径、广搜理论基础 jingjingjing1111 笔记
学习资料：代码随想录连通图是给无向图的定义，强连通图是给有向图的定义朴素存储：二维数组邻接矩阵邻接表：list基础知识：C++容器类|菜鸟教程深搜是沿着一个方向搜到头再不断回溯，转向；广搜是每一次搜索要把当前能够得到的方向搜个遍深搜三部曲：传入参数、终止条件、处理节点+递推+回溯98.所有可达路径卡码网题目链接（ACM模式）先是用邻接矩阵，矩阵的x,y表示从x到y有一条边主要还是用回溯方法遍历整个
【数组模拟邻接表】奋斗的阿庆 c++算法图论深度优先
前言在做图论算法题的过程中，总会遇到用数组来模拟邻接表进而表示图。之前一直没弄明白在用数组模拟邻接表相关的细节。如今明白了，记录一下。帮助不理解的小伙伴。一、所用变量constintN=1010;//表示点的个数constintM=10100;//表示边的条数inth[N];//h[i]表示以当前点i为起点所相连的第一条边的序号inte[2*M];//e[i]表示第i条边所对应的终点intne[2
【图论】数组模拟邻接表存储(链式前向星) ars4me 图论数据结构图论邻接表前向星
图的邻接表存储法又叫链式存储法可以用数组模拟定义structedge{intnext;//下一条边的编号intto;//这条边到达的点intdis;//这条边的长度}edge[size];//COYG核心代码加入一条从from到to距离为dis的单向边inlinevoidadd(intfrom,intto,intdis){edge[++num].next=head[from];edge[num].
人工智能之数学基础：数学对人工智能技术发展的作用每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能深度学习机器学习神经网络自然语言处理数学
本文重点数学是人工智能技术发展的基础，它提供了人工智能技术所需的数学理论和算法，包括概率论、统计学、线性代数、微积分、图论等等。本文将从以下几个方面探讨数学对人工智能技术发展的作用。概率论和统计学概率论和统计学是人工智能技术中最为重要的数学分支之一。概率论和统计学的应用范围非常广泛，包括机器学习、数据挖掘、自然语言处理、计算机视觉等领域。在人工智能技术中，概率论和统计学主要用于处理不确定性的问题，
图论并查集小结 _C9 并查集
这周学习了并查集的有关内容，简单说一下并查集并查集主要用于处理一些不相交集合的合并问题。。使用并查集时，第一步会存在一组不相交的动态集合，一般都会使用一个整数表示集合中的一个元素。每个集合可能包含一个或多个元素，并选出集合中的某个元素作为代表。每个集合中具体包含了哪些元素是不关心的，具体选择哪个元素作为代表一般也是不关心的。我们关心的是，对于给定的元素，可以很快的找到这个元素所在的集合（的代表），
【图论】并查集的学习和使用猪猪成 C++学习算法图论
目录并查集是什么？举个例子组成父亲数组：find函数：union函数：代码实现：fa[]初始化code:findcode：递归实现:非递归实现:unioncode:画图模拟：路径压缩：路径压缩Code：并查集是什么？是一种树形的数据结构，一般用来处理集合的合并，查询操作。举个例子告诉你1的父节点是22的父节点是34的父节点是56没有父节点那么可以画出三个集合，或者说是树。然后我们一般用并查集判断：
医图论文 CVPR‘24 | 适应医学图像中泛化异常检测的视觉-语言模型小白学视觉医学图像处理论文解读语言模型人工智能计算机视觉医学图像顶会医学图像处理 CVPR 论文解读
论文信息题目：AdaptingVisual-LanguageModelsforGeneralizableAnomalyDetectioninMedicalImages适应医学图像中泛化异常检测的视觉-语言模型作者：ChaoqinHuang，AofanJiang，JinghaoFeng，YaZhang，XinchaoWang，YanfengWang源码：https://github.com/Medi
代码随想录算法训练营第六十五天| 图论10 Rachela_z 算法图论
Bellman_ford队列优化算法（又名SPFA）代码随想录importcollectionsdefmain():n,m=map(int,input().strip().split())edges=[[]for_inrange(n+1)]for_inrange(m):src,dest,weight=map(int,input().strip().split())edges[src].append
代码随想录算法训练营第六十六天| 图论11 Rachela_z 算法图论
Floyd算法精讲Floyd算法代码很简单，但真正理解起原理还是需要花点功夫，大家在看代码的时候，会发现Floyd的代码很简单，甚至看一眼就背下来了，但我为了讲清楚原理，本篇还是花了大篇幅来讲解。代码随想录if__name__=='__main__':max_int=10005#设置最大路径，因为边最大距离为10^4n,m=map(int,input().split())grid=[[[max_i
代码随想录算法训练营第六十四天| 图论09 Rachela_z 算法图论
dijkstra（堆优化版）精讲代码随想录importheapqclassEdge:def__init__(self,to,val):self.to=toself.val=valdefdijkstra(n,m,edges,start,end):grid=[[]for_inrange(n+1)]forp1,p2,valinedges:grid[p1].append(Edge(p2,val))minD
算法——图论——关键活动阿饼240 算法图论
原题#include#include#include#includeusingnamespacestd;structedge{intdestination;intdist;edge(intdestination_,intdist_):destination(destination_),dist(dist_){}};vectorgraph[100];vectorreGraph[100];vector
算法——图论——交通枢纽阿饼240 算法 c++动态规划图论
原题#include#include#includeusingnamespacestd;typedefpairPII;vectorgraph[100];vector>Dist(100,vector(100,-1));vectorState(100,false);voidDijkstra(ints,intn){for(inti=0;i,greater>pq;pq.emplace(0,s);while
从0到1构建AI深度学习视频分析系统--基于YOLO 目标检测的动作序列检查系统：（2）消息队列与消息中间件 shiter 人工智能系统解决方案与技术架构人工智能深度学习音视频
文章大纲原始视频队列Python内存视频缓存优化方案（4GB以内）一、核心参数设计二、内存管理实现三、性能优化策略四、内存占用验证五、高级优化技巧六、部署建议检测结果队列YOLO检测结果队列技术方案一、技术选型矩阵二、核心实现代码三、性能优化策略四、可视化方案对比五、部署建议逻辑判定队列时间片图论时间序列大模型引入参考文献原始视频队列想要在单机内存中缓存1-5分钟的视频片段，python技术栈的话
数据结构与算法-图（绪论图论基本概念）可爱的野指针数据结构图论算法数据结构有向图欧拉回路
昨天我的的树就分享完了，树的概念很多吧，二叉树，满二叉树，完全二叉树，赫夫曼树，孩子，双亲……多不？哈哈哈，这算不了什么，我们接下来要看到的图的概念才叫多，没关系，勤奋和时间会让你记住他们，内心只需要告诉自己，加油，我能行，就一定能学会图。不知道有没有看过或者学过离散数学，如果学过，那么恭喜啦，离散数学里的图论就是这一章的基础，图论学的还不错的话，压力就小了。先介绍的是图的定义，图-V个顶点和E条
【算法每日一练]-图论篇14 欧拉路径，欧拉回路希望你变强啊图论算法图论 java 数据结构 c++深度优先
目录判断有向图有欧拉回路判断有向图有欧拉路径如果图G中的一个路径包括每个边恰好一次，则该路径称为欧拉路径(Eulerpath)。（每个点都经过一次就是旅行商问题）预备知识：有向图有欧拉路径：等价于：非0度节点连通，且所有节点入度等于出度(欧拉回路)或有n-2个节点入度等于出度，另外两个节点一个多1一个少1无向图有欧拉路径：等价于：连通图，且没有度为奇数的节点(欧拉回路)或只有两个2个度为奇数的节点
数据结构与算法-图论-二分图一个人在码代码的章鱼 #图论算法学习图论算法
关押罪犯(贪心+二分答案+染色法判定二分图/扩展域并查集)题目描述S城现有两座监狱，一共关押着N名罪犯，编号分别为1∼N。他们之间的关系自然也极不和谐。很多罪犯之间甚至积怨已久，如果客观条件具备则随时可能爆发冲突。我们用“怨气值”（一个正整数值）来表示某两名罪犯之间的仇恨程度，怨气值越大，则这两名罪犯之间的积怨越多。如果两名怨气值为c的罪犯被关押在同一监狱，他们俩之间会发生摩擦，并造成影响力为c的
【并查集】 weixin_47868976 python
并查集（DisjointSetUnion，DSU）是一种用于处理不相交集合的数据结构，主要支持两种操作：查找（Find）和合并（Union）。它在解决连通性问题、图论问题以及动态连通性等问题时非常有用。并查集的基础知识基本概念：集合：并查集维护一组不相交的集合，每个集合有一个代表元素。查找（Find）：查找某个元素所属的集合的代表元素。合并（Union）：将两个集合合并为一个集合。核心思想：路径压
【图论】——理论基础总结 weixin_47868976 图论
图论这一章尤其需要图例进行说明，方便理解，对于作者来说很费时间，本文主要为自己复习方便，所以并不会写的非常详细，见谅。图论图的基本概念基本要素：边节点两点连成线，多个点连成的线称为图。当然也可以就一个节点，或者啥也没有（空图）。图的种类方向的概念根据边有无方向划分为：无向图有向图权重的概念边可以有权重，根据有无权重和方向：加权有向图加权无向图度的概念针对无向图，对于某节点，有几条边连着该节点，就称
信息学奥赛一本通 1395：烦人的幻灯片(slides) 第四章图论长春高老师编程信息学奥赛一本通-数据结构图论算法
1395：烦人的幻灯片(slides)时间限制:1000ms内存限制:65536KB【题目描述】李教授将于今天下午作一次非常重要的演讲。不幸的事他不是一个非常爱整洁的人，他把自己演讲要用的幻灯片随便堆在了一起。因此，演讲之前他不得不去整理这些幻灯片。作为一个讲求效率的学者，他希望尽可能简单地完成它。教授这次演讲一共要用n张幻灯片（nusingnamespacestd;structnode{intx
图论基础--孤岛系列 Repeat715 算法深度优先图论基础广度优先
孤岛系列有：孤岛总面积求解（用了dfs、bfs两种方法）和沉没孤岛（这里只写了dfs一种）简单解释一下：题目中孤岛的定义是与边缘没有任何接触的（也就是不和二维数组的最外圈连接），所以我们在这里求面积和沉没孤岛都是先把不是孤岛的剔除，然后剩下的就是孤岛，然后处理起来就简单多了，那么我们这里是怎么遍历不是孤岛的岛呢，很简单，与数组外圈的1相连的肯定就不是孤岛，所以我们直接从四个方向的边缘遍历将他们都处
PTA L2-001 紧急救援 (25分) 蔚蓝不远图 C++(算法)算法题算法图论
这个题之所以记录是因为这是我写过考察图论知识最全面的一道算法题，题意不是很难读懂，考察到了图论中最短路径–Dijstkra算法，拓展到最短路径条数、最大权值、最短路径等。我认为拿它来复习图论中最短路径这个知识点还是比较适合的L2-001紧急救援(25分)题目描述作为一个城市的应急救援队伍的负责人，你有一张特殊的全国地图。在地图上显示有多个分散的城市和一些连接城市的快速道路。每个城市的救援队数量和每
【2024】LeetCode HOT 100——图论「已注销」 leetcode 图论算法
目录1.岛屿数量1.1C++实现1.2Python实现1.3时空分析2.腐烂的橘子2.1C++实现2.2Python实现2.3时空分析3.课程表3.1C++实现3.2Python实现3.3时空分析4.实现Trie(前缀树)4.1C++实现4.2Python实现4.3时空分析1.岛屿数量原题链接：200.岛屿数量经典的FloodFill算法，可BFS也可DFS。这里以DFS为例，DFS不需要开方向数
搜索与图论模板题(必备)Day3 怀化第一深情算法与数据结构数据结构算法
DFS给定一个整数nn，将数字1∼n1∼n排成一排，将会有很多种排列方法。现在，请你按照字典序将所有的排列方法输出。输入格式共一行，包含一个整数nn。输出格式按字典序输出所有排列方案，每个方案占一行。数据范围1≤n≤71≤n≤7输入样例：3输出样例：123132213231312321#include#include#include#include#include#include#include#
力扣热题 100：图论专题经典题解析剑走偏锋o.O leetcode 图论算法 java 学习笔记
文章目录一、岛屿数量（题目200）1.题目描述2.示例3.解题思路4.代码实现（Java）5.复杂度分析二、腐烂的橘子（题目994）1.题目描述2.示例3.解题思路4.代码实现（Java）5.复杂度分析三、课程表（题目207）1.题目描述2.示例3.解题思路4.代码实现（Java）5.复杂度分析四、实现Trie（前缀树）（题目208）1.题目描述2.示例3.解题思路4.代码实现（Java）5.复杂
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro