Cziun

【论文阅读】PGCL：Prototypical Graph Contrastive Learning

目录

摘要
1 引言
2 相关工作
3 准备工作
- 3.1 问题定义
- 3.2 GNN
- 3.3 图对比学习
4 PGCL
- 4.1 相关视图的聚类一致性
- 4.2 重加权对比目标
5 实验

摘要

之前的对比方法存在一个抽样偏差问题，即负样本很可能与正样本具有相同的语义结构，从而导致性能下降。为了减轻该抽样偏差，本文提出了一种原型图对比学习(PGCL)方法。

具体来说，PGCL通过将语义相似的图聚类到同一组中来对图数据的底层语义结构进行建模，同时鼓励同一图的不同增强的聚类一致性。然后，给定一个正样本，通过从那些与正样本集群不同的集群中提取图来执行负采样，这确保了正样本和负样本之间的语义差异。此外，对于一个正样本，PGCL基于其负样本的原型(聚类中心)与正样本原型之间的距离对它的负样本重新赋予权重，使得那些具有中等原型距离的负样本获得相对较大的权重，以保证正样本与负样本之间的语义差异。这种重新赋予权重策略被证明比均匀抽样更有效。

1 引言

现有的自监督图对比学习方法具有以下局限性：

现有的方法主要关注于实例级结构相似性的建模，只保留实例周围的局部相似性，但未能发现整个数据分布中的底层全局结构。但在实践中，大多数情况下，图数据中都存在潜在的全局结构。
如图所示1，从整个数据分布中均匀采样负样本可能会导致负样本在语义上与正样本相似。

整个数据集的全局语义结构由PGCL在原型向量（即可训练的聚类中心）中描述。

2 相关工作

基于聚类的对比学习： GraphLoG应用K-means聚类来捕获图的语义结构，但使用K-means可能会导致原型的分配不平衡。与GraphLoG相比，PGCL增加了原型分配必须划分为相同大小的子集的约束条件，并将其表述为最优传输问题。此外，PGCL的目标是通过从与正样本集群不同的集群中采样负样本，并根据其原型距离重新赋权负样本，来解决抽样偏差。

3 准备工作

3.1 问题定义

局部实例结构。 我们将不同图例之间的局部成对相似性称为局部实例结构。在对比学习的范式中，相似的图对的嵌入预计在潜在空间中很接近，而不同的图对应该映射得很远。

仅对局部实例结构进行建模通常不足以发现整个数据集底层的全局语义。我们非常希望捕获数据的全局语义结构，其定义如下：

全局语义结构。 来自现实世界的图结构数据通常可以被组织为各种语义集群。潜在空间中邻近图的嵌入应该体现全局结构，从而反映原始数据的语义模式。

问题设置。 给定一组未标记图 $\mathcal{G}=\{G_i\}^N_{i=1}$ ，无监督图表示学习的目的是学习每个图 $G_i∈\mathcal{G}$ 的低维向量 $z_i∈\mathbb{R}^D$ ，这有利于图分类等下游任务。

3.2 GNN

我们将一个图实例表示为 $G=(\mathcal{V},\mathcal{E})$ ，节点集为 $\mathcal{V}$ ，边集为 $\mathcal{E}$ 。在第 $k$ 次迭代时，节点 $v$ 在第 $k$ 层的嵌入为：

然后，可以通过使用读出函数聚合所有节点表示来获得图级表示，即：

READOUT表示平均或更复杂的图级池化函数。

3.3 图对比学习

4 PGCL

如图2所示，鼓励对增强视图的表示进行聚类，以具有相同的原型(聚类中心)。

4.1 相关视图的聚类一致性

形式上，考虑一个将图例 $G_i$ 映射到表示向量 $z_i∈\mathbb{R}^D$ 的图神经网络 $z_i=f_θ(G_i)$ 。我们可以将所有表示 $z_i$ 聚类成 $K$ 个簇，其中心由一组可训练原型向量 ${c_1,…,c_K\}$ 表示。为了简洁起见，我们用 $C∈\mathbb{R}^{K×D}$ 表示。在实践中， $C$ 可以通过单个线性层来实现。这样，给定一个 $G_i$ 图，我们可以通过计算表示 $z_i=f_θ(G_i)$ 和 $K$ 原型之间的相似性来执行聚类，如下：

同样地，将 $G_i'$ 分配给原型的预测 $p(y|z_i')$ 也可以通过 $z_i'$ 来计算。为了鼓励两个相关视图 $G_i$ 和 $G_i'$ 之间的聚类一致性，我们用 $z_i$ (而不是 $z_i'$ )来预测 $G_i'$ 的聚类分配，反之亦然。形式上，我们通过最小化平均交叉熵损失来定义聚类一致性目标：

其中， $q(y|z_i')$ 是视图 $G_i'$ 的原型分配，可以作为 $z_i$ 的预测 $p(y|z_i)$ 的目标。一致性目标作为一个正则化器，鼓励来自同一图的视图的相似性。如果我们交换方程(5)中 $z_i$ 和 $z_i'$ 的位置，我们可以得到另一个类似的目标。最终的一致性正则化器可以通过两个目标的和导出：

一致性正则化器可以解释为通过比较集群分配而不是表示来比较多个图的视图。在实际应用中，分布 $q$ 的优化面临着存在的简并性问题，因为通过将所有数据点分配给一个(任意的)原型，就可以简单地最小化(5)。为了避免这种情况，我们添加了原型分配必须被平均分区的约束。我们以小批量的方式计算目标，以实现有效的优化：

方程(7)中的目标在 $q$ 中是组合的，因此可能很难优化。然而，这是最优传输问题的一个实例，可以相对有效地解决。为了更清楚地看到它，我们将两个联合概率的 $K \times N$ 矩阵表示为：

然后，我们可以通过以小批量方式将矩阵 $Q$ 约束为传输多面体来实现相等的分割：

其中， $1_K$ 表示维度为 $K$ 的全是1的向量。这些约束要求每个原型在批处理中平均选择至少 $\frac{N}{K}$ 次。然后，方程(7)中的目标函数可以重新写为：

其中， $\langle·\rangle$ 是两个矩阵之间的Frobenius点积， $l o g$ 是用于元素级的。优化方程(10)总是导致一个整数解，尽管将 $Q$ 放宽到连续多面体 $T$ 而不是离散多面体。我们通过采用Sinkhorn-Knopp算法的快速版本来解决传输问题，并且方程(10)的解采用规范化矩阵的形式，如下所示：

其中， $α$ 和 $β$ 是两个重正化向量，指数化是元素级的。选择 $η$ 是为了权衡收敛速度与原始传输问题的接近程度，在我们的例子下，它是一个固定的值。重正化向量可以使用迭代的Sinkhorn-Knopp算法，使用少量的矩阵乘法来计算。

4.2 重加权对比目标

在本节中，我们将介绍如何通过从不同的集群采样图，并对负样本进行重新加权来减轻抽样偏差问题。给定一个正样本及其集群，我们可以简单地通过从不同的集群中提取“正确的”负样本来实现这一点。方程(3)可以扩展为：

其中， $c_i$ 和 $c_j$ 分别为图 $G_i$ 和 $G_j$ 的原型向量， $\mathbb{1}_{c_i≠c_j}$ 是表示两个样本是否来自不同簇的指标。

除了根据其集群的区别来选择负样本外，我们还希望避免在潜在空间中选择远离正样本的太简单的样本。直观地说，理想的负样本应该与正样本有适度的距离。为了实现这一需求，我们求助于控制它们的原型距离，而不是它们的直接距离。如图3所示，一方面，如果负样本的原型太接近query的原型，负样本仍然可以与query共享类似的语义结构（例如，附近的青色集群）。另一方面，如果负样本的原型（如紫色簇）离query的原型很远，这意味着负样本和query彼此相距很远，可以很好地区分，这实际上对表示学习没有帮助。

为此，我们进一步重新计算方程(12)中负样本项的权重，并将重新加权的目标定义为：

其中， $w_{ij}$ 为负对 $G_i,G_j)$ 的权重， $M_i=\frac{N}{\sum_{j=1}^Nw_{ij}}$ 是归一化因子。我们利用余弦距离来测量两个原型之间的距离，如： $\mathcal{D}(c_i,c_j)=1-\frac{c_i·c_j}{||c_i||_2||c_j||_2}$ 。然后根据上述原型距离，将 $w_{ij}$ 定义高斯函数的形式：

其中， $\mu_i$ 和 $\sigma_i$ 分别为 $\mathcal{D}(c_i,c_j)$ 的平均值和标准差。

最终的训练目标为：

最小化该损失函数来优化原型 $C$ 和图编码器的参数 $θ$ 。

5 实验

你可能感兴趣的:(自监督学习,图神经网络,对比学习,聚类,机器学习,深度学习,算法)

3月份学习任务、工作计划 Kamui_0us 学习
3月18日报名六级3月22日之前收集团日材料3月22日收集五四述职材料3月29日计算解二级学英语：为了六级为了绩点为了大英赛为了雅思接续规划留学计划恶补数学，拉下的慢慢补回来今日学习任务：学习本周的解析几何课程，背六级单词，还有时间可以看看github有关知识
MATLAB代码开发实战：从入门到高效应用 vvvae1234 matlab 开发语言
一、MATLAB生态系统的核心优势（扩展原有内容，增加行业数据）MATLAB在全球工程领域的市场占有率已达67%（2024年IEEE统计），其核心优势体现在：矩阵运算速度比传统编程快3-5倍包含22个专业工具箱的完整工具链与硬件设备（如Arduino）的即插即用接口自动生成C/C++代码的部署能力案例佐证：2023年NASA火星探测器使用MATLAB/Simulink完成97%的导航算法验证二、代
2024年12月CCF-GESP编程能力等级认证C++编程四级真题解析前网易架构师-高司机 c++开发语言 CCF-GESP
四级真题的难度：一、总体难度评价CCF-GESP编程能力等级认证C++四级真题的难度通常被认为相对较高。它不仅要求考生具备扎实的C++编程基础，还需要考生掌握一定的算法和数据结构知识，以及良好的问题解决能力。二、具体难度分析‌理论知识考察‌：单选题和判断题中，会涉及C++语言的理论基础知识，如数组的存储原理、函数的各种传参方式、指针、引用等。这些题目要求考生对C++语言有深入的理解。‌编程技能考察
基于DeepSeek R1构建下一代Manus通用型AI智能体的技术实践 zhangjiaofa DeepSeek R1&AI人工智能大模型 DeepSeek Manus 智能体 AI
目录一、技术背景与目标定位1.1大模型推理能力演进趋势1.2DeepSeekR1核心特性解析-混合专家架构(MoE)优化-组相对策略优化(GRPO)原理-多阶段强化学习训练范式1.3Manus智能体框架设计理念-多智能体协作机制-安全执行沙箱设计二、系统架构设计2.1整体架构拓扑图-分层模块交互机制-数据流与控制流设计2.2核心组件实现-规划模块(GRPO算法集成)-记忆系统分级存储架构-工具调用
AI笔记——语音识别 Yuki-^_^ 人工智能 AI 人工智能笔记语音识别
摘要：语音识别（AutomaticSpeechRecognition,ASR）是人工智能领域的一项重要技术，它将人类的语音信号转换成文字。随着科技的发展，语音识别已经成为现代生活和工作中不可或缺的一部分。本文旨在介绍语音识别的基本原理、关键技术、应用场景以及未来发展趋势。一、历史与发展语音识别技术的历史可以追溯到20世纪50年代，那时的技术基于规则和模板。随着计算能力的提升和深度学习方法的出现，语
php中文乱码无法解决_PHP基础|如何解决中文乱码问题？梦里一只喵 php中文乱码无法解决
为什么会出现中文乱码?很多新手朋友学习PHP的时候，发现程序中的中文在输出的时候会出现乱码的问题，那么为什么会出现这种乱码的情况呢?一般来说，乱码的出现有2种原因，一种是由于编码(charset)设置错误，导致浏览器以错误的编码来解析，从而出现了满屏乱七八糟的“天书”，第二种就是文件被以错误的编码打开，然后保存，比如一个文本文件原先是GB2312编码的，却以UTF-8编码打开再保存，就会出现乱码的
网络运维学习笔记（DeepSeek优化版） 018 HCIA-Datacom综合实验03 技术小齐网络运维学习
文章目录综合实验3实验需求一：A公司网络规划二：B公司网络规划配置一、ip、vlan、vlanif，stp、eth-trunkSW1SW2R1二、ospfSW1R1三、NATR1ISP四、拒绝ping允许httpSW1五、右半部分vlan、dhcp、ospf、NATSW4R2综合实验3实验需求一：A公司网络规划SW1/2/3组成了A公司的交换网络，其中SW1是核心层，SW2/3是接入层。三台交换机
Flask 学习-95.Flask-SQLAlchemy 查询今天当天的数据上海-悠悠 flask flask 学习 python
前言查询今天的数据，或者查询某一天的数据SQLDATE()function使我们能够从特定的历史或当前时间戳值访问日期值。DATE()函数Date（）函数返回从传递的datetime表达式中提取的日期。DATE(datetimeexpression)SQL语句按create_time获取某一天的数据select*frommytablewhereDATE(create_time)=='2022-11
大语言模型微调和大语言模型应用区别 AI Echoes 深度学习人工智能自然语言处理
大语言模型微调和大语言模型应用区别微调与应用LLM的区别微调大语言模型（LLM）是指取一个已经预训练好的模型，进一步用特定数据集训练，使其更好地适应某个任务或领域，比如为医疗聊天机器人优化医疗术语理解。应用LLM则是直接使用这些预训练模型来完成任务，如通过提示生成文本或回答问题，无需更改模型本身。研究表明，微调适合需要领域专精的任务，而应用更适合通用任务，效果因模型和任务复杂性而异。学习所需技术栈
[学习笔记] Windows编程——GDI——（六）设备上下文根本没在怕哦 Windows 编程学习笔记 windows
前言：学习笔记，随时更新。如有谬误，欢迎指正。说明：红色字体为较为重要部分。绿色字体为个人理解部分。原文链接：https://learn.microsoft.com/en-us/windows/win32/gdi/device-contexts6设备上下文设备上下文是一种结构，用于定义一组图形对象及其关联属性，以及影响输出的图形模式。图形对象包括用于线条绘制的笔、用于绘制和填充的画刷、用于复制或滚
[学习笔记] Windows编程——GDI——（三）裁剪根本没在怕哦 Windows 编程学习笔记 windows
前言：学习笔记，随时更新。如有谬误，欢迎指正。说明：红色字体为较为重要部分。绿色字体为个人理解部分。原文链接：https://learn.microsoft.com/en-us/windows/win32/gdi/clipping3裁剪剪裁是将输出限制为应用程序窗口的工作区中的某个区域或路径的过程。3.1关于裁剪应用程序通过多种方式使用剪裁。Word和Excel应用程序剪裁键盘输入，使其不显示在页
Manus（一种AI代理或自动化工具）与DeepSeek（一种强大的语言模型或AI能力）结合使用任务自动化和智能决策 zzlyx99 人工智能自动化语言模型
一、Manus与DeepSeek差异十分好奇DeepSeek和Manus究竟谁更厉害些，DeepSeek是知识型大脑，Manus则是全能型执行者。即DeepSeek专注于语言处理、知识整合与专业文本生成。其核心优势在于海量参数支持的深度学习和知识推理能力，例如撰写论文、润色法律合同、解答专业问题等。Manus则更强调从规划到交付的闭环能力。它通过工具链调用（如浏览器、代码编辑器）自主执行复杂任务，
强化学习:时间差分(TD)(SARSA算法和Q-Learning算法)(看不懂算我输专栏)——手把手教你入门强化学习(六) wxchyy 强化学习算法
目录前言前期回顾一、SARSA算法二、Q-Learning算法三、总结总结前言前两期我们介绍了动态规划算法，还有蒙特卡洛算法，不过它们对于状态价值函数的估值都有其缺陷性，像动态规划，需要从最下面向上进行递推，而蒙特克洛则需要一个Episode(回合)结束才能对其进行估值，有没有更直接的方法，智能体能边做动作，边估值一次，不断学习策略？答案是有的。这就是本期需要介绍的算法，时间差分法（TimeDi
回溯算法知识总结专业刷题Pia 算法
1.什么是回溯怎么用（回溯本质及模版）底层逻辑：解决树形结构问题、用到递归逻辑、穷举本质优化靠剪枝。回溯模版：1.建立回溯函数（一般以void返回）难点：如何选取参数（index，sum，used，...）voidbacktracking(参数)2.回溯终止条件难点：如何对应终止条件if(终止条件){存放结果;return;}3.单层遍历规则（广搜（横向遍历）靠for循环，深搜（纵向遍历）靠递归）
金融类APP-手写签名ADD盖章功能实现 CherryChen88 金融金融类App专栏金融 app 手写签名手写签名加盖公章 android
前言：之前换工作的时候，发现从事金融行业APP开发比较赚钱，为了钱，最近一直在学习，换工作之前在银行工作，虽然也算是金融行业但是却没有证券行业等的收益高，但在银行业务开发中金融行业也能够使用的其中之一就是，手写签名+公章功能的实现。原理:从业务逻辑上来说，就是我们提供一个可绘制的面板，让用户可以绘制，绘制完成后，进行写入文件保存或者加盖公章合成图片，然后上传后台，这里图片压缩处理逻辑省略。绘制面板
深度学习处理时间序列（2） yyc_audio 深度学习笔记深度学习人工智能
在数据中寻找周期性在多个时间尺度上的周期性，是时间序列数据非常重要且常见的属性。无论是天气、商场停车位使用率、网站流量、杂货店销售额，还是健身追踪器记录的步数，你都会看到每日周期性和年度周期性（人类生成的数据通常还有每周的周期性）。探索数据时，一定要注意寻找这些模式。（让人想到波，想到傅里叶变换）对于这个数据集，如果你想根据前几个月的数据来预测下个月的平均温度，那么问题很简单，因为数据具有可靠的年
SSE vs WebSocket，谁更适合实时文本传输？ A__tao websocket 网络协议网络
引言SSE和WebSocket是常见的实时数据传输技术，在在线文本传输工具中，如何选择合适的方案？技术对比特性SSEWebSocket连接方式单向（服务器→客户端）双向（客户端↔服务器）适用场景消息推送、实时更新双向交互、多用户协作兼容性兼容HTTP/2，支持大部分浏览器需要WebSocket支持复杂度简单易用需要管理连接状态选择建议仅需服务器推送→选择SSE（轻量、兼容性好）。需要双向通信→选择
机器学习的下一个前沿是因果推理吗？——探索机器学习的未来方向！真智AI 人工智能机器学习
机器学习的进化：从预测到因果推理机器学习凭借强大的预测能力，已经彻底改变了多个行业。然而，要实现真正的突破，机器学习还需要克服实践和计算上的挑战，特别是在因果推理方面的应用。未来，因果推理或许将成为推动机器学习发展的新前沿。什么是因果推理，它如何与机器学习相关？如果你和我一样没有数学背景，你可能会好奇“因果推理”到底意味着什么？它与机器学习又有什么关系？当我刚开始学习机器学习时，第一次听到“因果推
第2章 Vue核心架构解析道不尽世间的沧桑 vue深入理解前端 javascript vue.js
2.1双版本设计：运行时vs编译器2.1.1版本差异对比//完整版（包含编译器）构建过程newVue({template:'{{message}}'//需要编译模板})//运行时版（需预编译）构建过程newVue({render(h){//直接使用预编译的render函数returnh('div',this.message)}})关键差异说明表：特性完整版运行时版体积大小较大(~30KB)较小(~
深度好文图解 RocketMQ 的系统架构橘野禾系统架构 kafka java 分布式后端
今天给大家分享一篇学习RocketMQ系统架构核心知识点的梳理和总结,在讲解时力求精简、通俗易懂，通过图解来给正在学习RocketMQ的小伙伴带来帮助。RocketMQ是阿里巴巴的分布式消息中间件，在2012年开源，在2017年成为Apache顶级项目。1集群架构RocketMQ的集群架构如下图：从上图可以看到，整个集群中有四个角色：NameServer集群、Broker主从集群、Producer
AI编程篇-python基础篇 cv工程师(ctrl+c\v) AI编程 python
转型AI算法后的总结-python基础篇python基础AI算法工程师的日常开发工作离不开python这门语言。python的优点：开源免费、简单易学、丰富的库。以下是我总结的python的一些基础：1.python及IDE工具安装对于初学者来说，python的安装是必不可少的，但是为了方便代码编辑和查看结果及debug，可以安装pycharm社区版暂时用来前期学习：python安装及注意事项：下
DeepSeek+元脑企智大模型一体机（培训交流）互联网之路. deepseek
互联网各领域资料分享专区(不定期更新)：Sheet获取方式：请用手机点击链接进行保存，会自动赠送1TB内存，若链接生效请及时后台留言，谢谢。链接如下（夸克网盘）：夸克网盘分享免责声明：1）所共享的所有内容均来源于网络共享资源，版权归原作者或企业所有，下载的任何资源仅能用于学习和研究目的，请勿用于商业用途，否则后果自负。2）尊重版权，这些资源仅供个人学习和交流使用，请勿用于商业用途。本文档仅做整理。
大规模语言模型从理论到实践开源指令数据集 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大规模语言模型从理论到实践开源指令数据集1.背景介绍大规模语言模型（LargeLanguageModels,LLMs）近年来在自然语言处理（NLP）领域取得了显著的进展。诸如GPT-3、BERT等模型在各种任务中表现出色，从文本生成到翻译，再到问答系统，几乎无所不能。这些模型的成功离不开庞大的训练数据集和复杂的算法架构。然而，如何有效地构建和利用开源指令数据集，仍然是一个值得深入探讨的话题。2.核
Unity 中 Boids 算法：模拟群体行为的奇妙世界阿贾克斯的黎明游戏开发 unity 算法游戏引擎
目录Unity中Boids算法：模拟群体行为的奇妙世界一、Boids算法适用场景二、Boids算法基本原理三、在Unity中实现Boids算法在Unity游戏开发的广袤天地里，模拟逼真的群体行为能够为游戏增添丰富的动态与真实感。Boids算法作为实现这一效果的强大工具，被广泛应用于模拟鸟群翱翔、鱼群洄游、兽群迁徙等场景。本文将深入探讨Unity中Boids算法的应用，包括适用场景、实现方式及代码示
C/C++框架和库推荐大王算法 C++入门及项目实战宝典 C/C++开发实战365 C++
值得学习的C语言开源项目-1.WebbenchWebbench是一个在Linux下使用的非常简单的网站压测工具。它使用fork()模拟多个客户端同时访问我们设定的URL，测试网站在压力下工作的性能，最多可以模拟3万个并发连接去测试网站的负载能力。Webbench使用C语言编写,代码实在太简洁，源码加起来不到600行。下载链接：http://home.tiscali.cz/~cz210552/web
RISC-V架构 vs ARM架构：硬件工程师的深度对比 ICGOODFIND1 risc-v 架构 arm开发
引言在嵌入式系统和处理器设计领域，RISC-V和ARM架构是两大热门选择。作为硬件工程师，了解这两种架构的优缺点以及适用场景，对于选择合适的处理器至关重要。本文将从技术特性、生态系统、开发成本和未来趋势等方面，深入对比RISC-V和ARM架构，帮助你在项目中做出更明智的决策。1.架构设计：精简vs成熟RISC-V：开源与模块化RISC-V是一种基于精简指令集计算（RISC）原则的开源指令集架构（I
## VMware 虚拟机保姆级教程：从零开始玩转虚拟化一只联想小新15呀~ 运维开发
虚拟化技术已经成为现代计算不可或缺的一部分，而VMware作为虚拟化领域的领导者，其产品VMwareWorkstationPlayer和VMwareWorkstationPro更是深受广大用户喜爱。无论你是想体验不同操作系统，还是搭建测试环境，VMware都能满足你的需求。本教程将带你从零开始，一步步学习如何使用VMware虚拟机。**一、准备工作**1.**下载VMwareWorkstation
算法题（98）：大数加法被AI抢饭碗的人算法题算法
审题：本题需要我们解决大数加法，大数直接运算会超出范围，所以我们需要转换成字符串一位位进行计算思路：方法一：高精度加法我们将两个大数的每一个位分别计算，然后头插到answer字符串中即可解题：1.由于我们是从个位开始计算，而字符串的存储size-1的位置才是个位的位置，我们就把j和i初始化为size-1.2.当有进位或两个大数还有数据的时候，我们进行大数加法。3.字符串的头插可以使用=和+号实现，
《黑客攻防从入门到精通：工具篇》全15章万字深度总结——从工具解析到实战攻防，构建完整网络安全知识体系予安灵黑客技术 web安全安全系统安全网络安全安全架构网络攻击模型黑客工具链
目录一、书籍核心逻辑与学习路径二、核心模块与工具深度解析模块1：信息收集与网络扫描模块2：渗透测试与漏洞利用模块3：密码攻防与身份认证模块4：恶意程序攻防模块5：网络追踪与反追踪模块6：系统加固与数据防护三、工具链实战方法论第一章：黑客必备小工具第二章：扫描与嗅探工具第三章：注入工具（诸如工具）第四章：密码攻防工具第五章：病毒攻防常用工具第六章：木马攻防常用工具第七章：网游与网吧攻防工具第八章：黑
Java 基础到进阶&企业技巧（二） Aphelios380 开发语言 java 学习 idea 学习方法
在Java学习的旅程中，我们逐步探索了其丰富的知识体系，从基础的数据类型、字符串操作，到流程控制、运算符的运用，每一步都为我们构建强大的编程能力奠定基石。同时，了解这些知识在Java全栈开发中的应用场景，对未来进入企业工作至关重要。目录一、字符串1.底层原理与语法2.字符串位置与拼接3.字符串数组操作二、人机交互1.接收输入-Scanner类2.课堂练习三、字符与编码1.char字符2.面试题：字
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他