debug_jxr

通过深度神经网络实现可扩展性因果图学习

- 写在前面
- 背景介绍
- 相关方法
- - Granger Causality
  - Transfer Entropy
  - Graph Learning
  - Kernel-based Methods
  - Supervised Learning Methods
  - MLP and LSTM
  - Graphical Neural Network
- 模型概述
- - 模块 1：学习变量内非线性
  - 模块 2：因果图学习（重点）
  - 模块 3：学习变量间非线性
  - 模块 4：回归预测
- 实验部分
- - 对比方法
  - 数据集设置
  - 实验结果

写在前面

这是一篇CIKM（B类）2019年的论文，用神经网络做因果图学习，和我的研究方向相关，因此做一下笔记。

太长不看版：
输入： $m\times n$ 的矩阵，表示 $m$ 个变量的 $n$ 步时序列
输出： $m\times m$ 的矩阵，表示各变量之间的关联程度（包含非线性）
思想：通过时序预测做自监督训练
过程：

向网络输入 $m\times l$ 的矩阵，l表示预测需要的时序长度
通过改版的ResNet，得到多层 $m\times p$ 的矩阵，表示单节点非线性变量
各矩阵转置经过 $m\times k, k \times k, k \times m$ 的矩阵，得到多个考虑不同变量影响的变量 $m\times p$
将各矩阵拼接在一起，通过MLP得到 $m\times t$ 的多节点非线性变量，再通过一个相同维度的 $R$ 模拟回归系数，然后做点积，得到预测结果
MSE作为 $l o s s$ 并反向传播更新参数
训练结束后3中的三个矩阵相乘作为近似的关联矩阵

论文PDF链接

背景介绍

复杂系统中的因果图学习是非常重要的。现有的方法主要聚焦的是基于预先设定的核或者数据分布而做的因果图学习（也就是说需要具备一定的领域知识），或者只研究了系统中特定的单个目标对剩余节点的影响。同时，现有方法大多只能对线性因果关系进行发掘。而数据的非线性性会给因果图学习带来较大的影响，使得现有方法失效。

从数学上来说，因果图学习的输入是 $X=\{X(1, *), X(2, *),...,X(m,*)\}\in\mathbb R ^ {m\times n}$ ,即有m个变量，每个变量有一个长度为n的序列。输出则是 $A\in\mathbb R^{m \times m}$ 的非负有向矩阵。如果 $A (i, j)$ 远大于 $0$ ，那么说明第 $i$ 个变量是第 $j$ 个变量的影响因子之一。什么是非线性关系？论文中举了一个比较好的例子：
$X(3,t_3)=X(1,t_1)^2+log(X(2,t_1))+X(1,t_2)^{X(3,t_1)}+ X(1,t_1)^3cos(X(3,t_2))$
在上面这个式子中，变量 $X_1, X_2, X_3$ 就不是简单的线性关系了，而是复杂的非线性关系。这种非线性是现有的任何方法都难以刻画的，那对这种复杂函数的拟合，咱们能想到什么？对，神经网络。所以在我看来，这篇论文的motivation还是挺好理解的。（吹吹牛皮，缓解一下枯燥）

现有的因果图学习的挑战主要集中在三个方面：

数据噪声对结果存在影响
系统具有多样性，很难有一个不需要领域知识的普适方法
结点数量增加带来的可扩展性问题（我理解为复杂度控制）

虽然提出了这么多挑战，但是他用神经网络的方法，这些问题都可以得到解决（至少是理论上的解决）：

良好训练、鲁棒性高的神经网络具有较好的抗噪性
神经网络是数据驱动的，因此需要的领域知识较少；在论文中我们也可以看到，他应对不同数据集的方法就是增加可训练参数的数量&&把一些原本不可学习的参数变为可学习的。这个在后面会提到。
在神经网络中有一处要学一个 $\times m$ 的矩阵，如果节点数增多，那么空间开销将不可承受，而考虑到节点之间的关系矩阵是低秩的（很难有一个节点被其他节点各种非线性组合决定之类的），所以可以做一个低秩分解，变成学习 $\times k, k \times k, k \times m$ 这三个矩阵，然后重新组合成 $\times m$ 的矩阵

模型概述

模型分为四个部分，分别学习不同的非线性关系和因果关系。下面自底而上进行介绍（按照数据的流动方向）：

模块 1：学习变量内非线性

论文使用神经网络的最大目的之一就是在因果学习中融入非线性。第一个模块只需要考虑单变量的非线性。在之前的例子中，前两项就是单变量的非线性，因为他们虽然是非线性的，但是每个项只和单个变量相关。论文中使用了ResNet作为变量非线性的刻画。公式如下：
$G_q=ReLU(\beta _q(G_{q-1}B_q)+id(G_{q-1})),\quad q=1,2,...,Q \\ G_0 = X(*, t_j-l+1,t_j)$
其中:

$G_q\in \mathbb R^{m \times p}$ 表示ResNet第q层的输出
$B_q\in \mathbb R^{p\times p}$ 表示第q层的权值矩阵，第0层是 $l\times p$
$i d$ 是恒等变换，这里不清楚第0层是如何处理的
$Q$ 是ResNet层数
$\beta_q$ 是每一层对最终结果的相关性，在对ResNet优化的后续论文中，一般是设置它为一个长度递减的固定值，但是在这篇论文中，由于对于不同的数据集每层都有不同的相关性，因此将这个变量设置为可学习的。下面是论文中为了论证这个可学习是合理的而提供的图

横轴是训练迭代数，纵轴是不同的层。可以看到，在两个不同的数据集上，最终参数都收敛了而且收敛到了不同的值。

由此我们得到了 $Q$ 个 $m\times p$ 的矩阵。这些矩阵代表了神经网络所拟合的只包含单个变量的非线性关系。它将作为下一层的输入。

模块 2：因果图学习（重点）

模块1中并没有考虑到不同变量对最终结果的贡献，模块2就是用来处理这个的。其实非常简单，直接乘上一个 $A_q$ 矩阵就好，因为多变量更为复杂的非线性需要在模块3中处理。公式如下：
$\bar G_q^T(*,i)=G_q^TA_q(*,i),\quad i=1,2,...,m$
这里的转置是为了让维度对齐。注意，如果这里直接这么处理，我们需要 $q$ 个 $m\times m$ 的可学习矩阵，在 $m$ 过大的时候这样的空间复杂度是无法承受的，所以我们需要降维。其实这个做法在深度学习中很常见，原本要学习一个 $m\times m$ 的矩阵，改为学习 $m\times k, k\times k, k\times m$ 的三个矩阵，只要结果正确即可。论文中说这样做的理论依据是虽然总体的 $m$ 可能很大，但是对每个变量有影响的平均节点数 $k$ 是比较小的。这是可以理解的，因为很难做到一个节点被其他很多很多节点影响。但是至于经过模块1的非线性层之后是不是这么回事，那就不清楚了。我这里还是保留意见。

那么这个就是论文在开头提到的 $\text{"low-rank decomposition"}$ ，也是论文标题中的scalable。有了这样一个分解之后，我们就可以改写上式：
$\bar G_q^T(*,i)=\sigma ((\sigma (G_q^TU_{q,k})S_{q,k})V_{q,k})$
其中， $U, S, V$ 三个矩阵分别对应了前面提到的三个维度。在训练阶段结束后，令
$A_q \approx U_{q,k}S_{q,k}V_{q,k} \\ A\approx \sum_{q=1}^Q\beta_qA_q$
则 $A$ 就是对应该数据集的关联矩阵。

这里又存在一个问题了，为什么可以这样近似？理论上来说应该带上非线性层，但是带上非线性层会和数据相关，所以去掉了。那么这个贸然的去掉是否会给结果带来问题？会造成多大的精度损失？论文中并没有给出前人是否有相关的结论，只是说“Our empirical studies also confirm our choice.”。（我想这个地方大概就是它只能中B的原因？）论文中设置两个激活函数分别是tanh和ReLU（我特意去查了一下，tanh可以念作"tanch"，哈哈哈）。

与传统的SVD分解相似，这里通过了正则化项让 $U_{q,k}, V_{q,k}$ 是标准正交的。这里提到了一句“The constructed embedding also has theoretical connection to Stiefel manifolds and spectral theorem[30].”，回头补一补相关文献。

Petre Stoica and Randolph L Moses. 1997.Introduction to spectral analysis. Vol. 1.Prentice hall Upper Saddle River, NJ.

模块 3：学习变量间非线性

通过前两个模块，我们得到了 $Q$ 个 $m\times p$ 的矩阵。我们将它们拼接在一起，输入到一个多层MLP中，最后得到一个 $H_D\in \mathbb R^{m\times d_D}$ 的矩阵，其中 $D$ 是MLP的层数。然后论文对这个过程作了一些理论上的玄学解释，就略过去了。这里实在是有点过于简单了。

模块 4：回归预测

首先看传统的Granger Causality公式：
$X(*,t_j+1)=\sum_{r=1}^lA_rX(*,t_j+1-r)+\epsilon(*,t_j+1)$
其中 $A_r$ 是一个跟时间步相关的因果图矩阵。为了在神经网络中做回归，最后加了一个相同维度的矩阵去做行点积，运算结果作为预测结果：
$\hat X(i, t_j+1)=H_D(i,*)\circ R(i,*), \quad i=1,2,...,m$
将预测结果和原结果做MSELoss，加上正则化项和标准正交的约束作为整体的loss：
$loss={1\over {mn}}(X(*, t_j+1)-\hat X(*, t_j+1))^2 \\ +\lambda_1\sum_q(||U_{q,k}||_2+||V_{q,k}||_2) \\ +\lambda_2\sum_q(||U_{q,k}^TU_{q,k}-I||_2+||V_{q,k}^TV_{q,k}-I||_2)$

以上就是模型的整体框架，可以看到，重点就在于第二步的低秩分解。至于是否有效就需要在实验中进行验证。

实验部分

对比方法

和相关方法部分相对应，总共选取了5个baseline：

VAR
最为有名的方法，通过自回归向量模型+L2正则化项来学习因果图
PCKGC
源于成对的基于核的条件Granger因果性分析，只考虑了基于具有最高互信息分数的变量子集的条件概率，以此节省时间复杂度
Copula
将每个变量的边缘分布转换到高斯域，然后使用VAR图学习方法+L2正则化项
cLSTM
输入过往数据，经过LSTM后做未来数据的回归预测。使用L1正则化项并提取第一层的所有权重的绝对值和作为因果性的衡量
pTE
先基于过往数据的概率函数将每个变量的时序信号转换成离散阶段，然后计算阶段的转化熵（也就是对应于之前的Transfer Entropy）的方法

数据集设置

数据集分为人造数据集和真实数据集。人造数据集采用了分层构造的方式，三层结构，上层是下层的影响因子，每层变量数按照5-15-45(A)和10-30-90(B)排列。

这样做主要是有利于观察结果，期望的因果图，有值的点应尽量集中在上部。

每个节点的时序序列通过一些复杂的非线性数学运算组合生成，并且加入一定的噪声。这里具体可以参考原论文。

实验结果

实验采用了PR曲线和ROC曲线对应围成的面积作为指标，结果如下：

对比其他方法在准确度上有了比较大的提升。为了证明他们的模型收敛情况良好，也给出了对应的loss曲线和AUPR曲线：

另外一部分是在真实数据集上做的，据论文作者描述，这些数据采集自50个引擎的历史六个月的数据，总共的训练样本数是180K。文章对最后的结果进行了一些描述，但是限制于隐私原因并没有描述的很清楚：

后面还有一些消融实验，不是重点，这里就略去了。唯一值得一提的是不同方法时间效率上的对比：

SCGL在m增大时的增长是这里面最缓慢的之一（cLSTM也很缓慢，但是结果上比不过SCGL）。

上面就是这篇论文的全部内容了，可能有些许遗漏。写这篇翻译的本意就是当一个备忘录，让自己看完论文之后还能留下点什么。从思路来看，他借鉴了相关方法里面的MLP&LSTM以及Granger Causality，设计了比较精细的网络结构，通过low-rank分解降低了时间复杂度，从而有所创新。但是看完整篇，我依然觉得在生成因果图的部分，他并没有说明为什么可以忽略掉非线性函数，只是用了约等号敷衍了过去。或许这是下一个可以突破的地方。后面我要做的事情，就是去了解相关方法中提到的那些前人工作，看看能不能得到相似的motivation。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
非对称加密算法原理与应用2——RSA私钥加密文件私语茶馆云部署与开发架构及产品灵感记录 RSA2048 私钥加密
作者：私语茶馆1.相关章节（1）非对称加密算法原理与应用1——秘钥的生成-CSDN博客第一章节讲述的是创建秘钥对，并将公钥和私钥导出为文件格式存储。本章节继续讲如何利用私钥加密内容，包括从密钥库或文件中读取私钥，并用RSA算法加密文件和String。2.私钥加密的概述本文主要基于第一章节的RSA2048bit的非对称加密算法讲述如何利用私钥加密文件。这种加密后的文件，只能由该私钥对应的公钥来解密。
粒子群优化 (PSO) 在三维正弦波函数中的应用 subject625Ruben 机器学习人工智能 matlab 算法
在这篇博客中，我们将展示如何使用粒子群优化（PSO）算法求解三维正弦波函数，并通过增加正弦波扰动，使优化过程更加复杂和有趣。本文将介绍目标函数的定义、PSO参数设置以及算法执行的详细过程，并展示搜索空间中的动态过程和收敛曲线。1.目标函数定义我们使用的目标函数是一个三维正弦波函数，定义如下：objectiveFunc=@(x)sin(sqrt(x(1).^2+x(2).^2))+0.5*sin(5
非对称加密算法————RSA理论及详情 hu19930613
转自：https://www.kancloud.cn/kancloud/rsa_algorithm/48484一、一点历史1976年以前，所有的加密方法都是同一种模式：（1）甲方选择某一种加密规则，对信息进行加密；（2）乙方使用同一种规则，对信息进行解密。由于加密和解密使用同样规则（简称"密钥"），这被称为"对称加密算法"（Symmetric-keyalgorithm）。这种加密模式有一个最大弱点
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
【加密算法基础——对称加密和非对称加密】 XWWW668899 网络安全服务器笔记
对称加密与非对称加密对称加密和非对称加密是两种基本的加密方法，各自有不同的特点和用途。以下是详细比较：1.对称加密特点密钥:使用相同的密钥进行加密和解密。发送方和接收方必须共享这个密钥。速度:通常速度较快，适合处理大量数据。实现:算法相对简单，计算效率高。常见算法AES(高级加密标准)DES(数据加密标准)3DES(三重数据加密标准)RC4(流密码)应用场景文件加密磁盘加密传输大量数据时的加密2.
【算法练习】IDEA集成leetcode插件实现快速刷 2401_84102892 2024年程序员学习算法 intellij-idea leetcode
============点击右侧边leetcode->设置->配置地址、用户名、密码、存放目录、文件模板用户名要登录后在账号信息里看模板代码1.codefilename!velocityTool.camelC
【加密算法基础——RSA 加密】 XWWW668899 网络服务器笔记 python
RSA加密RSA（Rivest-Shamir-Adleman）加密是非对称加密，一种广泛使用的公钥加密算法，主要用于安全数据传输。公钥用于加密，私钥用于解密。RSA加密算法的名称来源于其三位发明者的姓氏：R:RonRivestS:AdiShamirA:LeonardAdleman这三位计算机科学家在1977年共同提出了这一算法，并发表了相关论文。他们的工作为公钥加密的基础奠定了重要基础，使得安全通
Python实现关联规则推荐这孩子谁懂哈 Python Machine Learning python 关联规则机器学习
1.什么关联规则关联规则（AssociationRules）是反映一个事物与其他事物之间的相互依存性和关联性，如果两个或多个事物之间存在一定的关联关系，那么，其中一个事物就能通过其他事物预测到。关联规则是数据挖掘的一个重要技术，用于从大量数据中挖掘出有价值的数据项之间的相关关系。关联规则挖掘的最经典的例子就是沃尔玛的啤酒与尿布的故事，通过对超市购物篮数据进行分析，即顾客放入购物篮中不同商品之间的关
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
高性能javascript--算法和流程控制海淀萌狗
-for,while和do-while性能相当-避免使用for-in循环，==除非遍历一个属性量未知的对象==es5:for-in遍历的对象便不局限于数组，还可以遍历对象。原因：for-in每次迭代操作会同时搜索实例或者原型属性，for-in循环的每次迭代都会产生更多开销，因此要比其他循环类型慢，一般速度为其他类型循环的1/7。因此，除非明确需要迭代一个属性数量未知的对象，否则应避免使用for-i
深度 Qlearning：在直播推荐系统中的应用 AGI通用人工智能之禅程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
深度Q-learning：在直播推荐系统中的应用关键词：深度Q-learning,强化学习,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。面对海量的直播内容,用户很难快速找到自己感兴趣的内容。因此,个性化推荐系统在直播平台中扮演着越来越重要的角色。1.2研究现状目前,主流的个性化推荐算法包括协同过滤、基于内容的推荐等。这些方法在一定程度上缓
JVM源码分析之堆外内存完全解读 HeapDump性能社区
概述广义的堆外内存说到堆外内存，那大家肯定想到堆内内存，这也是我们大家接触最多的，我们在jvm参数里通常设置-Xmx来指定我们的堆的最大值，不过这还不是我们理解的Java堆，-Xmx的值是新生代和老生代的和的最大值，我们在jvm参数里通常还会加一个参数-XX:MaxPermSize来指定持久代的最大值，那么我们认识的Java堆的最大值其实是-Xmx和-XX:MaxPermSize的总和，在分代算法
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$

通过深度神经网络实现可扩展性因果图学习