zenRRan

综述 | GNN金融风控领域业界进展调研

每天给你送来NLP技术干货！

来自：程序媛驿站

前言：

本文重点：

工业界金融欺诈风控领域上 GNN的应用及进展

注：

本文仅针对可用「深度图神经网络解决」的 - 「金融风控」相关的任务论文
「除深度图神经网络之外，业界常用经典图算法」 & 「除金融欺诈风控领域之外，常见推荐等任务」 & 「图数据库存储方式」会顺带提及，但本文不会详细讲解

前置知识：

一文读懂图神经网络

前言
1⃣️WHY GNN
- GNN 的核心
- 未来的研究方向
- 图神经网络框架
- GNN相关的一些开源平台
2⃣️图数据集选取条件
- 现有开源数据集
- 金融风控类 - 数据集现状
3⃣️金融风控方向GNN进展
- 阿里蚂蚁
  - 【网络结构设计】自动选择邻居的GNN
  - 【淘宝】运费险诈骗识别「反欺诈」
    - 运费骗保
    - GeniePath算法
  - 【支付宝】恶意账户识别 / 高危账户识别
    - 欺诈/恶意账户检测
    - GEM算法，世界上已知的首个利用图卷积进行恶意账户识别
  - 【蚂蚁金服信贷】贷款违约预测
  - 【GNN框架】
- IBM
  - 【比特币洗钱识别】
- 北航
  - 【互联网评论欺诈】
- GNN业界进展
4⃣️其他方向进展
- 阿里
  - 【广告推荐】
  - 【淘宝推荐】
  - 【推荐系统】
- Uber Eats
  - 【餐厅推荐】
- 网易音乐
  - 【音乐推荐】
- 滴滴
  - 【车辆调控管理】
- Fabula AI
  - 【假新闻检测】
- Comodo 科摩多
  - 【恶意应用识别】
5⃣️其他相关&参考资料

1⃣️WHY GNN

非欧空间需要GNN来解决：

当前，深度学习技术已经在语音识别、机器翻译、图像分析和计算机视觉等方向取得了重要成果
✅ 欧氏空间：音频 / 自然语言（1D）、图像（2D）、视频（3D）
❌ 非欧空间：社交网络数据、生物化学图结构、引文网络等

“图结构”的分类

有向 / 无向（边）
有权 / 无权（边）
有特征 / 无特征（节点 / 边）
同构 / 异购（节点 / 边）
Attributed：考虑节点性质，如用户性别、年龄、购买力等
Multiplex：多重边，节点之间可能有多种关系，比如说两个用户之间可能为好友、同学、交易关系等；用户和item之间可以浏览、点击、添加到购物车、购买等
Heterogeneous：异构，节点和边有多种类型，节点类型+边类型>2
-- Representation Learning for Attributed Multiplex Heterogeneous Network 阿里异构Embedding GATNE

GNN 的核心

就是 information diffusion mechanism / message passing。
其核心就是要在相互连接的节点之间交换信息，即需要迭代地更新节点的表示，每一次更新，每个节点上的信息都和相邻节点做一定的交互。
这两类都通过一个参数化表示的深度学习模块来做这样的信息交换：在 RecGNN 中，每一步信息交换的变换函数都是一样的，并且目标是做很多次这样的信息交换直到每个节点上的特征都达到稳态；在 ConvGNN 中，每一步信息交换的函数都不一样，并且只经过有限步的信息交换。这一点区别如下图所示。
对于 graph-level 的任务来说，还需要从图上每个节点把信息聚合起来，这就涉及到很多 pooling 的技术。

图神经网络的基本思想：

图神经网络的基本思想，就是基于节点的局部邻居信息对节点进行embedding。
直观来讲，就是通过神经网络来聚合每个节点及其周围节点的信息。
算法思想是基于节点的局部邻居及其自身特征信息对节点进行表示学习(Node Representation Learning)。
本质上是通过神经网络对聚合节点及其邻居节点的特征信息做非线性变换。
图神经网络有很多变种，可以从图的类型、训练方法和传播步骤等多方面进行变种分类。

图上的学习任务

1、图节点分类任务：图中每个节点都有对应的特征，当我们已知一些节点的类别的时候，可以设计分类任务针对未知节点进行分类
2、图边结构预测任务：图中的节点和节点之间的边关系可能在输入数据中能够采集到，而有些隐藏的边需要我们挖掘出来。就是对边的预测任务，节点和节点之间关系的预测。
3、图的分类：对于整个图来说，我们也可以对图分类。基本思路是将图中节点的特征聚合起来作为图的特征，再进行分类。

另：

一般在图中寻找子团的任务为社群检测（Community Detection）或者叫作高密子图挖掘（Dense Subgraph Mining）
算法不断删除节点使得剩下的节点构成的社区可疑度最大，然后记录整个删除过程中社区可疑度最大的那一轮，那么该轮的剩余节点构成的子图就是最可疑的。
针对固定问题使用固定算法，如FRAUDAR 算法自动化地挖掘出二部图里的高密子图，较少用GNN解决
https://zhuanlan.zhihu.com/p/45625323

学习任务的应用

图神经网络在文本分类（Text classification）
序列标注（Sequence labeling）
神经机器翻译（Neural machine translation）
关系抽取（Relation extraction）
事件抽取（Event extraction）
图像分类（Image Classification）
视觉推理（Visual Reasoning）
语义分割（Semantic Segmentation）
等等

领域应用：

风控领域、推荐系统（社交网络 / 电商推荐）、生物医疗等等

未来的研究方向

如何有效地提升模型复杂度：因为 convolution 层变多时，各个节点的特征将会变得越来越接近，加多层数最后会使得所有的点上的特征都变成一样的，因此不能单独靠把模型做深来提高模型复杂度。
如何提高模型的拓展性：当图的规模变得特别大时，就需要考虑如何来对图进行聚合并且尽量不要丢失图上的信息。有两种思路：sampling 可能会使得节点丢失一些很关键的邻居；clustering 可能会使得图丢失一些比较特别的结构模式。
如何融合异源数据：真实应用场景中，图可能会有不同类型的节点、连边，如何处理这些数据也将成为一个研究方向。
如何处理动态的图：就像 STGNN 中所做的事情一样。

图神经网络框架

几种当下最为广泛的图神经网络框架

1、Deep Graph Library（DGL）

DGL采用了基于「消息传递」的编程模型
消息传递是图计算的经典编程模型。
DGL已经支持PyTorch、MXNet和TensorFlow作为其后端。

2、PyTorch Geometric（PyG）

PyG目前支持大量常见基准数据集
基于PyTorch的几何深度学习扩展库

3、Ant Graph machine Learning system（AGL）

由阿里的蚂蚁金服团队推出的大规模图机器学习系统

4、tf_geometric

同时支持TensorFlow 1.x和2.x的图神经网络框架

5、PGL

由百度的paddle一个基于 PaddlePaddle 的高效易用的图学习框架

GNN相关的一些开源平台

1、Deep Graph Library（DGL）

DGL由纽约大学、纽约大学上海分校、AWS上海研究所和AWS MXNet科学小组开发和维护GNN平台。开始时间: 2018.
地址:https://www.dgl.ai/,
github地址: https://github.com/jermainewang/dgl

2、NGra

NGra是由北京大学和微软亚洲研究院开发和维护一款GNN平台。开始时间:2018。
地址:https://arxiv.org/pdf/1810.08403.pdf

3、Graph_nets

Graph_nets是由DeepMind, Google Corp开发和维护的。开始时间:2018
地址: https://github.com/deepmind/graph_nets

4、Euler

Euler是一款由阿里巴巴旗下的阿里妈妈开源的GNN平台。开始时间:2019
地址: https://github.com/alibaba/euler

5、PyTorch Geometric

PyTorch Geometric由德国杜特蒙德大学开发和维护的GNN平台。开始时间:2019
地址:https://github.com/rusty1s/pytorch_geometric
论文：https://arxiv.org/abs/1903.02428?context=cs.LG

6、PyTorch-BigGraph（PBG）

PBG是由Facebook人工智能研究开发和维护的GNN平台。
开始时间:2019
地址: https://github.com/facebookresearch/PyTorch-BigGraph
论文：https://arxiv.org/abs/1903.12287

2⃣️图数据集选取条件

图数据集的选择：

关系型数据，复杂网络
图(graph)是一种数据结构，常见的图结构由节点(node)和边(edge)构成，节点包含了实体(entity)信息，边包含实体间的关系(relation)信息。
「节点」和「边」必需，节点属性/类别 & 边权重/类别可选（异构）

本次调研要求领域：

金融风控 > 电商网络 > 社交网络

现有开源数据集

已有大规模公开数据集

斯坦福大学：
https://snap.stanford.edu/data/（大型社交、信息网络。包括：图分类数据库、社交网络、引用网络、亚马逊网络等
- 可用：社交网络 / 亚马逊电商数据
https://ogb.stanford.edu/（三种图任务上的真实基准数据集，同时提供数据加载器和评估器（PyTorch）
- 可用：亚马逊电商数据
- -- – https://blog.csdn.net/lj2048/article/details/106575412/
-- – https://www.pianshen.com/article/71231875410/

亚马逊电商网络

常用任务：节点分类，预测产品的类别
数据集特点：无权重无向图
节点为售卖的商品，边表示两个商品被一同购买

社交网络（FaceBook、Twitter等）

常用任务：推荐算法，解决冷启问题
数据集特点：无权重（FaceBook无向/Twitter有向）
节点表示用户，边表示朋友关系

知识图谱

Freebase
- 采用结构化数据的形式，如，已故美国总统肯尼迪的条目。类似履历表，包括出生时间、死亡时间、性别、职业、国籍、配偶等等
- 这一套格式是固定的，所有人物条目都包含同样的字段。这样一来，数据之间就可以很容易地联系在一起，为信息的查询和处理提供了巨大的方便
WordNet
- 按照单词的意义组成一个“单词的网络”。WordNet是一个覆盖范围宽广的英语词汇语义网

金融风控类 - 数据集现状

总述：

图深度学习技术应用在风控领域已经证明是有效且必要的，但发展时间较短，整体进程还处在发展初期阶段。
挑战：
- 模型开发者需要面对的挑战：
- 数据来源狭窄、数据格式不统一
- 算法验证标准尚未统一
- 应用场景多样
- 具体业务上模型定制化程度较高
- 缺少公开数据

1、数据：

数据隔阂 & 缺少统一数据
当前很少有公开的风控领域的图数据能够直接用于风控场景的图深度学习算法，虽然算法研究者多拥有自己的数据源，但外人几乎接触不到：
有的互联网公司，由于业务的特点，能够很方便接触到海量的用户数据（交易数据、APP下载数据、登录/注册数据、浏览/购买数据等），其中蚂蚁金服较为突出。这些公司或者组织能够很方便的基于自己现实业务，利用现有数据进行模型的构建。
但由于这些用户数据的私密性，这些数据仅在其所有者内部使用，外人接触不到。这也造成业内没有统一的标准进行模型的对比验证。各家目前还是各自为营，自产自销。
– – https://bbs.huaweicloud.com/blogs/184712

2、模型算法：

当前风控领域的图深度学习算法在不同场景下还没有很好的统一性。换句话说，现在单个算法主要还是聚焦在较为单一的风控场景。
比如首个利用图卷积进行恶意账户识别的GEM算法主要使用于账户登录/注册场景。-- Heterogeneous Graph Neural Networks for Malicious Account Detection 蚂蚁金服
GraphConsis算法主要聚焦在账户的恶意/欺诈评论识别。-- Alleviating the Inconsistency Problem of Applying Graph Neural Network to Fraud 北航
数据的隔阂，统一数据的缺少以及业务的针对性是造成模型针对面较窄的一些原因。
（都和我们预期的银行金融数据不同，且蚂蚁金服数据未开源）

3⃣️金融风控方向GNN业界进展

3.1 阿里蚂蚁

由于蚂蚁金服为上亿级的个人用户提供服务，产生的金融数据从一开始就是海量且极其复杂的。即便是此前最先进的Graph Embedding 技术，处理金融级的图结构仍有压力。

自研的图结构处理Graph Embedding 技术 ICML 2018

【网络结构设计】自动选择邻居的GNN

具有自适应接收路径的图神经网络，自动学习对目标节点贡献大的邻居进行传播
规避恶意账户
GeniePath通过定义两个parametric函数：自适应广度函数、和自适应深度函数，共同对子图进行广度、深度搜索。其中自适应广度函数限定朝哪个方向搜索重要节点，自适应深度函数限定搜索的深度，即是1跳邻居信息就足够了，还是需要多跳邻居信息。
-- GeniePath: Graph Neural Networks with Adaptive Receptive Paths 蚂蚁金服 CIKM, 2018
-- https://zhuanlan.zhihu.com/p/61134212
-- https://export.arxiv.org/pdf/1802.00910

【淘宝】运费险诈骗识别【反欺诈】

1 什么是运费骗保

本文在传统运费险风控的基础上，详细介绍了蚂蚁金服人工智能部如何用图学习的方法，抓取更多的骗保行为
退货是买家常见的诉求。然而退货的运费争议巨大。为了保障买家对购物行为的“后悔权”，运费险应运而生。大规模的运费险单量，也催生了不少的骗保产业。
购买运费险后，在确认收货前，买家可以要求退货。退货所需要的运费，需要承保公司来承担。大部分的运费险，购买一单只需要几毛钱，但退回的运费却有几块钱。如果实际退货没有发生，或实际退货所需运费成本低于保险公司的赔付额，用户可以得到数倍收益。
-- https://mp.weixin.qq.com/s?__biz=MzI0Nzc3MTQyMw==&mid=2247486168&idx=1&sn=fda5696ed9b4ac2c9ede9daa18c4e41c&chksm=e9abb2a8dedc3bbe8f0fd2c49b5feeee699f4eb20ad6d09c2bb35e5d8a0344a2f8c836da1c04&scene=21#wechat_redirect

2 GeniePath算法

运费骗保识别问题
传统的运费险风控，主要通过一组策略，在线对单个账户的风险等级进行评估。基于策略、着眼单个账户，往往不能覆盖所有的骗保活动；
本文将重点放在了构建账户关系网络（即关系图），用神经网络的方法，挖掘关系图中的信息。
本文将骗保识别问题，定义为一个账户的二分类问题，二分类的标注来自运费险风控的策略。
在解决这个问题的过程中，我们发现，行为特征（购物行为、浏览行为等）不能有效地区分“正常账户”和“骗保账户”。这主要是因为骗保的手段是专业的、变化的、有意遮掩的。然而，账户之间的关系，往往更加稳定，更加难以隐藏。但是如何构建账户之间的关系，让“正常账户”和“骗保账户”的区分度更高呢？
构建设备共用图：包括账户和设备两种节点，如果一个账户曾在某设备上登录，则这个账户和设备之间就有一条边。
设备共用图中“正常用户”和“骗保团伙”的关系模式区别较大。我们最终选择了设备共用图作为构图对象。
-- https://zhuanlan.zhihu.com/p/50531764
-- Who-Stole-the-Postage？Fraud Detection in Return-Freight Insurance Claims 蚂蚁金服 KDD, 2018

【支付宝】恶意账户识别 / 高危账户识别

1 欺诈/恶意账户检测

1）什么是恶意账户

恶意账户针对在线账户提出，如：Gmail 提供的邮件服务，微博/Twitter 提供的短消息分享服务，支付宝提供的支付服务等。
恶意用户可能迅速大量地扩散垃圾广告等信息；催生微博僵尸账户达到某种非法营销、传播目的；在金融服务领域，注册大量新账户达到薅羊毛、洗钱、欺诈等目的。
恶意账户具有强烈获取利益倾向和团伙性质，往往是通过批量、低成本注册的账户。

2）恶意账户的特点

1.设备聚集性：见下图所示。两张图分别展示了用户（纵轴）过去是否在设备（横轴）有过登录行为。蓝色点代表该用户过去有在某设备上登录过。从图中可以看出，左图 pattern 较为均匀，右图则完全不同，可以看到极为有规律和稠密的 pattern。这说明，黑产账户更倾向于在设备（媒介）的联通上有着高聚集性。

左图是正常账户特征，右图是恶意账户特征

2.时间聚集性：见下图所示。两张图分别展示了账户（纵轴）在时间（横轴）上的行为序列。其中蓝点代表登录行为。从左图可以看出，正常账户在注册之后，每天会有均匀的登录 pattern，右图中的黑产账户则只在某个时间段内集中达成某种行为，这种 pattern 我们称之为时间聚集性。

左图是正常账户特征，右图是恶意账户特征

小结：这两种特征是黑产账户所固有形成的。即，这些黑产受利益所驱动而无法绕开这些模式（只要能准确捕获黑产账户之间共享的设备信息，这里的设备不限于某一个手机、某一个IP地址，可以认为是一种媒介）。
因此，我们针对这些数据特点设计了基于图的神经网络算法识别黑产账户。

2 GEM算法，世界上已知的首个利用图卷积进行恶意账户识别

基于异构图神经网络的恶意账户识别方法，主要使用于账户登录/注册场景
在线账户伴随着（移动）互联网的诞生而产生，在金融服务领域，这种通过批量、低成本注册的恶意账户的存在是十分危险的。
该方法是支付宝为保障体系内账户安全，降低恶意账户带来的资损，保障支付体系健康，在人工智能领域所做的努力和尝试。
传统联通子图方法：
- 建立多个账户-设备二部图，由于设备聚集性，我们可以计算每个联通子图的节点数目，每个账户的危害程度取决于该节点所在联通子图的节点数目。
- 该方法可以准确识别那些设备聚集度特别高的黑产账户。但是对于设备聚集程度一般或较低的账户，很难做出准确区分。
图神经网络方法：
- 构建异构图，包括账户类节点，以及多种类型的设备信息，如：电话、MAC、IMSI 以及其他 ID。
- 为每个账户加入时间上的行为特征 X ∈ RN,P。其中每行 Xi 表示节点（账户或设备）在时间上的行为特征。我们希望构建的神经网络模型可以学习到通过设备聚集在一起的账户在行为特征上的模式，从而更准确的做出判别。
模型设计
- 模型认为是GCN的变体，在于：1.扩展到异构网络; 2.由于聚集性模式，对不同类型的图使用“sum”算子进行聚合操作，同时对不同设备图平均操作。
- 相比GCN只能处理同质网络，GEM 处理原始的异构网络，信息会有所保留，另外对每种类型节点使用“聚合”运算操作，而不是normalized 操作。
- GEM-attention 因为考虑不同设备的权重，而不是等同对待。
https://zhuanlan.zhihu.com/p/48243724
https://zhuanlan.zhihu.com/p/59666737
-- Heterogeneous Graph Neural Networks for Malicious Account Detection 蚂蚁金服 CIKM, 2018

【蚂蚁金服信贷】贷款违约预测

ST-GNN（Spatial-Temporal aware Graph Neural Network）的图神经网络对这个集合进行建模，从而获取到图中每个节点的embedding用于下游任务
贷款违约预测和链接预测（预测两个节点之间是否存在边）
利用供应链网络预测金融风险，利用图神经网络建模供应链网络预测贷款违约
本文针对中小企业财务风险分析中数据不足的问题，提出了一种基于图的供应链挖掘的财务风险分析框架。
具体来说，为了获取中小企业信用相关的拓扑结构和时间变化信息，我们设计并使用一种新的时空感知图神经网络，在中小企业图上挖掘供应链关系，然后基于挖掘的供应链图分析信用风险。在真实金融数据集上的实验结果证明了我们提出的中小企业金融风险分析方案的有效性。
（如图：服装工厂的供应链 | 供应链网络是随时间变化的，所以可以表示成 T 个时刻的快照集合）
模型设计：
- 对于时刻的快照，用类似图注意力网络的方法聚合节点的周围节点和边的信息，不同之处在于这里因为多了边的信息。重复次，每个时刻快照上的节点都会获得一个聚合了图结构信息的新表示。
- 有了每个时刻图上节点的表示，文章利用类似LSTM的方式来获取这些节点的时序信息。可以获得每一个节点在每个时刻融合了时序信息的节点表示, 结合上面获得，文章最后使用了一个注意力机制综合这两种表示，获得每个节点的最终表示。
之后文章在蚂蚁金服的信贷数据上做了贷款违约预测（链接预测：预测两个节点之间是否存在边）的任务，证实了模型的有效性。
-- https://zhuanlan.zhihu.com/p/348060075
-- Financial Risk Analysis for SMEs with Graph-based Supply Chain Mining 蚂蚁金服 IJCAI, 2020

【GNN框架】

在包含数十亿用户和产品的网络上。支持高效的分布式图存储，对采样过程进行了优化，同时内部集成了很多GNN模型。该框架已成功用于公司的多种产品推荐和个性化搜索任务。
-- AliGraph: A Comprehensive Graph Neural Network Platform
https://arxiv.org/abs/1902.08730

3.2 IBM【比特币洗钱识别】

使用GCN算法识别比特币反洗钱
节点表示交易的实体，边表示比特币的交易流，其数据共计203,769笔节点交易以及234,355条边。
使用模型
- 基于GCN的半监督学习
- Skip-GCN：多了一个“skip”变量，即将节点输入特征X和网络embedding特征共同进行学习，其好处是相当于在GCN中增加了一个LR的结构。
- EvolveGCN：GCN的时间模型是EvolveGCN，详见《EvolveGCN: Evolving Graph Convolutional Networks for Dynamic Graphs》，捕捉图的动态变化
https://zhuanlan.zhihu.com/p/85348013
-- Anti-Money Laundering in Bitcoin: Experimenting with Graph Convolutional Networks for Financial Forensics, 2019

3.3 北航【互联网评论欺诈】

GraphConsis算法
账户的恶意/欺诈评论识别
本文主要通过邻居节点距离进行均衡采样优化，来针对风控场景的一些Inconsistency问题。

1. Inconsistency 定义
- Context Inconsistency：a. frauder 会通过建立正常连接来伪装 b. 正样本数量少
- Feature Inconsistency: 节点特征差异性可能很大
- Relation Inconsistency: 存在不同类型的边会造成影响
2. 解决方案
- 通过引入可训练的Context Embedding，补充节点特征，解决Context Inconsistency
- 通过节点特征相似度，过滤低相似度节点，提高采样样本中的节点特征一致性
- 通过Attention，对不同边类型的邻居节点增加权重影响

https://zhuanlan.zhihu.com/p/385173898
-- Alleviating the Inconsistency Problem of Applying Graph Neural Network to Fraud 北航

4⃣️其他方向进展

4.1 Uber Eats【餐厅推荐】

使用图神经网络进行产品推荐。典型的做法是对用户和商品的交互关系进行建模，然后通过某种负采样损失学习节点嵌入，并通过kNN实时推荐给用户相似产品。Uber Eats 公司很早就通过这样的方式进行产品推荐，具体而言，他们使用图神经网络 GraphSage 为用户推荐食品和餐厅。
-- https://eng.uber.com/uber-eats-graph-learning/
-- Food Discovery with Uber Eats: Using Graph Learning to Power Recommendations

4.2 网易音乐【音乐推荐】

通过图神经网络，挖掘用户的特征、歌曲的特征、用户对歌曲的行为特征，实现精准的音乐推荐。
图中每个节点都具有结构信息，如果用户频繁订阅某种类别音乐或对某种类别音乐评分较高，那么系统就可以认定该用户对该类音乐比较感兴趣，就可以向该用户推荐更多该类别的音乐。
-- https://zhuanlan.zhihu.com/p/442309107

4.3 滴滴【车辆调控管理】

滴滴出行研究了一种基于时空多图卷积神经网络的网约车需求量预测模型。
通过分析区域之间复杂的时空依赖关系，对网约车需求量进行准确预测，指导车辆的调度，提高车辆的利用率，减少等待时间，并在一定程度上缓解了交通的拥堵。
-- Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting

4.4 阿里

【广告推荐】

搜索广告匹配
阿里妈妈利用图神经网络，从用户行为日志、内容属性等不同维度挖掘 Query（查询词）、Item（商品）和 Ad（广告）的多种关系。
对于在线请求场景，通过计算用户查询词向量、前置行为中节点向量和广告节点向量之间的距离进行高效的向量化最近邻检索，从而快速匹配到符合用户意图的广告并推荐给用户。

【淘宝推荐】

一篇关于结合知识图谱应用于大规模推荐的论文，成功应用于线上淘宝APP场景且有明显提升，推荐一读。
当前基于KG的推荐方法可以分为两类：基于Path和基于GNN的方法。
基于Path的方法通过探索目标user-item对在KG上的多个meta-path来预测用户偏好。这是一种典型需要domain knowledge的方法，而且忽略了KG中丰富的结构信息，因此不能充分刻画给定user和item内在的关系。
-- ATBRG: Adaptive Target-Behavior Relational Graph Network for Effective Recommendation SIGIR, 2020
https://blog.csdn.net/abcdefg90876/article/details/106893937/

【推荐系统】

异构图表示学习
-- Representation Learning for Attributed Multiplex Heterogeneous Network 阿里异构Embedding GATNE
论文详解：
KDD2019 | 阿里GATNE：异构图的表示学习

4.5 Fabula AI【假新闻检测】

伦敦的初创公司Fabula AI，使用GNN检测假新闻等
https://arxiv.org/abs/1902.06673

4.6 Comodo 科摩多【恶意应用识别】

通过构建HIN抽关系特征，对安卓智能手机中的恶意应用进行识别。

实体：APP，API
关系：
1)Package关系（API-API）：API 共用package，用矩阵P表示
2)CodeBlock关系（API-API）: API 共用code block，用矩阵B表示
3)InvokeMethod关系（API-API）: API 共用invoke方法，用矩阵I表示
4)Contain关系（APP-API）：APP使用API，用矩阵A表示
-- HinDroid: An Intelligent Android Malware Detection System Based on Structured Heterogeneous Information Network KDD 2017

5⃣️其他相关&参考资料

SIGIR2020推荐系统论文一览：https://zhuanlan.zhihu.com/p/159742956

图数据库：https://zhuanlan.zhihu.com/p/210074511

图计算在网易游戏中的应用：https://zhuanlan.zhihu.com/p/370433730

*2021年，GNN+推荐系统/CV/物理/化学：https://blog.csdn.net/BAAIBeijing/article/details/112691028

*GNN 图神经网络 2021 年的5大应用热点：https://zhuanlan.zhihu.com/p/346895359

*工业向反欺诈算法论文及解读汇总：https://zhuanlan.zhihu.com/p/85155064

*开源分布式图数据库：https://zhuanlan.zhihu.com/p/152399147

蚂蚁金服：GeaBase[1]
金融级图数据库，通过自定义类语言为业务方提供服务，全量计算下推，提供毫秒级延时。主要应用于以下场景：
金融风控场景：万亿级边资金网络，存储实时交易信息，实时欺诈检测。
推荐场景：股票证券推荐。
蚂蚁森林：万亿级的图存储能力，低延时强一致关系数据查询更新。
GNN：用于小时级 GNN 训练。尝试动态图 GNN 在线推理。
阿里巴巴：iGraph[2]
iGraph 是图索引及查询系统，存储用户的行为信息，是阿里数据中台四驾马车之一。通过 Gremlin 语言为业务方提供电商图谱实时查询。
今日头条：ByteGraph[3]
ByteGraph 通过在 kv 上增加统一 cache 层，关系数据拆分为 B+ 树以应对高效的边访问和采样，类似 Facebook 的 TAO 。
腾讯高性能分布式图计算框架柏拉图[4]

以上文中灰色链接部分也属于参考文献，此处不再赘述

投稿或交流学习，备注：昵称-学校（公司）-方向，进入DL&NLP交流群。

方向有很多：机器学习、深度学习，python，情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

整理不易，还望给个在看！

你可能感兴趣的:(神经网络,算法,大数据,编程语言,python)

Unity与VS2015协同调试C#脚本实战指南带你玩遍北海道
本文还有配套的精品资源，点击获取简介：Unity是广受青睐的跨平台游戏引擎，C#是其主要编程语言。VisualStudio2015作为一个强大的IDE，支持对Unity项目中的C#代码进行深入调试。本文将指导你如何设置VisualStudio2015作为Unity项目的官方外部脚本编辑器，并详细说明如何在VS2015中进行代码调试，包括断点设置、启动调试、调试操作和性能优化等步骤。了解这些调试技巧
初探贪心算法 -- 使用最少纸币组成指定金额是小V呀 C++贪心算法算法 c++python
python实现：#对于任意钱数，求最少张数n=int(input("money:"))#输入钱数bills=[100,50,20,10,5,2,1]#纸币面额种类total=0forbinbills:count=n//b#整除面额求用的纸币张数ifcount>0:print(f"{b}纸币张数{count}")n-=count*b#更新剩余金额total+=count#累加纸币数量print(f
数据结构与算法-09贪心算法&动态规划阿诚学java 数据结构与算法学习记录贪心算法动态规划 ios
贪心算法&动态规划1贪心算法介绍贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取在当前状态下最好或最优（即最有利）的选择，从而希望导致结果是全局最好或最优的算法。贪心算法通常用于解决优化问题，如最小化成本、最大化收益等。然而，贪心算法并不总是能够得到全局最优解，但它具有直观、高效、易于实现等优点，因此在许多实际问题中得到了广泛应用。基本思想贪心算法总是从问题的某一个初始解出发。
代码随想录算法Day35(2)||贪心算法-LeetCode406根据身高重建队列
学习内容参考卡哥代码随想录，有文字学习资料（代码随想录网站）和视频讲解（b站）2.根据身高重建队列题目力扣题目链接(opensnewwindow)假设有打乱顺序的一群人站成一个队列，数组people表示队列中一些人的属性（不一定按顺序）。每个people[i]=[hi,ki]表示第i个人的身高为hi，前面正好有ki个身高大于或等于hi的人。请你重新构造并返回输入数组people所表示的队列。返回的
算法第26天|贪心算法：用最少数量的箭引爆气球、无重叠区间、划分字母区间孟大本事要学习算法学习算法贪心算法
今日总结用最少数量的箭引爆气球题目链接：452.用最少数量的箭引爆气球-力扣（LeetCode）代码随想录整体思路：1、统一度量：将所有区间按照左端点进行排序：用到了二维的sort，在类中需要定义静态成员函数cmp，从小到大排列2、进行区间合并（1）如果没有气球，就是0箭（2）如果有气球，至少1箭（3）按照排序从小到大遍历，比较当前位置的左端点是否在前边位置的范围内（&a,vector&b){if
贪心算法（基础算法） breeze_phantom 算法 c++贪心算法
1.引言ok啊，拖更这么长时间也是没有压力（doge）不说啥，直接进入正题。2.概念这个贪心算法呢，看名字就知道，不就是每个步骤都挑最好的嘛，有啥难的。这么说的话......其实确实，你如果真的能很快找出贪心策略那就可以这么说，但还是那句话，策略怎么找是个问题。讲这么多，还没讲一下定义（虽然不讲感觉也能猜出来）：贪心算法就是在特定问题中每一次计算都做出最好的选择，举个例子：本蒟蒻去商店买东西，这商
数据结构与算法----贪心王嘉俊925 算法算法数据结构 C++贪心算法
##贪心算法1.核心思想贪心算法通过每一步的局部最优选择，逐步推导出全局最优解。它的特点是不回溯，即一旦做出选择，就不再修改。2.适用条件贪心算法适用于满足以下两个条件的问题：贪心选择性质：每一步的局部最优选择能够导致全局最优解。最优子结构：问题的最优解包含子问题的最优解。3.贪心算法的证明方法贪心算法的正确性通常需要通过以下方法证明：归纳法：证明每一步的贪心选择都能导致全局最优。交换论证：假设存
零基础数据结构与算法——第五章：高级算法-贪心算法-基础&示例
5.2贪心算法（GreedyAlgorithm）5.2.1贪心算法的基本概念什么是贪心算法？贪心算法是一种在每一步选择中都采取当前状态下最好或最优的选择，从而希望导致结果是最好或最优的算法。生活例子：想象你在超市购物，手里有100元钱，想买尽可能多的零食。如果你采用贪心策略，你会怎么做？你可能会先选择最便宜的零食，然后是第二便宜的，以此类推，直到钱用完。这就是一种贪心策略——每次都选择当前看起来最
【Python】Gym 库：于开发和比较强化学习（Reinforcement Learning, RL）算法彬彬侠 Python基础 python Gym 强化学习 RL Gymnasium
Gym是Python中一个广泛使用的开源库，用于开发和比较强化学习（ReinforcementLearning,RL）算法。它最初由OpenAI开发，提供标准化的环境接口，允许开发者在各种任务（如游戏、机器人控制、模拟物理系统）中测试RL算法。Gym的设计简单且灵活，适合学术研究和工业应用。2022年，Gym被整合到Gymnasium（由FaramaFoundation维护）中，成为主流的强化学习
Python 虚拟环境完全指南 wsj__WSJ python python 开发语言
为何离不开虚拟环境？在Python开发领域，虚拟环境堪称管理项目依赖的不二利器，其重要性体现在多个关键层面：项目隔离独立运行环境构建：为每一个项目量身打造专属的Python运行环境，使各个项目之间相互隔离，互不干扰。化解依赖版本冲突：有效解决不同项目对同一依赖包的版本需求不一致的难题。例如，项目A基于Django3.2进行开发，而项目B需要Django4.0才能正常运作，通过虚拟环境，两者可并行不
python学习路线（从菜鸟到起飞）突突突然不会编了 python 学习开发语言
以下是基于2025年最新技术趋势的Python学习路线，综合多个权威资源整理而成，涵盖从零基础到进阶应用的全流程，适合不同学习目标（如Web开发、数据分析、人工智能等）的学习者。路线分为基础、进阶、实战、高级、方向拓展五个阶段，并附学习资源推荐：一、基础阶段（1-2个月）目标：掌握Python核心语法与编程思维，熟悉开发环境。环境搭建安装Python3.10+，配置PyCharm或VSCode开发
小白带你部署LNMP分布式部署刘俊涛liu 分布式
目录前言一、概述二、LNMP环境部署三、配置nginx1、yum安装2、编译安装四、安装1、编译安装nginx2、网络源3、稍作优化4、修改配置文件vim/usr/local/nginx/conf/nginx.conf5、书写测试页面五、部署应用前言LNMP平台指的是将Linux、Nginx、MySQL和PHP（或者其他的编程语言，如Python、Perl等）集成在一起的一种Web服务器环境。它是
【LeetCode 1695. 删除子数组的最大得分】解析李昊_ LeetCode leetcode 算法数据结构
目录LeetCode中国站原文原始题目题目描述示例1：示例2：提示：讲解滑动窗口的艺术：寻找无与伦比的“纯净”子数组第一部分：算法思想——可伸缩的“探索边界”1.问题的核心：找到最“值钱”的“纯净”片段2.滑动窗口：一个能屈能伸的“探索框”第二部分：代码实现——滑动窗口的“装备”完整代码展示代码精讲LeetCode中国站原文https://leetcode.cn/problems/maximum-
力扣热题100 - 矩阵：矩阵置零菲英的学习笔记力扣热题100 leetcode 矩阵算法 c++go
本题主要考察代码能力。题目描述：题号：73给定一个mxn的矩阵，如果一个元素为0，则将其所在行和列的所有元素都设为0。请使用原地算法。解题思路：思路一：利用第一行第一列记录0算法思路：1、用2个变量记录矩阵第1行、第1列有没有02、遍历矩阵，如果遇到0则将其对应的第1行和第1列元素置03、遍历矩阵，若元素对应的第1行或第1列元素为0则将其置0时间复杂度：O(N)空间复杂度：O(1)C++//C++
如何构建FunASR的本地语音识别服务
FunASR简介FunASR是阿里巴巴达摩院开源的高性能语音识别工具包，支持离线识别和实时流式识别两种模式。其核心特点包括：支持多种语音任务：ASR（自动语音识别）、VAD（语音活动检测）、标点恢复、关键词检测等。提供预训练模型：覆盖中文、英文等多语言，支持不同场景（通用、会议、直播等）。支持多种部署方式：本地Python、Docker容器、ONNX推理优化等。开源地址：GitHub-FunASR
2025 睿抗机器人开发者大赛CAIP-编程技能赛-本科组（省赛）题解弥彦_ 睿抗算法 c++
目录前言RC-u1早鸟价考察算法：思路：注意点：accode：RC-u2谁进线下了？III考察算法：思路：注意点：accode：RC-u3点格棋评价：考察算法：思路：注意点：accode：RC-u4TreeTree的考察算法：思路：注意点：accode：RC-u5游戏设计师考察算法：思路：注意点：accode：前言被t3折磨坏了，几乎全部时间都在调t3，最后只拿了36分，呜呜呜。RC-u1早鸟价考
力扣Leetcode热题100-二分查找解题思路分享花卷321 Leetcode 热门100 leetcode 职场和发展 java 开发语言
1.搜索插入位置题目如下：给定一个排序数组和一个目标值，在数组中找到目标值，并返回其索引。如果目标值不存在于数组中，返回它将会被按顺序插入的位置。请必须使用时间复杂度为O(logn)的算法。思路分析与最基本的二分查找算法类似，但是基础的二分查找在找不到值的时候一般情况下返回-1，找到的值返回索引，下面先展示最基本的二分查找的Java代码：publicstaticintbinarySearch(in
Python 进阶学习之全栈开发学习路线 Microi风闲【胶水语言】Python python 学习开发语言
文章目录前言一、Python全栈开发技术栈1.前端技术选型2.后端框架选择3.数据库访问二、开发环境配置1.工具链推荐2.VSCode终极配置3.项目依赖管理三、现代Python工程实践1.项目结构规范2.自动化测试策略3.CI/CD流水线四、部署策略大全1.传统服务器部署2.容器化部署3.无服务器部署五、性能优化技巧1.数据库优化2.异步处理3.静态资源优化结语前言Python作为当今最流行的编
Pycharm下载链接 Aderic 杂陈
人生苦短，我用python3.4https://download.jetbrains.8686c.com/python/pycharm-community-2018.1.1.tar.gz后续更新可能就是后面版本号码稍微差异，mark！
python基础语法复习08——模块化编程洛华363 python python 开发语言
python基础语法目录python基础语法01——基本类型python基础语法02——复合类型python基础语法03——语句构成python基础语法04——函数python基础语法05——递归及装饰器python基础语法06——类与对象python基础语法07——迭代器与生成器文章目录python基础语法目录前言一、模块（Module）1.1什么是模块？1.2模块使用1.3模块分类1.3.1系
python基础语法复习02——复合类型洛华363 python python 开发语言
python基础语法目录python基础语法基础类型文章目录python基础语法目录前言一、初识列表list1.列表基本操作1.1创建列表1.2列表运算1.3列表访问1.4列表增删2常用函数二、初识元组tuple1.元组基本操作1.1创建元组1.2元组访问1.3元组运算2.常用函数三、初识字典dict1.字典基本操作1.1创建字典1.2增删改查2常用函数四、初识集合set1.集合基本操作1.1创建
初识opencv
文章目录1.什么opencv，它的优势点2.opencv安装和环境配置3.了解数字图像的基本概念：像素、彩色图像、灰度图像、二值图像、图像算数操作4.练习numpy中array的基本操作5.练习图像的加载、保存、以及算术操作参考文献1.什么opencv，它的优势点OpenCV是Intel®开源计算机视觉库。它由一系列C函数和少量C++类构成，实现了图像处理和计算机视觉方面的很多通用算法。OpenC
swift5分钟语法速记开发之家 iOS iOS
如果你依然在编程的世界里迷茫，不知道自己的未来规划，小编给大家推荐一个IOS高级交流群：458839238里面可以与大神一起交流并走出迷茫。小白可进群免费领取学习资料，看看前辈们是如何在编程的世界里傲然前行！群内提供数据结构与算法、底层进阶、swift、逆向、整合面试题等免费资料附上一份收集的各大厂面试题（附答案）!群文件直接获取各大厂面试题又把swift相关语法部分看了一遍，并整理了swift语
⚡C++ 有必要学吗？⚡我的家长有话说司空妲命 c++开发语言
在编程教育愈发普及的当下，除了备受关注的Python，C++也进入了许多家长和孩子的视野。作为一门经典且强大的编程语言，C++在系统开发、游戏制作、嵌入式领域等有着广泛应用。然而，对于是否让孩子学习C++，家长们看法不一。有人认为它是通往高端技术领域的钥匙，也有人担忧其较高的学习难度会让孩子望而却步。今天，就让我们深入探讨C++学习的必要性。一、家长眼中的C++：潜力与顾虑交织有人疑惑：“C++现
python3异步爬虫：asyncio + aiohttp + aiofiles（python经典编程案例）数据知道 python3案例和总结 python
更多内容请见：python3案例和总结-专栏介绍和目录文章目录1.安装依赖库2.异步爬虫的基本流程3.实现异步爬虫3.1代码实现3.2代码说明4.运行效果5.扩展功能5.1设置请求头5.2处理异常5.3限制并发数5.4爬取图片6.总结使用Python的异步编程技术（asyncio+aiohttp+aiofiles）可以实现高效的异步爬虫。以下是详细的使用指南和代码示例。1.安装依赖库首先安装所需的
qsort函数以及模拟不见腊月雪. c语言算法
文章目录概要qsort介绍qsort函数模拟实现小结概要本次我们将要学习一个库函数，该函数可以将你需要排序的数据进行排序，任何类型的数据都可以，比如整形数组，字符数组，或者结构体。并且本章我也会自己写一个函数模拟qsort的实现。qsort函数介绍qsort是一个C语言里面的库函数，它用于将用户指定给它的数据进行排序，它的底层逻辑是使用快速排序算法。函数引用的头文件函数需要包含头文件stdio.h
Python爬虫实战：借助代理IP破解反爬机制，批量下载哔哩哔哩高清视频程序员威哥最新爬虫实战项目 python 爬虫 tcp/ip
一、前言随着视频平台的蓬勃发展，视频数据成为互联网的一个重要组成部分。特别是哔哩哔哩（B站）作为一个年轻化、内容丰富的综合性视频平台，吸引了大量用户观看、上传和分享各种形式的创作内容。在这个信息高度开放的时代，如何高效、合法地获取这些视频数据成为了一个有挑战的技术问题。哔哩哔哩的视频下载不仅受到版权保护，同时平台也使用了强大的反爬虫机制来保护用户数据和平台内容。本文将通过Python爬虫实战，利用
Python爬虫高阶：Selenium+Scrapy+Playwright融合架构，攻克动态页面与高反爬场景程序员威哥 python 爬虫 selenium
随着互联网应用的不断发展，越来越多的网站采用JavaScript动态渲染页面，常见的静态页面数据抓取方式逐渐失效。此外，高反爬技术也使得传统爬虫架构面临着更大的挑战，许多网站通过复杂的反爬机制如验证码、IP屏蔽、请求频率限制等来防止数据抓取。为了应对这些挑战，我们需要采用更为先进和灵活的爬虫架构。在此背景下，结合Selenium、Scrapy和Playwright这三种技术，能够帮助我们突破动态页
基于SVm和随机森林算法模型的中国黄金价格预测分析与研究 python编程狮支持向量机算法随机森林 python 机器学习人工智能
摘要本研究基于回归模型，运用支持向量机（SVM）、决策树和随机森林算法，对中国黄金价格进行预测分析。通过历史黄金价格数据的分析和特征工程，建立了相应的预测模型，并利用SVM、决策树和随机森林算法进行训练和预测。首先，通过对黄金价格时间序列数据的探索性分析，发现黄金价格存在一定的趋势和季节性变化。随后，进行了数据预处理和特征选择，为建立准确的预测模型奠定了基础。分别使用SVM、决策树和随机森林算法建
基于ArcPy将HDF格式栅格文件批量转为TIFF格式疯狂学习GIS
本文介绍基于Python中ArcPy模块，实现大量HDF格式栅格图像文件批量转换为TIFF格式的方法。首先，来看看我们想要实现的需求。在一个名为HDF的文件夹下，有五个子文件夹；每一个子文件夹中，都存储了大量的.hdf格式的栅格遥感影像数据。我们在其中任选一个子文件夹，来看看其中所含的文件。我们要做的，就是将HDF文件夹下的全部子文件夹中的全部.hdf格式图像文件，一次性转换为
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY [email protected] 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa