文文学霸

图推荐算法在E&E问题上的应用

分享嘉宾：庄正中资深数据挖掘工程师

编辑整理：陈家辉

内容来源：先荐推荐系统学院

出品平台：DataFunTalk

导读：本次分享将围绕以图为基础衍生的一类推荐算法原理和应用，以及 E&E 问题 ( 如何应对新用户和新内容 ) 的一些处理方法。E&E 指探索与利用，是推荐系统当中的两个核心问题。

主要内容包括：

Background
Related Work
Our Work

Background

1. 推荐系统在 E&E 上的两大难点

在建立推荐系统的模型之前，我们需要获得用户和内容的相关数据。可是在推荐系统的实践中，经常会遇到冷启动的问题，即缺少新进入的用户信息和新进入的内容信息。对于用户信息，很多公司都会有市场部从市场上的各个渠道导入进来，成本较高，且无法完全覆盖。对于新进入的用户，他们往往是没有历史行为的，而这个行为特征却是推荐系统中最重要的特征之一。而新用户的留存对于公司是至关重要的，所以对于新用户的推荐要求尽可能的精准，使其对于平台产生忠诚度。新用户的推荐是推荐系统的第一个难题。第二个难点则是新内容的推荐，新内容首先是没有用户的反馈，没有用户的反馈也就无法利用相应的评估体系总结内容的真实价值。同时，新内容还存在难曝光的问题。现存的推荐系统，从比较传统的推荐系统，到 Word2Vec，再到现在各种各样的神经网络，在召回阶段都无法很好的召回新内容，所以很难进入到训练样本中去，这是新内容的长尾问题。

2. 经典图模型—协同过滤

我们可以把协同过滤认为是一种图推荐模型，因为用户和内容可以认为是二分图结构。推荐系统的宗旨是建立更多的用户到内容的链接，随着图越来越大，就可以抽取到更多的信息，从而服务更多的用户。以 item-based CF 为例，通过计算 item 之间的相似度，从而计算出最相似的 topK 内容，把它们当作当前 item 的邻接点，构成物与物相连的有向图保存在起来。推荐时快速定位用户接触过的 seeds 列表：在"一推多"场景直接查找节点的邻边。在 "n 推 n" 场景根据多节点对各邻边加权求和。在多样性推荐中将 seeds 分组并执行多个"一推多"操作。

CF 的缺点也很明显，首先，由于算法的设计问题，导致了它是一种偏热门推荐。在数据过滤的初期，没有达到某种阈值的 user 和 item 将会被过滤掉，形成马太效应。第二，容易形成内部环路。比如某些很受欢迎的主播，他们互为 topK，导致一直在他们内部互推。

这时，我们可以通过知识图谱和 node2vec 来拓展图的泛化能力。

3. Graph Embedding

我们都知道在 NLP 任务中，word2vec 是一种常用的 word embedding 方法，来源于神经网络模型，是神经网络的一种中间结构的简化。结构如上图所示：

word2vec 通过语料库中的句子序列来描述词与词的共现关系，进而学习到词语的向量表示。它是将序列向量化的一个浅层神经网络，通常只需要有效行为的序列就可以快速得到一个以 id 为单特征 item2vec 召回模型。

Graph Embedding 的思想类似 word2vec，使用图中节点与节点的共现关系来学习节点的向量表示。在 graph 中随机游走生成顶点序列，构成训练集，然后采用 skip-gram 算法，训练出低维稠密向量来表示顶点。这种思想与传统的协同过滤相比有两个比较明显的特点：

序列保留了时序信息
内容覆盖率提升，相关性略降低

在 graph 中主要存在两种关系，homophily 和 structural equivalence。所谓 homophily，即是在 graph 中紧密相连的邻域。具有这种关系的顶点之间，学习出来的向量应该接近或者相似。structural equivalence，就是指在图中具有相似作用的顶点，他们之间未必相邻，甚至可能相隔较远，都是所在邻域的中心顶点。满足这种关系的顶点之间，特征向量也应该接近或者相似。通常在现实世界的 graph 中，会同时存在这两种关系。可以表示如下结构：

但是在不同的任务中需要关注的重点不同，可能有些任务需要关注网络 homophily，而有些任务比较关注网络的 structural equivalence，可能还有些任务两者兼而有之。那么关键的问题就是如何来描述节点与节点的共现关系。RandomWalk 是一种可重复访问已访问节点的深度优先遍历算法。给定当前访问起始节点，从其邻居中随机采样节点作为下一个访问节点，重复此过程，直到访问序列长度满足预设条件。

DeepWalk 从一个节点开始采样，跳到下一个节点的概率完全取决于邻边的权重，无法灵活地捕捉这两种关系，在这两种关系中有所侧重。而实际上，对于这两种关系的偏好，可以通过不同的序列采样方式来实现。有两种极端的方式，一种是 Breadth-First Sampling ( BFS )，广度优先搜索，如图中红色箭头所示，从 u 出发做随机游走，但是每次都只采样顶点 u 的直接邻域，这样生成的序列通过无监督训练之后，特征向量表现出来的是 structural equivalence 特性。另外一种是 Depth-First Sampling ( DFS )，深度优先搜索，如图中蓝色箭头所示，从 u 出发越走越远，学习得到的特征向量反应的是图中的 homophily 关系。Node2vec 则额外定义了参数 p、q，用于控制回退、BFS、DFS 动作。

Related Work

1. Alibaba graph-embedding

首先我们介绍一篇阿里巴巴的图嵌入技术论文 "Billion-scale Commodity Embedding for E-commerce Recommendation in Alibaba ( kdd 2018 )"，其流程如下图所示：

首先如图 (a)，假设每个用户有不同的用户行为，每个用户浏览过不同的 item 按时间顺序排列。这里有一个业务上的技巧，就是把用户在某个时间窗内的连续行为作为一个 session，例如一个小时，如果超过时间窗，就划分为不同的 session。通常在短周期内访问的商品更具有相似性。每个 session 构成一个 sampled sequence，将所有 sampled sequence 构成有向图，图边表示该方向流过的次数，得到的 graph。

如图 (b)，边权重记录了商品的出现次数。计算商品的转移概率，并根据转移概率做游走，生成商品序列，图 (c)。最后通过 skip-gram 训练出 embedding。

新商品没有用户行为，因此无法根据 Base Graph Embedding ( BGE ) 训练得出向量。为了解决物品的冷启动问题，阿里加上了物品的边信息 Side Information ( SI )，例如品牌，类别，商店等信息。SI 相似的商品，在向量空间中也应该接近。如下图所示：

在最下面的 Sparse Features 中， SI₀ 表示商品本身的 one-hot 特征， SI₁到 SI_n表示 n 个边信息的 one-hot 特征，阿里采用了13种边信息特征。每个特征都索引到对应的 embedding 向量，得到第二层的 Dense Embeddings，然后将这 (n+1) 个向量做平均来表示这个商品，公式如下图。其中，W_v^s表示商品 v 的第 s 个边信息向量， H_v是隐向量。

剩下的事情就和 BGE 相同了。这个做法叫 Graph Embedding with Side Information ( GES )。不同的边信息对于商品的向量可能会有不同的贡献，可以另外学习一个权重矩阵 A∈R^|V|×(n+1)，其中 |V| 表示商品集合 V 的数量，A_ij表示第 i 个商品的第 j 个边信息权重。计算方法如下所示，从平均变成了加权求和。对权重取 e 的指数是为了保证所有边信息的权重大于0。

这个方法叫做 Enhanced Graph Embedding with Side Information ( EGES )。

2. Airbnb Word2Vec

Airbnb 提出的冷启动和采样方式同样值得我们借鉴。首先，它同样是采用 session 进行分割的，而且明确指出 30mins 内的连续有序 sequences。同时提出了一个新的负采样策略，即从与当前 item 的同一个 cluster 里面采样负样本。而且 Airbnb 强化了付费行为的训练。点击序列中若有付费行为，则将这个 item 强制纳入该序列每个 item 的上下文窗口。

Airbnb 的冷启动策略很简单，他并没有做 end2end 的学习属性的 embedding，而是直接把 new item 按主要属性 ( 房间数，地域，地段等等 ) 检索到最相似的 top3 个已知的 item，取3个 item 向量的平均值初始化 new item embedding。

更多详情，请参考：

Real-time Personalization using Embeddings for Search Ranking at Airbnb ( kdd 2018 )

Our Work

1. Mixed Graph-Vector model

在实践中，我们发现 CF 算法用于实时召回表现出的点击率较高，但召回存在上限，word2vec 算法表现出的泛化能力较好，可以让更多的内容得到召回，但也就带了泛化提升后的不确定性。两个召回策略是存在很多数据重叠，思考能否从精简算法的角度将两者合并起来，并各取所长。

具体来说，生成策略可以表示为下图：

先利用之前 CF 算法的计算得到的内容相似度矩阵，取最相似的 topK 重建一个 item 间相似性关联图，采用 node2vec 算法，对上图进行随机游走生成序列，再使用 word2vec 完成 graph embedding。所以我们最终可以得到两个产物，一个 item similarity graph，即原来的协同过滤图。第二个则是由 graph embedding 产生的 item embedding。

在推荐时，先通过用户触摸过的 item seed 定位到图节点，如果 item 不在模型则终止。然后获取到图节点距离1的邻接点，如果已推荐则扩展到距离2的邻接点，此时会进行一个过滤操作，已推荐的不会再推。如果推荐数据不足则使用图节点向量进行 vector search，运用向量最简单的方法就是内积或者余弦相似度，寻找出 N 个与其最相似的 item 进行补充。所以最终的推荐结果，结合了 CF 与 Graph embedding 两者的优势。

2. Side Info Graph

上述的混合模型在性能上的提升仅来自其模型层面做的 graph embedding，即图中的节点为所有内容的边界，带来的覆盖提升也不会突破这个边界。因此对于冷启动内容的处理，我们将标签作为一种冷启动参数参与到模型训练，使得新内容可以被高级模型接受。

这里与阿里巴巴的 EGES 构建图的策略不同，我们沿用了协同过滤生成的 item 相似矩阵构建 graph。在 embedding 和权重的训练过程与 EGES 过程一样。训练完之后，我们可以获得特征的 embedding 和权重矩阵。这个方法主要是针对新内容的冷启动问题。

3. Two tower DSSM

对于 user 和 item 的匹配，我们采用的是双塔结构进行匹配，具体结构如下：

双塔结构很简单，左侧为 user 的行为特征和基本特征的 embedding，拼接后经过全连接层和激活层的特征融合和提取，形成 user vector。同理右侧的 item network，可以通过之前 GES 计算的 item 的 embedding，进行特征融合。最后将 user vector 和 item vector 进行内积和 sigmoid 函数输出匹配分数。

在工程上，由于用户行为的实时性，user vector 需要进行实时计算。但 item 侧的相关 embedding 可以通过查表得到，节省资源和计算时间。

4. Graph Restrict Vector Search

我们采用图来约束推荐的搜索范围。我们的新用户面临两种类型：

第一种是他可能有标签但是没有行为，或者行为很少。
第二种是完全没有行为，需要我们去探索。

我们主要利用图结构 item 之间的约束关系，比如说我们刚刚生成的用户向量，它的搜索结果仅限于用户刚刚点击或者浏览的 item 相邻的节点，而这些节点是我们通过大量的用户反馈所生成的边的关系。所以用图约束进行搜索，一方面可以加快计算速度，还可以进一步探索下一个曝光 item 的性质。

问答环节

问：构建 session 过程中怎么过滤异常的数据？

答：这里我提出几个比较典型的异常情况：

异常点击 ( 时间太短的点击 )
异常 item ( 更新异常频繁的 item )
异常用户 ( 点击量异常多的 user )

问：Two tower 中的 user scene vector 和 item scene vector 的区别？

答：这两个是 user 和 item 的 feature field，可以根据需要进行整理。比如 user scene 包括 location、time、event、weather 等， item scene 包括 location、upload、division 等。

问：图不是全连通的，有多个子图，这种怎么样做 embedding 比较好？

答：如果图是隔断的，那直接当作两个图来做两次 embedding，因为很难有额外信息通过边把两个图联系起来。

今天的分享就到这里，谢谢大家。

如果您喜欢本文，点击右上角，把文章分享到朋友圈~~

社群推荐：

欢迎加入 DataFunTalk 推荐算法技术交流群，跟同行零距离交流。如想进群，请加逃课儿同学的微信（微信号：DataFunTalker），回复：推荐算法，逃课儿会自动拉你进群。

分享嘉宾

▬

庄正中

前荔枝FM | 资深数据挖掘工程师

现于某互联网公司任资深推荐算法工程师，负责直播产品推荐系统的设计开发工作。曾在荔枝FM和酷狗音乐负责推荐算法和文本处理相关工作，擅长神经网络的数据建模。

——END——

文章推荐：

AutoML 在表数据中的研究与应用

搜索协同过滤中的交互函数

机器学习中的隐私保护

关于我们：

DataFunTalk专注于大数据、人工智能技术应用的分享与交流。发起于2017年，在北京、上海、深圳、杭州等城市举办超过100场线下沙龙、论坛及峰会，已邀请近500位专家和学者参与分享。其公众号DataFunTalk累计生产原创文章400+，百万+阅读，5万+精准粉丝。

一个在看，一段时光！????

数据结构——练习题-银行牌号系统代码 doubt。数据结构 c++算法
老师布置的一道上机作业，作为参考，利用队列构成#include#includeusingnamespacestd;#defineOK1#defineERROR0typedefintStatus;intID=0;//全局变量，当前的编号//结点类型typedefstructnode{intid;//数据域，排队的编号structnode*next;//指针域}Node;//队列类型typedefst
“上海慧眼”超高层建筑的稳定之魂 doubt。知识图谱
“摩羯”“普拉桑”“苏力”不断来袭，作为我国最高的大楼，高达632米的上海中心大厦，是如何做到稳固不倒的？“上海慧眼”阻尼器发挥着至关重要的作用，"慧眼"本质上是一种摆式电涡流调谐质量阻尼器。其核心是一个大质量物体，惯性是这个物体作用的的关键。这个物体由配重物和吊索构成，类似巨型复摆。重达1000吨，距离地面583米，其单边摆幅的极限为2米，在正常情况下，阻尼器的摆动幅度非常小，但在强风等极端条件
AI产品经理还不会数据挖掘❓看完这篇就够了脱泥不tony 人工智能产品经理数据挖掘 python tensorflow 开发语言 llama
前言在数字化时代的浪潮中，AI产品经理正成为推动科技与商业融合的重要力量。然而，面对海量的数据，如何从中挖掘出有价值的信息，为AI产品的开发提供有力支持？这已成为AI产品经理必须面对的挑战。今天，我们就来探讨一下数据挖掘在AI产品经理工作中的重要性，以及如何通过掌握数据挖掘方法论，打造卓越的AI产品。一、数据挖掘：AI产品经理的必备技能在AI产品的世界中，大数据是构建一切的基础。无论是算法组件、知
深圳云盟智慧科技公司智慧停车管理系统GetVideo存在SQL注入漏洞缘梦未来漏洞复现科技安全 web安全
免责声明:本文旨在提供有关特定漏洞的深入信息，帮助用户充分了解潜在的安全风险。发布此信息的目的在于提升网络安全意识和推动技术进步，未经授权访问系统、网络或应用程序，可能会导致法律责任或严重后果。因此，作者不对读者基于本文内容所采取的任何行为承担责任。读者在使用本文信息时，必须严格遵循适用的法律法规及服务协议，自行承担一切风险与责任。如涉及侵权，请及时与我们联系，我们将尽快处理并删除相关内容。0x0
python数据分析与可视化盆蒂 python 开发语言
一、Python数据分析概述Python是一种解释型、交互式的编程语言，其设计理念强调代码的可读性和简洁性。Python的语法结构简单，支持面向对象、过程式和函数式三种编程范式，使得Python成为一种强大而灵活的编程语言。Python数据分析主要包括数据清洗、数据探索和数据可视化三个部分。数据清洗是数据分析的重要环节，主要是对数据进行预处理，包括缺失值处理、异常值处理、数据类型转换等。数据探索则
手写完整文本文件压缩与解压程序（哈夫曼、java）努力的小南 java 开发语言
一、前言：上一篇文章手写了一个简单的文本文件压缩与解压CSDN，主要目的是阐明原理，并没有为实际的应用做准备。如果你想做出一个可视化程序并且能转发给你的朋友使用，请看以下内容。由于在文章CSDN中已经阐明了利用哈夫曼树进行文本文件压缩的原理，在此就不再赘述，当然在程序中对某些方法有所修改，后续的实现当中会进行展示。二、需要解决的关键问题：（1）哈夫曼树无法在两个程序中使用（2）页面搭建使用了单选按
20250120 Flink 的缓冲区超时（Buffer Timeout）靈臺清明 flink
Flink的缓冲区超时（BufferTimeout）机制确实类似于一辆车等待乘客的过程，如果车每次只载一个乘客就发车，会导致效率低下，资源浪费。同样，在Flink的数据流处理中，缓冲区超时的设置对吞吐量和延迟的权衡至关重要。以下是更详细的原因解析和背后的机制：1.什么是缓冲区超时（BufferTimeout）？在Flink中，算子之间的数据通过网络传输。为了提高传输效率，Flink会在发送数据之前
智能合约中的异常处理不当问题 (Improper Exception Handling) 纸鸢666 编写安全的智能合约区块链智能合约
简介智能合约是一种自动化执行的协议，用于在区块链上执行合约条款。它通过代码来定义合同条款，并在条件满足时自动执行。然而，由于区块链是一个去中心化的环境，智能合约在执行过程中可能会遇到各种各样的异常情况，包括但不限于合约执行失败、资金转移失败、数据一致性问题等。异常处理在智能合约的设计和实现中扮演着至关重要的角色。正确的异常处理可以确保合约在遇到错误时能妥善回滚操作并保持合约状态一致，而不当的异常处
从 Ubuntu 到 Windows：如何在不同系统间共享 Git SSH 配置修炼室 Linux ubuntu git ssh
背景说明在现代软件开发中，许多开发者会同时在多个操作系统或环境中进行工作。例如，你可能在Ubuntu服务器上运行应用，而在本地Windows机器上进行代码开发和管理。在这种跨平台工作中，Git是一个重要的工具，用于版本控制和代码管理。然而，频繁地在推送（push）或拉取（fetch）代码时输入用户名和密码不仅繁琐，而且会影响开发效率。为了避免这种麻烦，使用SSH密钥进行身份验证是一个非常有效的解决
VUE+ Element-plus , el-tree 修改默认左侧三角图标，并使没有子级的那一项不展示图标 Jane - UTS 数据传输系统 vue.js javascript elementui
exportdefault{data(){return{data:[{label:'Parent1',children:[{label:'Child1-1'},{label:'Child1-2'}]},{label:'Parent2'},{label:'Parent3',children:[{label:'Child3-1'}]}],defaultProps:{children:'children
ARMv7-M架构参考手册及应用指南董鉴勃
ARMv7-M架构参考手册及应用指南【下载地址】ARMv7-M架构参考手册及应用指南分享本资源包包含：-**ARMv7-MArchitectureReferenceManual**：这是ARM官方发布的权威文档，全面深入地介绍了ARMv7-M架构的核心概念、指令集、内存模型和编程模型等，是开发高性能、低功耗嵌入式系统的理论基础。-**ARMv7-MApplicationLevelReference
高效消息传递架构：基于 RabbitMQ 与 C# 实现分布式系统的异步通信与解耦威哥说编程开发语言后端 rabbitmq
在现代分布式系统中，消息队列作为一种核心的通信机制，广泛应用于系统间的异步通信、解耦以及负载均衡等场景。特别是对于需要处理高吞吐量、低延迟和高度可扩展的应用，采用成熟的消息队列中间件如RabbitMQ，可以显著提高系统的可靠性、灵活性和可维护性。与C#结合使用时，开发者可以充分利用其强大的类型系统、丰富的库支持和异步编程能力，构建高效、响应快速的分布式系统架构。本文将深入探讨如何利用RabbitM
我国的金融组织体系，还有各大金融机构的分类，金融行业的组织 ademen 金融业务金融大数据人工智能
中国金融组织体系介绍中国金融组织体系是一个复杂而多层次的系统，涵盖了各种类型的金融机构和监管机构。以下是关于中国金融组织体系的详细介绍，包括一行三会等金融监管机构，各大金融机构的分类、涉及的银行以及行业组织。（一）货币当局1.中国人民银行：作为国家干预和调控国民经济发展的重要工具，承担着制定并执行国家货币信用政策、管理国家货币发行、维护金融稳定等多项职责。2.国家外汇管理局（部委管理的国家局，具体
GCC支持Objective C的故事？Objective-C?GCC只能编译C语言吗?Objective-C 1.0和2.0有什么区别？程序员小迷编程语言小话ios 编译器 c语言 ios 开发语言 objective-c gcc msvc clang
GCC支持ObjectiveC的故事Objective-C主要由Stepstone公司的BradCox和TomLove在1980年左右发明。乔布斯离开苹果公司后成立了NeXTSTEP公司，买下了Objective-C语言的授权。GCC对Objective-C语言的支持是在1992年加入的，具体是在GCC1.3版本中首次引入的。GCC的后续版本继续改进了对Objective-C的支持，包括对Obje
数据结构—栈与队列【顺序存储、链式存储、卡特兰数、优先级队列】多多钟意你吖阶段一：数据结构数据结构 java 算法
个人网站:路遥叶子版权:本文由【路遥叶子】原创、在CSDN首发、需要转载请联系博主如果文章对你有帮助、欢迎关注、点赞、收藏(一键三连)和订阅专栏哦想寻找共同成长的小伙伴，请点击【Java全栈开发社区】目录第三章：栈与队列(一)栈、队列和线性表有什么区别？(二)栈一、什么是栈？栈又有什么特性？二、栈都有那些术语操作？三、对于四个元素ABCD它们的出栈的序列有多少种呢？四、卡特兰数五、栈的抽象数据类型
国内领先的AI智能体平台大比拼 zhulangfly AI 人工智能智能体
在当今人工智能飞速发展的时代，AI智能体平台如雨后春笋般涌现，为各行业带来了前所未有的创新机遇。今天，我们就来深入了解一下国内几家做得相当出色的AI智能体平台，包括百度的文心智能体平台、阿里巴巴的魔塔智能体平台、腾讯的元器智能体开放平台以及字节跳动的扣子AI平台，看看它们各自都有哪些独特之处，以及在市场中的表现如何。一、百度文心智能体平台详细介绍百度文心智能体平台依托百度强大的人工智能技术研发实力
C# 通用缓存类开发指南 —— 缓存管理的奇幻之旅墨瑾轩一起学学C#【一】c#缓存
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣C#通用缓存类开发指南——缓存管理的奇幻之旅引言嘿，小伙伴们！今天我们要一起探索如何在C#中构建一个简单而强大的缓存系统。想象一下，当你访问一个网站时，那些常用的数据总是能瞬间加载出来，这就是缓存的魅力所在。那么，如何在自己的项目中实现这样一个功能呢？让我们一
【Java网络编程】IP网络协议与TCP、UDP网络传输层协议 xiaoli8748_软件开发网络通信网络网络协议 java
1.1、IP协议当应用层的数据被封装后，想要将数据在网络上传输，数据究竟要被发往何处，又该如何精准的在网络上定位目标机器，此时起到关键作用的就是“IP协议”。IP协议的作用在于把各种数据包准确无误的传递给目标方，其中两个重要的条件是IP地址和MAC地址。其中IP地址就是所有主机在网络通信中的唯一标识，但由于IP地址是稀有资源，不可能每个主机都拥有一个IP地址，因此路由器里面会记录我们主机的MAC地
一文大白话讲清楚webpack基本使用——8——开发环境和生产环境的配置和区别 16年上任的CTO webpack webpack 前端 node.js webpack开发环境 webpack生产环境
一文大白话讲清楚webpack基本使用——8——开发环境和生产环境的配置和区别1.建议按文章顺序从头看，一看到底，豁然开朗第一篇：一文大白话讲清楚啥是个webpack第二篇：一文大白话讲清楚webpack基本使用——1——完成webpack的初步构建第三篇一文大白话讲清楚webpack基本使用——2——css相关loader的配置和使用第四篇一文大白话讲清楚webpack基本使用——3——图像相关
文大白话讲清楚Node文件上传 16年上任的CTO node node.js 文件上传上传文件 express上传文件
文章目录一文大白话讲清楚Node文件上传1.文件上传的整体流程2.客户端文件的上传3.服务器文件接收保存一文大白话讲清楚Node文件上传1.文件上传的整体流程我们在开发Web应用的时候，免不了要上传文件，比如图片，视频等，但是由于浏览器自身的限制，无法直接操作文件系统，需要浏览器自身暴露出一些接口，经过用户授权后才可以访问文件然后文件会被加载到指定内存，在执行完提交请求后，文件又从内存上传到服务器
FPGA开发中的团队协作：构建高效协同的关键路径 whik1194 fpga开发
一、团队成员角色与职责FPGA工程师核心设计：负责FPGA的逻辑设计与代码实现，依据项目需求，运用硬件描述语言（如Verilog或VHDL）完成模块功能编写。例如在设计一个高速数据采集系统时，编写数据采集、缓存及预处理的逻辑代码。功能仿真与验证：使用仿真工具对所编写的代码进行功能验证，确保逻辑设计符合预期。像在完成数字滤波器模块代码后，通过仿真测试不同输入信号下的输出，检查滤波效果。时序分析与优化
HTTPS keytool工具使用(高频) 笑锝没心没肺 Linux #网络安全 https 网络协议 http
keytool是Java平台的一个密钥和证书管理工具，它用于管理JavaKeystore(JKS)文件，这些文件用于存储密钥和证书。以下是keytool命令的一些常用选项及其详解：基本语法keytool[options]选项列表生成密钥库-genkeypair:生成密钥对。-alias:密钥库条目的别名。-keyalg:密钥算法，例如RSA或EC。-keysize:密钥大小（位数）。-validi
C#——foreach循环遍历在下小孙 c#开发语言 foreach
foreach(varitin遍历对象)//类似于auto;var是C#中的隐式类型变量声明关键字,in关键字,用于指定要遍历的集合Console.WriteLine(it);二维遍历int[][]a={newint[]{1,2,3},newint[]{4,5,6},newint[]{7,8,9}};foreach(varitina){foreach(varnumberinit){Console.
顺序表、链式表、顺序栈、链式栈以及顺序队列、链式队列 ¿134 数据结构算法 c语言
一、什么是数据结构1、数据结构的起源1968，美国高德纳教授，《计算机程序设计艺术》第一卷《基本算法》，开创了数据结构和算法的先河数据结构是研究数据之间关系和操作的学科，而非计算方法数据结构+算法=程序美国沃斯提出这句话揭示了程序的本质2、数据结构相关概念结构：所以能够输入到计算机中，能够被程序处理的描述客观事物的符号数据项：有独立含义的数据的最小单位，也称为域数据元素：组成数据的有一定含义的基本
33.Java读写锁（认识读写锁、读写锁案例、锁降级、锁的演变）我命由我12345 Java -基础入门 java 开发语言 java-ee intellij-idea intellij idea spring boot 后端
一、锁概述1、悲观锁每个人进行操作时都进行上锁解锁，能解决并发问题，但不支持并发操作，只能逐个进行操作，效率低2、乐观锁通过版本号进行控制，谁先提交就先修改版本号，其他人因为版本号不相同就不能进行提交3、表锁对整个表加锁，不会发生死锁4、行锁对表中的单独一行加锁，会发生死锁5、读锁共享锁，可以有多个人读，会发生死锁6、写锁独占锁，只能有一个人写，会发生死锁二、读写锁1、基本介绍对共享资源有读和写的
Python操作MongoDB看这一篇就够了 Python3.7 Python进阶 python
MongoDB是由C++语言编写的非关系型数据库，是一个基于分布式文件存储的开源数据库系统，其内容存储形式类似JSON对象，它的字段值可以包含其他文档、数组及文档数组，非常灵活。在这一节中，我们就来看看Python3下MongoDB的存储操作。1.准备工作在开始之前，请确保已经安装好了MongoDB并启动了其服务，并且安装好了Python的PyMongo库。2.连接MongoDB连接MongoDB
C#单点登录（SSO）：解锁高效访问的密码步、步、为营 c#开发语言
一、单点登录（SSO）初相识在数字化办公的浪潮中，单点登录（SingleSign-On，简称SSO）技术犹如一把神奇的钥匙，为我们开启了便捷、高效的访问之门。它打破了传统登录方式的束缚，让用户在访问多个应用系统时，只需进行一次登录操作，就能畅游无阻。想象一下，你是一位忙碌的企业员工，每天需要频繁使用各种办公软件，如邮件系统、项目管理工具、财务报表平台等。在没有SSO之前，你可能需要为每个系统分别记
【Java用法】Java设计模式之（三）原型模式（Prototype Pattern） No8g攻城狮 Java设计模式设计模式 java 后端
目录一、原型模式简介1.1、原型模式简介1.2、原型模式角色1.3、原型模式优缺点1.4、原型模式使用场景1.5、浅拷贝与深拷贝二、原型模式实现2.1代码客户端2.2浅拷贝代码2.3深拷贝代码三、原码分析一、原型模式简介1.1、原型模式简介原型模式使用原型实例指定创建对象的种类，并且通过拷贝原型对象创建新的对象。Prototype模式提供了一个通过已存在对象进行新对象创建的接口（clone），cl
设计模式｜原型模式（Prototype Pattern）进击的小白菜设计模式设计模式原型模式
文章目录什么是原型模式结构优缺点优点缺点举例代码示例原型模式vs复制（copy）什么是原型模式原型模式（PrototypePattern）是一种创建型设计模式，其核心思想是通过复制现有对象来创建新对象，而无需显式地指定它们的类。这种模式通常用于当对象的创建成本较高，或者对象初始化过程比较复杂时。结构原型模式的主要角色包括原型接口（PrototypeInterface）、具体原型类（Concrete
【C#】将信息输出到 Visual Studio 的输出窗口的几个方式我不是程序猿儿 C#c#visual studio 开发语言
在WinForms项目中，可以通过使用System.Diagnostics.Debug或System.Diagnostics.Trace类将信息输出到VisualStudio的输出窗口。这两者之间的主要区别在于，Debug仅在调试模式下有效，而Trace则在调试模式和发布模式下都有效。方法1:使用System.Diagnostics.DebugDebug类允许你在调试时输出信息到VisualStu
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul

图推荐算法在E&E问题上的应用

你可能感兴趣的:(图推荐算法在E&E问题上的应用)