Lee_yl

RippleNet: Propagating User Preferences on the Knowledge Graph for Recommender Systems

一、摘要

为了解决协同过滤的稀疏性和冷启动问题，社交网络或项目属性等辅助信息被用来提高推荐性能。

考虑到知识图谱是边信息的来源，为了解决现有的基于嵌入和基于路径的知识图谱感知重构方法的局限性，本文提出了一种端到端框架，它自然地将知识图结合到推荐系统中。

与水上传播的实际涟漪类似，RippleNet通过在知识图谱实体集上传播用户兴趣，从而自主迭代地沿着知识图谱中的链接来扩展用户的潜在兴趣。

因此，由用户的历史点击项激活的多个“涟漪”被叠加以形成用户相对于候选项目的偏好分布，该偏好分布可用于预测最终点击概率。

通过在真实世界数据集上的大量实验，本文证明RippleNet在各种场景（包括电影、书籍和新闻推荐）中都能在多个最先进的基线上获得实质性的效果。

ripple net ：

ripple：波纹，是你往水里面扔石头产生的。

石头就是波纹的中心，也就是RS中的用户历史点击矩阵。
被激起的波纹就对应了知识图谱一个又一个的实体。

由用户的历史纪录激起的水波，就是用户潜在感兴趣的item
除此之外波纹还有一个特点，它会随着层数的变大而逐渐衰减，这里类比到ripplenet也是同样的。

二、引言

背景：

推荐系统（Recommender systems，RS）旨在通过为用户寻找一组满足其个性化兴趣的小商品来弥补信息爆炸带来的负面影响。

在推荐策略中，协作过滤（CF）考虑了用户的历史交互，并根据用户潜在的共同偏好进行推荐，取得了巨大的成功。然而，基于CF的方法通常存在用户-项目交互的稀疏性和冷启动问题。为了解决这些局限性，研究人员提出了将侧边信息整合到CF中，如社交网络、用户/项目属性、图像和上下文。

在各种类型的边信息中，知识图谱（KG）通常包含更多关于项目的有成效的事实和联系。KG是一种有向异构图，其中节点对应于实体，边对应于关系。最近，研究人员提出了一些学术KG，如NELL1、DBpedia2和商业KG，如Google Knowledge Graph和Microsoft Satori。这些知识图已成功地应用于许多应用中，如KG构建、问答、单词嵌入和文本分类。

KG用在推荐的好处：

（1）准确性。KG引入了项目之间的语义关联性，有助于发现它们之间潜在的联系，提高推荐项目的精度；

（2）多样性。由各种类型的关系组成，有助于合理地维护用户的利益，增加推荐项目的多样性；

（3）可解释性。KG将用户的历史记录与推荐项目联系起来，从而为推荐系统带来可解释性。

现有的KG结合推荐可分为两类：

第一类是基于embedding的方法，它使用知识图嵌入（KGE）预处理KG，并将学习到的实体嵌入合并到推荐框架中。

例如，深度知识感知网络（Deep Knowledge aware Network，DKN）将实体embedding和单词embedding作为不同的通道，然后设计一个CNN框架将它们结合起来进行新闻推荐。

协同知识库嵌入（CKE）在统一的贝叶斯框架中将CF模块与知识embedding、文本embedding和项目图像embedding相结合。

签名异构信息网络嵌入（SHINE）设计深度自动编码器，嵌入情感网络、社交网络和个人资料（知识）网络，用于名人推荐。

基于嵌入的方法在利用KG来辅助推荐系统方面显示出高度灵活性，但是在这些方法中采用的KGE算法通常更适合于诸如链接预测之类的图形应用，而不是推荐。

第二类是基于路径的方法，它揭示了以KG为单位的项目之间的各种连接模式，为建议提供额外的指导。

例如，个性化实体推荐（PER）和基于元图的推荐将KG视为异构信息网络（HIN），并提取基于元路径/元图的潜在特征，以表示用户和项目之间沿着不同类型的关系路径/图的连接。

基于路径的方法以更自然和直观的方式使用KG，但它们严重依赖于手动设计的元路径，这在实践中很难优化。另一个问题是，在某些实体和关系不在一个域中的场景（例如，新闻推荐）中，不可能设计手工创建的元路径。

ripple net :

RippleNet是为点击率（CTR）预测而设计的，

输入：用户项目对

输出：用户参与（如点击、浏览）项目的概率。

关键思想：偏好传播。

对于每个用户，RippleNet将其历史兴趣视为KG中的种子集，然后沿着KG链接迭代扩展用户兴趣，以发现其与候选项相关的层次潜在兴趣。

我们将偏好传播与雨滴在水面上传播所产生的实际涟漪进行类比，其中多个“涟漪”叠加在一起，形成用户对知识图的偏好分布。

RippleNet与现有文献的主要区别在于RippleNet结合了上述两种方法的优点：（1）RippleNet通过偏好传播自然地将KGE方法融入到推荐中；（2）RippleNet可以自动发现从用户历史记录中的项目到候选项目的可能路径，而无需任何手工设计。

实验：

根据经验，我们将RippleNet应用于电影、书籍和新闻推荐的三个真实场景。实验结果表明，与最新的推荐基线相比，RippleNet在电影、书籍和新闻推荐中的AUC分别提高了2.0%-40.6%、2.5%-17.4%和2.6%-22.4%。我们还发现，RippleNet根据知识图为推荐的结果提供了一种新的解释方法。

三、问题描述

前提介绍：

在典型的推荐系统中，让U={u1，u2，…}和V={v1，v2，…}分别表示用户和项目的集合。用户项目交互矩阵根据用户的隐含反馈定义（例如点击、观看、浏览等行为），其中

除了交互矩阵Y之外，还有一个知识G，它由实体-大量关系-实体三元组（h、r、t）组成。

其中，，表示三元组的头、关系、尾。表示实体，表示关系。

例如，三元组（Jurassic Park，film.director，Steven Spielberg）：史蒂芬·斯皮尔伯格（Steven Spielberg）是电影《侏罗纪公园》（Jurassic Park）的导演。

在许多推荐场景中，一个项目v可能与G中的一个或多个实体关联。

例如，电影《侏罗纪公园》与其同名的KG关联，而标题为“法国熊猫宝宝首次公开亮相”的新闻则与实体“法国”和“熊猫”关联。

问题定义：

给定交互矩阵Y和知识图G，目的是预测用户u是否对之前没有交互的项目v有潜在兴趣。我们的目标是学习一个预测函数，其中yˆuv表示用户u单击项目v的概率，而Θ表示函数F的模型参数。

四、RippleNet

1、RippleNet框架：

RippleNet将用户u和项目v作为输入，并输出用户u单击项目v的预测概率。

对于输入用户u，其历史兴趣集Vu被视为KG中的种子，然后沿链接扩展以形成多个ripple集Su^k（k=1、2、…、H）。

ripple集Su^k是远离种子集Vu的k-hop的知识三元组集。这些ripple集用于迭代地与项目嵌入（黄色块）交互，以获得用户u对项目v（绿色块）的响应，然后组合这些响应以形成最终用户嵌入（灰色块）。

最后，利用用户u和项目v的嵌入来计算预测概率yˆuv。

2、Ripple Set

知识图谱通常包含丰富的事实和实体之间的联系。

例如，如图3所示，电影《Forrest Gump》与“Robert Zemeckis”（导演）、“Tom Hanks”（明星）、“U.S.”（乡村）和“Drama”（流派）联系在一起，而Tom Hanks则与他主演的电影《The Terminal》和《Cast Away》进一步联系在一起。

这些复杂的KG连接为我们提供了一个深入和潜在的视角来探索用户偏好。

例如，如果用户曾经看过《Forrest Gump》，他可能会成为Tom Hanks的粉丝，对《The Terminal》或《Cast Away》感兴趣。

为了用KG来描述用户的层次扩展偏好，在RippleNet中，我们递归地为用户u定义了一组与k-hop相关的实体，如下所示：

定义1（相关实体）。给定交互矩阵Y和知识图G，用户u的k跳相关实体集定义为

其中，是用户过去点击项目集合，即KG中的种子集（seed）。

定义2（波纹集）。用户u的k跳Ripple集定义为从开始的知识三元组：

ripple可能存在的问题：随着跳数K的增加，圈子大小可能会变得很大。

解决：

（1）一个KG大量实体没有出度，只有出度。【如图3中的“2004”和“PG-13”实体】

（2）在电影或书籍推荐等特定推荐场景中，可以将关系限制在与场景相关的类别中来减小ripple集大小并提高实体之间的相关性。如图3中，所有关系都与电影相关，并且他们的名称中包含单词“film”

（3）在实践中，最大跳频h的数目通常不太大，因为离用户历史太远的实体可能带来比正信号更多的噪声。在实验部分我们将讨论H的选择。

（4）在RippleNet中，我们可以对一个固定大小的邻域集进行采样，而不是使用一个完整的RippleNet集来进一步减少计算开销。

3、偏好传播（模型）

传统的基于CF的方法及其变体[11，31]学习用户和项目的潜在表示，然后通过直接将特定函数应用于其表示（如内积）来预测未知评级。在RippleNet中，为了以更细粒度的方式对用户和项目之间的交互进行建模，我们提出了一种偏好传播技术来探索用户在RippleNet集合中的潜在兴趣。

item embedding：直接在embedding层计算。

如图2所示，每个item v 与item embedding V∈R^d相关联，其中d是嵌入的维数。基于应用场景，item embedding可以合并项目的one hot ID、属性、字袋或上下文信息。

user embedding计算：【图2 绿色矩形（向量）相加，即以下公式6】

绿色矩形的计算：

1、计算与item embedding的相关概率

给定项embedding V和用户u的1跳ripple集Su¹，Su¹中的每个三元组（hi，ri，ti）通过比较项目v与该三元组中的头hi和关系ri来分配相关概率：

　　其中，Ri 和hi是关系和头的embedding。相关概率pi可以视作项目 v 和实体hi 在关系空间Ri中的相似度, 注意不同的Ri关系空间计算得到的相似度不一样。

例如，《阿甘正传》和《弃儿》在考虑导演或明星时非常相似，但如果从体裁或作家的角度来衡量，它们的共同点就少了。

2、计算输入向量：（第一个绿色矩形表示的向量）

在得到相关概率后，取S_u¹中的尾乘以相应的相关概率进行加权求和，得到向量o_u¹：

3、偏好传播：（重复H次，H个绿色矩形）

通过等式（4）和等式（5）中的操作，用户的兴趣沿着Su¹中的链路从其历史集合Vu转移到其1跳相关实体Eu1的集合，这在RippleNet中称为偏好传播。

通过（4）和（5）将V 替换成 o_u¹，重复这个过程，获得用户的2阶o_u²，……。

从用户历史点击项目偏好开始通过H阶传播，得到各阶用户的偏好o_u1 , o_u2 , ..., o_uH 。

用户u对于项目v的最终embedding：

【注意：ouH 会包含前面所有ou1 , ou2 , ..., 的信息，但可能会被稀释，所以把所有的o相加】

4、最后预测的概率：

将user embedding 和item embedding结合成为最终要预测点击的概率：

4、学习算法

损失函数的推导：

给定知识图谱G和交互矩阵Y，学习参数来使得预测的点击概率最大化：

其中，包括所有的实体、关系和项目的embedding。

后验展开：

（根据贝叶斯）

第一项： ：模型参数的先验概率，设置为均值为0结合对角协方差矩阵的的高斯分布。

第二项：：给定观测知识图谱G的似然函数，G在θ下为均值为0的正太分布，采用张量分解令h^TRt 接近于I_h,r,t，如果(h,r,t)属于G，则指标I _h,r,t= 1，否则为0。h^TRt ≈ 1或0（I_h,r,t）服从正态分布类似于别的KGE方法。

第三项：：给定Θ和KG的观测隐式反馈的似然函数，其定义为伯努利分布的乘积。

结合前面的（2）到（7）的式子，最终的损失函数为：

其中，V 和 E 为所有项目和实体的embedding矩阵，I_r是在KG中关系 r 的指示张量 I 的切片，R 是关系 r 的embedding矩阵。

第一项：计算交互矩阵 Y 和预测值的交叉熵。

第二项：计算I_r和重建指示矩阵E^TRE的平方差。（没懂）

第三项：多拟合正则项。

SGD求解：

负采样：分别从 G 和 Y 的真/假三元组中随机抽取一小批，然后计算损失L相对于模型参数Θ的梯度，并基于采样的小批量数据通过反向传播更新所有参数。

5、讨论

（1）可解释性。RippleNet基于KG探索用户的兴趣，它通过跟踪从用户历史到KG中具有高关联概率的项目（等式（4））的路径，提供了一个新的可解释性观点。

（2）ripple叠加。用户点击历史记录中不同项目的相关实体常常高度重叠。换句话说，从用户的点击历史记录开始，可以通过KG中的多个路径访问实体。

五、实验

三个场景：电影、书籍、新闻推荐

Movielens-1M是电影推荐中广泛使用的基准数据集，评分1-5.
•Book-Crossing数据集包含对图书交叉社区图书的1149780个明确评分（从0到10不等）。
•Bing News数据集包含从2016年10月16日至2017年8月11日Bing News的服务器日志中收集的1025192条隐含反馈。每条新闻都有标题和片段。

输入：

对于MovieLens-1M和Book Crossing，我们使用用户和项目的ID embedding作为原始输入，而对于Bing News，我们将一条新闻的ID embedding和其标题的平均单词embedding连接为项目的原始输入，因为新闻标题通常比电影或书籍的名称长得多。

构造知识图谱：

我们使用Microsoft Satori为每个数据集构造知识图。

对于MovieLens-1M和Book Crossing，我们首先从KG集中选择 关系名包含“movie”或“Book”且置信度大于0.9的三元组子集。

给定子KG，我们通过将所有有效电影/书籍的名称与三元祖的尾部（head，film.film.name，tail）或（head，book.book.title，tail）匹配来收集它们的ID。为简单起见，排除没有匹配或多个匹配实体的项目。

然后，我们将ID 与所有KG三元组的头和尾匹配，从子KG中选择所有匹配良好的三元组，并将实体集迭代扩展到四跳。

Bing新闻的构造过程与Bing新闻相似，不同之处在于：

（1）我们使用实体链接工具来提取新闻标题中的实体；

（2）由于新闻标题中的实体不在一个特定的域内，因此我们不限制关系的名称。三个数据集的基本统计数据见表1。

基线方法：

CKE、SHINE、DKN、PER、LibFM、Wide&Deep

实验设置：

设置高的H性能不能提升且计算量大。

训练集：验证集：测试集 = 6：2：2

指标：

准确性和AUC评估CTR预估性能。

精度、召回、F1评估推荐性能。

六、实验代码

本文的代码地址如下：https://github.com/princewen/tensorflow_practice/tree/master/recommendation/Basic-RippleNet-Demo

参考的代码地址为：https://github.com/hwwang55/RippleNet

数据下载地址为：:https://pan.baidu.com/s/13vL-z5Wk3jQFfmVIPXDovw 密码:infx

在对数据进行预处理后，我们得到了两个文件：kg_final.txt和rating_final.txt

rating_final.txt数据形式如下，三列分别是user-id，item-id以及label（1表示正样本，0是负样本。0是通过负采样得到的，正负样本比例为1:1）。label表示用户与项目的偏好和不偏好。

kg_final.txt格式如下，三类分别代表h，r，t(这里entity和item用的是同一套id)：

h和 t都是有关于item的实体，类似于 “4657 film.actor.film 64604” 。电影 id 为4657的导演是电影id 64604。

以下的关系 r 为film.actor.film等，比如 “film.film.star”、“film.film.writer”、“film.person_or_entity_appearing_in_film.film”。共有25种关系。

RippleNet: Propagating User Preferences on the Knowledge Graph for Recommender Systems_第10张图片

作者：文哥的学习日记
链接： https://www.jianshu.com/p/c5ffaf7ed449
来源：简书
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

你可能感兴趣的:(RippleNet: Propagating User Preferences on the Knowledge Graph for Recommender Systems)

mysql禁用远程登录 igotyback mysql
去mysql库中的user表里，将host都改成localhost之后刷新权限FLUSHPRIVILEGES;
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
01-Git初识 Meereen Git git
01-Git初识概念：一个免费开源，分布式的代码版本控制系统，帮助开发团队维护代码作用：记录代码内容。切换代码版本，多人开发时高效合并代码内容如何学：个人本机使用：Git基础命令和概念多人共享使用：团队开发同一个项目的代码版本管理Git配置用户信息配置：用户名和邮箱，应用在每次提交代码版本时表明自己的身份命令：查看git版本号git-v配置用户名gitconfig--globaluser.name
【Git】常见命令(仅笔记) 好想有猫猫 Git Linux学习笔记 git 笔记 elasticsearch linux c++
文章目录创建/初始化本地仓库添加本地仓库配置项提交文件查看仓库状态回退仓库查看日志分支删除文件暂存工作区代码远程仓库使用`.gitigore`文件让git不追踪一些文件标签创建/初始化本地仓库gitinit添加本地仓库配置项gitconfig-l#以列表形式显示配置项gitconfiguser.name"ljh"#配置user.namegitconfiguser.email"[email protected]
xilinx vivado PULLMODE 设置思路坚持每天写程序 fpga开发
1.xilinx引脚分类XilinxIO的分类：以XC7A100TFGG484为例，其引脚分类如下：1.UserIO(用户IO)：用户使用的普通IO1.1专用(Dedicated)IO：命名为IO_LXXY_#、IO_XX_#的引脚，有固定的特定用途，多为底层特定功能的直接实现，如差分对信号、关键控制信号等，不能随意变更。1.2多功能(Multi-Function)IO：命名为IO_LXXY_ZZ
Table列表复现框实现【勾选-搜索-再勾选】～四时春～ java 开发语言 elementui vue
Table列表复现框实现【勾选-搜索-再勾选】概要整体架构流程代码实现技术细节注意参考文献概要最近在开发时遇到一个问题，在进行表单渲染时，正常选中没有问题，单如果需要搜索选中时，一个是已选中的不会回填，二是在搜索的结果中进行选中，没有实现，经过排查，查找资料后实现。例如：整体架构流程具体的实现效果如下：代码实现{{scope.row.userName}}已选区{{userItem.userName
golang获取用户输入的几种方式余生逆风飞翔 golang 开发语言后端
一、定义结构体typeUserInfostruct{Namestring`json:"name"`Ageint`json:"age"`Addstring`json:"add"`}typeReturnDatastruct{Messagestring`json:"message"`Statusstring`json:"status"`DataUserInfo`json:"data"`}二、get请求的
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
golang实现从服务器下载文件到本地指定目录余生逆风飞翔 golang 服务器开发语言
一、连接服务器，采用sftp连接模式packagemiddlewaresimport("fmt""time""github.com/pkg/sftp""golang.org/x/crypto/ssh")//建立服务器连接funcConnect(user,password,hoststring,portint)(*sftp.Client,error){var(auth[]ssh.AuthMethod
spring mvc @RequestBody String类型参数 zoyation spring-mvc spring mvc
通过如下配置：text/html;charset=UTF-8application/json;charset=UTF-8在springmvc的Controller层使用@RequestBody接收Content-Type为application/json的数据时，默认支持Map方式和对象方式参数@RequestMapping(value="/{code}/saveUser",method=Requ
使用python抽取post接口数据示例中台小A python python 开发语言
postman调用接口post接口https://inner-XXXXX.XXXXX.com/wXX/api/XXXXXctoryLake?user_key=XXXXXXXXXXXX，在boday的row里输入Jason格式的{"wasStartDay":"2024-09-03"}importrequestsurl='https://inner-XXXXX.XXXXX.com/wXX/api/XX
svg图片兼容性和用法优缺点独行侠_ef93
svg图片的使用方法第一次来认认真真的研究了下svg图片，之前只是在网上见过，但都是一晃而过也没当回事，最近网站改版看到同事有用到svg格式的图片，想想自己干了几年的重构也没用过，这些细节的知识是应该好好研究研究了。暂时还没研究得完全透切，先记下目前为止所看到的吧不然又给忘了。svg可缩放矢量图形（ScalableVectorGraphics），顾名思义就是任意改变其大小也不会变形，是基于可扩展标
静态常量（static const）|| 日志记录器课堂随想 moveit2 机器人
//AllsourcefilesthatuseROSloggingshoulddefineafile-specific//staticconstrclcpp::LoggernamedLOGGER,locatedatthetopofthefile//andinsidethenamespacewiththenarrowestscope(ifthereisone)staticconstrclcpp::L
由于直接在一个回答中提供完整且多语言的游戏商城代码是不现实的（因为每种语言都有其独特的语法和库），我将为你概述一个游戏商城的核心概念，并提供几种不同编程语言的基本框架或示例代码段。 uthRaman 游戏 python 开发语言
商城系统概述hailiangwang.com游戏商城系统通常包含以下部分：用户系统（登录、注册、用户信息）商品列表（游戏、DLC、虚拟货币等）购物车系统支付系统订单系统2.示例框架（伪代码）首先，我们给出一个伪代码框架，描述商城的核心逻辑。plaintextclassUser:deflogin(username,password):#验证用户登录passdefregister(username,p
2018-08-16【Swift 4.1】关于Swift4.0以后调用MJExtension无法模型转换问题码农happy
1、本人使用swift4.1，弄了一晚上才弄好，结果还是一个小问题真是尴尬，要在model中每个属性前面加上@objcimportUIKitclassUserModel:NSObject{@objcvardix=String()}letdic=["dix":"ffffff"]asNSDictionaryletmodel=UserModel.mj_object(withKeyValues:dic)!
【Python爬虫】百度百科词条内容 PokiFighting 数据处理 python 爬虫开发语言
词条内容我这里随便选取了一个链接，用的是FBI的词条importurllib.requestimporturllib.parsefromlxmlimportetreedefquery(url):headers={'user-agent':'Mozilla/5.0(WindowsNT6.1;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/80.
tf.get_collection() yalesaleng
此函数有两个参数，key和scope。Args:1.key:Thekeyforthecollection.Forexample,theGraphKeysclasscontainsmanystandardnamesforcollections.2.scope:(Optional.)Ifsupplied,theresultinglistisfilteredtoincludeonlyitemswhose
华为坤灵路由器初始化开局的注意事项，含NAT配置 redmond88 网络技术华为服务器运维
坤灵路由器比较坑，无web界面，全程命令行配置，但是版本更新导致和华为企业路由器配置很多不一样的地方，今天介绍下1、aaa密码复杂度修改：#使能设备对密码进行四选三复杂度检查功能。system-view[HUAWEI]aaa[HUAWEI-aaa]local-aaa-userpasswordpolicyadministrator[HUAWEI-aaa-lupp-admin]passwordcomp
MyBatis批量插入大量数据小黑屋说YYDS MyBatis java
1.思路分析批量插入这个问题，我们用JDBC操作，其实就是两种思路吧：用一个for循环，把数据一条一条的插入（这种需要开启批处理）。生成一条插入sql，类似这种insertintouser(username,address)values(‘aa’,‘bb’),(‘cc’,‘dd’)…。到底哪种快呢？我们从两方面来考虑这个问题：插入SQL本身执行的效率。网络I/O。先说第一种方案，就是用for循环循
Spring Security定义多个过滤器链（10）小黑屋说YYDS spring
在SpringSecurity中可以同时存在多个过滤器链，一个WebSecurityConfigurerAdapter的实例就可以配置一条过滤器链。我们来看如下一个案例：@ConfigurationpublicclassSecurityConfig{@BeanUserDetailsServiceus(){InMemoryUserDetailsManagerusers=newInMemoryUser
大数据真实面试题---SQL The博宇大数据面试题——SQL 大数据 mysql sql 数据库 big data
视频号数据分析组外包招聘笔试题时间限时45分钟完成。题目根据3张表表结构，写出具体求解的SQL代码（搞笑品类定义：视频分类或者视频创建者分类为“搞笑”）1、表创建语句：createtablet_user_video_action_d(dsint,user_idstring,video_idstring,action_typeint,`timestamp`bigint)rowformatdelimi
Spark 组件 GraphX、Streaming 叶域大数据 spark spark 大数据分布式
Spark组件GraphX、Streaming一、SparkGraphX1.1GraphX的主要概念1.2GraphX的核心操作1.3示例代码1.4GraphX的应用场景二、SparkStreaming2.1SparkStreaming的主要概念2.2示例代码2.3SparkStreaming的集成2.4SparkStreaming的应用场景SparkGraphX用于处理图和图并行计算。Graph
1-1.Jetpack 之 Navigation 简单编码模板我命由我12345 Android -Jetpack 简化编程 java java-ee android-studio android studio 安卓 android jetpack
一、Navigation1、Navigation概述Navigation是Jetpack中的一个重要成员，它主要是结合导航图（NavigationGraph）来控制和简化Fragment之间的导航，即往哪里走，该怎么走2、Navigate引入在模块级build.gradle中引入相关依赖implementation'androidx.navigation:navigation-fragment:2
5-【JavaWeb】JUnit 单元测试及JUL 日志系统 weixin_44329069 JavaWeb junit 单元测试
1.使用JUnit进行单元测试JUnit是Java中非常流行的单元测试框架，MyBatis与JUnit可以很好地结合，来测试持久层代码的正确性。1.1添加JUnit依赖在使用JUnit之前，需要在pom.xml中引入JUnit依赖。junitjunit4.13.2test1.2单元测试基本结构假设我们要测试UserMapper中的getUserById方法，测试代码如下：importorg.apa
GEO数据的下载和处理|GEO数据转换为Gene symbol|GEO注释文件提取symbol|查看样本标签|查看GEO数据疾病或正常|生物信息基础 Red Red 生信小技巧学习笔记生物信息 r语言 GEO数据库数据库
GEO数据的下载和处理|GEO数据转换为Genesymbol|GEO注释文件提取symbol|查看样本标签|查看GEO数据疾病或正常|生物信息基础数据的下载和处理首先在GEO数据库中通过GSEID找到相关数据，然后下载txt文件。数据读取与处理。#设置工作路径，也就是你的分析数据存放以及要保存到地方setwd(dir="C:\\Users\\LiaoMinzhen\\PycharmProjects
测试平台系列(24) 编写成员管理功能米洛丶
回顾上一节我们编写了项目设置相关功能，还剩下2个tab没有编写，分别是:用例列表和成员管理.编写成员列表及部分接口添加成员搜索成员编辑成员删除成员今天因为时间关系就不展示删除成员了，只编写编辑/新增成员接口和页面。编写新增/编辑角色的方法由于之前我们已经编辑过新增角色的方法了，但是需要修改一点:image这里角色的筛选条件不能加上，为什么呢？因为加上的话，我可以创建同一个user_id的不同角色，
Swift4.0: 利用图形上下文画基础图? Dayu大鱼
步骤:开启图片上下文获取上下文配置上下文3.1填充颜色cgColor3.2填充尺寸从图形上下文中获取图片关闭上下文返回图片importFoundationimportUIKitextensionUIImage{///画一个白色背景的图片classfuncimageWithWhiteBackGroundColor()->UIImage{//开始图形上下文UIGraphicsBeginImageCon
主流行架构 rainbowcheng 架构架构
nexus，gitlab,svn,jenkins,sonar,docker，apollo，catteambition，axure，蓝湖，禅道,WCP；redis，kafka，es，zookeeper，dubbo，shardingjdbc，mysql，InfluxDB，Telegraf，Grafana，Nginx，xxl-job，Neo4j,NebulaGraph是一个高性能的,NOSQL图形数据库
navicate远程linux上的pgsql提示密码失败 coding上下求索 linux 服务器数据库
错误提示：FATAL:passwordauthenticationfailedforuser“postgres”解决方案：1、pg_hba.conf文件中，ipv4下面的内容改成hostallall0.0.0.0/0md52、postgresql.conf文件中，修改listen_addresses由#listen_addresses='location'改为listen_addresses='*
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS