demm868

知识图谱辅助的个性化推荐系统

向AI转型的程序员都关注了这个号????????????

机器学习AI算法工程公众号：datayx

本文主要包括以下内容：

推荐系统的基础知识
知识图谱辅助的推荐方法介绍
基于embedding的知识图谱推荐方法
混合型知识图谱推荐方法

知识图谱：是结构化的语义知识库，用于迅速描述物理世界中的概念及其相互关系。

知识图谱通过对错综复杂的文档的数据进行有效的加工、处理、整合，转化为简单、清晰的“实体,关系,实体”的三元组，最后聚合大量知识，从而实现知识的快速响应和推理。

知识图谱有自顶向下和自底向上两种构建方式。所谓自顶向下构建是借助百科类网站等结构化数据源，从高质量数据中提取本体和模式信息，加入到知识库中；所谓自底向上构建，则是借助一定的技术手段，从公开采集的数据中提取出资源模式，选择其中置信度较高的新模式，经人工审核之后，加入到知识库中。

看一张简单的知识图谱：

如图所示，你可以看到，如果两个节点之间存在关系，他们就会被一条无向边连接在一起，那么这个节点，我们就称为实体（Entity），它们之间的这条边，我们就称为关系（Relationship）。

知识图谱的基本单位，便是“实体（Entity）-关系（Relationship）-实体（Entity）”构成的三元组，这也是知识图谱的核心。

实体: 指的是具有可区别性且独立存在的某种事物。实体是知识图谱中的最基本元素，不同的实体间存在不同的关系。如图中的“中国”、“北京”、“16410平方公里”等。
关系: 关系是连接不同的实体，指代实体之间的联系。通过关系节点把知识图谱中的节点连接起来，形成一张大图。如图中的“人口”、“首都”、“面积”等

3. 数据类型和存储方式

知识图谱的原始数据类型一般来说有三类（也是互联网上的三类原始数据）：

结构化数据（Structed Data）：如关系数据库
半结构化数据（Semi-Structed Data）：如XML、JSON、百科
非结构化数据（UnStructed Data）：如图片、音频、视频、文本

如何存储上面这三类数据类型呢？一般有两种选择，一个是通过RDF（资源描述框架）这样的规范存储格式来进行存储，还有一种方法，就是使用图数据库来进行存储，常用的有Neo4j等。

RDF结构：

在知识图谱方面，图数据库比关系数据库灵活的多。
在数据少的时候，关系数据库也没有问题，效率也不低。但是随着知识图谱变的复杂，图数据库的优势会明显增加。当涉及到2,3度的关联查询，基于图数据库的效率会比关系数据库的效率高出几千倍甚至几百万倍。

其实我们的构建知识图谱的过程，就是信息抽取、知识融合、知识加工三个过程，但是这三个过程都有各自的难点，下文通过从这三个模块出发，解析这三个模块说要解决的问题，会遇到的难点。

信息抽取

信息抽取（infromation extraction）是知识图谱构建的第1步，其中的关键问题是：如何从异构数据源中自动抽取信息得到候选指示单元？

信息抽取是一种自动化地从半结构化和无结构数据中抽取实体、关系以及实体属性等结构化信息的技术。

涉及的关键技术包括：实体抽取、关系抽取和属性抽取。

实体抽取(Entity Extraction)

实体抽取又称为命名实体识别（named entity recognition，NER），是指从文本数据集中自动识别出命名实体。实体抽取的质量（准确率和召回率）对后续的知识获取效率和质量影响极大，因此是信息抽取中最为基础和关键的部分。

2012年Ling等人归纳出112种实体类别，并基于条件随机场CRF进行实体边界识别，最后采用自适应感知机算法实现了对实体的自动分类，取得了不错的效果。

但是随着互联网中内容的动态变化，采用人工预定义实体分类体系的方式已经很难适应时代的需求，因此提出了面向开放域的实体识别和分类研究。

在面向开放域的实体识别和分类研究中，不需要（也不可能）为每个领域或者每个实体类别建立单独的语料库作为训练集。因此，该领域面临的主要挑战是如何从给定的少量实体实例中自动发现具有区分力的模型。

一种思路是根据已知的实体实例进行特征建模，利用该模型处理海量数据集得到新的命名实体列表，然后针对新实体建模，迭代地生成实体标注语料库。

另一种思路是利用搜索引擎的服务器日志，事先并不给出实体分类等信息，而是基于实体的语义特征从搜索日志中识别出命名实体，然后采用聚类算法对识别出的实体对象进行聚类。

关系抽取(Relation Extraction)

文本语料经过实体抽取，得到的是一系列离散的命名实体，为了得到语义信息，还需要从相关的语料中提取出实体之间的关联关系，通过关联关系将实体（概念）联系起来，才能够形成网状的知识结构，研究关系抽取技术的目的，就是解决如何从文本语料中抽取实体间的关系这一基本问题。

人工构造语法和语义规则（模式匹配）
统计机器学习方法
基于特征向量或核函数的有监督学习方法
研究重点转向半监督和无监督
开始研究面向开放域的信息抽取方法
将面向开放域的信息抽取方法和面向封闭领域的传统方法结合

属性抽取(Attribute Extraction)

属性抽取的目标是从不同信息源中采集特定实体的属性信息。例如针对某个公众人物，可以从网络公开信息中得到其昵称、生日、国籍、教育背景等信息。属性抽取技术能够从多种数据来源中汇集这些信息，实现对实体属性的完整勾画。

将实体的属性视作实体与属性值之间的一种名词性关系，将属性抽取任务转化为关系抽取任务。
基于规则和启发式算法，抽取结构化数据
基于百科类网站的半结构化数据，通过自动抽取生成训练语料，用于训练实体属性标注模型，然后将其应用于对非结构化数据的实体属性抽取。
采用数据挖掘的方法直接从文本中挖掘实体属性和属性值之间的关系模式，据此实现对属性名和属性值在文本中的定位。

知识融合

通过信息抽取，我们就从原始的非结构化和半结构化数据中获取到了实体、关系以及实体的属性信息。

如果我们将接下来的过程比喻成拼图的话，那么这些信息就是拼图碎片，散乱无章，甚至还有从其他拼图里跑来的碎片、本身就是用来干扰我们拼图的错误碎片。

拼图碎片（信息）之间的关系是扁平化的，缺乏层次性和逻辑性；
拼图（知识）中还存在大量冗杂和错误的拼图碎片（信息）
那么如何解决这一问题，就是在知识融合这一步里我们需要做的了。

知识融合包括2部分内容：实体链接，知识合并

实体链接

实体链接（entity linking）：是指对于从文本中抽取得到的实体对象，将其链接到知识库中对应的正确实体对象的操作。

其基本思想是首先根据给定的实体指称项，从知识库中选出一组候选实体对象，然后通过相似度计算将指称项链接到正确的实体对象。

研究历史：

仅关注如何将从文本中抽取到的实体链接到知识库中，忽视了位于同一文档的实体间存在的语义联系。
开始关注利用实体的共现关系，同时将多个实体链接到知识库中。即集成实体链接（collective entity linking）

实体链接的流程：

从文本中通过实体抽取得到实体指称项。
进行实体消歧和共指消解，判断知识库中的同名实体与之是否代表不同的含义以及知识库中是否存在其他命名实体与之表示相同的含义。
在确认知识库中对应的正确实体对象之后，将该实体指称项链接到知识库中对应实体。

实体消歧：专门用于解决同名实体产生歧义问题的技术，通过实体消歧，就可以根据当前的语境，准确建立实体链接，实体消歧主要采用聚类法。其实也可以看做基于上下文的分类问题，类似于词性消歧和词义消歧。
共指消解：主要用于解决多个指称对应同一实体对象的问题。在一次会话中，多个指称可能指向的是同一实体对象。利用共指消解技术，可以将这些指称项关联（合并）到正确的实体对象，由于该问题在信息检索和自然语言处理等领域具有特殊的重要性，吸引了大量的研究努力。共指消解还有一些其他的名字，比如对象对齐、实体匹配和实体同义。

知识合并

在构建知识图谱时，可以从第三方知识库产品或已有结构化数据获取知识输入。

常见的知识合并需求有两个，一个是合并外部知识库，另一个是合并关系数据库。

将外部知识库融合到本地知识库需要处理两个层面的问题：

数据层的融合，包括实体的指称、属性、关系以及所属类别等，主要的问题是如何避免实例以及关系的冲突问题，造成不必要的冗余
通过模式层的融合，将新得到的本体融入已有的本体库中
然后是合并关系数据库，在知识图谱构建过程中，一个重要的高质量知识来源是企业或者机构自己的关系数据库。为了将这些结构化的历史数据融入到知识图谱中，可以采用资源描述框架（RDF）作为数据模型。业界和学术界将这一数据转换过程形象地称为RDB2RDF，其实质就是将关系数据库的数据换成RDF的三元组数据。

知识加工

在前面，我们已经通过信息抽取，从原始语料中提取出了实体、关系与属性等知识要素，并且经过知识融合，消除实体指称项与实体对象之间的歧义，得到一系列基本的事实表达。

然而事实本身并不等于知识。要想最终获得结构化，网络化的知识体系，还需要经历知识加工的过程。

知识加工主要包括3方面内容：本体构建、知识推理和质量评估。

本体构建

本体（ontology）是指工人的概念集合、概念框架，如“人”、“事”、“物”等。

本体可以采用人工编辑的方式手动构建（借助本体编辑软件），也可以以数据驱动的自动化方式构建本体。因为人工方式工作量巨大，且很难找到符合要求的专家，因此当前主流的全局本体库产品，都是从一些面向特定领域的现有本体库出发，采用自动构建技术逐步扩展得到的。

自动化本体构建过程包含三个阶段：

实体并列关系相似度计算
实体上下位关系抽取
本体的生成

比如对下面这个例子，当知识图谱刚得到“阿里巴巴”、“腾讯”、“手机”这三个实体的时候，可能会认为它们三个之间并没有什么差别，但当它去计算三个实体之间的相似度后，就会发现，阿里巴巴和腾讯之间可能更相似，和手机差别更大一些。

这就是第一步的作用，但这样下来，知识图谱实际上还是没有一个上下层的概念，它还是不知道，阿里巴巴和手机，根本就不隶属于一个类型，无法比较。因此我们在实体上下位关系抽取这一步，就需要去完成这样的工作，从而生成第三步的本体。

当三步结束后，这个知识图谱可能就会明白，“阿里巴巴和腾讯，其实都是公司这样一个实体下的细分实体。它们和手机并不是一类。”

知识推理

在我们完成了本体构建这一步之后，一个知识图谱的雏形便已经搭建好了。但可能在这个时候，知识图谱之间大多数关系都是残缺的，缺失值非常严重，那么这个时候，我们就可以使用知识推理技术，去完成进一步的知识发现。

我们可以发现：如果A是B的配偶，B是C的主席，C坐落于D，那么我们就可以认为，A生活在D这个城市。

根据这一条规则，我们可以去挖掘一下在图里，是不是还有其他的path满足这个条件，那么我们就可以将AD两个关联起来。除此之外，我们还可以去思考，串联里有一环是B是C的主席，那么B是C的CEO、B是C的COO，是不是也可以作为这个推理策略的一环呢？

当然知识推理的对象也并不局限于实体间的关系，也可以是实体的属性值，本体的概念层次关系等。

推理属性值：已知某实体的生日属性，可以通过推理得到该实体的年龄属性；
推理概念：已知(老虎，科，猫科)和（猫科，目，食肉目）可以推出（老虎，目，食肉目）
这一块的算法主要可以分为3大类，基于逻辑的推理、基于图的推理和基于深度学习的推理。

知识更新

从逻辑上看，知识库的更新包括概念层的更新和数据层的更新。

概念层的更新是指新增数据后获得了新的概念，需要自动将新的概念添加到知识库的概念层中。
数据层的更新主要是新增或更新实体、关系、属性值，对数据层进行更新需要考虑数据源的可靠性、数据的一致性（是否存在矛盾或冗杂等问题）等可靠数据源，并选择在各数据源中出现频率高的事实和属性加入知识库。
知识图谱的内容更新有两种方式：

全面更新：指以更新后的全部数据为输入，从零开始构建知识图谱。这种方法比较简单，但资源消耗大，而且需要耗费大量人力资源进行系统维护；
增量更新：以当前新增数据为输入，向现有知识图谱中添加新增知识。这种方式资源消耗小，但目前仍需要大量人工干预（定义规则等），因此实施起来十分困难。

什么是推荐系统

在当前互联网时代，推荐系统是所有面向用户的互联网产品的核心技术，只要产品是面向用户的，那么就有推荐系统的需求。

推荐系统是解决信息爆炸问题，给用户推荐一个用户感兴趣的小规模集合。用户在大量商品中，不知道如何选择，推荐系统是替用户做这个选择，猜用户的兴趣，然后给用户推荐一个小规模的商品集合，这样用户就不会迷失在大量商品中。

举几个推荐系统的例子。如下图是imdb系统中的电影推荐，imdb会推荐用户可能更感兴趣的电影。

如下图是亚马逊系统中的图书推荐，给用户推荐和用户更相关，用户更感兴趣的书籍。

如下图是booking.com系统中旅游景点的推荐，给用户推荐更感兴趣景点。

如下图是我们更为熟悉的推荐系统的例子，知乎，抖音，头条等系统，都有推荐功能。

推荐系统的实现方法

推荐系统主要有2个任务，一个是评分预测 ( Rating Prediction )。如下图左边是评分预测的例子，横坐标是物品，纵坐标是用户。表格是用户对物品的打分，这个评分可以显示的反应用户对物品的喜好程度，1表示很不喜欢，5表示很喜欢。推荐系统就是预测表格中问号处的缺失值，这就叫评分，这个评分叫显示反馈 ( Explicit feedback )。

另一个是点击预测 ( CTR Prediction )。右边是点击预测的例子，表格中只有0和1，0表示用户没有点击过，1表示用户点击过，这类数据叫隐式反馈 ( Implicit feedback )，点击预测只能反映用户的非常弱的偏好程度，用户点击了不一定说明用户喜欢，比如逛淘宝，用户只是点击了某个物品就退出了，所以点击物品并不能代表用户的真实感受。

推荐系统有一个非常经典的方法叫协同过滤 ( Collaborative Filtering, CF )，CF的核心是假设相似的用户有相似的偏好。

如下图为4个用户对4个物品的打分情况，来预测用户u4对物品i1的评分。通过这4个用户在其他3个商品 ( i2,i3,i4 ) 的打分，计算出其他3个用户和u4用户的相似度，分别是0.7，0.1，0.2，然后用相似度加权平均其他3个用户在i1物品的打分，这样就得到了u4对i1的评分为2.1。

协同过滤CF是根据历史物品评分记录，计算出用户相似度，从而预测分数。

CF是一种常见的方法，但存在以下2类问题。

第一类是稀疏性问题 ( Sparsity )，一般情况下评分分布是相当稀疏的，比如一个用户一辈子可能只会看几百部电影，但电影总数达百万量级，所以在计算相似度的时候会有困难。

第二类更进一步，冷启动问题 ( Cold start )，当来了一个新的用户，这个新的用户没有历史记录，所以没法计算相似性，就没法做推荐。当注册新的app时，比如读书类的app，系统一开始会问你对哪些主题感兴趣，因为系统没有你的历史记录，刚开始没法给你推荐。

▌知识图谱辅助的推荐方法介绍

针对推荐系统出现的问题，我们的思路是既然用户和物品交互很稀少，甚至没有，那可以引入其他的一些信息，这些引入的信息叫辅助信息 ( Side Information )。如下图是4类非常常见的辅助信息：社交网络；用户或商品属性特征；多媒体信息，比如电影的海报，文本信息，视频音频信息等；上下文信息，假设一个用户购买了一个商品，购买记录的一些信息，比如时间、地点、当前用户购物车的其他物品信息等。

1. 什么是知识图谱

知识图谱 ( Knowledge Graphs, KG ) 也是一种辅助信息。KG是一个有向异构图 ( heterogeneous graph )，图中节点表示实体 ( entity )，边表示关系 ( relation )。

一个KG通常包含很多对三元组triple ( head,relation,tail )，其中head和tail是2个实体 ( entity )，relation就是边。

如下图，推荐系统的item是电影，所以Forrest Gump是推荐系统的item，同时也是KG中的实体，KG中其他的实体并不是推荐系统的item，Forrest Gump这部电影的主演是Tom Hanks，虽然Tom Hanks是KG的实体 ( entity )，但并不是item。把图中左边这些三元组 ( triples ) 组合起来，就变成了右边的一个很大的KG。

2. 为什么要在推荐系统中使用KG

如下图，假设一个用户 ( 最左边 ) 看过3部电影 ( item )，Cast Away，Back to the Future，TheGreen Mile，在KG中，可以将这3部电影连接到其他的一些事情上，比如Cast Away 这部电影的类别 ( genre ) 是冒险形 ( Adventure )，Back to the Future的导演 ( directed ) 是Robert Zemeckis等，可以连接到很多其他non-item实体上，再从这些non-item实体又连接到item电影实体上，比如最右边的Interstellar，Forrest Gump，Raiders of the Lost Ark。

KG建立一个从用户已经看过的电影到没看过的电影的连接，而这些连接不是由用户的观看记录得来的。在CF里，实际上是把中间这块替换成了其他用户，用其他用户历史观看记录得到这些连接。KG提供了另外一种关于物品连接的信息来源的方法。

如上图是一个新闻推荐的例子，假设某个用户看过一条新闻，这个新闻的内容是：

Boris Johnson Has Warned Donald Trump To Stick ToThe Iran Nuclear Deal。

从这条新闻中提取了4个实体，在KG中，可以对这些实体做进一步的扩展，做2次，做3次扩展，又会发现这些实体都指向另外一条新闻：

North Korean EMP Attack Would Cause Mass U.S. Starvation, Says Congressional Report。

这2条新闻在字面上没有任何相似度，新闻的单词都不一样，但他们是很相关的，这个相关性体现在KG上，他们在低层是相关的，但这种相关性没法从字面意义上得到，这也是为什么要用KG，KG提供了一种item相似度的计算方式。

3. KG能给推荐系统带来什么

第1个提高推荐系统的精度 ( Precision )，更准确的发现item之间的相似性，如下图2部电影，能通过Tom Hanks做个连接。

第2个提高推荐系统的多样性 ( Diversity )，可以通过主演扩展，可以通过电影类别扩展，也可以通过导演扩展，总有一款是用户非常喜欢的。

第3个是可解释性 ( Explainability )，可以用KG的path来解释系统为什么会推荐这部电影，如下图某个用户喜欢Cast Away这部电影，系统会推荐The Terminal这部电影，因为他们有相同的主演。

4. 知识图谱处理方法

KG 的处理方法中有一类方法叫Knowledge Graph Embedding，KGE。KGE主要是对KG的每个实体 ( entity ) 和每个关系 ( relation ) 学习一个低维的特征。在KGE中有一个基于翻译的距离模型，Translational distancemodels。

如上公式为TransE算法模型，对KG中的每一个tuple(h,r,t)，学习到的entity embedding，relation embedding，使h+r约等于t，这的r相当于翻译作用，把h翻译成t，f函数对每个tuple的真实分值越小越好。

如图(a)是TransE模型，假设head对应的embedding加上relation对应的embedding等于tail对应的embedding。基于TransE有很多扩展模型，比如TransH, TransR。

TransH解决的是一对多的问题，某一个head和relation可能会对应多个tail，如图(b)，把head和tail都投影到一个平面上，然后让它们在相对应的平面上做转换。

TransR是把head和tail都投影到另外一个空间中，在新的空间里让h+r=t。

KG-Aware Recommender Systems正式方法大概可以分为3类。

第一类是Embedding-based methods，基于KG embedding的方法，下图列举了5篇论文，今天将会介绍第2篇和第5篇。

第二类是Path-based methods，基于KG计算路径的推荐方法，今天不会涉及这类方法。

第三类是Hybrid methods，结合embedding和path的方法，今天将介绍一下第1、3、4篇，第3、4是比较统一的方法。

5. 知识图谱辅助的推荐系统问题定义

已知一个用户的集合Users，一个物品的集合Items，用户和物品之间的交互 (relations，y_uv)，一个包括很多non-item实体的KG。图中y_uv表示用户u对物品v的一个隐式反馈，即用户有没有点击过这个物品，目标是给定一个新的u-v对，预测点击率y_uv。

公式定义如上图。用户集合U={u₁,u₂,...}，物品集合V={v₁,v₂,...}，交互矩阵 ( 隐式反馈 ) Y矩阵Y={y_uv ϵ {0,1} | uϵU, vϵV}，KG包括实体 ( entity ) 和关系 ( relation )，由很多三元组组成。

每个物品v在KG中可能对应一个或多个实体。物品是实体的一个子集。

目的是学习一个预测函数F，给定一对u,v，可以输出一个预测分值ŷ_uv，θ是目前的一个参数。

▌基于embedding的知识图谱推荐方法

1. DKN方法

DKN: Deep Knowledge-Aware Network for News Recommendation，属于基于embedding的知识图谱推荐方法，是2018年发表的论文，这篇论文是关于新闻推荐。

如上图，给出一段新闻，提取新闻中的实体，根据这些实体，构建一个知识图谱的子图，对知识图谱做embedding映射，得到每个实体的embedding，最后就得到每个实体的特征向量。

如上图，对于某个实体Fight Club，只有其对应的embedding还不够，在KG中每个实体，连接着好多其他的实体，那这些临近实体就是该实体的上下文，将这些上下文中的每个实体的embedding相加平均，就得到该实体的上下文embedding。如上图公式中ē就是实体e_i的上下文embedding。

在NLP中有一个模型叫KimCNN，主要是给定一个sentence，返回一个特征向量。如上图给定一个n个单词的sentence ( 图中n为7 )，对每个单词做embedding映射，embedding的长度为d ( 图中d为5 )，得到一个d*n的word embedding矩阵。用7个卷积核做卷积进行featuremaps，得到7个1维向量，对每个向量做池化 ( Max pooling )，得到该sentence的word embedding。

前面介绍中已有3种特征向量，分别是实体embeddings，上下文embeddings，word embedings，我们的方法是把这3种embeddings做一个累加，卷积，池化，最后得到这个sentence的embeddings，这种方法叫KCNN。

接下来介绍基于KCNN做推荐的方法。如上图假设某个用户已经点击过了3条新闻，来了一个候选新闻，预测该用户对候选新闻的点击率。对这4条新闻做KCNN的embedding映射，得到4个特征向量。因为用户看过的新闻的重要性对候选新闻是不一样的，用Attention Net计算用户看过的每一条新闻和候选新闻的决策分值。用得到的分值加权观看记录，得到User embedding。将user embedding和candidate news embedding拼接，输出一个预测的点击概率，这个就是做预测的DKN模型。

2. MKR方法

MKR：Multi-TaskFeature Learning for Knowledge Graph Enhanced Recommendation，属于基于embedding的知识图谱推荐方法，是2019年发表在WWW的论文，是一个多任务的模型。

如上图为MKR框架，包括3个模块，一个是推荐模块，一个是knowledge graph embedding， KGE模块，还有一个是以上2个模块的桥梁，cross&compress units，交叉压缩单元，下面将分别阐述这3个模块。

推荐系统模块，输入是user, item，输出是用户对物品的点击率。模块分2块，一个是low-level的部分，一个是high-level的部分。在low-lever部分，用了一个MLP ( multi-layer perceptron ) 来处理用户的特征U_L，item是cross&compress units做的处理，返回一个物品的特征V_L，把U_L和V_L拼接起来，用一个recommendation system函数f_RS，输出一个点击预测值。

KGE模块，也分成low-lever和high-level部分，输入head，用cross&compress unites来做特征处理，relation用MLP做特征处理，把这2个处理结果拼接起来，经过一个K层的MLP，得到一个predictedtail，预测的tail和真实的tail用一个函数f_KG算一个分值，这样就可以优化这个score值。

这个多任务之所以能做起来，主要是推荐系统模块的物品 ( item ) 和KGE模块的实体 ( entity ) 是对应的，很多item可以在KGE中找到对应的entity，item和entity是对同一个物品的描述，他们的embedding在某种程度上是相似的，是可以被连接的。中间的cross&compress units就是这个连接结合，这个模块是在每一层都有，在l层，输入是item的embedding v_l和entity的embedding e_l，输出是下一层的embedding。

这个模块计算分2步，第一步是cross，第二步是compress。

cross操作是将v_l,e_l做一个cross，v_l是一个d*1的向量，e_l^T是1*d的向量，矩阵相乘后得到一个d*d的矩阵C_l。

compress是将交叉后的矩阵C_l重新压缩回embedding space，这块细节部分可以参考论文。通过参数w_l压缩输出v_l+1,e_l+1。

学习算法中loss的计算公式如上图。L_RS是推荐系统的loss，预测user-item的分值ŷ_uv和真实分值y_uv的差距。L_KG是KG的loss，对于真实tuple(h,r,t)，预测分值score越大越好，而对于随机替换tuple(h', r, t') ( 负样本 )，预测的分值越小越好。L_REG是正则项。

算法实现第1块是推荐系统的任务，第2块是KGE任务，交替训练2者。在每次循环里面，做t次的RS的任务训练，做1次的KGE任务训练，做t次RS训练是因为更关注RS任务，这个t是可以调整的，这就是MKR模型。

▌混合型知识图谱推荐方法

1. RippleNet方法

RippleNet: Propagating User Preferenceson the Knowledge Graph for Recommender Systems，属于混合型知识图谱推荐方法，是2018发表在CIKM的一篇论文。

Ripple从名字上理解是水波的意思，水波是一层一层的，那这个算法是指在KG中某个实体，和该实体相连的其他实体也有一跳，二跳，三跳的关系，如上图列出了ForrestGump这部电影对应的3跳的临近实体。

如上图是RippleNet框架，输入是一对user-item，输出是用户对物品的点击预测值。

对输入用户u，获取用户的点击记录V_u，在KG中找到对应的V_u，比如图中有2个对应实体，获取这些实体对应的tuple，把实体一跳的集合拿出来。对输入物品v做embedding映射。如上公式，将item embedding v和这些head h_i在R空间中做一个softmax，得到v相对于每个head的分值p_i。

如上图公式，用p_i加权平均对应的tail embedding t_i，得到输出o_u¹，即当前用户u的一跳的特征，对应图中绿色竖条，可以看成该用户对当前物品的一阶响应 ( User's1-order response )。

继续拿o_u¹特征重复之前的操作，拿o_u¹和物品二跳的tuple算一个p值，加权对应的tail embedding，得到o_u²。

重复做下去，得到很多跳的响应值o_uⁱ，把这些响应值加起来，得到用户最终的embedding。

用这个用户embedding和物品最初的embedding做内积，再用一个sigmoid函数得出点击预测值。

学习算法如上图，在已知KG和RippleNet系统情况下，学习参数，最大化后验概率。通过贝叶斯定理，可以把该公式拆成3个值。第1项是参数的先验分布，用上面这个公式来刻画这个先验概率分布p(θ)，这项对应的是正则项loss。

第2项给定参数θ，KG的概率，这项对应的是KG的embedding部分。当(h,r,t)是正样本，I_h,r,t接近1，反之为0，希望h^TRt能接近真实的tuple值。

第3项已知参数θ和KG，用户和物品交互的似然函数。这个似然函数是一个伯努利分布，关于用户和物品内积的伯努力分布。

把这3项用负log做处理，得到loss函数，优化这个模型。

2. KGCN和KGCN-LS方法

KGCN：Knowledge GraphConvolutional Networks for Recommender Systems，是发表在2019年WWW上的一篇论文。

KGNN-LS：Knowledge-awareGraph Neural Networks with Label Smoothness Regularization for RecommenderSystems，是发表在2019年KDD上的一篇论文，这篇是基于第1篇的扩展，这2篇论文一块讲解。

核心思想是基于KG辅助的推荐，但引入了一个新的模型GCN ( 图神经网络 )，方法是基于GCN对KG扩展一个模型。

在KG中的边没有显示权值，只是一个关系类型。引入一个relation scoring function s_u(r)，对每个relation打分，从而把KG转换成weighted graph。函数s_u(r)的输入是user和relation，输出一个分值。核心思想是识别用户关注的类型，比如有些用户偏好同种类的电影，有些用户偏好某个主演的电影。s_u(r)用来刻画不同用户对不同relation的偏好程度，将user embeding和relation embedding内积，算出相应的分值。把异构KG转换成weighted graph，这样一个graph对应邻接矩阵A_u，下标为u是因为每个用户对应的邻接矩阵是不一样的，s_u(r)是取决于用户。

把KG中实体信息通过GNN做一个融合，如上图公式是一个标准的GNN的公式，A_u是用户对应的邻接矩阵。

D_u是A_u的三角对称矩阵diagonal degree matrix。

W_l就是训练传输参数矩阵。

H_l,H_l+1是entity对应的embedding矩阵。

σ是一个非线性函数。

这个式子本质是在KG上做了一个多跳的message passing，把实体周围的那些临近点的特征向中间聚集，最后一层学到的特征是融合了多跳的临近点的特征。当得到最后一层embedding H_l后，就可以做点击预测。

上图公式中u对应的是User embedding。

v_u是根据前面KGNN计算得出的关于用户的entity embedding。

通过f函数得到预测值，f函数可以取内积，或MLP等。到这是第1篇论文的KGCN模型。

如上公式，在传统GNN模型中，A_u是固定的，只需要训练W_l。

但在我们的模型中，A_u和W_l都需要训练，A_u是通过relation scoring function计算，图的结构需要训练，导致模型参数很多，容易过拟合。

为了防止过拟合的问题，引入一个正则项，给模型一个约束。用label做约束，user engagement labels，指的是用户对物品的打分值，y_uv是用户对某个物品的评分，这个评分是一个已知值，所以可以在KG中对这些点打一个标签。用户看过某部电影，对应的标签是1，没看过的电影对应的标签是0，对non-item实体没有标签。

下一步是预测某个点的label，有一类算法叫标签传播算法 ( label propagation algorithm, LPA )，这个算法是优化下面这个函数。

遍历所有的边，A_u是边的权值。如果i,j节点有边，说明这2个节点联系比较强，那这2个节点的label会比较相近。这2个节点的边权值越大，那这2个节点的label就越一致。这是算法LPA的一个假设，标签过度是平滑的。

预测一个无标签的节点，将其周围节点的label加权平均，重复该操作直到收敛，这就是label propagation。

利用label propagation做正则项，对于一个节点v，其真实lable是y_uv( 图中为0 )。

利用LPA算法预测这个v的label，得到预测值y__uv，算出预测值和真实值之间的损失J。

在做label propagation时，标签传播是取决于边权值，所以最终预测值是关于边权值的函数，损失J也是一个关于边权值的函数。损失函数R(A)是一个关于A的函数，所以可以把梯度往这个损失函数中传播，起到一个正则项的作用。

如上图，回顾一下整个模型，把原始异构KG转成weighted graph，学习边的权值，得到一个邻接矩阵，用GNN得到entity embedding，用这个entity embedding 和user embedding来做这个预测，得到预测值ŷ_uv，用ŷ和真实值y得到一个loss，反向传播，将误差梯度向前传播，更新A_u和参数W。

下面部分是正则项，邻接矩阵为参数，做一个label propagation，得到预测值y__uv，用y_和y得到一个loss，反向传播，更新A_u。

总结一下，本文主要介绍了3个部分的内容，第1部分介绍了知识图谱是推荐系统的一种新的辅助信息。另外2个部分介绍了两类知识图谱推荐方法，一类是基于embedding的知识图谱推荐方法，包括DKN和MKR，一类是混合型知识图谱推荐方法，包括RippleNet、KGCN和KGNN-LS。

阅读过本文的人还看了以下文章：

【全套视频课】最全的目标检测算法系列讲解，通俗易懂！

《美团机器学习实践》_美团算法团队.pdf

《深度学习入门：基于Python的理论与实现》高清中文PDF+源码

python就业班学习视频，从入门到实战项目

2019最新《PyTorch自然语言处理》英、中文版PDF+源码

《21个项目玩转深度学习：基于TensorFlow的实践详解》完整版PDF+附书代码

《深度学习之pytorch》pdf+附书源码

PyTorch深度学习快速实战入门《pytorch-handbook》

【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》

《Python数据分析与挖掘实战》PDF+完整源码

汽车行业完整知识图谱项目实战视频(全23课)

李沐大神开源《动手学深度学习》，加州伯克利深度学习（2019春）教材

笔记、代码清晰易懂！李航《统计学习方法》最新资源全套！

《神经网络与深度学习》最新2018版中英PDF+源码

将机器学习模型部署为REST API

FashionAI服装属性标签图像识别Top1-5方案分享

重要开源！CNN-RNN-CTC 实现手写汉字识别

yolo3 检测出图像中的不规则汉字

同样是机器学习算法工程师，你的面试为什么过不了？

前海征信大数据算法：风险概率预测

【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目，让你掌握深度学习图像分类

VGG16迁移学习，实现医学图像识别分类工程项目

特征工程(一)

特征工程(二) :文本数据的展开、过滤和分块

特征工程(三):特征缩放,从词袋到 TF-IDF

特征工程(四): 类别特征

特征工程(五): PCA 降维

特征工程(六): 非线性特征提取和模型堆叠

特征工程(七)：图像特征提取和深度学习

如何利用全新的决策树集成级联结构gcForest做特征工程并打分？

Machine Learning Yearning 中文翻译稿

蚂蚁金服2018秋招-算法工程师（共四面）通过

全球AI挑战-场景分类的比赛源码(多模型融合)

斯坦福CS230官方指南：CNN、RNN及使用技巧速查（打印收藏）

python+flask搭建CNN在线识别手写中文网站

中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程

不断更新资源

深度学习、机器学习、数据分析、python

搜索公众号添加： datayx

长按图片，识别二维码，点关注

你可能感兴趣的:(知识图谱辅助的个性化推荐系统)

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说造命者说
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说我叫吴起，生于公元前440年的战国初期，正是群雄并起、天下纷争不断的时候。后人说我是军事家、政治家、改革家，是兵家代表人物。评价我一生历仕鲁、魏、楚三国，通晓兵家、法家、儒家三家思想，在内政军事上都有极高的成就。周安王二十一年（公元前381年），因变法得罪守旧贵族，被人乱箭射死。我出生在卫国一个“家累万金”的富有家庭，从年轻时候起就不甘平凡
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
想家爆米花机
也许不同于大家对家乡的思念，我对家乡甚至是疯狂的不舍。还未踏出车站就感觉到幸福，我享受这里的夕阳、这里的浓烈柴火味、这里每一口家常菜。我是宅女，我贪恋家的安逸。刚刚踏出大学校门，初出茅庐，无法适应每年只能国庆和春节回家。我焦虑、失眠、无端发脾气，是无法适应工作的节奏，是无法接受我将一步步离开家乡的事实。我不想承认自己胸无大志，选择再次踏上征程。图片发自App
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
谢谢你们，爱你们！鹿游儿
昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
小丽成长记（四十三）玲玲54321
小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
瑶池防线谜影梦蝶
冥华虽然逃过了影梦的军队，但他是一个忠臣，他选择上报战况。败给影梦后成逃兵，高层亡尔还活着，七重天失守......随便一条，即可处死冥华。冥华自然是知道以仙界高层的习性此信一发自己必死无疑，但他还选择上报实情，因为责任。同样此信送到仙宫后，知道此事的人，大多数人都认定冥华要完了，所以上到仙界高层，下到扫大街的，包括冥华自己，全都准备好迎接冥华之死。如果仙界现在还属于两方之争的话，冥华必死无疑。然而
爬山后遗症璃绛
爬山，攀登，一步一步走向制高点，是一种挑战。成功抵达是一种无法言语的快乐，在山顶吹吹风，看看风景，这是从未有过的体验。然而，爬山一时爽，下山腿打颤，颠簸的路，一路向下走，腿部力量不够，走起来抖到不行，停不下来了！第二天必定腿疼，浑身酸痛，坐立难安！
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h