wangxinRS

《推荐系统笔记（十七）》userCF和itemCF —— 基于领域的推荐

面对用户-物品评分矩阵，我们有一种推荐思路，叫做基于领域的推荐。

什么是itemCF和userCF？可以这样理解，

我喜欢这个商品，那么和这个商品非常类似的其他商品，可能也是我喜欢的，这个是itemCF的思路，推荐和用户喜欢的商品类似的其他商品
我喜欢这个商品，别人也喜欢这个商品，那么我们可能兴趣很相似，那么那人喜欢的其他商品，可能也是我喜欢的，这个是userCF的思路，推荐和用户相似的其他用户喜欢的商品

那么，什么是领域？

对于itemCF而言，领域就是和该商品类似的其他商品，这种度量是商品相似度
对于userCF而言，领域就是和该用户类似的其他用户，这种度量是用户相似度

基于用户-物品评分矩阵 $R_{m\times n}$ ，相似度 $s i m i l a r i t y$ 如何定义？

这在userCF和itemCF里面定义形式相似但有不同，我们分别来说。

相似度

1. userCF里的相似度

有两种常用的以及一个改进的。我们假设 $N (u)$ 为用户 $u$ 评分过的物品集合。

1.1 Jaccard相似度

用户 $u$ 和 $v$ 的Jaccard相似度为
$w_{uv}=\frac{|N(u)\cap N(v)|}{|N(u)\cup N(v)|}$

这里的意思是，两个用户购买的物品越重合，说明两个用户越相似。

1.2 Cosine相似度

用户 $u$ 和用户 $v$ 的余弦相似度为
$w_{uv}=\frac{|N(u)\cap N(v)|}{\sqrt{|N(u)||N(v)|}}$

当然，也可以直接用评分数据来做，如下
$w_{uv}=\frac{\sum_{i\in N(u)\cap N(v)}r_{ui}r_{vi}}{\sqrt{\sum_{i\in N(u)}r_{ui}^2\cdot\sum_{i\in N(v)}r_{vi}^2}}$

其实就是把评分矩阵的第 $u$ 行的向量提出来，把第 $v$ 行的向量提出来，求两个向量的夹角的余弦值。

1.3 改进的相似度

对于热门商品，大家都会买，所以并不能体现两个用户有多相似，由于 $N(u)\cap N(v)$ 中可能有一大部分为热门商品，我们期望能降低热门商品的影响，可以重写为
$N(u)\cap N(v)\rightarrow \sum_{i\in N(u)\cap N(v)}\frac{1}{log(1+N(i))}$

其中， $N (i)$ 为购买过物品 $i$ 的用户人数。显然，热门商品的购买人数会很大，所以 $\frac{1}{log(1+N(i))}$ 就会小，形成对热门商品的一个惩罚。

改进后的相似度为
$w_{uv}=\frac{\sum_{i\in N(u)\cap N(v)}\frac{1}{log(1+N(i))}}{\sqrt{|N(u)||N(v)|}}$

1.4 MSD

均方差误差也可以作为相似度，只不过此时值越小，越相似
$w_{uv}=\frac{\sum_{i\in N(u)\cap N(v)}(r_{ui}-r_{vi})^2}{|N(u)\cap N(v)|}$

1.5 Pearson相似度

我们定义 $\mu_u$ 为用户 $u$ 的平均打分。

$w_{uv}=\frac{\sum_{i\in N(u)\cap N(v)}(r_{ui}-\mu_u)(r_{vi}-\mu_v)}{\sqrt{\sum_{i\in N(u)}(r_{ui}-\mu_u)^2\cdot \sum_{i\in N(v)}(r_{vi}-\mu_v)^2}}$

从表达式可以看出来，pearson相似度其实是中心化之后的consine相似度。

2. itemCF里的相似度

定义 $N (i)$ 为购买过物品 $i$ 的用户集合。类似的，我们有两个物品之间的Jaccard相似度和余弦相似度。

2.1 Jaccard相似度

物品 $i$ 和物品 $j$ 之间的Jaccard相似度为
$w_{ij}=\frac{|N(i)\cap N(j)|}{|N(i)\cup N(j)|}$

意思为，购买两个物品的人里面，同时购买两个物品的比例越高，越能说明两个物品相似。

2.2 余弦相似度

物品 $i$ 和物品 $j$ 之间的余弦相似度为
$w_{ij}=\frac{|N(i)\cap N(j)|}{\sqrt{|N(i)||N(j)|}}$

当然，也能利用用户评分数据，如下
$w_{ij}=\frac{\sum_{u\in N(i)\cap N(j)}r_{ui}\cdot r_{uj}}{\sqrt{\sum_{u\in N(i)}r_{ui}^2\cdot\sum_{u\in N(j)}r_{uj}^2}}$

有了相似度定义，我们就可以进一步定义用户 $u$ 对物品 $i$ 的打分 $p (u, i)$ 。

2.3 MSD

均方差误差也可以作为相似度，只不过此时值越小，越相似
$w_{ij}=\frac{\sum_{u\in N(i)\cap N(j)}(r_{ui}-r_{uj})^2}{|N(i)\cap N(j)|}$

2.4 Pearson相似度

我们定义 $\mu_i$ 为物品 $i$ 的平均得分。

$w_{ij}=\frac{\sum_{u\in N(i)\cap N(j)}(r_{ui}-\mu_i)(r_{uj}-\mu_j)}{\sqrt{\sum_{u\in N(i)}(r_{ui}-\mu_i)^2\cdot \sum_{u\in N(j)}(r_{uj}-\mu_j)^2}}$

打分函数 $p (u, i)$

由于userCF和itemCF的打分函数并不一样，所以我们依然分开来说。

1. userCF

这里，用户 $u$ 对物品 $i$ 评分，需要

根据用户相似度，找出用户 $u$ 最相似的其他 $k$ 个用户，我们将这些用户集合记为 $S (u, k)$
从集合 $S (u, k)$ 中，找出购买过物品 $i$ 的用户 $v$ ，也就是 $v\in S(u, k)\cap N(i)$
计算如下打分函数 $i)=\frac{\sum_{v\in S(u, k)\cap N(i)} w_{uv}\cdot r_{ui}}{\sum_{v\in S(u, k)\cap N(i)} w_{uv}}$

2. itemCF

这里，用户 $u$ 对物品 $i$ 评分，需要

根据物品相似度，计算物品 $i$ 最相似的 $k$ 个物品，将这些物品的集合记为 $S (i, k)$
在物品集合 $S (i, k)$ 中，找到用户 $u$ 也使用过的物品 $j$ ，这里， $j\in S(i, k)\cap N(u)$
计算如下打分函数 $i)=\frac{\sum_{j\in S(i, k)\cap N(u)}w_{ij}\cdot r_{uj}}{\sum_{j\in S(i, k)\cap N(u)}w_{ij}}$

有了用户 $u$ 对物品 $i$ 的评分，我们就可以根据评分，生成对用户 $u$ 的推荐。

简单实战

下面，我们利用surprise库，对数据集movielens进行电影推荐。

movielens数据集已经上传，可以免费下载。

# 第三方库
import pandas as pd
import numpy as np
from surprise import Dataset, Reader
from surprise import KNNBasic

# 载入数据
data = pd.read_csv(r'D:\myfile\开课吧\推荐系统\第八节\movielens\ratings.csv')
data.head()

# 将timestamp列去掉
data.drop('timestamp', axis=1, inplace=True)
data.head()

# 将数据载入surprise

# 定义阅读器
reader = Reader(line_format='user item rating')
# 载入数据
raw_data = Dataset.load_from_df(data, reader=reader)
# 将数据转化为可操作数据
my_data = raw_data.build_full_trainset()

# userCF
# 领域内有40个用户
# 相似度为余弦相似度
algo = KNNBasic(k=40, sim_options={'user_based': True, 'name': 'cosine'})
algo.fit(my_data)

# userCF
# items，记录所有产品
items = data['movieId'].unique().tolist()

# 字典user_items，记录用户购买过的产品
user_items = {}
for user, group in data.groupby('userId'):
    user_items[user] = set(group['movieId'].tolist())
    
# 给用户u推荐
def topN(u, N=4):
    scores = {}
    
    for i in items:
        if i not in user_items[u]:
            scores[i] = algo.predict(u, i).est
    
    return sorted(scores.items(), key=lambda x: x[1], reverse=True)[: N]

# userCF 
# 测试
topN(1)

# userCF
# 测试结果
[(60482, 5), (107230, 5), (31123, 5), (134, 5)]

# itemCF
# 训练模型
algo = KNNBasic(k=40, sim_options={'user_based': False, 'name': 'cosine'})
algo.fit(my_data)

# itemCF
# items，记录所有产品
items = data['movieId'].unique().tolist()

# 字典user_items，记录用户购买过的产品
user_items = {}
for user, group in data.groupby('userId'):
    user_items[user] = set(group['movieId'].tolist())
    
# 给用户u推荐
def topN(u, N=4):
    scores = {}
    
    for i in items:
        if i not in user_items[u]:
            scores[i] = algo.predict(u, i).est
    
    return sorted(scores.items(), key=lambda x: x[1], reverse=True)[: N]

# itemCF
# 测试
topN(1)

# itemCF
# 测试结果
[(93320, 5), (26368, 5), (26520, 5), (26928, 5)]

你可能感兴趣的:(usrcf,itemcf)

打卡2-协同过滤 sunflowers11 推荐系统
基本介绍现有的协同过滤主要有以下两种：基于用户的协同过滤算法（UserCF）：给用户推荐和该用户相似的其他用户喜欢的物品基于物品的协同过滤算法（ItemCF）：给用户推荐和他之前喜欢的物品相似的物品这两个算法可以使用两张图来表示，下图左是UserCF，图右是ItemCF。UserCF算法流程1.计算用户的相似度，获取与该用户最相似的用户集2.将用户集中用户喜欢的，并且目标用户没有见过的物品推荐给目
机器学习面试问题8 wangyufeng99 机器学习机器学习
userCF和itemCF在实际当中如何使用，提供具体操作，以及它们的优势（推荐系统）基于用户的协同过滤算法UserCF基于用户的协同过滤，通过不同用户对物品的评分来评测用户之间的相似性，基于用户间的相似性做出推荐。简单来讲就是：给用户推荐和他兴趣相似的其他用户喜欢的物品。基于UserCF的基本思想相当简单，基于用户对物品的偏好找到相邻邻居用户，然后将邻居用户喜欢的推荐给当前用户。计算上，就是将一
开发混合推荐系统 BoltBear 大数据推荐算法算法机器学习
某电商网站首页有猜你喜欢推荐位，该推荐位一次能展示6个商品，推荐内容可以更换四次，共需推荐24个商品。需要使用协同过滤算法（userCF&ItemCF）及基于物品内容的算法进行混合推荐。一次性展示的6个商品中，从左到右的顺序分别是：第一位：基于物品的实时推荐结果第二位：基于用户的离线推荐结果第三位：基于物品的离线推荐结果第四位：基于内容的实时推荐结果第五位：基于物品的实时推荐结果第六位：基于用户的
ItemCF召回竹竹竹～论文阅读人工智能算法
基本思想：该算法向用户推荐与他们之前喜欢的物品相似的其它物品。内容：itemCF算法通过计算用户的历史行为记录，来分析物品之间的相似度：如果喜欢物品a的用户大多数也喜欢物品b，那么认为物品A与物品B具有一定的相似度。相似度计算公式：参数影响：参数K是ItemCF算法的重要参数，它对推荐算法的各种指标都会产生一些列的影响：精度（准确率和召回率）：准确率和召回率与参数k并不呈正相关或者负相关，但是选择
基于物品的协同过滤算法（ItemCF）-- 原理与实战铁甲大宝推荐系统推荐系统
1、ItemCF算法原理：ItemCF算法并不利用物品的内容属性计算物品之间的相似度，它主要通过分析用户的行为记录计算物品之间的相似度。该算法认为一个人的兴趣都局限在几个方面，当很多人都对两个物品感兴趣时，就认为这两个物品具有较大的相似度，即物品A,B具有很大的相似度是因为喜欢物品A的用户大都也喜欢物品B。2、ItemCF算法步骤：计算物品之间的相似度根据物品的相似度和用户的历史行为给用户生成推荐
推荐算法实战项目：物品协同过滤算法(ItemCF)原理以及案例实战(附完整 Python 代码) 机器学习社区搜广推算法实战算法 python 推荐算法
协同过滤（collaborativefiltering）是一种在推荐系统中广泛使用的技术。该技术通过分析用户或者事物之间的相似性，来预测用户可能感兴趣的内容并将此内容推荐给用户。这里的相似性可以是人口特征的相似性，也可以是历史浏览内容的相似性，还可以是个人通过一定机制给与某个事物的回应。比如，A和B是无话不谈的好朋友，并且都喜欢看电影，那么协同过滤会认为A和B的相似度很高，会将A喜欢但是B没有关注
一文看懂推荐系统：召回01：基于物品的协同过滤（ItemCF），item-based Collaboration Filter的核心思想与推荐过程冰露可乐个性化推荐系统大厂人工智能技术概览知识图谱推荐系统协同过滤基于物品的协同过滤 itemCF
一文看懂推荐系统：召回01：基于物品的协同过滤（ItemCF），item-basedCollaborationFilter的核心思想与推荐过程提示：最近系统性地学习推荐系统的课程。我们以小红书的场景为例，讲工业界的推荐系统。我只讲工业界实际有用的技术。说实话，工业界的技术远远领先学术界，在公开渠道看到的书、论文跟工业界的实践有很大的gap，看书学不到推荐系统的关键技术。看书学不到推荐系统的关键技术
推荐系统笔记--Swing模型的原理晓晓纳兰容若推荐系统笔记推荐系统
1--Swing模型的引入在ItemCF召回中，物品的相似度是基于其受众的交集来衡量的，但当受众的交集局限在一个小圈子时，就会误将两个不相似的物品定义为相似；Swing模型引入用户的重合度来判断两个用户是否属于一个小圈子；overlap(u1,u2)用来衡量用户U1和U2的重叠度，重叠度大代表两个人可能来自同一个小圈子，那么他们对相似度的贡献会比较小。重叠度小，说明他们可能不属于同一个小圈子，则他
基于物品的协同过滤ItemCF qq_54432917 推荐系统推荐算法深度学习数据结构
上一篇笔记讲到了推荐系统的链路，其中讲到了召回，那么这篇文章就来讲讲召回中会用到的算法，今天介绍基于物品的协同过滤（ItemBasedCollaborativeFiltering，缩写ItemCF）。这篇文章的三个要点：1.如何计算两个物品之间的相似度。2.如何预估用户对候选物品的兴趣。3.如何利用索引在线上快速做召回。ItemCF的原理：我喜欢看CBA，CBA与NBA相似，我又没看过NBA，推荐
推荐算法---协同过滤2021-4-13 小威程序员推荐系统人工智能推荐系统协同过滤
协同过滤前言一、什么是协同过滤？（CollaborativeFiltering）二、协同过滤涉及的相关性强弱的计算（相似度）1.皮尔逊相关系数2.余弦相似度3.评分预测公式三、具体分类1.基于用户的协同过滤（UserCF）1.1实例解说UserCF1.11例子1.12代码实现2，基于物品的协同过滤（ItemCF）2.1相似度计算的套路公式2.11直接上例子2.2求用户对某件商品的兴趣2.21矩阵乘
算法篇--协同过滤小强签名设计大数据面试推荐系统协同过滤
文章目录一、长尾理论二、协同过滤介绍三、相似度度量方法1.杰卡德(Jaccard)相似系数2.余弦相似度3.皮尔逊相关系数四、基于用户的协同过滤算法（User-basedCF，简称UserCF）五、基于物品的协同过滤算法（Item-basedCF，简称ItemCF）第一步：计算物品之间的相似度；第二步：根据物品的相似度和用户的历史行为给用户生成推荐列表；六、算法评估1.召回率2.准确率3.覆盖率4
Python推荐系统学习笔记（3）基于协同过滤的个性化推荐算法实战---ItemCF算法（下） ZYH@Smart3S Python Python ItemCF 协同过滤个性化推荐推荐系统
本文在Python推荐系统学习笔记（2）基于协同过滤的个性化推荐算法实战---ItemCF算法一文的基础上，对其基本的ItemCF算法做出改进。一、相关概念1、ItemCF中，基于行为（喜好）的相似性度量公式原始形式：si,j代表物品i和j的相似度；u(i)和u(j)代表含有物品i或者物品j行为的用户集合；分子表示既行为过i又行为过物品j的用户个数的绝对值；分母代表行为过物品i以及行为过物品j的用
推荐系统笔记--基于物品的协同过滤（Item CF）晓晓纳兰容若推荐系统笔记推荐系统
1--基本原理ItemCF的原理是根据物品的相似度来将新的物品推荐给用户；下图中用户对红色物品的感兴趣度为[2,1,4,3]，红色物品与橙色物品的相似度为[0.1,0.4,0.2,0.6]，因此可以计算出用户对橙色物品的感兴趣度。ItemCF的基本思想是：如果用户A喜欢物品item1，而且物品item1和物品item2很相似，那么用户很可能也喜欢item2，因此可以将item2推荐给用户A；2--
python个性化推荐系统结果保存,Python推荐系统学习笔记（6）基于协同过滤的个性化推荐算法实战---Surprise库实现ItemCF... 曲继风 python个性化推荐系统结果保存
一、Surprise库简介Surprise是一个用于简单快速构建推荐系统的Python库，其底层基于PythonScikit构建。官方文档地址：https://surprise.readthedocs.io/en/stable安装方式：(1)通过pip安装，需具有MicrosoftC++BuildTools环境。(2)通过conda安装，使用miniconda或者anaconda。Surprise
快速了解推荐引擎检索技术张彦峰ZYF 系统架构等思考推荐算法系统架构
目录一、推荐引擎和其检索技术二、推荐引擎的整体架构和工作过程（一）用户画像（二）文章画像（三）推荐算法召回三、基于内容的召回（一）召回算法（二）优缺点分析基于内容的召回的优点基于内容的召回的缺点（三）案例：新闻推荐系统四、基于协同过滤的召回（一）基于用户的协同过滤（UserCF）原理展开案例：电影推荐系统（二）基于物品的协同过滤（ItemCF）原理展开案例：音乐推荐系统（三）Model-based
ALS算法原理闲云野鹤~~~ java
ALS算法是2008年以来，用的比较多的协同过滤算法。它已经集成到Spark的Mllib库中，使用起来比较方便。从协同过滤的分类来说，ALS算法属于User-ItemCF，也叫做混合CF。它同时考虑了User和Item两个方面。用户和商品的关系，可以抽象为如下的三元组：。其中，Rating是用户对商品的评分，表征用户对该商品的喜好程度。ALS算法是基于模型的推荐算法。起基本思想是对稀疏矩阵进行模型
推荐系统-基于物品协同过滤算法代码实现 Moutai码农大数据推荐系统算法推荐算法大数据 spark
1、简介当前Spark没有像mahout那样，严格区分基于物品的协同过滤推荐（ItemCF）和基于用户的协同过滤推荐（UserCF），只有基于模型的协同过滤推荐算法ALS（model-basedCF）。但ALS算法对于一些特定的问题(用户数量较小的场景，以及物品数量明显小于用户数量的场景)，效果并不理想，不像mahout提供了各种推荐算法选择。为了充分利用spark在速度上带来的提升同时为满足一些
大数据应用概览（林子雨慕课课程）几窗花鸢大数据应用 hadoop 大数据
文章目录14大数据应用概览14.1大数据应用概览14.2大数据在互联网的应用—推荐系统14.2.1推荐系统概述14.2.2基于用户的协同过滤算法（UserCF）14.2.3基于物品的协同过滤（ItemCF）14.2.4UserCF算法和ItemCF算法的对比14.3基于大数据的综合健康服务平台14大数据应用概览14.1大数据应用概览大数据的主要应用领域互联网：推荐系统生物医学领域：流行病预测、智慧
协同过滤推荐算法UserCF、ItemCF 蓝净云学习笔记推荐算法算法机器学习
目录相似度计算基于用户的协同过滤（UserCF）算法评估基于物品的协同过滤（ItemCF）协同过滤算法的权重改进协同过滤算法的问题分析思考学习参考相似度计算杰卡德（Jaccard）相似系数Jaccard系数是衡量两个集合的相似度一种指标，计算公式如下：simuv=∣N(u)∩N(v)∣∣N(u)∣∪∣N(v)∣sim_{uv}=\frac{|N(u)\capN(v)|}{|N(u)|\cup|N(
基于springboot+vue+爬虫实现电影推荐系统编程千纸鹤 Java项目实战专栏信息管理类 spring boot vue.js 爬虫 java
项目编号：BS-XX-136一，项目简介这是一个前后端分离的电影管理和推荐系统，采用Vue.js+SpringBoot技术栈开发，电影数据来源于豆瓣，采用Python爬虫进行爬取相关电影的数据，将数据插入MYSQL数据库，然后在前端进行数据展示。后台主要进行电影相关基本数据的管理功能。给用户推荐的电影数据写入到REDIS数据库中进行存储。推荐算法采用协同过滤算法，采用于ItemCF和UserC
推荐系统之隐语义模型(LFM) visiontry
一基本概念LFM(latentfactormodel)隐语义模型，这也是在推荐系统中应用相当普遍的一种模型。那这种模型跟ItemCF或UserCF有什么不同呢？这里可以做一个对比：对于UserCF，我们可以先计算和目标用户兴趣相似的用户，之后再根据计算出来的用户喜欢的物品给目标用户推荐物品。而ItemCF，我们可以根据目标用户喜欢的物品，寻找和这些物品相似的物品，再推荐给用户。我们还有一种方法，先
基于Item的协同过滤算法实践（最简单的在线电影推荐系统）征途开始机器学习推荐系统协同过滤 ItemCF
上一篇文章《基于用户的协同过滤算法实践》中，基于用户的相似度生成推荐列表，本文将基于Item的相似度阐述。1相似度基于物品的协同过滤算法（简称ItemCF）给用户推荐那些和他们之前喜欢的物品相似的物品。不过ItemCF不是利用物品的内容计算物品之间相似度，而是利用用户的行为记录。该算法认为，物品A和物品B具有很大的相似度是因为喜欢物品A的用户大都也喜欢物品B。这里蕴含一个假设，就是每个用户的兴趣都
[pyspark]itemcf协同过滤推荐算法------应用华为比赛数据实现（包含转化为稀疏向量，lsh模型，杰卡德距离） nnodurian- pyspark spark
学完以后，第一感受，确实会比python代码来得简洁先上代码第一步，用pysql处理原始数据，包含计算冷却得分（不是今天的重点，暂不会在后面细说了）importfindsparkfindspark.init()importpathlibimportsysimportjsonfrompysparkimportSparkContextfrompysparkimportSparkConffrompysp
《Neural Attentive Item Similarity Model》论文阅读笔记白兔记
转载自石晓文大佬的这篇文章：https://www.jianshu.com/p/c0384b213320基于物品的协同过滤ItemCF是推荐领域常用的方法，其关键是评估item之间的相似性。本文将要介绍NeuralAttentiveItemSimilarityModel(简称NASI)来解决ItemCF问题。该模型将注意力机制和神经网络相结合，提升了模型的预测准确性。接下来，我们将从基本的Item
2020-02-27-ModelCode inspiredhss
召回策略：热度，LBS，usertag，itemcf，频繁模式挖掘，二部图挖掘，embedding（word2vec、fasttext、bert），deepmatch排序策略，learningtorank流程三大模式（pointwise、pairwise、listwise），常见的特征挖掘（user、item、context，以及相互交叉），ctr预估（lr、gbdt、fm、ffm、dnn、wid
2018-10-15——时间上下文推荐算法 Ariel_wyy
1.最近最热门给定时间T，物品i最近的流行度ni(T)可以定义为：这里，α是时间衰减函数。下面的python代码实现了上面的计算公式：2.时间上下文相关的ItemCF算法首先回顾一下前面提到的基于物品的协同过滤算法，它通过如下公式计算物品的相似度：而在给用户u做推荐时，用户u对物品i的兴趣p(u,i)通过如下公式计算：在得到时间信息（用户对物品产生行为的时间）后，我们可以通过如下公式改进相似度计算
基于pyspark的als推荐电影 xhaoDream Python als 推荐 pyspark
ALS推荐算法：ALS算法是基于模型的推荐算法基本思想对稀疏矩阵进行模型分解，评估出缺失项的值，以此来得到一个基本的训练模型。然后依照此模型可以针对新的用户和物品数据进行评估。ALS是采用交替的最小二乘法来算出缺失项的，交替的最小二乘法是在最小二乘法的基础上发展而来的。从协同过滤的分类来说，ALS算法属于User-ItemCF，也叫做混合CF，它同时考虑了User和Item两个方面。矩阵分解模型的
新闻推荐-多路召回 58506fd3fbed
1.基于关联规则的itemcf2.基于关联规则的usercf3.youtubednn召回4.冷启动召回多路召回合并多路召回合并就是将前面所有的召回策略得到的用户文章列表合并起来，下面是对前面所有召回结果的汇总1.基于itemcf计算的item之间的相似度sim进行的召回2.基于embedding搜索得到的item之间的相似度进行的召回3.YoutubeDNN召回4.YoutubeDNN得到的use
计算机毕业设计Python+Vue.js+Flask+Scrapy电影大数据分析电影推荐系统电影爬虫可视化电影数据分析大数据毕业设计计算机毕业设计大神
开发技术协同过滤算法、机器学习、vue.js、echarts、Flask、Python、MySQL创新点协同过滤推荐算法、爬虫、数据可视化补充说明两种Python协同过滤推荐算法集成(ItemCF推荐算法和UserCF推荐算法)2.专业美工整体设计的细腻的酷黑主题，前后端分离一体化系统（爬虫→MySQL→Flask→Vue）；实现影片库搜索，多种Echarts图形分析、jieba分析；完全移动端自
推荐系统-ALS协同过滤算法实现茅台码哥 spark 大数据推荐算法
从协同过滤的分类来说，ALS（AlternatingLeastSquares，交替最小二乘）算法属于User-ItemCF，也叫做混合CF，它同时考虑了User和Item两个方面，通过数量相对少的未被观察到的隐藏因子，来解释大量用户和物品之间潜在联系。ALS基于矩阵分解通过降维的方法来补全用户-物品矩阵，对矩阵中没有出现的值进行估计。用户和物品的关系，可以抽象为如下的三元组：。其中，Rating是
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他