疯狂哈丘

初探推荐系统-01

文章目录

一、什么是推荐系统
- 是什么
- 为什么
- - 长尾理论
- 怎么做
二、相似度算法
- 杰卡德相似系数
- 余弦相似度
三、基于内容的推荐算法
- 如何获取到用户喜欢的物品
- 如何确定物品的特征
四、推荐算法实验方法评测指标
- 推荐效果实验方法
- - 1、离线实验
  - 2、用户调查
  - 3、在线实验
- 评测指标
- - 1、预测准确度
  - - 评分预测
    - TopN预测
    - 关于评分预测问题和TopN预测的讨论
  - 2、用户满意度
  - 3、覆盖率
  - 4、多样性
  - 5、新颖度
  - 6、惊喜度
  - 7、信任度
  - 8、实时性
  - 9、健壮性
  - 总结

一、什么是推荐系统

是什么

推荐系统，顾名思义，就是向用户推荐物品或信息的系统。

推荐系统在我们的生活中随处可见：

在内容推送平台，比如抖音、头条、快手，推荐系统会根据你的兴趣向你推荐合适的内容
在电商平台，比如淘宝、京东，推荐系统会根据你的喜欢将一些物品优先放在首页
在社交平台，比如微博、facebook，推荐系统会向推荐你可能感兴趣的人
广告服务可以根据用户的兴趣针对性的投放广告
…

为什么

我们为什么需要推荐系统？

对于用户而言（信息消费者），面对网上海量的信息，要从中找出我们感兴趣的信息，是一件非常难的事情。比如某一天我们闲来无事，想看一部电影解解闷，可是市面上的电影实在太多了，一时也不知道该看哪部电影。这时，推荐系统就可以为你选择一部你最可能感兴趣的电影。治好了你的选择困难症。

对平台而已（信息生成者），如何让自己生产的信息被广大用户关注到也是一个非常困难的事。而推荐系统就可以将这些信息针对性的推送给需要的人。拿电商平台举例，如果将用户感兴趣的物品放在用户浏览的首页，那么该物品被对应用户消费的概率将极大的提升，从而提高电商平台的销量。对于内容平台来说，好的推荐系统可以更好的留住用户，提高平台的用户留存率。

另外，推荐系统可以更好的发掘物品的长尾。

长尾理论

在了解长尾理论，先来看一个非常著名的定律：82定律。82定律相信在座的大家应该都有所耳闻。

82原则也叫二八定律，正规叫法是巴莱多定律。巴莱多定律是1897年意大利经济学家巴莱多提出的。他认为，在任何一组东西中，最重要的只占其中一小部分，约20％，其余80％的尽管是多数，却是次要的，因此又称二八法则。

82定律在我们的生活中普遍适用：80%的销售额都来自于20%的热门商品，20%的人占据了社会财富的80%，80%的业务收入是由20%的客户创造的，20%的强势品牌，占有80%的市场份额。

然而，这个定律在互联网时代受到了挑战。美国《连线》杂志主编克里斯·安德森在2004年发表了"The Long Tail"一文并于2006年出版了《长尾理论》一书。该书指出，传统的82原则在互联网的加入下会受到挑战。

在互联网的条件下，由于货架成本低端低廉，电子商务网站往往能出售比传统零食店更多的商品。虽然这些商品绝大数都不热门，但是数量却极其庞大，总体销售额并不会输给那些热门商品。

这里我们将那些不热门的商品统称为长尾商品，热门的成为头部商品。

在传统的82定律中，头部商品的销售额可能是80%，长尾商品的销售额可能仅20%

在长尾理论中，得利于互联网低廉的货架成本，长尾商品的销售额能得到50%甚至更多。

一般而言，头部商品代表了绝大数用户的需求，而长尾商品往往代表了一小部分用户的个性化需求。因此，如果想通过发掘长尾提高销售额，就必须充分研究用户的兴趣，这正是个性化推荐系统主要解决的问题。

举个例子，某个用户喜欢玩游戏，尤其偏好动作类游戏，但是如今市面上的游戏实在太多了，用户不可能全部都了解。但有了推荐系统后，游戏平台就可以根据该用户的爱好，给他推送一些他没玩过的冷门但口碑不错的动作游戏。这类冷门的动作游戏就属于长尾商品，如果没有推荐系统主动推荐，大部分用户都不会找到并购买这些游戏。

因此，推荐系统可以很好的发掘那些长尾物品的销量。

怎么做

抛开推荐系统，我们先想象一下在生活中面对很多选择时做决定的过程。我们以看电影为例，假设我们一时不知道要看什么电影，那么我们可能采用如下方式来决定最终要看什么电影：

想朋友咨询。我们可能会打开聊天工具，找几个经常看电影的朋友，问他们有没有什么好看的电影可以推荐。或者打开微博，发一句"我想看电影，求推荐"，然后等待热心人推荐电影。
我们一般都有喜欢的演员和导演。这时我们可以打开搜索引擎，输入自己喜欢的演员名，然后看看结果中还有什么电影是自己没看过的。这种方式是寻找和自己之前看过的电影在内容上相似的电影。推荐系统可以将上诉过程自动化，通过分析用户曾经看过的电影找到用户喜欢的演员和导演，然后给用户推荐这些演员或导演的其他电影。这种推荐方式在推进系统中称为基于内容的推荐。
我们可以查看排行榜，比如豆瓣电影排行榜，看看别人都在看什么电影，别人都喜欢什么电影，然后找一部广受好评的电影观看。这种方式可以进一步扩展：如果能找到和自己历史兴趣相似的一群用户，看看他们最近都在看什么电影，那么就能结果会比宽泛的排行榜更能符合自己的兴趣。这种方式称为基于协同过滤的推荐。

从上面的方法可以看出，推荐算法的本质是通过一定的方式将用户和物品联系起来，不同的推荐系统使用了不同的方式。上面的例子让我们了解了两种实现推荐系统的方式：

基于内容的推荐：找到用户感兴趣的类型，推荐给他和该类型相似的物品
基于协同过滤的推荐：找到和用户兴趣相似的用户，从这些相似用户中找出用户之前没接触过的物品推荐给用户

如果仔细琢磨，会发现这两个方式有个共同点，那就是寻找相似。是的，基于内容的推荐需要寻找相似的物品，基于协同过滤的推荐需要寻找兴趣相似的用户。那么，如果定义物品之间的相似度以及用户之间的相似度，是一个很重要的命题。

二、相似度算法

要判断物品、用户之间的相似度，需要一定的算法。目前常见的相似度算法有：

杰卡德相似系数
余弦相似度
通过距离计算相似度（比如欧式距离、曼哈顿距离）
皮尔逊相关系数

下面我们分别使用杰卡德相似系数和余弦相似度为大家介绍一下如何计算物品或用户之间的相似度。

杰卡德相似系数

假设现在有4个用户，他们的购买行为如下：

用户标识	购买物品列表
u1	a、b、d、e
u2	a、c
u3	b、c、d
u4	a、c、d、e

我们来看一下如何利用杰卡德相似系数来计算这些用户之间的相似度。首先杰卡德系数的计算公式如下：
$B)=\frac{|A \cap B|}{|A \cup B|}=\frac{|A \cap B|}{|A|+|B|-|A \cap B|}=\frac{A和B的交集}{A union B}$
J(A,B) 表示用户A和用户B之间的相似度。

公式很简单，我们先来看一下分子，A ∩ B表示用户A的购买记录和用户B的购买记录的交集。拿上面的数据举例，u1用户和u2用户的交集为：{a、b、d、e} ∩ {a、c} = {a}

之后来看一下分母，它的意思是A和B做union的结果（注意不是union all）。因此，拿u1用户和u2用户距离，此时union出来的结果为 {a、b、d、e} union {a、c} = {a、b、c、d、e}

因此我们可以得出
$J(u_1, u_2)=\frac{\{a\}}{\{a、b、c、d、e\}}=\frac{1}{5}=0.2$
之后继续计算u1和u3、u4之间的相似度：
$J(u_1, u_3)=\frac{\{a、b、d、e\}\cap\{b、c、d\}}{\{a、b、d、e\}union\{b、c、d\}}=\frac{\{b、d\}}{\{a、b、c、d、e\}}=\frac{2}{5}=0.4$

$J(u_1, u_4)=\frac{\{a、b、d、e\}\cap\{a、c、d、e\}}{\{a、b、d、e\}union\{a、c、d、e\}}=\frac{\{a、d、e\}}{\{a、b、c、d、e\}}=\frac{3}{5}=0.6$

因此从杰卡德相似系数可以看出，u1用户和u4用户是相似的。

余弦相似度

余弦相似度是通过测量两个向量之间的夹角余弦值来衡量他们之间的相似程度。

如上图，A(1,2)和B(2,1)分别是两个向量，θ 是两个向量的夹角，cosθ 是夹角的余弦值。θ的取值范围是是[0,180度]，对应的cosθ范围为[-1,1]

当cosθ等于1时，也就是θ=0，a和b的方向一致，此时可以认为它们的相似度最大
当cosθ等于-1时，也就是θ=180度时，a和b的方向完全相反，此时可以认为它们的相似度最小

因此，cosθ的值越大，两个向量的相似度就越大

需要注意的是，余弦相似度关注的是向量的方向，因此向量的大小并不重要。比如下图：

向量(1,2)和向量(2,1)的相似度是cosθ，和向量(4,2)的相似度也是cosθ。

知道了余弦值如何表达相似度后，我们该计算两个向量之间的余弦值呢。

首先从余弦定理出发，高中时大家应该都有学过余弦定理：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-FM0SqtwS-1677574284171)(推荐系统-1.assets/image-20220928160004213.png)]
$\begin{array}{l} c^{2}=a^{2}+b^{2}-2 a b \cos \theta \\ a^{2}=b^{2}+c^{2}-2 b c \cos \beta \\ b^{2}=c^{2}+a^{2}-2 c a \cos \alpha \end{array}$

勾股定理是余弦定理的特殊情况，即α为90度时，cosα=0，此时
$b^{2}=a^{2}+c^{2}$

根据余弦定理，我们可以推出
$\cos \theta=\frac{a^2+b^2-c^2}{2ab}$
其中a、b、c三条边的大小我们通过两个向量A、B可以求出（A、B加上坐标轴原点构成了一个三角形）。

假设有向量A(x1,x2)和B(y1,y2)，那么
$\begin{array}{l} a^{2}=(x_1-0)^{2}+(x_2-0)^{2}=x_1^2+x_2^2 \\ b^{2}=(y_1-0)^{2}+(y_2-0)^{2}=y_1^2+y_2^2 \\ c^{2}=(x_1-y_1)^{2}+(x_2-y_2)^{2}=x_1^{2}-2 * x_1 y_1+y_1^{2}+x_2^{2}-2 * x_2 y_2+y_2^{2} \end{array}$

所以可得：
$\cos \theta=\frac{x_1^2+x_2^2+y_1^2+y_2^2-x_1^{2}+2 * x_1 y_1-y_1^{2}-x_2^{2}+2 * x_2 y_2-y_2^{2}}{2\sqrt{(x_1^2+x_2^2)} \sqrt{(y_1^2+y_2^2)} }=\frac{x_{1} y_{1}+x_{2} y_{2}}{\sqrt{x_{1}^{2}+x_{2}^{2}} \times \sqrt{y_{1}^{2}+y_{2}^{2}}}$
数学家已经证明，余弦的这种计算方法对n维向量也成立。假定A和B是两个n维向量，A是 [A1, A2, …, An] ，B是 [B1, B2, …, Bn] ，则A与B的夹角θ的余弦等于:
$\begin{aligned} \cos \theta &=\frac{\sum_{i=1}^{n}\left(A_{i} \times B_{i}\right)}{\sqrt{\sum_{i=1}^{n}\left(A_{i}\right)^{2}} \times \sqrt{\sum_{i=1}^{n}\left(B_{i}\right)^{2}}} \\ &=\frac{A \cdot B}{|A| \times|B|} \end{aligned}$
知道了余弦相似度如何计算后，我们该如何去计算用户之间的相似度呢，还是以这几个用户举例：

用户标识	购买物品列表
u1	a、b、d、e
u2	a、c
u3	b、c、d
u4	a、c、d、e

余弦相似度只能计算两个向量之间的相似，而上面用户对应数据是一个物品列表，因此我们需要对其进行编码。

因为物品的总数量是5个，因此我们可以用一个5维的向量来表示。比如A[A1、A2、A3、A4、A5]的5个值分别对应a、b、c、d、e的购买行为，购买过则值为1，没购买过则为0。通过编码，我们可以得到各个用户对应的向量：

	a	b	c	d	e	最终编码(向量)
u1	1	1	0	1	1	(1,1,0,1,1)
u2	1	0	1	0	0	(1,0,1,0,0)
u3	0	1	1	1	0	(0,1,1,1,0)
u4	1	0	1	1	1	(1,0,1,1,1)

之后使用余弦相似度计算u1和其他用户之间的相似度：
$\begin{array}{l} \cos (u_1,u_2)=\frac{1*1+1*0+0*1+1*0+1*0}{\sqrt{1*1+1*1+0*0+1*1+1*1}*\sqrt{1*1+0*0+1*1+0*0+0*0}}=\frac{1}{\sqrt{8} }\\ \cos (u_1,u_3)=\frac{1*0+1*1+0*1+1*1+1*0}{\sqrt{1*1+1*1+0*0+1*1+1*1}*\sqrt{0*0+1*1+1*1+1*1+0*0}}=\frac{2}{\sqrt{12} }=\frac{1}{\sqrt{3} }\\ \cos (u_1,u_4)=\frac{1*1+1*0+0*1+1*1+1*1}{\sqrt{1*1+1*1+0*0+1*1+1*1}*\sqrt{1*1+0*0+1*1+1*1+1*1}}=\frac{3}{4} \end{array}$
通过余弦相似度公式我们可以算出，u4和u1的相似度是最大的。

三、基于内容的推荐算法

Content-based Recommendations（CB）是推荐系统中最基础的算法，也是最古老的算法。它会根据用户过去喜欢的物品，为用户推荐和这个物品相似的物品。这个相似判断是通过抽取物品的内在或外在的特征值来实现的。

举个例子，对于一个电影来说，它的特征可能有[导演、演员、影片类型、时长、所属国家、用户打分、…]。基于这些特征，我们通过相似度算法计算出各个电影之间的相似度。

总得来说，基于内存的推荐算法很好理解，一共就分两步：

获取用户喜欢的物品
通过该物品的特征，找到和该物品最相似的N个物品，推荐给用户

如何获取到用户喜欢的物品

用户不会主动告诉我们他喜欢什么物品，因此我们需要根据用户的相关行为来构建用户画像信息。具体什么行为得根据不同的场景来判断。

对于电影网站来说，用户的评分就可以拿来当评判依据，如果用户喜欢一个电影，自然会打比较高的分数
对于电商网站，用户的购买行为也可以当成用户喜欢这个物品
对于资讯类网站，我们可以拿用户的浏览时长来作为评判标准

如何确定物品的特征

基于内容的推荐第二步是找到和用户喜欢物品最相似的N个物品。

相似度算法之前已经介绍过了，但在使用相似度算法之前，我们需要确定物品有哪些特征。因此，如何挖掘物品的特征是基于内容的推荐算法中的核心问题。可以说，基于内容的推荐，最重要的不是推荐算法，而是内容挖掘和分析(也就是挖掘物品的特征/标签)。内容挖掘的越深，才能让推荐算法达到更好的效果。

对于物品的特征提取/标签挖掘，一般有几种办法：

专家标签：雇佣一些专门的人员为网站上的物品逐个打标签（数据标注工程师）
用户自定义标签(UGC)：让用户自己为各个物品打标签（豆瓣）
降维分析数据，提取隐语义标签（隐语义模型）
分词、语议处理和情感分析 —— 适用于一些物品是文本的网站（NLP）

四、推荐算法实验方法评测指标

评测指标

1、预测准确度

预测准确度是说一个推荐系统或者推荐算法预测用户行为的能力。它是推荐系统最重要的一个指标，从推荐系统诞生的那一天起, 几乎99%与推荐相关的论文都在讨论这个指标。这主要是因为该指标可以通过离线实验计算,方便了很多学术界的研究人员研究推荐算法。

在离线实现中，我们可以将数据集分为训练集和测试集，通过测试集来预测算法的准确度。不同的推荐场景对于准确度有不同的计算方法。主要的推荐场景一般有两种，分别是评分预测和TopN推荐。

评分预测

很多提供推荐服务的网站都有一个让用户给物品打分的功能。那么,如果知道了用户对物品的历史评分，就可以从中习得用户的兴趣模型, 并预测该用户在将来看到一个他没有评过分的物品时,会给这个物品评多少分。预测用户对物品评分的行为称为评分预测。

评分预测的预测准确度一般通过均方根误差 (RMSE) 和平均绝对误差 ( MAE ) 计算。rui表示用户u对物品i的实际评分，rui表示用户u对物品i的预测评分，T表示测试集的样本数量，那么
$\operatorname{RMSE(均方根误差)}=\sqrt{\frac{\sum_{u, i \in T}\left(r_{u i}-\hat{r}_{u i}\right)^{2}}{|T|} }=\sqrt{\frac{\sum_{u, i \in T}\left(实际评分-预测评分\right)^{2}}{|样本数量|} }$

$\mathrm{MAE(平均绝对误差)}=\frac{\sum_{u, i \in T}\left|r_{u i}-\hat{r}_{u i}\right|}{|T|}=\frac{\sum_{u, i \in T}\left|实际评分-预测评分\right|}{|样本数量|}$

RMSE与MAE对比：RMSE针对异常值更敏感（即有一个预测值与真实值相差很大，那么RMSE就会很大）。因此，使用RMSE来评测准确度就意味着对系统的评测更为苛刻。在实际情况中，我们可以同时用这两个指标，通过查看MAE和RMSE的比值找出那些存在较大但不常见的错误。

TopN预测

网站在提供推荐服务时,一般是给用户一个个性化的推荐列表,这种推荐叫做TopN推荐。 TopN推荐的预测准确率一般通过准确率 ( precision ) /召回率 (recall ) 度量。

假设R(u)是算法给用户u的推荐列表，T(u)是用户u真实的行为列表。那么
$\text { Recall(召回率) }=\frac{\sum_{u \in U}|R(u) \bigcap T(u)|}{\sum_{u \in U}|T(u)|}$

$\text { Precision(准确率) }=\frac{\sum_{u \in U}|R(u) \bigcap T(u)|}{\sum_{u \in U}|R(u)|}$

也就是说，假设我们给用户推荐了5个物品，用户自己消费了10个物品，而我们推荐的物品中只有一个和用户真实的列表一致，那么召回率就是1/10=10%，准确率就是1/5=20%。

关于评分预测问题和TopN预测的讨论

评分预测一直是推荐系统研究的热点，这主要是因为推荐系统的早期研究组GroupLens的研究主要是基于电影评分数据MovieLens进行的，同时推荐系统的Netflix大赛也主要面向评分预测问题。

但有科学家指出，TopN预测更符合实际的应用场景。因为即使我们对用户的评分预测的非常准确，也不能表明它能为我们带来多少收益。

举个例子，在豆瓣上有许多冷门的高分电视剧或电影，这些电影都是高品质的，大部分人去看应该也会打高分。但是打高分并不意味着用户就感兴趣，如果我们因为预测用户对这些电影评分高而向他们推荐这些电影，那最后八成会被大部分用户忽视。

备注：

但是准确的预测并不代表好的推荐。

比如一个用户本来就要准备购买某书，那么无论是否给他推荐，他都准备购买，所以这个推荐结果显然是不好的，因为它未使用户购买更多的书。

2、用户满意度

用户作为推荐系统的重要参与者，用户的满意度也是最重要的指标之一。与预测准确度相比，用户满意度是个相对主观的指标，因此无法通过离线实验计算出来，只能通过在线实验和用户调查中获得。

在做用户调查时，我们可以根据发放问卷的形式来收集用户的满意度，拿GroupLens曾经做过的一个论文推荐系统的问卷来举例。该问卷是让用户选择哪句话是看到推荐内容结果后的感受：

推荐的论文都是我比较想看的
推荐的论文很多我都看过了,确实是符台我兴趣的不错论文
推荐的论文和我的研究兴趣是相关的，但我并不喜欢
不知道为什么会推荐这些论文，他们和我的兴趣丝毫没有关系

这个问卷可以看出，设计满意度问卷时不能单单让用户回答是否满意，可能用户心里认为大体满意，但是对某些方面不满意，因而可能很难回答这个问题。需要设计问卷时需要充分考虑到用户各方面的感受，这样才能针对问题给出准确的回答。

在在线系统中，用户满意度用户的一些行为来统计得到。比如统计用户在对应物品上的点击率、用户停留时间和转化率等来手机用户的满意度。

3、覆盖率

覆盖率是描述一个推荐系统对物品长尾的发掘能力。覆盖率有不同的定义方法，最简单的定义就是推荐出来的物品集合占总物品的比例。即：
$覆盖率=\frac{推荐的物品数量}{总物品数量}$
再复杂些的系统就需要考虑上推荐列表中物品出现次数的分布。如果所有的物品都出现在推荐列表中，且出现的次数差不多，那么说明该推荐系统的覆盖率高，发掘长尾的能力很好。

在信息论和经济学中有两个著名的指标可以用来定义覆盖率。第一个是信息熵：
$H=-\sum_{i=1}^{n} p(i) \log p(i)$
这里的p(i)是物品的流行度除以所有物品流行度之和。

第二个是基尼系数：
$G=\frac{1}{n-1} \sum_{j=1}^{n}(2 j-n-1) p\left(i_{j}\right)$
推荐系统的初衷是消除马太效应，需要用基尼系数。。。。

4、多样性

用户的兴趣是广泛的，在视频网站中，一个用户既可能喜欢看《猫和老鼠》一类的动画片，也喜欢看成龙的动作片。因此，推荐列表最好能覆盖用户不同的兴趣领域，即推荐结果需要具有多样性。

多样性保证了我们不会在一棵树上吊死。举个例子，某个用户对于电影的兴趣可能有很多，比如喜剧片、动作片、恐怖片。但是在某一时刻（比如他心情不好），只想看喜剧片，这时候多样性就保证了用户找到感兴趣电影的概率。而如果推进的列表品类单一，则用户找到感兴趣电影的概率就会降低。

多样性描述了推荐列表中物品的不相似程度，因此多样性和相似性是对应的。假设s(i,j)-[0,1]定义了物品i和物品j之间的相似度，那么用户u的推荐列表R(u)的多样性定义如下：
$\text { Diversity }=1-\frac{\sum_{i, j \in R(u), i \neq j} s(i, j)}{\frac{1}{2}|R(u)|(|R(u)|-1)}$
推荐系统的整体多样性可以定义为所有用户推荐列表多样性的平均值：
$\text { Diversity }=\frac{1}{|U|} \sum_{u \in U} \text { Diversity }(R(u))$
关于推荐系统的多样性最好达到什么程度，我们可以通过一个简单的例子来了解一下。假设某个用户喜欢动作片和动画片，且用户80%的时间都在看动作片，20%的时间都在看动画片。那么，下面4种推荐列表：

A列表中有10部动作片，没有动画片
B列表中有10部动画片，没有动作片
C列表中有8部动作片，2部动画片
D列表中有5部动作片，5部动画片

可以看出，AB列表缺乏多样性，D列表过于多样，没有考虑到用户的主要兴趣。C列表是最好的，因为它考虑到了用户的主要兴趣，又具有一定的多样性。因此，多样性也需要根据用户的实际情况来调整。

5、新颖度

新颖的推荐是指给用户推荐那些他们以前没有听说过的物品。推荐列表保证一定的新颖度可以更好的发掘用户的兴趣。评测新颖度的最简单方法就是利用推荐结果的平均流行度，因为越不热门的物品越可能让用户觉的新颖。因此，如果推荐结果中物品的平均热门程度越低，那么推荐结果就可能有比较高的新颖度。

但是这个方法还是比较粗略的，因为不同用户不知道的东西是不同的，所以要准确的统计新颖度还需要做用户调查。

可能有同学会发现，要保证新颖度很可能会牺牲准确度。因此，如何不牺牲准确度的情况下，提高多样性和新颖度也是推荐系统近几年的一个研究方向。

6、惊喜度

惊喜度和新颖度有些相似，但也有一定区别。

举个例子，假设一个用户喜欢周星驰的电影，我们给他推荐了一部《临歧》的电影（1983年由刘德华、周星驰、梁朝伟合作演出，很少有人知道这部电影有周星驰出演），而该用户不知道这部电影，那可以说这个推荐具有新颖性，但是没有惊喜度，因为该用户一旦了解了这个电影的演员，就不会觉得特别奇怪。

如果我们给用户推荐了张艺谋导演的《红高粱》，假设用户没有看过这部电影，那么他看完这部电影后可能会觉的很奇怪，因为这部电影和他的兴趣一点关系也没有，但如果看完之后觉的很不错，那就可以说这个推荐是让用户惊喜的。

总的来说，惊喜度就是推荐和用户历史上喜欢的物品不想死，但用户却觉得很满意的推荐。

不过目前也没有什么公认的惊喜度指标定义的方式，虽然近几年学术界对惊喜度问题有了一定的关注，但是还没有太成熟的结果。

7、信任度

用户对推荐系统的信任度也是影响推荐好坏的一个非常重要的指标。

举个现实生活中的例子，你有2个朋友，一个非常靠谱，一个整天满嘴跑火车。那个靠谱的朋友推荐你去某个地方旅游时，你很可能听从他的建议。而那个满嘴跑火车的朋友的建议，你很可能就不会当回事。

提高推荐系统的信任度主要有两个方法：

增加系统的透明度，也就是需要向用户提供推荐解释，只有让用户了解推荐系统的运行机制，让用户认同推荐系统的运行机制，才会提高用户对系统的信任度。
充分利用用户的社交网络信息，利用用户的好友信息给用户做推荐，并且用好友进行推进解释。因为用户一般对他们的好友都比较信任，如果推进的商品刚好是好友购买过的，那么他们对推荐结果就会相比比较信任

8、实时性

实时性主要描述了时间因素对推荐效果带来的影响。

一种情况是物品本身具有时效性，比如一个新闻网站经常给用户推荐两三年前的新闻，那么这个网站无疑会失去大量用户。

还有一种情况，比如一个用户刚买了一部iphone，那么我们立刻给他推荐iphone相关配件肯定比第二天才给他推荐效果来的好。

9、健壮性

任何一个能带来收益的系统都会被人攻击。这方面最为典型的例子就是搜索引擎。搜索引擎的作弊和反作弊斗争异常激烈，因为如果能让自己的商品成为热门搜索的第一个搜索结果，会带来极大的商业利益。推荐系统也有类似的问题，而健壮性指标则衡量了一个推荐系统抗击作弊的能力。

举个例子，亚马逊有一种推荐叫做"购买商品A的用户也经常购买的其他商品"，它的主要计算方法是统计购买商品A的用户购买其他商品的次数。那么，我们可以很简单的攻击这个算法，让自己的商品在这个推荐列表中获得比较高的排名。比如可以注册很多账号，用这些账号同时购买商品A和自己的商品。

为了让系统的健壮性更高，我们要尽量在使用数据前过滤掉一些异常数据，同时尽量使用用户代价较高的用户行为。比如对比用户购买行为和用户浏览行为，购买行为需要付费，代价相对更高，而浏览行为很容易伪造，因此选择用户购买行为作为依据的算法会更健壮些。

总结

上面介绍了很多指标，有些可以离线计算，有些只能在线获得。在实际的开发中，我们很难同时兼顾所有的指标。因此，如何有选择的放弃或降低一些指标来实现收益最大化也是推荐系统研究的重要问题。

比如我们的优化策略可以是保证覆盖率、多样性、新颖度达到一定值的情况下，尽可能的让预测准确度达到最大。
$\begin{array}{l} Max(预测准确度) \\ \left\{\begin{matrix} 覆盖度>A \\ 多样性>B \\ 新颖度>C \end{matrix}\right. \end{array}$
其中A、B、C的具体取值可以根据实际情况进行调整。

你可能感兴趣的:(机器学习,推荐系统,相似度计算,基于内容的推荐算法)

vrrp技术完熟芒果忙智能路由器
VRRP技术概述VRRP（VirtualRouterRedundancyProtocol，虚拟路由器冗余协议）是一种网络协议，用于提高默认网关的可用性。通过将多台路由器组成一个虚拟路由器组，VRRP确保在主路由器故障时，备份路由器能无缝接管流量转发，避免单点故障。VRRP工作原理虚拟路由器组：多台物理路由器组成一个逻辑组，共享一个虚拟IP地址（VIP）和虚拟MAC地址。主/备份选举：通过优先级（0
redis-transaction zhangsanzhu
redis-transaction注意不支持回滚操作是因为redis是先执行指令然后做日志，所以即使发生异常，没有可以用来执行回滚操作的日志。只保证事物的隔离性,不保证原子性.redis禁止在multi和exec之间执行watch指令，而必须在multi之前做好盯住关键变量，否则会出错。事物的过程multi:事物的开始(创建一个事物);exec:事物的执行;discard:丢弃这个事物;127.0
用生命求蜕变我爱更纱
有的人躲避人生的缺陷，是因为那个缺陷就只是缺陷。而有的人，把缺陷变成了历练。胡歌就是就样。他正视了自己的伤疤，治疗过程中还保持乐观的心境，他珍惜低谷中的心态，审视自己，重逆自己，他在激流中勇退，巩固自己，发展自己。祸与福或许真的相依相伴。换个角度看世界，天地大了，心胸也必定宽广。
华彬集团董事长严彬浇灌的那朵公益之花开了温酒_4305
自1995年红牛进入中国市场，20多年来早已成了中国饮料界的领军人物，提起红牛，恐怕没人不知道，“困了，累了，喝红牛”的广告早已响遍大街小巷。但是谈及它背后的人，想必大多数人都很陌生，这个人就是被称为“中国红牛之父”的严彬，正是因为他才有了今日的红牛。冰心曾说：“成功的花，人们只惊慕她现时的明艳！然而当初她的芽儿，浸透奋斗的泪泉，洒遍了牺牲的血雨。”1954年，严彬出生于山东的一个清贫之家。197
白衣执甲，逆行出征，凯旋而归！向您致敬！昵称云之上
今天41支医疗队，3675医护人员开始撤离武汉，离我们期待的哪一天越来越近了。所有的伟大都是平凡的人在历经磨难时的坚持，没有什么人是天生的英雄，只是你没去做而他去做了，感激没放弃的平凡人!白衣执甲，逆行出征，凯旋而归！向您致敬！感谢英雄们的付出，辛苦了，祝一路顺风！
抄读《山海经》(一百一十九) 言小暖
【原文】6.14贯匈国在其东，其为人匈有窍。一曰在臷（zhí）国东（此句当是后人注解，不是经文）。【译文】贯匈国（即贯胸国，因其国中之人胸部有洞而得名）在臷国的东边，国中之人胸部都有一个洞。一说贯匈国在臷国的东面。拓展：【贯匈国】贯匈国即贯胸国，国民原是山神防风氏的后裔。这个国家的人从胸前到后背有一个贯穿的洞，样子十分奇特。关于这个洞的来历，有一个传说。大禹治水时，曾召集诸神在会稽山开会，商议治水
windows docker-02-docker 最常用的命令汇总老马啸西风 Docker 容器学习实战笔记 docker eureka 容器 ubuntu maven linux 运维
一、镜像管理命令说明常用参数示例dockerpull:拉取镜像dockerpullnginx:latestdockerimages查看本地镜像dockerimages-a（含中间层镜像）dockerrmi删除镜像dockerrmi-f$(dockerimages-q)（强制删除所有镜像）dockerbuild-t.构建镜像dockerbuild-tmyapp:v1-fDockerfile.prod
星返邀请码是多少?(2024附星返app邀请码填写及获取指南)网络购物和智能省钱凌风导师
关于星返极速版邀请码2024年的最新汇总及填写步骤，由于我无法直接访问实时更新的数据库或官方公告，以下信息基于当前可获取的资料和一般经验进行总结：星返极速版邀请码最新汇总请注意：由于邀请码可能随平台政策、推广活动等因素变化，以下提供的邀请码仅供参考，具体有效性需以星返极速版官方发布的信息为准。常见邀请码：包括但不限于这些邀请码在多个渠道中被提及，但具体使用时请确认其有效性。官方渠道获取：最可靠的方
题目在哪里池池雾
现在我不知道要写什么，但写着写着，灵感这东西该会跑出来瞅瞅我吧。我和朋友在上海聊高中，五年前一起高考的人，五年后躺在一起，仿佛那段看似黑暗的时间就在眼前，仿佛又是那个搞不清高考原因，埋头苦读的自己，仿佛这中间的时间刹那间化为乌有。再说到那个时刻，我仍然感得到力量和苦涩，那个时候，我还在相信着坚定的未来，把未来牢牢缝合在胸口，而现在的我过着当时的未来生活。想要的都在口袋里乖乖等待我的宠爱，想过的生活
STM32与树莓派通信 bing_feilong 硬件嵌入式硬件
STM32与树莓派（RaspberryPi）的通信常见方案及实现步骤：1.UART串口通信（最简单）适用场景：短距离、低速数据交换（如传感器数据、调试信息）。硬件连接：STM32引脚树莓派引脚备注TXRX(GPIO15)交叉连接RXTX(GPIO14)交叉连接GNDGND共地软件配置：STM32端（使用HAL库）：UART_HandleTypeDefhuart1;huart1.Instance=U
Dockerfile 完全指南：从入门到精通赵大仁 nodejs 运维技术 docker 运维服务器 node.js
Dockerfile完全指南：从入门到精通一、什么是Dockerfile？Dockerfile是一个文本文件，包含了一系列构建Docker镜像的指令。通过Dockerfile，开发者可以将应用程序的构建过程标准化、自动化，确保在任何环境中都能生成一致的镜像。使用Dockerfile构建镜像的核心优势：可重复性：相同的Dockerfile在任何环境下都能生成相同的镜像可维护性：以代码形式管理镜像构建
给史多多的第760封信第一次尝试游乐区七千22
你好，这里是七千每日文字输出的第841天。你好，史多多今天周六，好好的一个休息日变成了比工作日还早的早起日。早上五点多的时候妈妈想去上个厕所，稍微就动了那么一下下，然后多多就好似被按了启动开关，就开始发癔症、伸懒腰、哼唧唧，最后直接翻身探头爬起来。才六点多一点啊史多多，简直是折磨人。今天带多多去体验一个软体游乐园之前，妈妈带多多在楼下广场玩，小家伙老大爷附身似的，小脚一靠，后来还坐在运动器材上晃脚
VRRP技术暴龙战士wef 智能路由器网络
一、VRRP基本概念VRRP（VirtualRouterRedundancyProtocol，虚拟路由器冗余协议）是一种容错协议，通过将多个路由器加入到备份组中形成一台虚拟路由器来承担网关功能。主要特点：提高网络可靠性简化主机配置（主机只需配置虚拟网关IP）应用场景：解决单网关无冗余的问题，当网关出现故障时，内网设备仍可通过备份路由器访问外网。二、VRRP相关概念VRRP组(VRID)：由多个路由
恋爱三年，结婚一年(江瑶苏泽)完本小说_热门小说排行恋爱三年，结婚一年(江瑶苏泽) d1932dbc5104
《恋爱三年，结婚一年》主角：江瑶苏泽简介：我和闺蜜一起嫁进苏家，又几乎同时怀孕。我嫁给外科一把手的哥哥，她嫁给最帅警察的弟弟。结婚一周年，我在去医院取我们孕检报告回家的路上出了严重车祸。闺蜜给我们买奶茶躲过一劫。我下身当场大出血，整个人躺在血泊里，吓的面色惨白。颤抖着掏出手机给老公打电话求救，他却一连挂断三次才接起。语气里满是不耐烦：“能不能别无理取闹？你刚刚孕检不还没事？医疗资源不是让你这样浪费
我40多岁时学到的人生经验，我希望能告诉20岁的自己（翻译）氪星人
你有没有说过这样的话:如果我当时就知道我现在就知道的那会怎样？你不是第一个有这种想法的人，当然也不会是最后一个。我们中的许多人都相信，如果我们能回到过去，和20岁的自己聊聊天，那么我们绝对不想长大。很多成长发生在我们20多岁的时候。然而，在20岁的时候，我们说服自己，我们知道所有我们需要知道的事情，并且我们准备好抓住它。不过，这确实提出了一个问题，如果你有机会和过去的自己说话，你会对20岁的自己说
2018-06-27 Sammy_S
天气越来越炎热，身体的反应也越来越严重，支撑我的是小伙伴们的能量和信念。吃碗长寿面，明天继续…图片发自App
VR全景园区：开启智慧园区新时代
在科技飞速发展的当下，智慧园区建设正如火如荼地展开。其中，全景园区作为智慧园区的创新模式，正逐渐崭露头角，成为推动园区高效运营、创新发展的关键力量。随着数字化进程的不断加快，全景园区的内涵和外延还在持续拓展，为城市和产业发展注入新的活力。一、全景园区的核心定义与价值逻辑全景园区，是借助先进的数字化技术，将园区的物理空间、基础设施、运营管理、服务应用等进行全方位、立体化的呈现与整合，构建出一个高度可
盘点各省市的历史名人，了解一下莫妮卡莫妮卡
所谓一方水土养一方人，一个地域之所以能人才辈出，和这个地区的文化，地理位置等因素多少有一些关系。湖南省：湖南省是中国名人第一大省，英雄豪杰众多。谁敢叫号，可能被一串人名淹死。湖南在近代历史上为中国人民做出了巨大的贡献。代表人物：毛泽东，刘少奇，彭德怀，贺龙，粟裕，田汉，谭嗣同，黄兴，曾国藩，蔡伦，王夫之，左宗棠，齐白石，周敦颐等等。安徽省：中国各省中唯一可以和湖南比的也就是安徽。安徽在古代和近代都
雷锋精神代代传 Kilig遇
今年的3月5日是第59个“学雷锋纪念日”，回顾学习雷锋一路走来，一心一意跟党走、全心全意为人民服务为核心的雷锋精神已深入中国人的骨髓，为一代代中国人崇敬、追随。雷锋是一座不朽的精神丰碑。新时代是奋斗者的时代，传承雷锋精神，是新时代奋斗者应执守的奉献追求。雷锋精神，人人可学；奉献爱心，处处可为。习近平总书记曾将新时代雷锋精神的核心概括为：信念的能量、大爱的胸怀、忘我的精神、进取的锐气。雷锋精神内涵丰
蓝另一种蓝宁静而已
鸟儿愿为一朵云。云儿愿为一只鸟。☞泰戈尔这个世界上肯定有另一个我，做着我不敢做的事，过着我想过的生活。另一个作了正确选择的我，正在另一块土地上幸福地生活，另一种正确的人生正在进行。而我选错了。我被美丽的外表欺骗了，选择了一部有缺陷的车。另一部落满灰尘的才是能快意人生的高性能的车子。都说一个人的人生之路不能走两次。但是不知为何，唯独我现在拥有这个机会……选择，另一种选择选择，另一种选择；自己，另一个
是非辩证层次解问学院凯撒院长
是非辩证层次如果第一层是最高的(更高级更正确），第一百层是最低的。如果第一百层，的正确结论是，是。比他更高一层，第99层的，辩证结论就是，非。以此类推98层，是。97层，非。……1层，非。(单数非偶数是)如果你们同样是，第，90层的人。那这一层的正确是“是“。所有这个层次的人，都会认为是是正确的。如果更高，几层，比如说，第37层的人，告诉他们，非，是正确的。那么这个更高级37层的人，无疑会被所有9
理性与感性戴老师成长记录仪
昨天在罗胖的60秒中，听到了这么一个话语，就是理性的反面不是感性，而是本能，感性的反面不是理性而是冷漠，当我听到这么一句话的时候，一直刺激着我的大脑，因为我对这句话理解的不够透彻，今天的文章，我就想要针对这个六十秒的话语，说说我的自己的思考，谈谈我的感受。[if!supportLists]一、[endif]理性与感性我们还是回到罗胖说的那句话，就是理性的反面是本能，感性的反面是冷漠。那些自以为感性
团结奋斗是中国人民创造历史伟业的必由之路康小贤
力量生于团结，幸福源自奋斗。习近平总书记在参加十三届全国人大五次会议内蒙古代表团审议时强调，团结奋斗是中国人民创造历史伟业的必由之路。只要在党的领导下全国各族人民团结一心、众志成城，敢于斗争、善于斗争，我们就一定能够战胜前进道路上的一切困难挑战，继续创造令人刮目相看的新的奇迹。一百年来，党和人民取得的一切成就都是团结奋斗的结果，团结奋斗是中国共产党和中国人民最显著的精神标识。中国共产党自成立以来，
瞎评《一出好戏》核心弹头
黄渤自导自演的《一出好戏》想必大家都知道，可能很多人还没看过，这是一部非常值得观看的电影。本人有幸前段时间观看了这部电影，总体感觉还是不错的(因为没花钱)。我没看过预告和介绍，上映前也没关注过这部电影。预想着这电影可能会跟宁浩的电影风格差不多(比如《疯狂的石头》、《疯狂的赛车》等等，事实上风格的确是一样的，都是那种讽刺人性的荒诞喜剧。因为演员都是黄渤，如果不告诉别人导演是黄渤，可能大家会以为都是同
日精进第104天七田阳光晓蓓
敬爱的黄校长，亲爱的老师们：大家晚上好！我是寿光七田阳光的霍晓蓓，今天是2018.12.25日，我的日精进行动第104天，给大家分享我今天的进步。1、比学习：今天学习了《给孩子的未来脑计划》2、比改变：积极的状态迎接每一天。3、比付出：努力做好每一件事。4、比谦卑：换位思考，多为别人考虑，学习别人的优点。5、比感恩：感恩黄姐给予的学习机会和平台。6、比坚持：坚持学习！坚持晨练！坚持日精进！
AI 智能质检系统在汽车制造企业的应用 ykjhr_3d 人工智能汽车 ai
某知名汽车制造企业在其庞大且复杂的生产流程中，正面临着棘手的汽车零部件质检难题。传统的人工质检方式，完全依赖人工的肉眼观察与简单工具测量。质检员们长时间处于高强度的工作状态，精神高度集中，即便如此，由于人工检测的局限性，效率十分低下。对于一些极其微小的零部件缺陷，像是零部件表面细微如发丝般的划痕，或者仅仅是极其细微的尺寸偏差，人工检测很难做到精准识别。这种情况不仅严重限制了生产效率，导致生产线时常
华锐云空间平台：开启数字化创新体验新时代 ykjhr_3d VR实训 3D虚拟展厅 3D数字捏脸
（一）3D虚拟展厅搭建，轻松打造独特展示空间华锐云空间平台的3D虚拟展厅搭建功能堪称一绝，为用户提供了超过500个丰富多样的展厅模板，这些模板涵盖了各种风格与主题，无论是科技感十足的现代风，还是充满艺术氛围的文艺风，亦或是庄严肃穆的商务风，都能在这里找到。即使你是毫无技术背景的小白，也能轻松上手。平台采用了简单便捷的拖拽式编辑方式，无需掌握复杂的编程技能，只需通过简单的拖拽操作，就能随心所欲地添加
VR 火化设备仿真系统具备哪些优势？
VR火化设备仿真系统，是融合了当下前沿的VR(虚拟现实)技术，精心打造出的一套针对火化设备的模拟演示与学习系统。它借助先进的3D建模技术，对火化设备进行1：1的高精度还原建模，无论是设备外观的每一处细节，还是内部复杂的构造，都能逼真呈现。(一)培训革命：随时随地沉浸式学习VR火化设备仿真系统给传统培训模式带来了颠覆性的变革。以往，培训往往受限于特定的时间和场地，工作人员必须在火化场规定的时间内，跟
gitlab登录报422的错 xiaodaiwang GitlabCI 服务器运维
用户密码正确，但是登录gitlab报422thechangeyourequestedwasrejected.解决方案：1.检查浏览器所在的电脑的时间2.检查gitlab所在服务器时间3.如果经过了nginx，检查一下nginx所在服务器时间然后把时间改正确，重新打开浏览器就行了。
mtime参数 xiaodaiwang linux
-mtimen按照文件的更改时间来找文件，n为整数。n表示文件更改时间距离为n天，-n表示文件更改时间距离在n天以内，+n表示文件更改时间距离在n天以前。例如：-mtime0表示文件修改时间距离当前为0天的文件，即距离当前时间不到1天（24小时）以内的文件。-mtime1表示文件修改时间距离当前为1天的文件，即距离当前时间1天（24小时－48小时）的文件。-mtime＋1表示文件修改时间为大于1天
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地