jony0917

Summary of Effective Recommendation Algorithms

简介

本文以问题为导向介绍推荐算法。

问题一

问题定义：假设 $U=\{u_1, u_2, ..., u_n\}$ 表示用户集合， $P=\{p_1, p_2, ..., p_m\}$ 表示物品集合， $S\in R^{n\times m}$ 表示用户对物品的评分组成的矩阵，例如 $s_{ij}$ 表示用户 $u_i$ 对物品 $p_j$ 的评分，如果用户 $u_i$ 没有对物品 $p_j$ 没有评过分数，则对应的矩阵项为空。我们的目标是为用户生成个性化的TopN推荐列表。

1. 基于用户的协同过滤

按照基于用户的协同过滤算法，我们需要找到目标用户的相似用户，首先可以用用户各自的评分组成的向量表示用户，比如要计算两个用户的 $u_a, u_b$ 的相似度，则 $u_a=[s_{a1},s_{a2},...,s_{am}],u_b=[s_{b1},s_{b2},...,s_{bm}]$ ,然后计算用户向量间的相似度。向量相似度的计算方式有很多，比如欧式距离、协方差、余弦相似、Pearson相关系数、Jaccard系数等。

欧式距离的计算公式为：

$d(x,y)=\sqrt{\sum_{i=1}^n(x_i-y_i)^2}$

欧式距离的取值范围是0到正无穷，取值越小表示相似度越高，取值为零表示两个向量完全相等。

协方差的计算公式为：
$C o n (x, y) = E [(x - E [x]) (y - E [y])] = E [x y] - E [x] E [y]$
Pearson相似度的计算公式为:

$\rho(x,y)=\frac{Con(x,y)}{\sigma_x\sigma_y}=\frac{E[x-E[x]])(y-E[y]}{\sigma_x\sigma_y}$

其中 $\sigma_x,\sigma_y$ 分别表示x,y的标准差。

余弦相似度计算公式：

$cos(x,y)=\frac{\sum x_iy_i}{|x||y|}=\frac{\sum x_iy_i}{\sqrt{\sum_ix_i^2}\sqrt{\sum_iy_i^2}}$

那么如何选择相似度的计算方法呢？这些相似度计算方法之间满足下面的关系

定理一：数据标准化之后（均值为0，标准差为1），Pearson相关系数等于余弦相似度

证明如下：

$\rho(x,y)=\frac{Con(x,y)}{\sigma_x\sigma_y}$
$=\frac{E[(x-E[x]])(y-E(y))}{\sigma_x\sigma_y}$

$E[x]=0,E[y]=0,\sigma_x=1,\sigma_y=1$ 带入以上公式得到;

$\rho(x,y)=E(xy)=\frac{\sum_i x_iy_i}{N}$

又因为：

$cos(x,y)=\frac{\sum_i x_iy_i}{\sqrt{\sum_i x_i^2}\sqrt{\sum_i y_i^2}}$
$=\frac{\sum_i x_i y_i}{N * \sqrt{\sum_i x_i^2/N}\sqrt{\sum_i y_i^2/N}}$
$=\frac{\sum_i x_i y_i}{N}$
$=\rho(x,y)$

定理二：数据标准化之后（均值为0，标准差为1），Pearson相关系数有欧式距离的平方满足线性关系

证明如下：

$d(x,y)^2=\sum_i^n(x_i-y_i)^2$
$=\sum_i^n(x_i^2-2x_iy_i+y_i^2)$
$=\sum_i^n x_i^2 + \sum_i^n y_i^2 - 2\sum_i^n x_iy_i$
$=n\sum_i^n \frac{x_i^2}{n} + n\sum_i^n \frac{y_i^2}{n} - 2\sum_i^n x_iy_i$
$=n\sigma_x^2 + n\sigma_y^2 - 2\sum_i^n x_iy_i$
$\rho(x,y)$
$=2n(1-\rho(x,y))$

定理三：数据标准化之后（均值为0，标准差为1），预选相似度与欧式距离平方满足线性关系

回到推荐算法，我们以Pearson相似度计算为例，用户 $u_a,u_b$ 之间的相似度计算公式为;

$sim(a,b)=\frac{\sum_{i\in P(a,b)}(s_{ai}-\mu_a)(s_{bi}-\mu_b)}{\sqrt{\sum_{i\in P(a,b)}(s_{ai}-\mu_a)^2}\sqrt{\sum_{i\in P(a,b)}(s_{bi}-\mu_b)^2}}$

其中 $P (a, b)$ 表示a,b用户共同评过分的物品集合， $\mu_a,\mu_b$ 分为表示用户a，b评分的均值。

有了用户相似度计算方法之后，就可以利用相似用户的评分，预测目标用户的评分，比如a用户对物品p的评分可以通过下面公式预测：

$p)=\mu_a + \frac{\sum_{b\in U(a, K)}sim(a, b)(s_{bp}-\mu_b)}{\sum_{b\in U(a, K)}sim(a, b)}$

其中 $U (a, K)$ 表示与用户相似度最高的TopK个用户组成的集合。

以上是最基本的基于相似用户的推荐算法，实践中可以有几个方向的改进：

在计算用户相似度的时候，并没有考虑热门物品的影响，显然喜爱这类热门物品，并不表示两位用户的兴趣比较相似，相反，共同喜爱某些冷门物品，更能表示两个用户的兴趣比较类似。
在计算用户相似度的时候，并没有考虑用户有多少个共同评分的物品。显然当用户虽然评分非常一致，但是只对极少数物品评分，也并不能表示两位用户的兴趣类似。

改进算法就不在这里展开了，可以通过设计一些加权算法赋予不同的物品以不同的权重来改进基本版本的算法。

2. 基于物品的协同过滤

类似的，有了评分矩阵后，物品a,b的评分表示为 $p_a=[s_{1a},s_{2a},...,s_{na}], p_b=[s_{1b},s_{2b},...,s_{nb}]$ 。我们可以直接通过相似度计算方法计算两个物品的相似度,比如余弦相似度为:

$sim(a,b)=\frac{\sum_{i\in U(a, b)}s_{ia}s_{ib}}{\sqrt{\sum_{i\in U(a,b)}s_{ia}^2}\sqrt{\sum_{i\in U(a, b)}s_{ib}^2}}$

其中 $U (a, b)$ 表示对物品a,b都评过分的用户的集合。

有了物品的相似度后，可以预测某个用户对某个物品的评分值：

$p)=\frac{\sum_{i\in P(u, p)} sim(i, p)s_{ui}}{sim(i,p)}$

其中 $P (u, p)$ 表示用户u评过分的与物品p相似的物品集合。

以上的相似度计算方法，在实践中与几个方向的改进：

在计算物品相似度的时候，各个纬度是同等加权的，实际中不同用户对物品相似度的贡献不一样的。活跃用的兴趣可能比较宽泛，这类用户喜欢物品，并不能说明两类物品比较类似。
在计算物品相似度的时候，并没有考虑共同评分的用户数量。显然被极少数用户评论过并不能代表物品比较相似。

3. 基于奇异值分解(SVD)

奇异值分解的原理是将原始的评分矩阵分解为3个矩阵乘积的形式：

$S=U\Sigma V^T$

其中 $U, V$ 称为左右奇异向量， $\Sigma$ 对角线墒的值称为奇异值。

分解矩阵之后，如何对目标用户进行推荐呢？

拿到目标用户的评分向量 $u_v$ ，首先计算目标用户在低位空间的位置:

$u_v' = u_v U\Sigma^{-1}$

有了目标用户子低维空间的位置，可以有不同的策略为她推荐物品，比如可以在低维空间寻找相似用户，用相似用户的物品评分预测目标用户的物品评分。

对以上的基本算法可以有几个方向的改进：

加权方案
缺失评分的填充方案

4. 基于隐语义学习(LFM)

首先基础的LFM通过下面的公式计算用户对物品的评分：

$s_{ui}=p_uq_i^T=\sum_{k=1}^Kp_{u,k}q_{i,k}$

其中 $p_{u,k},q_{i,k}$ 称为模型的参数。那么如何得到模型的参数呢？可以通过最小化下面的损失函数来计算模型的参数：

$C=\sum (s_{ui}-\widehat{s}_{ui})^2$

一般为了防止过拟合，我们会在损失函数上加上正则化：

$C=\sum ((s_{ui}-\widehat{s}_{ui})^2+\lambda |p_u|^2 + \lambda |q_i|^2)$

关于机器学习的内容我们在其他文章里有详细的介绍，这里就不展开了。

我们来对基础的LFM做一些改进：

我们将系统的偏移信息用独立的模型参数来表示：

$s_{ui}=p_uq_i^T + b_u + b_i + \mu$

其中 $b_u, b_i, \mu$ 分别表示用户评分的偏置，物品评分的偏执，全局平均分。

如此则损失函数变成：

$C=\sum((p_uq_i^T + b_u + b_i + \mu - \widehat{s}_{ui})^2 + \lambda(|p_u|^2 + |q_i|^2 + |b_u|^2 + |b_i|^2))$

我们将用户的属性加入到模型，比如用户的年龄、地域等，每一个属性值都对应一个隐因子

$s_{ui}=(p_u+\sum a_u)q_i^T + b_u + b_i + \mu$

我们将用户的消费过的物品加入模型，每个消费过的物品都对应一个隐因子

$s_{ui}=(p_u + \sum a_u + |N(u)^{-0.5}|\sum_{k\in N(u)} y_k)q_i^T + b_u + b_i + \mu$

加入时间的考虑，或对样本进行时间的加权，或将重要的时间特征对应隐因子加入模型，或将样本按时间分类，不同时间段对应不同的参数。

有了这些隐因子之后，如何对目标用户进行推荐呢？很简单，有了隐因子之后，我们可以直接估算用户对某个物品的评分了，按评分的高低生成TopN推荐列表。

问题二

问题定义：假设 $U=\{u_1, u_2, ..., u_n\}$ 表示用户的集合， $P=\{p_1, p_2, ..., p_m\}$ 表示物品的集合， $P(u_i)，u_i\in U$ 表示用户i的所以有正反馈的物品组成的集合。这里的正反馈可以是隐式反馈。目标是为用户生成TopN推荐列表。

1. 基于用户协同过滤

Jaccard相似度计算：

$v)=\frac{|P(u_u)\cap P(u_v)|}{|P(u_u)\cup P(u_v)|}$

余弦相似度计算：

$v)=\frac{|P(u_u)\cap P(u_v)|}{\sqrt{|P(u_u)|}\sqrt{|P(u_v)|}}$

有了相似用户之后，就可以预测目标用户对目标物品的兴趣程度：

$\frac{\sum_{v\in U(u, K)\cap U(p)}sim(u,v)r_{vp}}{\sum_{v\in U(u, K)\cap U(p)}sim(u, v)}$

其中 $U (u, k)$ 表示与用户u最相似的K个用户组成的集合， $U (p)$ 表示对物品p有个正反馈的用户集合。

我们对以上的基本算法做一下改进：

我们在计算用户相似度的时候，没有考虑热门物品的影响，热门和非热门物品度对用户相似度的影响程度一样。显然这事不太对的，因为共同喜欢热门物品，并不能表示两个用户的兴趣比较类似，只能说明这个物品比较热门，被大多数人喜欢。

所以我们改进用户相似度的计算方法：

$s i m (u, v) = I m p r o v e d C o s (u, v)$
$=\frac{\sum_{p\in P(u_u, u_v)}\frac{1}{log(1 + |U(p)|)}}{\sqrt{|P(u_u)|}\sqrt{|P(u_v)|}}$

其中 $U (p)$ 表示对物品p有过正反馈的用户集合。

2. 基于物品协同过滤

物品的余弦相似度计算法公式为：

$\frac{|U(i)\cap U(j)|}{\sqrt{|U(i)|}\sqrt{|U(j)|}}$

有了物品相似度之后可以预测用户对物品的兴趣程度：

$p)=\frac{\sum_{i\in P(p, K)\cap P(u)}sim(p, i)r_{ui}}{\sum_{i\in P(p, K)\cap P(u)}sim(p, i)}$

其中 $P (p, K)$ 表示物品p最相似的K个物品的集合， $P (u)$ 表示用户u正反馈过的物品集合。

下面我们对上面的基本算法做个改进：

在上面计算物品相似度的时候，所有用户对物品相似度的贡献值是一样的。这个假设不太合理，活跃用户对相似度的影响应该小于非活跃用户，这个概念被称为反用户频率(Inverse Uesr Frequence)。因为被活跃用户感兴趣的物品，不一定很相似。

改进后的相似度计算方式为：

$ImprovedCos(i,j)=\frac{\sum_{u\in U(i)\cap U(j)}\frac{1}{log(1 + |P(u)|)}}{\sqrt{|U(i)|}\sqrt{|U(j)|}}$

3. LFM模型

LFM模型在评分预测类的任务中表现很好，同样在行为预测类的任务中也可以使用:

$s_{ui}=(p_u + \sum a_u + |N(u)^{-0.5}|\sum_{k\in N(u)} y_k)q_i^T + b_u + b_i + \mu$

正样本总取 $s_{ui} = 1$ ,负样本则取 $s_{ui}=0$ . 在这类任务中，训练数据只有正样本，而没有负样本。所以首先需要解决的问题是如何为用户生成负样本数据。

负样本的采样策略可以是简单的，随机的从用户没有过行为的数据中选取。但是也有一些改进的方法，比如偏重热门物品，因为热门的物品用户大概率看到过，但是没有正反馈，这表示是一个负样本。

4. 基于图的算法

基于图的推荐算法中，我们首先需要将用户的行为数据表示成图的形式。

定义：我们将用户的行为表示为图 $G=(V_u, V_I, E)$ ，其中 $V_u$ 表示用户顶点集合，每一个顶点表示一个用户， $V_I$ 表示物品顶点集合，每一个顶点表示一个物品。用户的历史行为可以表示为[用户，物品]二元组的形式，对于每一个这样的二元组，图G中都存在一条连接对应用户和物品的边，构成集合 $E$ .

例如有用户 $u_1, u_2, u_3, u_4$ ,分别有各自的历史行为，他们的历史行为表示为图的形式如下：

用户的行为表示为图的形式之后，推荐过程就是在图中寻找与目标用户顶点具有相关性的物品顶点。那么首先需要解决的是如何衡量图中顶点间的相关性。

实践中研究人员设计了很多计算图中顶点相关性的算法。这里介绍一种基于随机游走的PersonalRank算法。对于每一个目标用户 $v_u$ ，我们通过下面的公式计算顶点的权重：

$\alpha \sum_{v'\in in(v)}\frac{Rank(v')}{|out(v)|}\space if (v \neq v_u)$

$\alpha) + \alpha \sum_{v'\in in(v)}\frac{Rank(v')}{out(v)} \space if (v = v_u)$

经过若干次的迭代后顶点的权重会收敛，此时的权重值可以作为物品推荐的分数。

5. 基于内容的算法

基于内容的推荐算法的基本思想是给目标用户推荐他喜欢的物品的相似物品，但与基于物品的协同的过滤算法不同，物品间的相似度由物品的属性（物品类别、标签等等）决定，而不是由物品上积累的用户行为决定。由于不需要物品上积累的用户行为，基于内容的推荐算法在物品冷启动阶段非常有用。

基于内容的推荐可以分成三个阶段：

物品的分析阶段，生成物品画像，包括物品的类别、标签、价格、品牌等等。物品画像的维度同时也定义了用户画像的维度。
用户兴趣点提取阶段，生成用户兴趣点画像
根据用户的兴趣点生成推荐列表

第一阶段我在其他的文章中有详细介绍过，涉及的算法根据物品的不同，可能会涉及文本处理、图像处理、人工生成标签等等，这里不展开，重点介绍一下二三阶段。

首先遇到的问题是什么是兴趣点？前面已经提到了，物品画像的维度定义了用户的兴趣点。

第二个问题是如何提取用户的兴趣点？基本是方式是通过用户与物品的交互行为历史(浏览、点击、收藏、购买、分享、屏蔽等)生成用户的兴趣点。

一般来说，兴趣点的提取可以从考虑以下的量化指标：

兴趣点的正向反馈绝对次数
兴趣点的正向反馈比率

我们来对兴趣点的提取做一些改进：

上面在提取兴趣点的时候，没有考虑兴趣点本身的热门程度，我们加入反兴趣点自身频率的考虑，因为这样才会捕捉到用户的非热门的兴趣点。
加入时间衰减的考虑，最近的正向反馈行为的权重要大于一段时间前的正向反馈行为
分时间段的兴趣点提取

在第三个阶段，有了用户的兴趣点之后，如何为用户生成推荐内容呢？这里可以有不同的推荐策略，比如简单的可以将兴趣点作为检索关键词直接检索出相关的物品。也可以加入一些实时兴趣点筛选逻辑，根据用户当时的状态实时决定用哪些兴趣点。

6. 排行榜推荐策略

排行榜可能是最容易被忽视的非个性化的推荐策略，但在很多情况下不失为一种很好的推荐策略。

常见的排行榜有：

物品点击排行榜
物品时效性排行榜

我们在基本的排行榜策略里，加入用户的人口统计学特征，比如性别、年龄、地域、职业等特征，可以生成半个性化的排行榜。

7. 社会化推荐

社会化推荐是指利用用户的社交关系进行推荐的策略。有了用户的社交关系，最简单的推荐策略就是给目标用户推荐其好友喜欢的物品集合：

$s_{ui}=\sum_{v\in Related(u)}w_{uv}s_{vi}$

其中 $R e l a t e d (u)$ 表示用户u的好友集合。 $s_vi$ 表示用户v对物品i的兴趣程度。 $w_{uv}$ 表示用户u,v间的熟悉程度的权重。

还有一些社会化推荐算法，将用户间的好友关系以及用户与物品间的兴趣关系通过图的形式表示，然后采用基于图的推荐算法。

8. 深度学习的实践

深度学习在建模和表示用户的兴趣上有很多卓有成效的实践。大规模的推荐系统中，推荐过程一般分为两个阶段：召回阶段和排序阶段。召回阶段负责从海量的物品集合中选择并生成一个推荐物品候选集合，候选集合规模相对较小；排序阶段负责基于一定的目标（点击、消费等等，或则是多目标）对候选集合内的物品进行排序，并生成最终的推荐列表。深度学习在两个阶段都有应用。

召回阶段：

基于Embedding思想的用户兴趣建模算法，比如以前文章中介绍过的Graph Embedding, MIND

排序阶段;

WideAndDeep, 多目标模型，ESMM

9. 其他推荐算法

还有一些推荐算法，感兴趣的可以搜索相关的paper阅读了解，以后有时间在做详细展开：

基于受限玻尔兹曼机的推荐算法
基于增强学习的推荐算法

问题三

问题定义：假设待推荐的物品集合为 $P=\{p_1, p_2, ..., p_n\}$ ，用户的整体集合为 $U=\{u_1, u_2, ..., u_m\}$ 。我们的目标是为每个待推荐的物品 $p_i\in P$ 生成一个用户列表，将物品推送给用户。

这是一个典型的推送问题，属于推荐问题范畴，但与通常的推荐问题不同点在于：

通常的推荐问题是为用户找到合适的物品，而推送问题是为物品找到合适的用户

以上的算法进过简单的变化即可以用在推送问题上，这里不再展开。

从实现层面来说，推送系统的结构与通常的推荐系统的结构比较相似，通常分为两个阶段：召回阶段和排序阶段。召回阶段负责从海量的用户集合中挑选可能对物品感兴趣的用户并生成备选用户候选集合。排序阶段负责以特定指标为目标（点击、消费、够买等）对候选集中的用户进行排序。

《Effective Python》第十三章测试与调试——使用 pdb 进行交互式调试不学无术の码农 Effective Python 精读笔记 python 开发语言
引言本文基于《EffectivePython:125SpecificWaystoWriteBetterPython,3rdEdition》第十三章：测试与调试中的Item114:ConsiderInteractiveDebuggingwithpdb，旨在系统总结书中关于Python内置调试器pdb的使用方法，结合笔者在实际开发中的调试经验，探讨其应用场景、技巧以及延伸思考。Python开发过程中，
Effective Modern C++ 条款7：区分使用 `()` 和 `{}` 创建对象郝学胜-神的一滴 Effective Modern C++c++开发语言程序人生
在C++11及以后的版本中，初始化对象的方式变得更加灵活，但也带来了选择上的困惑。()和{}是两种常见的初始化语法，它们在语义、行为和适用场景上有显著差异。本文将通过具体示例，深入解析这两种初始化方式的区别，并探讨如何在实际编程中合理选择。一、基本区别：()和{}的语义差异1.1()：传统构造函数调用Widgetw1(10);//调用带一个int参数的构造函数Widgetw2(10,true);/
通过“逆向侦测”驾驭涌现复杂性的认知架构与技术实现由数入道架构认知框架人工智能思维模型
摘要(ExecutiveSummary)我们正处在一个由人工智能驱动的“寒武纪大爆发”时代，复杂性本身正在经历一次相变。面对这一现实，渐进式的分析优化已然失效，唯有通过构建一种全新的认知架构——“逆向侦测”（ReverseDetection），才能在混沌中驾驭涌现的力量。本报告旨在提供该架构的终极蓝图，涵盖从哲学基石到技术实现，再到组织重塑的完整路径。一个基本的理论内核：“前兆复合体”（Precu
一周掌握Flutter开发--10. 结构与设计模式江上清风山间明月 Flutter flutter 设计模式快速
文章目录10.项目结构与设计模式核心原则10.1分层架构10.1.1UI层10.1.2业务逻辑层10.1.3数据层10.2代码规范：遵循EffectiveDart10.2.1命名规范10.2.2代码格式10.2.3注释与文档10.3模块化设计10.3.1按功能拆分模块10.3.2模块化设计的优势10.3.3实现模块化总结10.项目结构与设计模式在Flutter开发中，良好的项目结构和设计模式是确保
Python打卡：Day46 剑桥折刀s python打卡 python
importtorchimporttorch.nnasnnimporttorch.optimasoptimimporttorchvisionfromtorchvisionimportdatasets,transformsfromtorch.utils.dataimportDataLoaderfromtorch.utils.tensorboardimportSummaryWriterimportnu
FPGA设计中的数据存储 cycf FPGA之道 fpga开发
文章目录FPGA设计中的数据存储为什么需要数据存储FPGA芯片内部的载体触发器查找表块存储FPGA芯片外部的资源RAM应用场合ROM特征简介实现载体应用场合FIFO特征简介FIFO使用小技巧之冗余法FIFO写接口缓存FIFO读接口缓存“冗余法”总结根据数据流的稳定性与存储操作的容错性，决定采用RAM模式还是FIFO模式STACK特征简介实现载体应用场合SummaryFPGA设计中的数据存储为什么需
Effective Python 条款4:用支持插值的f-string取代C风格的格式字符串与str.format方法郝学胜-神的一滴 Python Effective Python python 开发语言程序人生
在Python开发中，字符串格式化是日常操作的核心功能。本文将深入解析三种主流方法，并通过对比表格助你选择最佳方案。三种方法快速概览特性%格式化str.format()f-stringPython版本要求所有版本≥2.6≥3.6可读性低中高执行速度慢中等最快变量复用需重复写入需重复写入单点定义表达式支持不支持有限支持完整支持类型安全低中高字典/对象访问冗余较清晰最简洁%格式化-C语言风格的遗产na
Python数据分析学习笔记：字符串统计 NIKEeri python pandas 字符串匹配 python 数据分析学习
一、题目来源KagglePandas-Exercise:SummaryFunctionsandMaps章节二、题目要求描述一瓶葡萄酒时，可用的词汇有限。哪种词出现频率更高：“tropical”还是“fruity”？统计description列中这两个词的出现次数。忽略大小写。三、我的思路（使用str.contains统计总次数）tropical_count=reviews['description
FastAPI WebSocket：你的双向通信通道为何如此丝滑？
url:/posts/0faebb0f6c2b1bde4ba75869f4f67b76/title:如何在FastAPI中玩转WebSocket，让实时通信不再烦恼？date:2025-07-06T20:11:20+08:00lastmod:2025-07-06T20:11:20+08:00author:cmdragonsummary:FastAPI的WebSocket路由通过@app.webso
C++17 并行算法：std::execution::par
在多核处理器普及的今天，如何高效利用硬件资源成为提升软件性能的关键。C++17引入的并行算法库（ParallelAlgorithms）为开发者提供了一套标准化的并行编程接口，通过简单的策略切换即可将顺序算法转换为并行执行。本文将深入探讨C++17并行算法中最核心的执行策略std::execution::par，从基础概念到高级应用，全面解析其原理、用法及最佳实践。一、C++17并行算法概述1.1并
推荐与广告区别 ActionReaction
TheDifferencebetweenaRecommendationandanAdAquickthoughtregardingFacebook’snewSocialAdsplatform.Arecommendationissomethingyougetfromsomeonewhoknowssomethingaboutyou.Theyhaveseenanitemofinterestandthoug
FastAPI如何玩转安全防护，让黑客望而却步？
url:/posts/c1314c623211c9269f36053179a53d5c/title:FastAPI如何玩转安全防护，让黑客望而却步？date:2025-07-04T18:28:43+08:00lastmod:2025-07-04T18:28:43+08:00author:cmdragonsummary:FastAPI通过内置的OAuth2和JWT支持，提供了开箱即用的安全解决方案，
数据结构面试题编程题_您下次编程面试时应该了解的顶级数据结构 cumichun6193 数据结构链表队列 python java
数据结构面试题编程题byFahimulHaq通过FahimulHaqNiklausWirth,aSwisscomputerscientist,wroteabookin1976titledAlgorithms+DataStructures=Programs.瑞士计算机科学家NiklausWirth在1976年写了一本书，名为《算法+数据结构=程序》。40+yearslater,thatequatio
【置顶】【GESP】C++ 认证学习资源汇总 CoderCodingNo GESP c++学习开发语言
其余详见：【置顶】【GESP】C++认证学习资源汇总|OneCoder【置顶】【GESP】C++认证学习资源汇总|OneCoder本置顶将汇总本站发布的GESP认证考试相关资源，并进行了分类整理，不定期更新。https://www.coderli.com/gesp-resource-summary/考纲解析一级（考纲）考点知识讲解考试级别（1）了解计算机的基本构成（CPU，内存，I/O设备等），了
红外小目标检测算法RIPI hie98894 目标检测目标跟踪机器学习
红外小目标检测算法RIPI，基于红外块图像，张量加权，PCADENTIST-master/algorithms/detection/NIPPS/demo_generate_nipps_data.m,1244DENTIST-master/algorithms/detection/NIPPS/nipps.m,2649DENTIST-master/algorithms/detection/NIPPS/R
如何用三层防护体系打造坚不可摧的 API 安全堡垒？
url:/posts/0bbb4a455ef36bf6f81ac97189586fda/title:如何用三层防护体系打造坚不可摧的API安全堡垒？date:2025-07-03T18:55:04+08:00lastmod:2025-07-03T18:55:04+08:00author:cmdragonsummary:FastAPI安全与认证综合实战涵盖了JWT认证、OAuth2集成和渗透测试等内
FastAPI安全加固：密钥轮换、限流策略与安全头部如何实现三重防护？
url:/posts/f96ba438de34dc197fd2598f91ae133d/title:FastAPI安全加固：密钥轮换、限流策略与安全头部如何实现三重防护？date:2025-07-02T22:05:04+08:00lastmod:2025-07-02T22:05:04+08:00author:cmdragonsummary:FastAPI框架安全加固方案包括密钥轮换自动化、请求频率
FastAPI安全加固：密钥轮换、限流策略与安全头部如何实现三重防护？ qcidyu fastapi 安全
url:/posts/f96ba438de34dc197fd2598f91ae133d/title:FastAPI安全加固：密钥轮换、限流策略与安全头部如何实现三重防护？date:2025-07-02T22:05:04+08:00lastmod:2025-07-02T22:05:04+08:00author:cmdragonsummary:FastAPI框架安全加固方案包括密钥轮换自动化、请求频率
2. 当构造方法参数过多时使用 builder 模式
Effectivejava文章目录Effectivejava为什么要使用builder模式?多可选参数的情景使用Builder模式Builder模式类层次结构总结为什么要使用builder模式?静态工厂和构造方法都有一个限制：它们不能很好地扩展到很多可选参数的情景。请考虑一个代表包装食品上的营养成分标签的例子。这些标签有几个必需的属性——每次建议的摄入量，每罐的份量和每份卡路里，以及超过20个可选
Java POI 删除最后一页空白页 qijingpei POI POI Java Word 空白页
情况1：确定是空白页如果最后一页确定是个空白页，然后有一个换行符占了整整一页，想去掉这个换行符的话，采用这种方式：//删除最后一个元素try{intsummary=doc.getBodyElements().size();doc.removeBodyElement(summary-1);}catch(Exceptione){e.printStackTrace();}情况2：有可能是空白页如果最后一
C++为什么中不应该返回局部变量的地址 i love 3 C++返回引用 c++return
最近在写代码的时候遇到返回局部变量的引用问题，认识不是很清晰，下面是转自http://blog.csdn.net/tujinqiuqq85948239/article/details/27236677博文的详细解释！在EffectiveC++中明确指出：不应该返回局部变量的引用，原因在于：局部变量会在函数返回后被销毁，因此被返回的引用就成为了”无所指”的引用，程序会进入未知状态。如果比较理解函数局
CppCon 2018 学习:A Little Order! Delving into the STL sorting algorithms 虾球xz CppCon 学习 c++排序算法
记录一下一个编译器加密的算法#include#include#include#include#include#include#includenamespacedetail{//编译期伪随机key：每个字符对应不同keytemplateconstexprstd::uint8_tkey8(){returnstatic_cast((N*31+57)^0xAA);}}//namespacedetail//
Effective Go 编程技巧总结强哥之神 golang 人工智能 GPU调度 linux 语言模型云计算
Go是一种新兴的编程语言。尽管它借鉴了其他语言的许多特性，但也具备一些独特的属性，使得用Go编写的高效程序在风格上与其他语言编写的程序有所不同。直接将C++或Java程序翻译成Go代码，通常无法取得令人满意的结果——Java程序的编写方式是Java风格，而非Go风格。另一方面，如果从Go的语言特性出发去思考问题，可能会编写出风格截然不同但更为成功的程序。换句话说，要编写出优秀的Go代码，理解Go语
《Effective Python》第十一章性能——延迟加载模块，通过动态导入减少 Python 程序启动时间不学无术の码农 Effective Python 精读笔记 python 开发语言
引言本文基于《EffectivePython:125SpecificWaystoWriteBetterPython,3rdEdition》第11章:性能中的Item98：Lazy-LoadModuleswithDynamicImportstoReduceStartupTime。本文旨在总结书中关于延迟加载模块的核心观点，并结合我自己的开发经验，深入探讨其在实际项目中的应用场景与优化价值。Pytho
Effective C 中文版资源下载史剑咪Nessa
EffectiveC中文版资源下载去发现同类优质开源项目:https://gitcode.com/欢迎来到本仓库！这里提供了一个非常实用的资源——EffectiveC中文版.pdf。这本书深入浅出地介绍了C语言编程中的各种技巧和最佳实践，无论你是C语言的新手还是有一定基础的程序员，都能从中获得宝贵的知识。本书详细讲解了C语言的各个方面，包括基础语法、高级特性、内存管理、效率优化等。通过阅读本书，你
【图像去噪】论文精读：Linear Combinations of Patches Are Unreasonably Effective for Single-Image Denoising 十小大深度学习图像处理计算机视觉图像去噪人工智能
请先看【专栏介绍文章】：【图像去噪（ImageDenoising）】关于【图像去噪】专栏的相关说明，包含适配人群、专栏简介、专栏亮点、阅读方法、定价理由、品质承诺、关于更新、去噪概述、文章目录、资料汇总、问题汇总（更新中）文章目录前言AbstractI.INTRODUCTIONII.APARAMETRICVIEWOFTWO-STEPNON-LOCALMETHODSFORSINGLE-IMAGEDE
1163 Dijkstra Sequence (30) 圣保罗的大教堂 PAT刷题图 pat考试
Dijkstra'salgorithmisoneoftheveryfamousgreedyalgorithms.Itisusedforsolvingthesinglesourceshortestpathproblemwhichgivestheshortestpathsfromoneparticularsourcevertextoalltheotherverticesofthegivengraph.
colour-demosaicing：实现多款CFA去马赛克算法的Python开源包常琚蕙
colour-demosaicing：实现多款CFA去马赛克算法的Python开源包colour-demosaicingCFA(ColourFilterArray)DemosaicingAlgorithmsforPython项目地址:https://gitcode.com/gh_mirrors/co/colour-demosaicing项目介绍在数字图像处理领域，马赛克效应（Mosaicing）是
[论文阅读] 人工智能 + 软件工程 | 揭秘ChatGPT在软件开发问题解决中的有效性：一项实证研究张较瘦_ 前沿技术论文阅读人工智能软件工程
揭秘ChatGPT在软件开发问题解决中的有效性：一项实证研究论文：WhatMakesChatGPTEffectiveforSoftwareIssueResolution?AnEmpiricalStudyofDeveloper-ChatGPTConversationsinGitHubarXiv:2506.22390WhatMakesChatGPTEffectiveforSoftwareIssueRe
RBAC权限模型如何让API访问控制既安全又灵活？
url:/posts/9f01e838545ae8d34016c759ef461423/title:RBAC权限模型如何让API访问控制既安全又灵活？date:2025-07-01T04:52:07+08:00lastmod:2025-07-01T04:52:07+08:00author:cmdragonsummary:RBAC权限模型通过用户、角色和权限的关联实现访问控制，核心组件包括用户、角色
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在