钱魏Way

知名网站热门排序算法分析

很多内容网站都会根据用户的交互信息等对内容进行排序。这里整理了一些比较知名的内容网站的排序规则，每个网站都有不同，在此过程中，我们不仅仅要了解其排序规则（公式），更多的期望了解公式背后的逻辑。

Hacker News

Hacker News 是一家关于计算机黑客和创业公司的社会化新闻网站，由 Paul Graham 的创业孵化器 Y Combinator 创建。与其它社会化新闻网站不同的是 Hacker News 没有踩或反对一条提交新闻的选项（不过评论还是可以被有足够 Karma 的用户投反对票，或是投支持票）；只可以赞或是完全不投票。简而言之，Hacker News 允许提交任何可以被理解为“任何满足人们求知欲”的新闻。

以上为Hacker News的界面截图，如果你是该产品的负责人，你会如何进行排序？哪些维度可以进行排序？

从上面截图中我们考虑的因素主要有：

点赞数（每个新闻标题前面有一个向上的三角形，如果你觉得这个内容很好，就点击一下，投上一票）
距离发布的时间
评论量

最简单的方式是只考虑点赞数，这样点赞数越多的文章的会排在最前面。但是会导致整个站点信息的新颖度不高。即历史的文章由于展示的时间较长点赞数相对会更高。所以需要将时间因素也考虑在内。由于点赞量与评论量存在一定的相关性，且评论量大也有可能是由于内容有较大争议而非热门导致的，所以我们先将影响因素限制在：

点赞数：相同发帖时间，投票数越高，分值越高
距离发布时间：相同投票数，距离发帖时间越近，分值越高

我们将点赞数设为，发帖时间设为t，则排序分值可以是：

$$score = \frac{P}{t}$$

即分值与点赞数存在正相关，与距离发布时间存在负相关。画出的分值图形如下：

而Hacker News真实采用的公式如下：

$$score = \frac{P-1}{(t+2)^{1.5}}$$

画出的图形如下：

备注：Hacker News 采用公式$score = \frac{P-1}{(t+2)^{1.5}}$做为排行依据（Hacker News使用Paul Graham开发的Arc语言编写，源码可以从 arclanguage.org下载），其中P是投票数量，t是发表以来的时间，小时计。后来AMIX.DK给出公式$score = \frac{P-1}{(t+2)^{G}}$推广了上面的公式，Hacker News的公式变成了一个特例，其在G=1.5时的应用。历史上Hacker News有用G=1.8。

接下来我们对公式进行分析：

得票数P

在其他条件不变的情况下，得票越多，排名越高。从下图可以看到，有三个同时发表的帖子，得票分别为200票、60票和30票（减1后为199、59和29），分别以黄色、紫色和蓝色表示。在任一个时间点上，都是黄色曲线在最上方，蓝色曲线在最下方。

为什么是P-1?网络上的一种解释是，很多文章作者在提交的时候会给自己投上一票。其实更重要的原因是文章发布初期的投票数对排名影响非常的，仅仅是自己给自己投的一票，也占非常大的作用。

假设P不去减去1，一个作者发布完就给自己投票，那么文章的得分为1/(0+2)^1.5=0.3535 。假设另外一篇文章发布了8小时，那么需要多少的投票呢？x/(8+2)^1.5>0.3535，即X>11.17即一天前的帖子要有12票才能超过新提交的文章，这显然不合理。

投票数具体应该减去多少，可能需要考虑刷数据的问题，根据网络环境去设置很可能更合理，比如去除同一IP用户的操作等。

另外想要调整得票数的影响权重，可以采用的方式是在得票数上买一个指数。例如你不期望“高投票文章”与“低投票文章差距过大，可以在得票数上加一个小于1的指数，比如(P-1)^0.8。

距离发帖时间t

在其他条件不变的情况下，越是新发表的帖子，排名越高。或者说，一个帖子的排名，会随着时间不断下降。从上图可知，经过24小时之后，所有帖子的得分基本上都小于1，这意味着它们都将跌到排行榜的末尾，保证了排名前列的都将是较新的内容。

公式中为什么要使用t+2？我们先来看下图：

在时间上+2，核心是为了分值曲线向左移，让最开始几个小时过大的下降趋势被舍弃。

重力因子G

它的数值大小决定了排名随时间下降的速度。从下图可以看到，三根曲线的其他参数都一样，G的值分别为1.5、1.8和2.0。G值越大，曲线越陡峭，排名下降得越快。

毫无疑问，G这个数字既非时间，也非评价，其实它的主要目的是控制更新频率。G的值越大，score的衰减速度越快，排行的更新越频繁。所以，确定G值需要观察系统内部投票数在时间上的分布，然后根据需要的更新频次确定G的合理取值。越火爆、用户互动越频繁的社区，为了保证排行的稳定性（不要频繁大量的刷新），G值趋向于比较低。这就是为什么Hacker News从一开始的1.8修改成1.5，过段时间可能就变成1.2了。

应用思考

电商网站的热门排序能否使用Hack News的排序规则？答案是不太适合，主要原因的Hacker News是类似新闻类的网站，用户对于信息的更新频率要求比较高。而电商率的网站更多的看中近期或一段时间的热度。两者还是有些差别。

在电商网站上我先前尝试过的公式为：

$$score = \sum (orderCount * \alpha ^t)$$

这里主要实现逻辑是取一定范围内的订单，比如30天。计算商品每天的销售量。再在销售量根据距离的天数t进行衰减。其中$\alpha $为0-1之间的衰减系数。

当α=1时，即为最为简单的仅统计浏览量或者订单量的数据，整个公式中最不好确定的是α的取值。我通常使用假设的方式，最后通过不同假设计算出来的结果进行人工的选择。

1周后的权重降为5，则$\alpha$ ^7=0.5，$\alpha$≈0.905724
2周后的权重降为5，则$\alpha$ ^14=0.5，$\alpha$≈0.951695
3周后的权重降为5，则$\alpha$ ^21=0.5，$\alpha$≈0.967532
4周后的权重降为5，则$\alpha$ ^28=0.5，$\alpha$≈0.975549

Reddit文章

Reddit与Hacker News类似，也是一个社会化新闻网站，Reddit对文章和评论使用了不同的排名算法，这里介绍的排序规则主要针对的是文章排序。

Reddit与Hacker News有很大的不同点就是，Hacker News文章标题前面只有一个向上的小箭头，即只能投赞成票，而Reddit的每个文章标题前会有两个箭头，即一个向上，一个像下。分别代表“赞成”与“反对”。 Reddit已经把他们的所有源代码进行了公开，具体涉及到排序部分的代码如下： https://github.com/reddit/reddit/blob/master/r2/r2/lib/db/_sorts.pyx。由于此部分代码是使用Python的C语言扩展来写，下面是用Python重写的代码：

from datetime import datetime
from math import log

epoch = datetime(1970, 1, 1)


def epoch_seconds(date):
    """ Returns the number of seconds from the epoch to date. """
    td = date - epoch
    return td.days * 86400 + td.seconds + (float(td.microseconds) / 1000000)


def up_down(ups, downs):
    return ups - downs


def hot(ups, downs, date):
    """ The hot formula. Should match the equivalent function in postgres. """
    z = up_down(ups, downs)
    order = log(max(abs(z), 1), 10)
    sign = 1 if z > 0 else -1 if z < 0 else 0
    seconds = epoch_seconds(date) - 1134028003
    return round(order + sign * seconds / 45000, 7)

从上面的代码中可以看到整个逻辑并不复杂。

分值计算公式：

$$score = \log_{10}z+\frac{yt_s}{45000}$$

其中：

z：获得的投票数的绝对值（赞成-反对），当=0时，z=1
y：投票方向，投票数＞0时，y=1；y＝0时，y=0；＜0时，y=-1
$t_s$：发布时间距离2005年12 月 8 日07:46:43的秒数

从上面的代码级公式中我们可以了解到Reddit的排名算法主要与以下内容有关：

文章的发表时间t

t = 发表时间 – 2005 年 12 月 8 日7:46:43

在Hacker News的算法中，用来标注文章新旧程度的单位为小时，而Reddit的单位为秒，其使用Unix时间戳（从1970年1月1日到当前时间的秒数）进行的计算，代码中的1134028003代表的日期为2005 年 12 月 8 日7:46:43。这个应该是Reddit这个网站的上线时间。通过上面的公式可以看到一旦帖子发表，t就是固定值，不会随时间改变，而且帖子越新，t值越大。

发表时间和话题排名的影响可以被概括如下:

发表时间对排名有很大影响，该算法使得新的话题比旧的话题排名靠前
话题的得分不会因为时间的流失而减少，但是新的话题会比旧的话题得分高。这与 Hacker New 的算法不同（随着时间的发展降低话题的得分）

下图展示了话题得分在好评和差评的数量不变时，随着时间而变化的情况：

赞成票与反对票的差x

x = 赞成票-反对票

真是由于Reddit提供了投反对票的功能，所以可以使一些具有争议的话题会排的较后，下图展示了在好评和差评不变时，随着时间而变化的情况：

公式分解分析

上述公式可以分成两个部分来讨论：

$$\log_{10}z$$

这个部分表示，赞成票超过反对票的数量越多，得分越高。需要注意的是，这里用的是以 10 为底的对数，意味着z=10可以得到 1 分，z=100可以得到 2 分。也就是说，前 10 个投票人与后 90 个投票人（乃至再后面 900 个投票人）的权重是一样的，即如果一个帖子特别受到欢迎，那么越到后面投赞成票，对得分越不会产生影响。而当反对票超过或等于赞成票，z=1，因此这个部分等于0，也就是不产生得分。

Reddit 的热排序算法使用了对数函数来衡量前面的投票与其他投票的差距使其前十个好评和之后的100个，1000个投票有相同的权重。参见下面的图：

如果不采用对数，而使用线性函数的效果如下：

Reddit敢于如此消弱投票的作用，其实与其庞大的流量和用户参与度相关。如果没有以上因素算法很难实现很好的推荐。

另外对数取不同的额底对于消弱的效果也是不同的。

$$\frac{yt_s}{45000}$$

这个部分表示，t越大，得分越高，即新帖子的得分会高于老帖子。它起到自动将老帖子的排名往下拉的作用。分母的 45000 秒，等于 12.5 个小时，也就是说，后一天的帖子会比前一天的帖子多得 2 分。结合前一部分，可以得到结论，如果前一天的帖子在第二天还想保持原先的排名，在这一天里面，它得到的净赞成票必须增加100 倍。

y 的作用是用来产生正分和负分。当赞成票超过反对票时，得分为正；当赞成票少于反对票时，得分为负；当两者相等，得分为0。这就保证了得到大量净赞成票的文章，会排在前列；得到大量净反对票的文章，会排在最后。投票对于总分的贡献不大，但是当投票的意见倾向发生变化时（由正面评价转向负面评价），投票对于总分的作用却是决定性（Y的取值）。

总结

关于Reddit的排名，基本上是由发表时间决定的，只有相同时段的文章才有可比性。晚半天，投票就要翻10倍，只能同时段的文章相比。只有超级受欢迎的文章才会排在最前面，有争议或者一般性的文章很难靠前。基于上述也就决定了 Reddit是一个符合大众胃口的网站，并不是一个很激进可以展示少数派想法的地方。

再来看下Reddit与Hacker News的区别，到底哪一个的算法更好一些呢？其实算法并没有优劣之分，两种方法更有千秋，重要的是你打算用在什么地方。Reddit流量大，所以可以减少投票的权重，而也因为流量大，使得每篇文章在没有收到新的投票的时候无需重新计算得分，也可大大的减少服务器的运算成本。

Reddit评论

目前很多网站采用的评论排名主要有两种，即绝对好评数（好评减去差评）和好评率（好评/总评）。这两种评价方式都存在很明显的缺陷，以下为事例：

A:好评550;　差评450
B:好评60；差评40
C:好评1；差评0
D:好评9，差评1

首先是A与B比较，A的绝对好评数是550-450=100，B的绝对好评数是60-40=20，从绝对好评数比较，A的排名应该在B的前面；A的好评率为550/（450+550）=55%，B的好评率为60/（40+60）=60%，从好评率来说B的排名要比A的排名好。

再来比较下C与D，从好评率出发，C的好评率为100%，而D的好评率为9/（1+9）=90%，单纯从数据上看D的排名要比C的排名落后。对于评论排名上述的方法是否是我们所需要的呢？这样的计算才能更好的体现评论价值？正确的排名算法应该是怎样的？

我们先做如下设定：

每个用户的投票都是独立事件。
用户只有两个选择，要么投好评，要么投差评。
如果投票总人数为n，其中好评为k，那么好评率p就等于k/n。

如果你熟悉统计学，可能已经看出来了，p服从一种统计分布，叫做 “两项分布”（binomial distribution）。

p越大，就代表这个项目的好评比例越高，越应该排在前面。但是，p的可信性，取决于有多少人投票，如果样本太小，p就不可信。由于p服从”两项分布”，因此我们可以计算出p的置信区间。所谓 “置信区间”，就是说，以某个概率而言，p会落在的那个区间。比如，某个产品的好评率是 80%，但是这个值不一定可信。根据统计学，我们只能说，有 95% 的把握可以断定，好评率在 75% 到 85% 之间，即置信区间是[75%， 85%]。

通过上面的分析，我们就可以推断出，如果要给一个评论进行排名，就需要考虑一下内容：

计算每个评论的“好评率”
计算每个“好评率”的置信区间（以 95% 的概率）。
根据置信区间的下限值，进行排名。这个值越大，排名就越高。

这样做的原理是，置信区间的宽窄与样本的数量有关。比如，

A有 8 张赞成票，2张反对票
B有 80 张赞成票，20张反对

这两个项目的赞成票比例都是 80%

A的置信区间（假定[70%， 90%]）
B的置信区间（假定[75%， 85%]）

B的置信区间的下限值（75%）会比A（70%）大，所以B应该排在A前面。置信区间的实质，就是进行可信度的修正，弥补样本量过小的影响。如果样本多，就说明比较可信，不需要很大的修正，所以置信区间会比较窄，下限值会比较大；如果样本少，就说明不一定可信，必须进行较大的修正，所以置信区间会比较宽，下限值会比较小。

正态区间

二项分布的置信区间有多种计算公式，最常见的是“正态区间”（Normal approximation interval），教科书里几乎都是这种方法。但是，它只适用于样本较多的情况（np > 5 且 n (1 – p) > 5），对于小样本，它的准确性很差。

要了解正态区间前需要先掌握一些正态分布的知识。

上图最右侧的0%、90%、95%为置信水平。即数据录入[a,b]区间内的概率。与此对应的1.28$\sigma$、1.64$\sigma$、1.96$\sigma$，其中\sigma为标准差，1.28、1.64、1.96为z-score（标准分位）。在正态分布中，不同的置信水平对应的z值是固定的，如下为常见的90%、95%和99%对应的z值。

你可以通过搜索z-score table搜索到详细的Z值对应置信水平的表格，如下图：

正态区间[a,b]的计算方法：

a = 总体平均值$\mu$ – 标准分位z * 标准误差SE
b = 总体平均值$\mu$ + 标准分位z * 标准误差SE

其中：

$$SE=\frac{S}{\sqrt{n}}$$

SE：标准误差
s：样本标准差
n：样本大小

威尔逊区间

1927年，美国数学家 Edwin Bidwell Wilson 提出了一个修正公式，被称为威尔逊区间，很好地解决了小样本的准确性问题。Reddit 目前使用的是评论算法就是基于威尔逊得分区间 (Wilson score interval)。具体代码片段可从开放的源代码中找到，将其转化成Python代码后：

from math import sqrt
 
def _confidence(ups, downs):
    n = ups + downs
 
    if n == 0:
        return 0
 
    z = 1.0 #1.0 = 85%, 1.6 = 95%
    phat = float(ups) / n
    return (phat+z*z/(2*n)-z*sqrt((phat*(1-phat)+z*z/(4*n))/n))/(1+z*z/n)

def confidence(ups, downs):
    if ups + downs == 0:
        return 0
    else:
        return _confidence(ups, downs)

威尔逊得分区间具体公式如下：

$$\frac{\hat{p}+\frac{1}{2n}z_{1-\frac{\alpha }{2}}^2 \pm z_{1-\frac{\alpha }{2}}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}+\frac{z_{1-\frac{\alpha }{2}}^2}{4n^2}}}{1+\frac{1}{n}z_{1-\frac{\alpha }{2}}^2}$$

其中：

p 是好评率
n 是总投票数
$ z_{1-\frac{\alpha }{2}}$表示对应某个置信水平的z统计量，这是一个常数，可以通过查表得到。一般情况下，在 95% 的置信水平下，z统计量的值为96。

可以公式看到，当n的值足够大时，这个下限值会趋向$\hat{p}$。如果n非常小（投票人很少），这个下限值会大大小于$\hat{p}$。实际上，起到了降低“好评率”的作用，使得该评论的得分变小、排名下降。

威尔逊得分区并不关心一个评论的投票数，而关心好评数和投票总数或采样大小的相对关系！

上图是根据威尔逊得分区计算出来的值：一个评论有1个好评，没有差评，它的支持率是100%，但是由于数据量过小，系统还是会把它放到底部。但如果，它有10个好评，1个差评，系统可能会有足够的信息把他放到一个有着40个好评，20个差评的评论之前。因为我们基本确认当它有了40个好评的时候，它收到的差评会少于20个。最好的一点是，一旦这个算法出错了（算法有15%的失效概率），它会很快拿到更多的数据，因为它被排到了前面。

威尔逊得分区间不仅仅用于评论排名，它还适用于以下情景：

垃圾邮件检测：看到这个内容并将它标记成垃圾邮件的百分比有多少？
创建精华列表：看到这个内容并将它加星标件的百分比有多少？
创建最受欢应列表：看到这个内容并将它转发给朋友的百分比有多少？

说了那么多，再来看看威尔逊得分区间的缺点，从上面的分析中也很容易发现问题，即排行榜前列总是那些票数最多的项目，新项目或者冷门的项目，很难有出头机会。

另外被成为当代故事会的知乎回答的答复貌似也是采用的威尔逊得分。

IMDB

IMDB.COM是目前互联网上最为权威、系统、全面的电影资料网站，里面包括了几乎所有的电影，以及1982 年以后的电视剧集。它所特有的电影评分系统深受影迷的欢迎，注册的用户可以给任何一部影片打分并加以评述，而网站又会根据影片所得平均分、选票的数目等计算得出影片的加权平均分并以此进行TOP250（最佳250部影片）和Bottom100（最差100部影片）的排行。

如果是你，你会如何进行排序？哪些维度会被你考虑在内？

点评数
点评分

以上两个因素都是正相关，如何确定哪个权重更高？比如：

电影A，十个人看过，全部评分均为10分
电影B，十万个人看过，评分平均值为8分

如何计算才能确定哪部电影更好看？有的人可能认为是A，有的人可能认为B，作为平台如何确定哪个更好？

IMDB排名算法采用的是贝叶斯定理确定的其分值。在了解贝叶斯定理前，我们想要来理清一些概念。

什么是概率？

抛一枚硬币正面向上的概率是多少？

频率学派：事件A在独立重复试验中发生的频率趋于极限p，那么这个极限就是该事件的概率。理论基础：事件本身具有某种客观的随机性。

不能重复试验的场景下的概率又是什么？

比如：苏州明天下午的概率是？

贝叶斯学派：把概率解释为对不确定的主管置信度，描述观察者知识状态在新的观测发生后如何更新。理论基础：同一件事情对于知情者而言就是「确定事件」，对于不知情者而言就是「随机事件」，随机性并不源于事件本身是否发生，而只是描述观察者对该事件的知识状态。

平均数定律

在赌场里或看到有趣的人类行为。当投骰子的人连续赢了几把的时候，有些赌徒就会认为他“手很顺”，打赌他还会继续赢。其他人说，根据“平均数定律”他接下来要输了，这样输赢才能平衡。从你的角度你认为他会赢还是会输。

在解答上述问题前，我们先来看一个数学题，抛硬币，连续三次向上，下一次抛硬币还是正面概率是多少？

概率学派：只要我们认可硬币是均匀的（正负概率各半），且为独立同分布，则结论仍然是50%。

贝叶斯学派：问题转换，你拿一个硬币，扔一百次，每当连扔出三个正面时你就把下一次投掷的结果记下来，最后你的结果里正反面各占多少？下一次投掷是正面的概率对不同的投掷次数 n、连续出现正面的次数 k 和单次投掷出现正面的概率 p 作图。“扔一百次，观察连扔出三个正面后下一次的结果” 对应着 n=100，k=3，p=0.5，所以下一次是正面的概率约为 0.46。

贝叶斯定理

贝叶斯定理是关于随机事件A和B的条件概率的一则定理。

$$P(A|B) = \frac{P(A)P(B|A)}{P(B)}$$

其中A以及B为随机事件，且P(B)不为零。P(A|B)是指在事件B发生的情况下事件A发生的概率。基于上式可推倒出：

$$P(B)=P(A,B)+P(A^C,B)=P(B|A)P(A)+P(B|A^C)P(A^C)$$

IMDB排名公式

$$WR=\frac{v}{v+m}R+\frac{m}{v+m}C$$

其中：

WR，加权得分
v，该电影的投票人数
m，排名前 250 名的电影的最低投票数（人为设定的，目前好像是25000）
R，该电影的用户投票的平均得分
C，所有电影的平均得分（现在为9）

针对该公式的解读：

IMDB为每部电影增加了25000张选票，并且这些选票的评分都为9。
假设所有电影都至少有25000张选票，那么就都具备了进入前250名的评选条件
假设这25000张选票的评分是所有电影的平均得分（即假设这部电影具有平均水准）
用现有的观众投票进行修正
长期来看，v/(v+m)这部分的权重将越来越大，得分将慢慢接近真实情况。

这样做拉近了不同电影之间投票人数的差异，使得投票人数较少的电影也有可能排名前列。值得注意的是，虽然很多影片在资料系统中得分很高，但由于未能达到TOP所要求的最低投票数而无法参加排行。

IMDB电影排名算法的缺陷：

新上映的电影短时间内评分上不去（点评量达不到要求）
能进入TOP 250的肯定是好电影，不是所有的好电影都能进入TOP 250

贝叶斯平均

把这个公式写成更一般的形式：

$$\bar{x}=\frac{C\times m+\sum_{i=1}^{n}x_i}{n+C}$$

其中：

C，投票人数扩展的规模，是一个自行设定的常数，与整个网站的总体用户人数有关，可以等于每个项目的平均投票数。
n，该项目的现有投票人数。
x，该项目的每张选票的值。
m，总体平均分，即整个网站所有选票的算术平均值。

这种算法被称为“贝叶斯平均”（Bayesian average）。因为某种程度上，它借鉴了“贝叶斯推断”（Bayesian inference）的思想：既然不知道投票结果，那就先估计一个值，然后不断用新的信息修正，使得它越来越接近正确的值。

在这个公式中，m（总体平均分）是“先验概率”，每一次新的投票都是一个调整因子，使总体平均分不断向该项目的真实投票结果靠近。投票人数越多，该项目的”贝叶斯平均”就越接近算术平均，对排名的影响就越小。因此，这种方法可以给一些投票人数较少的项目，以相对公平的排名。

“贝叶斯平均”也有缺点，主要问题是它假设用户的投票是正态分布。比如，电影A有 10 个观众评分，5个为五星，5个为一星；电影B也有 10 个观众评分，都给了三星。这两部电影的平均得分（无论是算术平均，还是贝叶斯平均）都是三星，但是电影A可能比电影B更值得看。

解决这个问题的思路是，假定每个用户的投票都是独立事件，每次投票只有n个选项可以选择，那么这就服从“多项分布”（Multinomial distribution），就可以结合贝叶斯定理，计算该分布的期望值。由于这涉及复杂的统计学知识，这里就不深入了。

问题：豆瓣的TOP 250排序？

StackOverflow

Stack Overflow是一个专门针对程序员的问答网站，它能解决代码开发中遇到的很多问题。StackOverflow的排序共分为两类，1个是问题排序，1个是答案排序。这里主要介绍的是关于热门问题的排序。

在分析问题前可以先考虑下，如果是你来做这个排名算法需要考虑哪些因素？

StackOverflow在开始设计热门排序规则时考虑的因素：

问题的投票数，StackOverflow允许用户投反对票，所以这里可以使用绝对投票数，即正面票-负面票数量。绝对数越高问题越热门。
答案的投票数，即是否存在一个被大量认可的答案。这里存在两种情况，被提问者认可或被其他访问者投票。多少的投票量可以认为是问题答案被认可也是需要考虑的问题。
问题的浏览量，或是有效浏览量，有效浏览量可以建立一个停留时间的阀值去衡量。浏览的越多则越热门。
问题的答案数，理论上说答案越多则问题的越热门，但这也并不绝对，有些好的问答可能只有一个好的答案。
问题的提问时间和问题的最近回答时间，问题的受欢迎程度应该是随时间变长而变得不热门。
提问者的声望和回答者的声望，声望越高的问题肯定质量越到，越值得去推荐。

在2008年8月23日的时候，StackOverflow的创始人Jeff Atwood曾经公布了一个热门问题的排名算法（链接）：具体为：

$$\frac{(\log_{10}Qviews)\times 4+\frac{Qanswers\times Qscore}{5}+sum(Ascores)}{((Qage+1)-(\frac{Qage-Qupdated}{2}))^{1.5}} = \frac{(\log_{10}Qviews)\times 4+\frac{Qanswers\times Qscore}{5}+sum(Ascores)}{(1+\frac{Qage}{2}+\frac{Qupdated}{2})^{1.5}}$$

Qviews（问题的浏览次数） log(Qviews)*4

某个问题的浏览次数越多，就代表越受关注，得分也就越高。这里使用了以 10为底的对数，用意是当访问量越来越大，它对得分的影响将不断变小。

Qscore（问题得分）和 Qanswers（回答的数量） (Qanswers * Qscore)/5

Qscore（问题得分）= 赞成票-反对票。如果某个问题越受到好评，排名自然应该越靠前。Qanswers 表示回答的数量，代表有多少人参与这个问题。这个值越大，得分将成倍放大。这里需要注意的是，如果无人回答，Qanswers 就等于0，这时 Qscore 再高也没用，意味着再好的问题，也必须有人回答，否则进不了热点问题排行榜。

Ascores（回答得分） sum(Ascores)

一般来说，”回答”比”问题”更有意义。这一项的得分越高，就代表回答的质量越高。但是简单加总的设计还不够全面。这里有两个问题。首先，一个正确的回答胜过一百个无用的回答，但是，简单加总会导致，1个得分为 100 的回答与 100 个得分为 1 的回答，总得分相同。其次，由于得分会出现负值，因此那些特别差的回答，会拉低正确回答的得分。

Qage（距离问题发表的时间）和 Qupdated（距离最后一个回答的时间） ((Qage+1) – ((Qage – Qupdated)/2)) ^ 1.5

Qage 和 Qupdated 的单位都是小时。如果一个问题的存在时间越久，或者距离上一次回答的时间越久，Qage 和 Qupdated 的值就相应增大。也就是说，随着时间流逝，这两个值都会越变越大，导致分母增大，因此总得分会越来越小。

此算法目前是否还继续使用或者是否改变不得而知。将其转化成Python代码为：

import time, math


def hot(Qviews, Qanswers, Qscore, Ascore, date_ask, date_active):
    Qage = round((time.time() - date_ask) / 3600)
    Qupdated = round((time.time() - date_active) / 3600)
    return (math.log10(Qviews) * 4 + Qanswers * Qscore / 5 + Ascore) / (pow((Qage + 1) - (Qage - Qupdated) / 2, 1.5))

Stack Overflow 热点问题的排名，与参与度（Qviews 和 Qanswers）和质量（Qscore 和 Ascores）成正比，与时间（Qage 和 Qupdated）成反比。以下为个人思考点：

为什么不使用“声望值”？

问题的质量与提问者的声望无正相关系
问题的答案与回答者的声望无正相关系
无名小辈也可以有精彩的问题与答案

提问的目的是获得正确的答案，而不是谁参与了此问题。声望值纳入容易造成，在没有声望认识加入的情况下，问题无法进入热门榜。

浏览量与分值的关系 log(Qviews)*4

这类对浏览量做了一次对数处理，主要目标应该是防止浏览量较大的问答占着榜单不动，抑制马太效应。这里再对结果*4，应该是由于10为第的对数抑制效果太大了，乘4稍微加大权重的影响。

针对此部分内容，我认为可以简化为：

$$ \log_{10}{x}=\log_{b}{x}\Rightarrow b=\sqrt[4]{10}=1.78$$

即将底数从10改为1.78，或者以2为底。

答案数和投票数与分值关系 $\frac{Qanswers\times Qscore}{5}$

这里的将答案的分值与答案数相乘，我个人认为是不适合。问题是否热门与回答数量正相关？与答案的分值正相关？这里将分数除以5，我的猜测是答案数、投票分的权重，考虑到问题答案数量普遍较少，猜想是想投票分的影响。

是否合理？

技术类问答，非开放性问题，往往答案只有一个，提问者的需求也仅仅需要一个答案
Qscore = 赞成票-反对票，如果这个问题存在较大的争议，赞成票与反对票接近，是否是一个热门的问题？

我建议的修改方案是：Qstatus * Qupvote：

Qstatus：是否有答案，没有为0，有为1
Qupvote：赞成票数量（考虑到Stackoverflow可能没有存赞成票数，用Qscore也可以）

答案投票数与分值关系 sum(Ascore)

是否合理？

问题A：有1个答案，投票数为10
问题B：有4个答案，投票数为4，3，2，1
问题C：有2个答案，投票数为10，-5

以上问题哪个更好？从现有的公式中最好的可能是A和B，实际上更高的或许应该是AC？

建议优化方案：Ascore只取投票数为正（Ascore>0）的答案，取每个分值平方和的开方（Square root of sum of squares）：$\sqrt{x_1^2+x_2^2+…+x_n^2}$

提问时间与最后解答时间与分值关系 $(1+\frac{Qage}{2}+\frac{Qupdated}{2})^{1.5}$

为什么要+1？防止问题刚提交时，公式中分母为0
为什么要÷2？把2小时作为最小的时间粒度单位
为什么要去5次方？添加“重力加速度”，提升曲线的陡度

如何理解影响关系？

发布时间越久，分值越低
回答时间越久，分值越低

总体评价：Stack Overflow的排序算法非常的简陋，还有很多优化空间。

SegmentFault

SegmentFault 参考了Stack Overflow的热门算法设置了自己的排序算法，具体排序算法如下：

热门文章

对于热门文章，使用了如下公式：

$$\frac{\lg(views)*4+recommendScore+collectScore+\ln(articleComments)}{(1+\frac{age}{2}+\frac{update}{2})^i}$$

其中

views：浏览量，对浏览量做了一次去对数处理，主要是为了防止某些浏览量较大的文章异军突起，待在榜单迟迟不动。
recommendScore：文章的推荐数，直接加和到分子中，作为文章热门程度的考虑因素。
collectScore：文章的收藏数，直接加和到分子中，作为文章热门程度的考虑因素。
articleComments：文章评论数，这个也作为一个影响文章热度的因素，不过为了降低其影响，对其作了一次取对数操作，主要是考虑到评论数量的影响力并没有上面两个的高。
(1 + age/2 + update/2)^i：分母是对时间因子的考虑，宏观上来看，就是文章热度和创建时间成反比。细节上，做成了个指数函数，可以通过对 i 变量的调控来改变时间因子在对热度的影响。
age：内容发布时间
update：内容最后更新时间（所有时间值单位均为 h/3600）
i：重力因子，取值的大小会直接决定热门排序（后面将介绍这点）

热门问答

对于热门问答，使用了如下公式：

$$\frac{\lg(views)*4+\frac{sum(Qanswers * answerScores + Qscore)}{5}+ln(commentScore)}{(1+\frac{age}{2}+\frac{update}{2})^i}$$

热门问答的计算参考了 Stack Overflow 对于回答数量和问题得票数的处理。同时，结合我们的实际，将评论的得票数也做为一个因素加入计算。

Qanswers / Qscore：分别是问题的答案数量和问题的得票数
anwserScores / commentSocres：分别是该问题下所有答案的总得票数和所有评论的总得票数
update：该问题下答案的最新更新时间

其余的变量含义和文章算法相同。

日/周/月热门

首先要明确各类不同热门内容的目的。

日热门的主要目的就是突出最近一天内的热门内容，更方便于内容被大家看到，文章快速地形成讨论、受关注的问题尽快得到解决；
周热门的主要目的很明确，就是突出过去一周内的热门内容，同时，给新产生的优秀内容机会，让其有机会进入热门列表；
月热门同周热门目的一样，但更需要给新内容进入列表的机会，以让内容经常更新。

所以，该怎么做呢？对于同一内容，上面的计算公式均可简化为：$\frac{s}{t^i}$

S是总得分指标
t为时间量
i是变量重力因子

可以看出，其热度和创建时间成反比，那么这个反比的值最终就由重力因子 i 来影响。

日热门为了突出新热内容、过滤时间过久的热门内容，需要增大重力因子，尽可能排除 24 小时之外的热门内容；周热门和月热门则需要按时间要求依次逐渐降小 i 值。

关于指数 i 值的选定，采取了估算：绘制出一定范围内时间和文章热度的指数函数的图，然后根据需求挑选满足自己条件的指数值。如下图：

多次估值测试，最终分别将日、周、月的 i 值选取为 1.0、0.5、0.3。

参考链接：

How Hacker News ranking algorithm works
How Reddit ranking algorithms work
What formula should be used to determine “hot” questions?
知乎如何对回答进行排序？你的一票很重要
SegmentFault 热门内容优化

机器学习算法之决策树分类
机器学习之距离与相似度计算
深度学习之BP神经网络

你可能感兴趣的:(产品,术→技巧,研发,排序算法)

广州的高仿表在哪里买，盘点十个广州高仿表批发渠道腕表鞋屋
广州，作为中国最大的表类产品批发市场之一，聚集了众多高仿表厂家和商家，其中不乏品质上乘、价格合理的高仿名表。那么，在广州到底在哪里可以买到高仿表呢？下面就为大家盘点广州十大高仿表批发渠道。微信:798445980(下单赠送精美礼品)1.北京路钟表街：这里不仅有著名的珠宝首饰市场，还有很多经营高仿表的店铺。虽然并非专业的手表市场，但产品种类丰富，属于旅游购物区，方便观光购物。2.海珠手表城：是广州最
他卖汽车被同行群起而攻之，遇到困难，最重要的不是“勇于面对” 日梦白
原来早些时候，自己在淘宝上开店卖东西，看到许多一样的产品标的价格都比我低，而自己根本也想不出有什么好办法同他们竞争，毕竟产品是一模一样，那么消费者为何不去选价格低的呢？受到打击，于是作罢。后来，有位朋友开公司也是贩卖商品，原本销路不错的东西，后来引来一大堆的模仿者，再后来市场竞争越来越激烈，生意开始出现了亏损。收到打击，于是作罢。当年，有一家上市公司叫做霸王集团，他家的中药洗发水还请了成龙来做广告
商家怎么开通抖音团购？古楼
商家想要开通抖音团购权限有两种方式，一个是注册企业号，还有一个是开通抖音蓝v，接下来我们来说说企业号怎么开通抖音团购权限。高省只是一个导购的优惠平台！不卖产品！它对接淘宝天猫，京东，拼多多，唯品会等电商平台，在原传统电商的基础上，加入了分享经济的元素，也就是传说中的自用省钱，分享赚钱。零成本创业一直备受创业者们的喜欢，不需要投资只需要投入自己的业余时间即可，如果一个项目不需要你投钱，那就尝试一下哪
在哪里买高仿手表,分享八个最新购买渠道鸿运工作室
在当今市场上，高仿手表因其价格实惠、外观精美而备受追捧。然而，许多消费者在购买高仿手表时常常面临着一个问题：在哪里购买？本文将为您分享八个最新购买高仿手表的渠道，帮助您轻松找到心仪的款式。【更多详情加薇信了解：FB2260】一、官方网站许多品牌都有自己的官方网站，上面会销售正品高仿手表。消费者可以通过官方网站了解产品的详细信息，包括材质、功能、尺寸等，同时还可以享受品牌提供的售后服务。在购买时，建
使用 C++ 和 OpenCV 进行表面划痕检测 whoarethenext c++opencv 开发语言划痕检测
使用C++和OpenCV进行表面划痕检测在工业自动化生产中，产品表面的质量控制至关重要。划痕作为一种常见的表面缺陷，其检测是许多领域（如金属、玻璃、塑料制造）质量保证流程中的一个关键环节。本文将介绍如何使用C++和强大的计算机视觉库OpenCV来实现一个基本的表面划痕检测算法。核心思路划痕通常在图像中表现为具有以下一个或多个特征的区域：高对比度的线性结构：划痕区域的像素强度通常会与其周围背景有明显
名人名言摘录第670期（一辈子很长总得找点乐子）林窗鲸落
是否有一句话，在不经意间给你莫大的触动和鼓励？是否有一句话在你最需要的时候出现在你的生命中，又不经意间在影响着你。1、生活能够治愈的，都是愿意好起来的人。——佚名2、好运只是个副产品，只有当你不带任何私心杂念，单纯地去做事情时，它才会降临。——马克·安德鲁斯3、人不管走到哪一步，总得找点乐子，想一点办法，老是愁眉苦脸的，干嘛呢！——汪曾祺4、高台只在人心之上，壮志不止方寸之间。——某音朱铁雄5、未
佳能A系列数码相机(A720 IS)拍摄技巧大全 weixin_34238642 photoshop 操作系统人工智能
佳能A系列数码相机(A720IS)拍摄技巧大全强文一篇,可惜作者不详,向作者致敬1、点测光怎么用？点测光是从P档开始的手动档才有的测光方式，从AUTO开始的自动档没有。首先转到这些档，按相机最中间的那个功能键，出现调节菜单，然后用上下键调到测光处，再用左右键调到中间只有一个点的测光方式，按功能键（func)确定，然后半按快门键对准需要测光的部位到绿框内，快门保持半按，再按一下左上角那个+/-键，使
我花钱，你受益，免费干货送给想学写作的你！俪璇
有幸通过朋友介绍认识新媒体写作教练弗兰克，并参加了他的499元的写作特训营。时间：14天任务：根据每日主题(其间穿插四次老师的视频指导课程)，连续14天作业，每篇666+，并在公号或朋友圈发布。福利：完成任务返现300元。我真是乘兴而来，满载而归！14天的听课+动手，不仅让我学会了写作技巧，而且学会了用写作的思维去工作，学习和生活。每天利用刷微信，聊QQ，骑车，甚至上厕所的时间构思、码字，每天的任
游卡，快手，蓝禾26届秋招/提前批/实习内推 u010022905 算法 c语言前端关卡设计游戏美术
游卡，快手，蓝禾26届秋招/提前批/实习内推①游戏大厂-游卡26秋招内推【岗位】产品策划，发型运营，程序技术，美术表现，职能综合【一键内推】https://app.mokahr.com/m/campus_apply/yokagames/41940?recommendCode=DS5y8jth&hash=%23%2Fjobs#/jobs【内推码】DS5y8jth①快手2026届快STAR-X提前批校
Rock Robotic-无人机测绘 moonsims 人工智能
RockRobotic-无人机测绘RockRobotic公司简介RockRobotic是一家总部位于美国的无人机测绘技术公司，专注于：高精度LiDAR载荷系统一体化三维测绘解决方案云端数据处理平台（RockCloud）公司定位于“LiDAR即服务”，为工程师、测绘师提供即插即用的硬件+简单易用的软件服务。目标用户群：土地测绘公司、电力巡检、地籍建模、林业资源单位等。RockRobotic产品发展历
写好文章第一步 386_be08
优秀的写作能力并不是一种天赋。的确，像托尔斯泰、莎士比亚等这些大文豪之所以如此突出一方面是因为他们具有一种天赋，一种来自于性格、阅历及信仰的天资。但是，准确地驾驭写作文字这样一种能力则不是与生俱来的，它和其他所有技巧一样，是后天经过专业培养、训练出来的。今天，就来讲一下写好文章，如何迈出第一步1、明确学习写作目的明确写作目的，自己为什么要写作？只有目的明确过后才有可能写出好文章。在这里，我总结了两
手撕C语言数组：从青铜到王者的逆袭之路！！！
文章目录一、数组的"出生证明"（超重要！）1.1数组的定义姿势1.2数组初始化の艺术二、数组内存布局大揭秘三、新手必踩的5大深坑（血泪教训）3.1数组越界访问3.2sizeof的陷阱3.3数组赋值妄想症四、高手进阶技巧（秀起来~）4.1动态计算数组长度4.2多维数组の奥义4.3数组与指针的量子纠缠五、实战代码示范5.1数组反转算法5.2数组去重骚操作六、总结与思考天天用数组，你真的了解它吗？这个看
AI人工智能领域TensorFlow的模型训练策略 AIGC应用创新大全人工智能 tensorflow python ai
AI人工智能领域TensorFlow的模型训练策略关键词：TensorFlow、模型训练、深度学习、神经网络、优化策略、分布式训练、迁移学习摘要：本文将深入探讨TensorFlow框架下的模型训练策略，从基础概念到高级技巧，全面解析如何高效训练深度学习模型。我们将从数据准备、模型构建、训练优化到部署应用，一步步揭示TensorFlow模型训练的核心技术，并通过实际代码示例展示最佳实践。背景介绍目的
文心一言API接入指南：手把手教你快速集成AI能力 AIGC应用创新大全文心一言人工智能 ai
文心一言API接入指南：手把手教你快速集成AI能力关键词：文心一言API、大模型集成、开发者指南、AI能力调用、API接入实战摘要：本文是面向开发者的文心一言API接入全流程指南，从注册账号到代码调用，用“手把手”式讲解+实战案例，带你快速掌握大模型能力集成方法。无论你是想给产品增加智能对话功能的中小团队，还是想尝试AI开发的个人开发者，读完本文都能轻松上手文心一言API！背景介绍目的和范围近年来
多模态查询优化：5个提升搜索准确率的技巧
多模态查询优化：5个提升搜索准确率的技巧关键词：多模态搜索、特征融合、跨模态对齐、混合索引、语义增强摘要：本文将揭示5个提升多模态搜索准确率的实用技巧，通过生活化案例和代码示例，带您理解如何让图像、文本、语音等不同模态数据协同工作，构建更智能的搜索引擎。背景介绍目的和范围本文旨在帮助开发者和产品经理理解多模态搜索的核心优化技术。涵盖从基础概念到实战应用的完整知识体系，重点解析5个提升准确率的关键技
数据结构与算法里散列表的算法优化技巧数据结构与算法学习散列表算法数据结构 ai
数据结构与算法里散列表的算法优化技巧关键词：散列表、哈希冲突、负载因子、开放寻址法、链地址法、动态扩容、哈希函数优化摘要：本文将深入探讨散列表的核心原理与优化技巧，通过图书馆管理员的比喻揭示哈希冲突的本质，结合Python代码演示动态扩容策略与哈希函数优化方法，最后通过实际案例展示如何将查询速度提升300%。文章包含5个可视化流程图和3个完整代码实现。背景介绍目的和范围本文面向已掌握基础数据结构知
原来区块链相关的工作缺位这么大木木大木木
图片发自App区块链技术的研发也已经经历了好几个年头了，有最初的一无所知到后来的雏形的建立再到现在的应用落地的研发，这个历程经过不仅见证了区块链技术的一步一步的成熟和完善，同时与区块链相关的产业也在不断的扩大，因此这个行业对人才的需求也在不断的增多，但是市场中可以从业这方面工作的专业人才却是寥寥无几的，人才的欠缺和行业的快速发展是极其不匹配的，这在一定程度上对行业的发展也有阻碍的影响。下面就和大家
打造MVP：最小可行产品开发指南 AI天才研究院 AI大模型企业级应用开发实战 Python实战 AI人工智能与大数据 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
打造MVP：最小可行产品开发指南关键词：MVP，最小可行产品，产品开发，快速迭代，用户体验，商业策略摘要：本文旨在详细探讨最小可行产品（MVP）的概念、价值以及开发流程，通过分析市场调研、资源优化、快速验证和迭代优化等关键步骤，为读者提供一套完整的MVP开发指南。文章还将通过成功案例分析，总结MVP开发的最佳实践，并展望未来发展趋势。目录大纲：《打造MVP：最小可行产品开发指南》第一部分：MVP概
购物省钱利器！学会回收京东购物券的技巧！浮沉导师
在京东购物中，购物券是一种常见的优惠方式。很多消费者对于购物券的回收方式和使用方法还不太了解。本文将为您详细介绍回收京东购物券的过程，以及京东购物券使用教程。大家好！我是高省APP最大团队&联合创始人浮沉导师！【高省】APP网购优惠券免费领，分享还能赚钱。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台。佣金更高，模式更好，终端用户不流失。0投资，稳定可靠，百度有几百万篇报道，期待你的加入。浮沉
2021-11-03 射频消融快乐的老猫
昨晚做了射频消融术，一切顺利。五点钟进手术室，尹晓盟主任主刀，一个半小时的手术过程一直处清醒的状态。同室的病友说他痛的几乎没坚持下来，我觉得还是可以耐受。相对于以前的治病经历，对猫来说，昨晚顶多就是场小雨。在病床上静卧一夜，今天上午开始下床活动，中午就办理了离院手续。回家的路上，走进一间名为浅草的日料店，准备大吃一顿补补这些日子的亏空，再来一杯扎啤庆祝一下。家人掏出出院医嘱给我看，三个月内以清淡饮
摆地摊卖什么最赚钱而且很受欢迎高省_飞智666600
一：卖什么产品最赚钱？其实摆地摊这个行业，本身就是一个很好的创业项目。但是，并不是所有的人都有这个资本去摆摊，所以，选择一个好的产品也是至关重要的。现在网上最火的地摊经济，不就是卖东西吗？但是很多人就会想问，我在摆地摊过程中卖什么产品最赚钱？那么今天我就来给大家说一说。首先就是卖吃的东西，这类产品一般都比较火爆。还有一类产品就是卖一些电子产品方面的东西。还有一类就是卖生活用品或者说一些小用品等等。
交互说明撰写案例：从页面结构到动态规则的实战示范 SickeyLee 产品经理 prd文档
交互说明撰写案例：从页面结构到动态规则的实战示范交互说明的价值，最终要通过实际案例来体现。一份好的交互说明，能让开发团队准确理解每个按钮的点击反馈、每个列表的加载逻辑，甚至每个文字的显示规则。本文以一个APP首页为例，详解交互说明的撰写步骤、核心规则和实用技巧，帮你掌握从“页面结构”到“动态交互”的完整撰写方法。一、页面说明：理清结构是基础在撰写交互说明前，首先需要明确页面的整体框架和访问路径，这
中原焦点团队网络37期孟&坚持分享第13天凌_777
以重新建构的眼光找到当事人难能可贵之处打破生活中理所当然的视框，浮现无所不在的正向素材咨询师可以试着看到当事人优异表现之外，值得肯定的小小优点，要看到这样的优点，可以加入重新建构的技巧，比如当事人工作业绩不佳，但是当事人至少还拥有积极冲刺的决心；考试成绩不佳的学生仍有努力考试的尝试；犹豫是否要结束生命的当事人，还有稳住他的力量，值得大大肯定与开发；被同时攻击而没有还手的当事人，至少有一颗不愿意伤害
[硬件电路-40]：从物理世界到数字软件，信号处理的共通性
前言：从激光的光信号，到电磁波信号处理，到模拟电路的信号处理，到数字电路的信号处理，到软件的信号处理。从纯粹的物理世界到虚数字化的虚拟世界。从技术的角度看，都在做了相同的事：放大、衰减、滤波、变频、调制、解调、加法、减法、乘法、除法、积分、微分……。不同的是，实现的物理手段不同而已，对信号处理的多样性和灵活性反倒是越来越高。从产品开发、研发流程、项目管理、商业角度看，形式上有所差异，核心上没多大的
2021，从“心”出发--稻盛和夫《心》读后感-2 一心二艺
2021.01.01#日更#day22/2555我个人一直认为，信心只有两种状态，100%有信心的笃定，以及没有信心。信心不存在中间状态。所谓的90%的信心，或者60%的信心，其实就是没有信心。我的这种想法在稻盛和夫的《心》中也得到了印证、稻盛说成功人士和非成功人士的差距，关键在于，当遭遇前所未见的巨大障碍时，能不能对自己说”一定能跨越“。每当被问到’产品研发的成功率时多少时‘时，稻盛和夫都会毫不
Appium 简介 AIZHINAN appium 测试工具自动化测试
Appium是一个开源的移动应用自动化测试框架，用于测试原生应用(native)、混合应用(hybrid)和移动网页应用(mobileweb)。它支持iOS、Android和Windows平台。https://www.bilibili.com/video/BV1R93szkEhi/?App自动化测试：App测试Appium+UiAutomator2技巧、实战项目核心特点跨平台：同一套API可用于i
教育科技产品设计：从公司背景到 MVP 方案的落地思路 SickeyLee 产品经理 prd文档需求文档
教育科技产品设计：从公司背景到MVP方案的落地思路在教育科技领域，一款成功的产品不仅需要贴合用户需求，更要与公司战略、行业特性深度匹配。对于新人产品经理而言，理解公司背景、把握项目定位是设计产品方案的第一步。本文以一家专注数字化人才培养的教育科技公司为例，详解如何从公司资源出发，设计符合行业规律的MVP产品方案，为产品落地奠定基础。一、公司背景：理解产品的“土壤”与“边界”任何产品都诞生于特定的公
基于Spring Boot的农村农产品销售系统设计与实现不若浮生一梦计算机毕设 spring boot 后端 java
随着现代农业的快速发展，传统农产品的销售模式逐渐暴露出信息闭塞、流通效率低和中间环节多等问题。为了打破这些瓶颈，我基于SpringBoot框架开发了一套农产品销售系统，旨在构建一座连接农民与消费者之间的数字桥梁，让优质农产品更高效地直达用户餐桌。一、项目背景与目标在农村，很多优质农产品因缺乏渠道和系统管理而难以获得市场认可。而当前电商平台对小农户并不友好，技术门槛和抽成比例较高。因此，我希望通过构
当追女生陷入僵局…… Getty彤
不知道一个人能坚持一件事坚持多久。在仅知道对方的名字与学院，并通过各种关系加上了对方微信，而对其他一无所知的时候，你还能坚持喜欢她吗？虽然你加了她微信，却无法与她正常聊天，无法施展自己从前屡试不爽的撩妹技巧，甚至发现对方根本无视你所谓的“喜欢”。我坚持了一个月……所有情义基本上都表达了，但毫无进展，没有任何突破口，而她对是否会答应你也不置可否，就像是在做高数题时，陷入一个无法跳出的坑，解下去无望，
常州紫云府|细致入微的万千美好，原来就在身边 365淘房常州
匠心品质一脉相承一座座建筑闪耀城市的背后，不仅是对开发运营模式的探索和创新，更凝聚着华润置地对城市建设、运营以及发展的思考与实践。作为华润置地的精铸匠造产品，紫云府在择址、配套、建造上，每一细节皆为紫云府对主城人居生活的深刻解读。紫云府效果图择址常州城市几何中心，落子龙城十字轴脉，周围生活配套齐全，5大繁华商圈环绕，出门即是弘阳广场，趣享多种娱乐业态；与荆川公园为伴，向西出行便是皇粮浜湿地公园，生
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri