lzt1983

[置顶] Netflix推荐系统：从评分预测到消费者法则

原文链接：Netflix recommendations: beyond the 5 stars (Part 1), (Part 2)

原文作者：Xavier Amatriain and Justin Basilico

翻译：大魁

前言

Nexflix是一家提供在线视频流媒体服务和DVD租赁业务的公司，也是著名的Netflix大奖赛的发起者。如果读者希望进一步了解Netflix，建议读一下和讯上的一篇文章：

Netflix：从传统DVD租赁向流媒体华丽转身

以及爱范儿上的：

Netflix成功的背后：高薪，高标准，高淘汰率，股票，无限制休假，恐惧文化，垃圾便当午餐

在这篇博文中，作者为我们掀开了Netflix最有价值的资产--推荐系统的面纱。

全文分两部分。在第一部分中，作者首先介绍了Netflix Prize对智能推荐领域的贡献，Netflix推荐服务的主要模块，以及推荐服务如何满足网站的商业需求；第二部分中，作者描述了系统使用的数据和模型，讨论了如何将离线的机器学习实验与线上的AB testing相结合。

第一部分

Netflix大奖赛与推荐系统

在2006年，我们启动了Netflix大奖赛，是一个机器学习和数据挖掘的比赛，旨在解决电影评分预测问题。我们举办这个比赛的目的是为了发现更好的方法来向我们的用户推荐产品，这是我们商业模式的核心任务。对于能够将我们的Cinematch系统的准确率提升10%的获胜团队，我们准备了一百万美元的大奖。当然，我们需要一个比较容易评测和量化的问题定义，我们选择的评测指标是RMSE--预测的评分与真实评分相差的均方根（root mean squared error）。竞赛的要求是要打败我们0.9525的RMSE得分，并将其降低到0.8572或更低。

竞赛开始一年之后，队伍Korbell以8.43%的提升赢得了第一个半程奖。他们付出了超过2000小时的努力，融合了107种算法才得到了这份奖金。他们将源代码提供给了我们。我们分析了其中2种最有效的方法：矩阵分解（SVD）和波尔兹曼机（RBM）。SVD能取得0.8914的RMSE，RBM是0.8990，将这两种方法线性融合能达到0.88。为了将这些方法应用到实际系统，我们必须克服一些限制，例如比赛的数据集是一亿个评分，但实际的线上系统是50亿个，并且这些方法的设计并没有考虑用户不断产生新评分的情况。但是我们最终克服了这些挑战，并将这两种方法用到实际产品中，而且直到现在还作为系统的一部分在运行。

如果读者对此次竞赛有过关注的话，可能对2年后大奖的归属很感兴趣。大家后2年的工作也确实令人印象深刻，数百种预测模型被融合到一起，最终突破了0.8572的临界线。我们评测了一些最新的离线算法，但是很遗憾，这些在竞赛数据集上优胜的算法，到了线上系统却表现的不够出色。考虑到系统实现以及部署的代价，我们最终并没有应用到我们的线上环境。

与此同时，我们的关注点也从提升Netflix的个性化体验转移到了新的领域。接下来我们会讲述具体的原因。

从美国DVD租赁到全球视频流媒体服务

过去几年间，我们对推荐算法的关注点发生了变化，原因在于Netflix公司的业务也在不断变化。在Netflix Prize举办一年之后，我们发布了实时的流媒体服务，流服务不仅仅改变了用户与系统的交互方式，也改变了推荐算法的数据来源。对DVD租赁业务来说，目标是帮助用户找到电影，并在接下来几天邮寄到用户邮箱。用户从选择电影到观看电影，当中需要延迟几天，因此系统收到反馈的时间比较长；用户如果不满意，进行更换的代价比较大，所以用户一般会仔细挑选。而对流服务的用户来说，选好一部电影立马就可以观看，甚至可以在很短时间内观看多部，同时，我们也可以知道用户是看完了整部电影，还是只看了一部分。
另一个巨大的变化是，网站从单纯的web端扩展到了成百上千的不同设备，例如与Roku播放器和XBOX的集成在2008年就发布了，又过了一年，Netflix流服务登陆了IPhone，到现在为止，各种Android设备以及最新的AppleTV上都有Netflix的身影。
两年前，我们发布了加拿大版，2011年我们在43个拉美国家启动了我们的服务，最近我们还登陆了英国和爱尔兰。今天，Netflix遍布47个国家，共有2300万的订阅用户。上个季度，这些用户通过几百种不同的设备，观看了20亿个小时的视频。每一天，有200万的电影和电视剧被观看，并新增400万个用户评分。
我们已经在这些新的场景中添加了个性化服务，现在有75%的视频观看是与推荐系统有关。这些成就的取得源于不断优化的用户体验，通过优化算法，我们的用户满意度有了显著提升。下面我们将展示一些推荐系统的技术和算法。

推荐无处不在

经过几年的积累我们发现，在Netflix中尽可能地集成推荐系统的个性化功能，会对我们的订阅用户产生巨大的价值。首页上的个性化包含了按行展示的视频，每一行有一个主题，主题揭示了这行视频的内在联系。大多数的个性化都是基于挑选行视频的方法，包括哪些行该放哪些视频，以及如何对视频排序。

以最顶部的10行为例：我们猜测你最可能喜欢这10个主题。当然，我们说“你”的时候也包含了你的家人。不得不提的是，Netflix的个性化是针对每一个家庭，而一个家庭的不同成员很有可能兴趣不一致。这也是为什么要选10行视频的原因，我们要为“爸爸“，”妈妈“，”小孩“或者整个家庭来做推荐。即使是这个家庭只有一个用户，那我们也想兼顾到这个用户的不同兴趣和情绪。正是因为如此，我们系统的目标不仅是准确性，还包括结果的离散程度。

Netflix个性化系统的另一个重要元素是认知（awareness）。我们想让我们的用户知道我们是怎么把握到他们的喜好的。这不仅仅能使用户信任我们的系统，而且鼓励用户提交更多的反馈来帮助我们的推荐做到更好。个性化系统的另一个可以提升信任度的方式是提供推荐理由：为什么我们要推荐这部电影或剧集？不是因为它满足了我们的商业需求，而是基于我们从用户那里获得的信息（用户的评分、观看记录、用户朋友的推荐等等）。

还有基于好友的推荐，我们最近刚刚在47个相关国家中的46个发布了我们的Facebook连接组件，只有美国除外，这是因为考虑到VPPA（《录像隐私权保护法案》，1998）的影响。通过了解朋友们在做什么，不仅仅为我们的推荐算法提供了另一个数据来源，也使我们能够以“社交圈”为主题生成几行新的推荐结果。

我们的推荐服务中让人印象深刻的一点便是“风格”为主题的几行推荐结果。这里包含了像“喜剧”这样的大类，也包含了"时空穿越剧“这样的非常长尾的小类。每一行的展现都考虑了三个方面：选择哪一种风格；选这个风格里的哪些视频；这些视频如何排序。用户对这个模块的关注度是很高的，当我们把长尾的类别放到前面的时候，检测到用户停留时间有明显的增长。新颖性和多样性也是我们选择视频时要考虑的因素。

我们也为每一行的选择提供了推荐理由，有些是基于隐式反馈：最近观看、用户评分和其他交互，有些是基于显式反馈，显式反馈是通过我们邀请用户做口味偏好测试得来的。

基于相似性的推荐也是我们提供个性化服务的一方面。相似性是一个很宽泛的概念，描述的对象可以是不同的电影、用户，也可以是评分、视频元信息等。这些相似性的计算也会用于别的模块。基于相似性的推荐用在多种场景之中，例如当用户搜索一个电影或者把一部电影放到观看列表的时候，也可以用来生成”动态风格“的推荐结果，这些结果是基于用户最近看过的视频。

上述的场景，包括优选的10行推荐、风格推荐、基于相似性的推荐，都要涉及到排序算法，这是提供有效的推荐结果的关键一步。排序系统的目标是为不同的场景发现用户最感兴趣的视频。我们把排序系统分解为：评分、排序、过滤几部分。我们的商业目标是最大化用户的满意度和每月订阅比例，这实际上等价与最大化用户对视频的观看次数。因而我们把用户兴趣得分最高的视频推荐给用户。

现在我们很清楚，Netflix Prize对电影评分的预测，只是构建有效的推荐系统的众多组成的一种。我们也需要考虑像用户场景、视频流行度、新颖性、多样性、用户兴趣、可解释性等方方面面。为了兼顾这些要素，我们要挑选合适的算法。在下一部分，我们将要详细地讨论排序问题，同时也涉及到我们的数据和模型，以及我们为满足以上需求所做的创新。

第二部分

在第一部分中，我们详细介绍了Nexflix推荐系统的各个部分。我们也解释了从Netflix Prize开始，我们的推荐系统是如何随着时间演变的。付出一百万美元的奖金为我们换来了丰厚的回报，不只是是算法的创新，也提升了我们的品牌价值，并吸引了优秀的人才加盟。评分预测只是我们的世界级的推荐系统的一部分功能，在接下来的部分中，我们将要介绍更为广泛的个性化技术：我们会讨论下我们的模型、数据，以及我们在这方面的创新方法。

排序算法

推荐系统的目的在于提供一些有吸引力的物品供用户选择。具体做法是先选择一些候选物品，并对这些物品按照用户感兴趣的程度排序。展示推荐结果的最常用的方式是组成某种有序列表，例如在Netflix中，列表就是一行行的视频。因此，我们需要借助一个合适的排序方法，利用各种各样的信息，来为每一个用户生成个性化的推荐列表。

最显而易见的排序方法，就是根据物品的热门程度排序。选择热门推荐作为基准算法的原因也很明显，用户总是倾向于购买大家都喜欢的物品。但是，热门推荐是个性化推荐的反义词，它为每一个用户生成的结果千篇一律。因而，我们的目标就是找到一个比热门推荐更好的个性化排序算法，以满足不同用户的不同口味。

既然我们的目标是推荐用户最可能观看的视频，最自然的方法就是利用用户对视频的评分的预测值，来代替视频的热门程度。但这样也有个问题，用户评分高的很可能是小众的电影，但用户往往更喜欢看那些虽然评分不高，但是比较流行的电影。因此，最好的做法是兼顾视频的热门程度和用户的期望评分。
有很多方法可以用来设计排序系统，比如评分排序方法、配对优化方法、全局优化方法。举例说明，我们可以设计一个简单的评分排序方法：对视频热门程度和用户期望评分进行线性加权：(u,v) = w1*p(v) + w2*r(u,v) + b，其中u表示用户，v表示视频，p表示热门函数，r表示期望评分。这个公式可以通过一个二维空间表示，如下图：

一旦我们设计好了评分函数，我们就可以输入一组视频，并对它们基于评分由高到低进行排列。你可能很好奇我们怎么选择w1和w2的值，换句话说，怎么确定热门程度更重要，还是用户的期望评分更重要？这个问题最少有两种解决方案。你可以对w1和w2简单的选一些候选数值，放到线上进行A/B测试。这种做法虽然比较耗时，但是代价仍旧可以接受。另一个方案是用机器学习的方法：从历史数据中选择一些正样本和负样本，设计一个目标函数，让机器学习算法自动地为w1和w2学习一个权重。“ Learning to rank”就是用来解决这个问题的，现在已经在搜索引擎和广告精准匹配领域得到了广泛应用。但推荐系统的排序任务有一个很重要的区别--个性化，我们不是要获得一个全局的w1和w2权重，而是想为每个用户有一个个性化的值。

你可能想到，除了热门程度和用户期望评分，我们在Netflix推荐系统还试了很多别的特征，有些没有效果，有些明显地提升了系统排序精度。下图展示了我们通过添加不同的特征和优化机器学习目标函数，对排序性能的改进效果。

许多分类算法可以用于排序系统，例如逻辑斯特回归（Logistic Regression）、支持向量机（Support Vector Machines）、神经网络（Neural Networks）、决策树（Decision Tree）、以及GBDT（Gradient Boosted Decision Trees）。另一方面，许多算法在过去几年中被应用到Learning to rank领域，像RankSVM和RankBoost。对于一个给定的排序问题，找到效果最好的算法并不容易。通常，你的特征越简单，模型就可以越简单。但是有一个值得注意的地方是，有时候一个特征不起作用，恰恰是是因为你选的模型对它不友好；或者一个很好的模型在系统中表现不好，可能是因为你用的特征跟模型不匹配。

数据和模型

在为用户构建一个完美的个性化体验的过程中，拥有优质的数据和选择合适的模型，对我们的排序算法都十分重要。很幸运的是，在Netflix我们既拥有大量相关的数据，也有很多天才的工程师能够将数据特征转化为产品。以下是我们的推荐系统中用到的数据源。

我们有几十亿的用户评分数据，并且以每天几百万的规模在增长。
我们以视频热度为算法基准，但是我们可以用来计算热度的数据源也是很丰富的。可以在不同的时间段内进行统计，例如最近一小时、一天、或者一周。可以将用户按照地域划分，计算视频在某部分用户中的热度值。
我们的系统每天产生几百万次播放，这些播放的场景也带来很多特征，例如播放时长、播放时刻、设备类型。
我们的用户每天将几百万不视频添加到他们的播放列表。
每个视频拥有不同的属性信息：演员、导演、类型、评分、评论。
视频展现方式：我们知道推荐的视频是在什么时间、什么位置展现给用户的，因而可以推断这些因素如何影响用户的选择。我们也能够观察到用户与系统交互的细节：滚动鼠标、悬停鼠标、点击，以及在页面的停留时间。
社交网络信息最近也成为我们的数据源，我们可以知道用户的好友们都在看什么视频。
用户每天要进行几百万次搜索请求。
上述的所有数据源都来自于我们自己的系统，当然我们也可以获取外部数据，例如电影的票房、影评家的点评。
以上并非全部，还有诸如人口统计数据、地点、语言、时间数据（temporal data，或者为临时数据）等都可以用来预测用户兴趣。

介绍完数据，那选什么模型呢？我们发现，有这么多种高质量的数据，单一的模型是不够的，我们必须要做模型选择、模型训练和测试。我们用了许多种的机器学习算法：诸如聚类这种无监督方法，还有一些有监督的分类方法。如果你对推荐领域的机器学习算法感兴趣，以下是一个不完整的方法列表。

线性回归（Linear Regression）
逻辑斯特回归（Logistic Regression）
弹性网络（Elastic Nets）
SVD（Singular Value Decomposition）
RBM（Restricted Boltzmann Machines）
马尔科夫链（Markov Chains）
LDA（Latent Dirichlet Allocation）
关联规则（Association Rules）
GBDT（Gradient Boosted Decision Trees）
随机森林（Random Forests）
聚类方法，从最简单的k-means到图模型，例如Affinity Propagation
矩阵分解（Matrix Factorization）

消费者法则

丰富的数据来源、度量方式和相关的实验结果，使我们能够以数据驱动的方式来组织我们的产品。从Netflix建立伊始，这种方式就成了公司的基因，我们称其为消费者法则（Consumer Data Science）。总体来讲，我们的消费者法则的目标是通过不断创新，来使我们的和用户得到便利。真正的失败是没有创新，就像IBM的创始人Thomas Watson先生所说，”如果你想要获得成功，那就不要畏惧失败。“（ If you want to increase your success rate, double your failure rate.）我们的创新文化要求我们能够快速高效地通过实验来检验我们的想法，只有我们把试验完成，我们才能够理解，这个想法为什么成功或者失败。如此，我们能够专注于提升我们的用户体验，而不是把时间浪费在无用的想法上。

实际工作中，如何贯彻实施这个理念呢？跟传统的科学研究有些不同，我们对想法的验证是借助线上分流测试（A/B tesing, bucket testing）。
1. 提出假设

待检验的算法/特征/设计X能够帮助提升视频播放时长，并且提升用户停留时间。

2. 设计实验

开发解决方案或原型系统。想法的最终效果可能是原型系统的2倍，但一般没有10倍那么多。

考虑清楚系统的外部依赖、操作、重要性。

3. 进行测试
4. 让数据说话
当我们做A/B测试的时候，我们会记录多个维度的指标，但最信任的还是视频播放时长和用户停留时间。每一次测试通常覆盖到几千个用户，并且为了验证想法的方方面面，测试会分成2到20份进行。我们一般都是平行开展多个A/B测试，这使我们能够实验一些激进的想法，并且能同时验证多个想法，最重要的是，我们能够通过数据驱动我们的工作。关于我们A/B测试的详细介绍，请参考我们的技术博客和我们首席产品官Neil Hunt 在Quora上的回复。
我们必须面对一个有趣的挑战，如何把我们的机器学习算法融入到Netflix以数据驱动的A/B testing文化中。我们的应对方式是既做离线测试，又做线上测试。离线测试是在线上测试之前，我们先优化并检验我们的算法。为了度量算法的离线性能，我们采用了机器学习领域的很多种指标：有排序指标，例如NDCG（normalized discounted cumulative gain）、mean reciprocal rank、fraction of concordant pairs；也有分类指标，例如accuracy、precision、recall、F-score，我们也用了Netflix Prize中著名的RMSE和别的不太常用的指标，像离散度（diversity）。我们跟踪比较这些离线指标和线上效果的吻合程度，发现它们的趋势并不是完全一致，因此线下指标只能作为最终决定的参考。

一旦离线测试验证了一个假设，我们就着手准备设计并发布A/B测试，通过用户的反馈再做进一步的验证。如果这一步也通过了，我们便将其加入到我们的主要系统中，为所有的用户提供服务。下图详细说明了整个创新周期。

这个创新周期有一个强悍的例子，我们称之为”前十行结果的马拉松比赛“（Top10 Marathon）。这是一个为期10周的、高度专注的、高强度的工作，旨在快速检验数十种算法，以提升系统的前十行推荐结果。不同的团队和个人被邀请到一起，贡献想法，并编程实现。每周有6种不同的算法被推动到线上A/B测试，并要持续评估离线和线上的技术指标。最终表现优异的那些算法成为了我们推荐系统的一部分。

结语

虽然Netflix Prize把推荐系统任务抽象为评分预测问题，但是评分只是推荐系统众多数据来源的一种，评分预测也只是我们的解决方案的一部分。在过去的几年中，我们把推荐系统任务重新定义为提升用户选择视频、观看视频、享受我们的服务、并成为回头客的概率。更多的数据可以带来更好的效果，但是为了达到这样的目标，我们必须不断地优化我们的方法，进行合理的评测，以及快速的迭代。

为了构建一个领先的个性化平台，仅靠我们的这些研究还是不够的，系统的上升空间还很大。在Netflix，我们都很热衷于挑选、观看电影和剧集，我们把这份激情转化为提升系统的强大直觉：对数据的透彻分析、发现更好的特征、更合理的模型和评测、以及弥补现有系统的不足。我们通过数据挖掘和别的试验方法来验证我们的直觉，并对其按优先级逐步实现，这个过程就像任何科学发现一样，运气是很重要的，但是俗话说的好：机会青睐有准备的人。最后，还是需要让我们的用户来评测我们的推荐系统，毕竟我们的目标就是提升用户在Netflix上的体验。

高级java每日一道面试题-2025年3月11日-微服务篇[Eureka篇]-Eureka Client配置有哪些? java我跟你拼了 java每日一道面试题 java 微服务 eureka
如果有遗漏,评论区告诉我进行补充面试官:EurekaClient配置有哪些?我回答:为了提供一个全面且综合的回答，涵盖EurekaClient配置的各个方面，并结合实际应用中的最佳实践，以下是详细的分析和解释。这将帮助候选人准备高级Java面试中关于EurekaClient配置的问题。一、核心基础配置服务注册与发现eureka.client.serviceUrl.defaultZone:指定Eur
软件兼容性测试的矩阵爆炸问题有哪些解决方案测试
解决软件兼容性测试中的矩阵爆炸问题主要有优先级划分、组合测试方法、自动化测试技术等方案。其中，组合测试方法尤其有效。组合测试通过科学的组合算法，能够显著降低测试用例的数量，同时保持较高的测试覆盖率，例如正交实验设计（OrthogonalArrayTesting，OAT）能将测试规模有效减少90%以上。通过有效利用组合测试方法，企业不仅能控制测试规模，还能确保测试质量。一、优先级划分策略的应用在面对
Linux 上使用 Docker 部署 Kafka 集群黎明晓月 linux docker kafka
在Linux上使用Docker部署Kafka集群的步骤如下1.准备工作确保已安装：DockerDockerCompose2.创建DockerCompose文件(docker-compose.yml)version:'3.8'services:zookeeper:image:wurstmeister/zookeepercontainer_name:zookeeperports:-"2181:2181
Nacos 上等猿笔记后端 nacos
简介Nacos（DynamicNamingandConfigurationService）是阿里巴巴开源的一款动态服务发现、配置管理和服务管理平台，旨在为微服务架构提供高可用、高性能的解决方案。其核心功能包括服务注册与发现、动态配置管理、服务健康监测、动态DNS服务等，广泛应用于云原生和分布式系统场景官网https://nacos.io/zh-cn/docs/what-is-nacos.html配
渗透测试（Penetration Testing, Pentest） niuniu_666 单元测试测试工具 java
渗透测试（PenetrationTesting,Pentest）渗透测试（又称渗透攻击测试或道德黑客测试）是一种模拟黑客攻击的安全评估方法，目的是发现计算机系统、网络或应用程序中的安全漏洞，并验证其可能导致的危害。渗透测试通常由**安全专家（白帽黑客）**执行，以帮助组织修复漏洞，防止真实攻击。渗透测试的核心目标发现安全漏洞（如SQL注入、XSS、权限提升等）评估漏洞的危害程度（是否可被利用？影响
不常用的第三方服务集成彼岸花@开 spring boot 后端 java
1.ldap1.1.ldap服务搭建docker方式搭建：包含了ldap服务和ldapadmin图形化界面服务参考ldap服务：http://127.0.0.1:81用户名：CN=admin,DC=ldap,DC=com密码：123456docker-compose.yml文件内容如下version:'3'services:ldap:image:osixia/openldap:latestcont
springboot 四层架构之间的关系整理笔记一 Q18600000000 spring boot 架构后端
‌1.控制层（Controller）——像工厂的前台接待员‌就像你去玩具工厂订玩具，前台接待员负责收你的订单，然后把做好的玩具交给你。控制层就是专门和用户打招呼的部门，负责接收用户的请求（比如点击按钮），然后把结果返回给用户看。‌2.Service层——像工厂的设计师团队‌比如你要做一个会说话的芭比娃娃，设计师团队就要想：怎么让娃娃说话？用什么材料？要分几个步骤做。Service层就是专门处理这些
云原生四重涅槃·破镜篇：混沌工程证道心，九阳真火锻金身程序猿chen 【后端修炼·九阳真经】云原生 python java git 后端程序人生开发语言
【乾坤惊变·混沌劫起】"轰——！"龙渊山巅突然雷云翻滚，九重天外传来梵音轰鸣。监察使手中玄光镜剧烈震颤，镜中映出骇人景象：原本井然有序的ServiceMesh星轨竟自行扭曲，数十万Envoy边车化身血色修罗，Pod金丹爆裂如烟花绽放！"报——混沌劫气侵入护山大阵！"八百弟子口吐黑血，本命法器接连黯淡。龙渊剑主剑指苍天，背后《九阳真经》残卷迸射金光："诸天浩劫，非生死历练不可破！今传尔等混沌工程无上
Ubuntu 系统上完全卸载 CasaOS 曼岛_ k8s实战 ubuntu linux 运维
以下是在Ubuntu系统上完全卸载CasaOS的详细步骤一.卸载验证二.卸载步骤1.停止并禁用CasaOS服务#停止CasaOS核心服务sudosystemctlstopcasaos.service#禁用开机自启sudosystemctldisablecasaos.service#确认服务状态（应显示inactive）sudosystemctlstatuscasaos.service2.卸载Cas
Web应用架构：从后端API到前端交互 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能 java python javascript kotlin golang 架构人工智能
Web应用架构：从后端API到前端交互关键词：Microservices,RESTfulAPI,GraphQL,WebSocket,Serverless,ProgressiveWebApps,SinglePageApplication,ResponsiveDesign1.背景介绍随着互联网的发展，Web应用已成为人们日常生活和工作中不可或缺的部分。然而，构建一个高质量、可扩展、可维护的Web应用并
Xlua调用C#重载函数原理张_0 c#lua
在lua中调用C#函数调用，如调用B.Load(),我们都知道lua是无法支持函数重载的，但load函数又只是一个函数地址，所以我推测在c#中传入lua的函数地址，并不是真正的该函数的地址，而是在中间封装了一层，通过判断参数来调用不同的重载函数。事实证明，这个推测确实是正确的。推测过程如下：Utils.makeReflectionWrapforeach(varkvinpending_methods
Java通达信接口如何实现获取实时股票数据？「已注销」爬虫
Java通达信接口如何实现获取实时股票数据？一般有三种方式：网页爬虫。采用爬虫去爬取目标网页的股票数据，去相关网站或技术论坛上找一下别人写的爬虫集成到项目中。请求第三方API。会有专门的公司（例如百度API市场）提供股票数据，你只需要去购买他们的服务，使用他们提供的SDK，仿照demo开发实现即可。3.请求第三方WebService接口，一般用的较多的网站是聚合数据！
Android 11.0 framework实现对系统语言切换的功能实现安卓兼职framework应用工程师 android 11.0 Rom开发疑难问题分析 android 11.0 Rom定制化高级进阶 android rom framewokr 语言切换系统语言切换
1.前言在11.0的系统rom定制化开发过程中，在定制某些接口的过程中，需要通过系统提供接口，然后实现对系统语言的切换功能实现,接下来分析下系统中关于系统语言切换的相关功能2.framework实现对系统语言切换的功能实现的核心类frameworks/base/core/java/android/app/IActivityManager.aidlframeworks/base/services/c
Android14 系统左右声音通道设置代码峥嵘life android Android系统 android 开发语言
Android14系统左右声音通道设置代码文章目录Android14系统左右声音通道设置代码一、前言二、系统级设置左右声音通道分析1、各方案设置左右声音通道的主要代码（1）3588Android13方案的实现（2）9679Android14方案的实现（3）311D2Android13方案的实现2、串口验证左右声道平衡设置3、AudioService.java监听并设置左右声音通道平衡4、Audio
python黏合flash_Python+Flash框架开发接口,pythonflask weixin_39719749 python黏合flash
fromflaskimportFlaskapp=Flask(__name__)CORS(app,resources=r'/*')#声明app并写入run主py文件@app.route('/insert_case_base_data',methods=['POST'])definsert_case_base_data():request.encoding='utf-8'code=request.js
el-select 在iOS手机上，无法唤起软键盘以及二次点击问题拿回忆下酒 elementui el-select ios vue
问题elementUI中有一个el-select组件。我们经常用它来实现下拉框功能。但是在手机上使用时，发现iOS手机上，该组件无法唤起软键盘。主要是因为组件中，input上有一个readonly属性，而该属性规定输入字段为只读。阻止了用户对值进行修改，直到满足某些条件才行。方案//本案例只为处理兼容问题，不包含其他复杂逻辑exportdefault{methods:{clear(async){t
最新工业基于点云的3D缺陷检测和分类综述 3Ｄ视觉工坊 3D视觉从入门到精通 3d 分类数据挖掘人工智能机器学习
点击下方卡片，关注「3D视觉工坊」公众号选择星标，干货第一时间送达来源：3D视觉工坊添加小助理：dddvision，备注：点云检测，拉你入群。文末附行业细分群论文题目：ADVANCEMENTSINPOINTCLOUD-BASED3DDEFECTDETECTIONANDCLASSIFICATIONFORINDUSTRIALSYSTEMS:ACOMPREHENSIVESURVEY作者：AnjuRani
Kubernetes: Service 和 Pod 的关系曹天骄 kubernetes 容器云原生
1.PodPod是Kubernetes中的最小可调度单位。它代表一个或多个容器的集合，这些容器共享网络和存储资源。每个Pod有一个唯一的IP地址，但这个IP地址在Pod重启时可能会改变。Pod通常是临时性的，如果Pod被删除或崩溃，Kubernetes会根据Deployment或StatefulSet等控制器重新创建新的Pod。2.ServiceService是一种Kubernetes资源，用于在
【k8s部署elasticsearch】k8s环境下安装elasticsearch集群和kibana 汪碧康 kubernetes elasticsearch kibana kubernetes elasticsearch kibana k8s docker
文章目录简介一.条件及环境说明二.需求说明三.实现原理及说明四.详细步骤4.1.规划节点标签4.2.创建三个statefulset和serviceheadless配置4.3.创建service配置五.安装kibana六.调整索引分区七.安装说明简介k8s集群中搭建有elasticsearch服务一般都会用到pvc，但是考虑到有些自建k8s环境下，搭建的共享存储可能会存在稳定性及性能问题，所以这次是
k8s安装elasticsearch 老程随风微服务数据库 java elasticsearch 大数据 big data
镜像镜像版本：可以去https://hub.docker.com/搜索镜像,这里用的是elasticsearch:7.17.4k8s已经存在存储类(StorageClass)：alicloud-disk-ssd服务发现apiVersion:v1kind:Servicemetadata:name:elasticsearchspec:clusterIP:Noneports:-name:elastics
小样本学习综述2025 wuxuand 深度学习计算机视觉深度学习人工智能
一、Few-ShotClass-IncrementalLearningforClassificationandObjectDetection:ASurvey用于分类和目标检测的少样本类增量学习：综述引用：@ARTICLE{10840313,author={Zhang,JinghuaandLiu,LiandSilvén,OlliandPietikäinen,MattiandHu,Dewen},jou
六级词汇积累 (day12) 无敌大饺子 dot 职场和发展
corporation公司incorporate纳入，包含Thisaircraftincorporatesseveralnewsafetyfeatures.oprate操作，经营，手术territory领土factory工厂laboratory实验室dormitory宿舍楼lavatory飞机上的厕所multinational跨国的，跨国公司multiply乘，繁殖，迅速增加multiple许多，
利用Ollama部署Llama 3/deepseek-r1模型，只需5行代码即可实现对话 Lins号丹 Python编程 llama ollama deepseek-r1 聊天机器人
文章目录1.前言2.通过Ollama在本地运行Llama3和deepseek-r13.通过ollama的pythonapi与大模型对话4.部分LLM参数4.1Temperature调节推理能力和创造力4.2TestingSeed随机种子控制随机数4.3MaxTokens控制响应量4.4Streaming流式响应1.前言尽管目前开源的大语言模型很多，但是许多人想在电脑上部署，仍需要克服许多困难，例如
centos7 二进制安装docker和docker-compose(amd64,arch64) 蓝~天~ 容器化脚本 docker centos linux
一、优化系统modprobebr_netfiltercat>>/etc/sysctl.conf/etc/systemd/system/docker.service/etc/docker/daemon.json<
Chapter 24: Typelists_《C++ Templates》notes 郭涤生 c/c++c++笔记开发语言
Typelists1.AnatomyofaTypelist2.AccessingElements3.AppendingTypes4.ReversingaTypelist5.LengthofTypelist6.Compile-TimeTestingwith`main`Multiple-ChoiceQuestionsDetailedDesignQuestionsAnswers&Explanations
c# post获取小红书列表数据，x-s 乐于分享 c#js
stringurl=DecodeBase64(Request["post"]);//stringjsonData=DecodeBase64(Request["jsonData"]);//WebClientwebClient=newWebClient();ServicePointManager.SecurityProtocol=(SecurityProtocolType)3072;webClient
Spring @Bean的管理机制分析 CnLg.NJ Java spring java 前端
在Spring框架中，有些注解不需要手动添加@Bean，而有些则需要，这主要取决于注解的功能和Spring框架对Bean的管理机制，下面为你详细分析：不需要手动添加@Bean的情况1.组件扫描注解Spring提供了一系列组件扫描注解，如@Component、@Service、@Repository、@Controller、@RestController等。这些注解的作用是标记一个类为Spring组
springmvc全局异常处理器简单点，编程的方式简单点 java web
定义一个类，继承springmvc的一个接口，实现里面的关于对异常的处理的方法。当dao抛出异常、service、action抛出异常后，springmvc将会用这个类的方法来处理这些异常，我们的处理逻辑是：1.先判断异常是否自定义异常，如果是未知异常，则新建一个自定义异常，并赋值为未知异常信息；2.判断action方法是否有responsebody注解，如果有，则将自定义异常类转json并返回，
智能合约中的拒绝服务攻击 (Denial of Service - DoS) 详解纸鸢666 区块链智能合约 solidity 安全
简介拒绝服务攻击（DenialofService，简称DoS）是指攻击者通过消耗合约的资源、阻塞某些操作，导致合约无法正常执行，或者使用户无法访问服务。在智能合约的环境中，DoS攻击可能会通过多种手段使合约陷入不可用状态，影响其功能和可用性。虽然DoS攻击通常不会直接导致资金损失，但它会严重影响合约的稳定性和可靠性，给合约的用户带来不便。智能合约的去中心化和不可更改特性使其特别容易受到DoS攻击，
《深度剖析Android 12 SystemUI锁屏通知布局亮屏流程：从源码到实现》 KdanMin 【高通 Android 系统开发系列】android
优化后文章结构：1.前言强调锁屏通知布局的重要性及分析目的，引出后续源码分析的必要性。2.核心类解析KeyguardViewMediator：锁屏核心逻辑控制，处理亮屏/息屏事件分发。PhoneWindowManager：系统输入事件（如电源键）的入口，触发屏幕状态切换。KeyguardServiceDelegate：桥接系统服务与Keyguard核心逻辑，代理关键生命周期回调。3.核心流程分析3
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后

[置顶] Netflix推荐系统：从评分预测到消费者法则

在这篇博文中，作者为我们掀开了Netflix最有价值的资产--推荐系统的面纱。

你可能感兴趣的:(service,features,methods,testing,classification)