u013250861

推荐系统-概述：基本架构

提纲

过去八九年在广告、生活服务、电商等领域从事大数据及推荐系统相关工作，近来打算对过去的工作做一个系统性的梳理。一方面帮自己查缺补漏、进行更深入的学习；另一方面也希望能通过博客结交同好，增进交流。
这一博客系列以介绍推荐系统为主，会少量涉及广告系统。本篇文章作为该系列的第一篇，主要对推荐系统、数据框架等进行整体介绍，不涉及过多技术细节问题。

推荐系统的架构

由于推荐系统是架构于海量数据之上的，为了保证推荐的实时性和高效性，必须要有一套强有力的技术架构做支撑。其基本结构如下图所示：

我们分数据和计算两部分来介绍系统架构。

数据层

离线数据

离线数据通常是按日存储更新的海量数据，它有两个作用：1、支持模型的离线训练；2、为线上服务提供离线数据（需导入服务友好的数据访问系统）；
从用户、场景及item的角度来看，离线数据包括：1、用户相关数据，主要为用户标签数据，包含用户年龄、性别、长短期爱好、常驻地理位置、消费水平等等；2、场景数据：根据不同业务，可能会包含时间、数据来源、访问页面特征、GPS等等，场景数据在线上预估时往往需要实时获取，因此离线场景数据通常仅用来做离线模型训练；3、物品数据，这部分数据基于不同业务有较大差异，以社区消息信息流推荐而言，通常会包括物品id、物品标签、类目属性、发布者相关信息，以及该物品上的用户行为统计性信息，如过去若干天被点赞收藏数量等等；4、交互行为数据，通常是为离线模型准备的样本训练数据，如点击率模型所需要的展现点击数据；多目标模型可能还需要根据业务定制的点赞、收藏、时长等数据。离线作业往往不是一蹴而就，有些离线任务是在为下游离线任务准备中间结果，如文章的分词结果，矩阵分解的中间向量等。它们会作为输入再次在离线任务中流转。

为了获得结构化的上述数据，通常需要线下对数据进行清洗、过滤及存储。如下图所示。

离线处理数据主要使用Hadoop，Spark等技术，数据经过清洗处理后，存入以HDFS为典型代表的离线存储系统，供离线模型读取使用；同时会将其中部分数据导入到Redis、Tair这种线上可实时访问的系统（如用户画标签、物品特征等）用于线上进行实时计算。

离线数据由于对存储要求限制低，可以存储大量精细化特征，从而能支持复杂模型的构建。但是，由于离线的时滞性，使得数据所表达的实时性不强，比如线上用户看了奥运的新闻，接着搜索奥运相关信息，但由于用户的兴趣转瞬即逝，使用前一天的离线数据就无法捕获到当前萌发的兴趣点，也就无法推荐出用户实时感兴趣内容。

因此，近年来随着实时数据处理技术的深入，实时特征及实时模型获得迅猛发展，

近线数据

近线数据，是指时效性较高，但非完全实时化的数据。通常时间间隔在秒级到小时级，因此可以捕获用户及上下文环境近期的变化，包括实时兴趣，地理位置变化等；同时近线数据处理技术的发展也为模型的实时线上更新带来了可能。由于系统可以捕获用户及物品近期特征，因此可以在离线模型基础上，对线上模型进行实时增量更新，以提升模型的时效性。

近线计算从消息队列里订阅数据（如Kafka，MQ，Flume等），对于数据的处理主要使用Storm、Flink、SparkStreaming等技术。其中，SparkStreaming本身还是批处理的方式，是将数据流按照时间单位切分，再通过分布式数据集来进行批量处理，是一种伪实时。相较而言，Storm则是基于单条数据驱动的实时处理系统，而Flink则是基于事件驱动，是面向流的处理系统，因此这二者都是纯实时框架，可达到毫秒级响应。但是，SparkStreaming本身又具有超越其他实时处理系统的高吞吐量、高容错性的优势，因此实时流处理框架的选择要根据业务情况进行取舍，后续的大数据相关博客中我们再进一步详述。

近线数据通常也会存入服务访问友好数据系统，供线上访问。近年来比较火的lambda架构，便是由离线数据计算与近线数据计算共同构成。由离线作业写入存储，再由近线计算增量更新，以完成海量数据的低延迟处理。

实时数据

实时数据主要是指用户在实时访问时拿到的各种数据，如广告系统中广告请求发起时的时间，数据源，页面特征，地理位置等各种因素。这部分数据通常是用于模型的实时预估。推荐模型所依赖的输入特征，不仅取决于用户的离线长期兴趣，也与当前的动态环境有关，实时数据可以提供相关的实时特征。

以信息流推荐系统为例，来看一下实时数据的使用场景。一般来说，实时数据主要来自于实时请求，通过对当下数据的收集及结构化处理，统一装配成业务需要的数据，传入模型，完成模型计算。

请求发起时，系统所收集到的实时数据将会用于模型预估。请求完成后，用户的交互行为会产生新的实时数据。这部分数据会存入系统，最终以近线或离线形式存储下来，用于后续的模型训练，或者是报表展示。

综上，推荐系统所依赖的数据是由离线、近线和实时数据三部分组成。这三部分数据又互相渗透，彼此交互，共同组成推荐系统的数据支持体系。

一个例子

我们以一个例子来看待一个具体的用户行为数据是如何在这个数据系统中流转的。为了更好地展现数据的流转过程，此处不掺入复杂的机器学习算法，仅以用户标签系统来举例说明。假设我们构建的是一个信息流推荐系统，以各类生活化信息为主。今天中午来了一位男用户，他最近买了个大house，准备装修，所以来搜索装修信息。他搜索了“上海装修”，并查看了装修相关的几篇文章。这样，用户行为记录里便有了如下几条日志：

user_id: a_123; item_id:1100; action: view; ts: 2021-11-30:11:12:30
user_id: a_123; item_id:1111; action: view; ts: 2021-11-30:11:21:11
user_id: a_123; item_id:1111; action: click; ts: 2021-11-30:11:22:13
user_id: a_123; item_id:2221; action: view; ts: 2021-11-30:11:29:22
user_id: a_123; item_id:2221; action: click; ts: 2021-11-30:11:30:02

实际的日志存储更为复杂，通常还会包含如页面特征、点击位置等上下文信息，另外点击日志与展现日志也是分开处理的，为了便于说明，此处进行了简化处理，以kv形式展示，同时仅保留用户id，物品id，行为类型及时间戳。
用户及其所访问的物品，会有其对应的特征数据（一般离线和在线都会存储），如下：

item_id	item_tag	item_class
1100	上海，装修，欧式	生活/装修
1111	板材，环保	电商/装修/板材
2221	装修，日式，小清新	生活/装修

事实上，对于物品，除了确定其类目，通过nlp技术提取其关键词外，还可以做更多的处理，提取出更多相关特征，比如：文章主题抽取，知识图谱构建，语义概率模型生成以及用户交互行为类标签，如文章热度、作者被关注度，关联文章id，同类文章等等；从中可以窥探出，数据固然重要，但只有有效地处理和表达数据，才能最大程度地发挥它的价值，这也正是算法的魅力所在。
用户对物品的交互行为，联合物品特征、用户画像等内容，会在离线处理过程中进行规范化继而落盘保存，如下：

user_id	view_item	click	item	item_tag	item_class	user_profile
a_123	1100	0	1111	上海，装修，欧式	生活/装修	{性别:男，地域：上海，爱好：电影:0.9、旅游:0.5}
a_123	1111	1	1121	板材，环保	电商/装修/板材	{性别:男，地域：上海，爱好：电影:0.9、旅游:0.5}
a_123	2221	1	2221	装修，日式，小清新	生活/装修	{性别:男，地域：上海，爱好：电影:0.9、旅游:0.5}

注意，这里我们加入了该用户的画像，其中电影：0.9是权重系数，表达的是该标签在用户身上的重要程度（一般会根据时间间隔长短和用户行为强度进行计算）。我们将表达用户兴趣的点击文章标签进行处理，将其整合进用户兴趣体系：

user_id	user_profile
a_123	{性别:男，地域：上海，爱好：电影:0.85、装修/环保：0.8，日式：0.7，旅游:0.3}

我们可以看到，随着时间的流逝，不同的兴趣权重存在一定程度的增强或减弱。用户画像经过数据交换系统，也会流入Redis，变成实时标签。

此时，我们就对用户有了大概认知，第二天当这个用户再次到来时，就可以基于标签为他推荐“装修”相关的内容了。

这个例子展示了一个用户标签是如何在数据系统里流转，并参与推荐的。对于复杂的机器学习模型乃至深度学习模型来说，虽事殊术异，但其数据处理的框架与思想是完全相类的。只要把握住这个思路，就可以化用到任何推荐业务场景里的任何数据处理模式了。

模型训练

模型训练通常也分成两部分：线下全量训练和线上增量更新。

线下训练

用户多日的行为数据（一般以月为单位，一个月到半年不等）经清洗后，进入模型训练。一般机器学习模型可用spark实现（其本身有强大的机器学习包），深度学习则使用Tensorflow或Pytorch实现。但一般大公司会自研机器学习平台（如阿里的PAI，百度的飞桨等），一般都会提供完善的训练框架，可以支持多种模型的实现和集成，同时可以较方便地支持线上预测部署。
对于召回、排序等不同阶段，需要训练不同的模型，如协同过滤、LR、树模型、深度学习模型等。这些模型可以同时在线上存在（多路召回，或进行AB实验）。

线上更新

离线模型保证了模型的精准性，但由于实时性不强，因此近年来推荐系统一直在往实时化方向演进。实时化包括两方面：特征的实时更新及模型的实时更新，都是通过线上实时增量样本来完成。特征实时更新解决的是如用户线上出现实时兴趣时，为其推荐相关物品的问题，比如用户看了一部侦探电影，那么可以马上为其推荐相关主题（或主演）的电影；实时模型解决的是捕获用户实时行为模式的问题，对于场景商品发生快速变化的情况尤其适用（如电商大促等场景，大量新商品上线的场景），比如热门商品的更新，同好人群最新感兴趣的物品等。

线上推荐

用户端发起一次请求后，线上系统开始运作。海量物品经历召回、粗排序、精排序、重排序这几个环节，最终展现一条（广告）到十几条、几十条信息给用户（信息流推荐）。

从图中可以看出，模型预估虽然是推荐系统中的重中之重，但是真正支撑模型运作起来，需要强大的工程系统。可以说，线上系统是推荐系统中最为复杂的部分，它要承担诸多任务：接收请求，收集实时数据，进行模型预估，将请求结果返回给用户，对于用户反馈进行收集发送给后端，用于实时报表系统及近线数据收集等。

召回阶段是面向全量信息库，检索出用户最可能感兴趣的成百上千条信息。作为线上模型运作的第一步，召回的策略是多种多样的，但核心都是需要保证快速从海量数据中得到一个用户感兴趣的物品集合。想象一下搜索引擎是如何运作“召回”这一步的？用户输入查询词（query），然后搜索引擎去数据库中检索出标题或者内容中带有query的全部记录。推荐场景下没有意向query，推荐引擎该如何做呢？从某种角度讲，没有用户的明确输入，既是好事，也是坏事。好在用户没有限定条件，那么“法无禁止即可行”，算法可以任意发挥想象空间，从各种角度来召回（基于用户历史兴趣、基于用户当下兴趣、基于好友推荐、基于上下文、甚至是基于天气、基于地理位置等等都可以）；坏在用户没有表达明确意向，那么召回的结果中可能含有不是特别相关的内容，这个就要靠后续的排序模块来进一步筛选了。

粗排序阶段是将召回的成百上千条信息按照一定指标进行排序（通常包括粗排序和精排序两个阶段），筛选出头部的几条到几十条信息，用于后续展现。粗排序模型主要通过快速排序，将几百上千条的信息进行过滤，剩下几十条给精排序模型，这一阶段的排序要求是要足够快速，精准度要求不高（也有的推荐系统会直接省略这一步）。

精排序模型就是常说的CTR模型，因为早期广告系统强依赖于CTR（点击率）指标，因此预估CTR的高低是排序的重要标准。现如今的无论广告还是信息流排序多考虑综合指标，如广告转化率；信息流的观看时长、点赞收藏率等，因此，多目标排序系统是推荐系统所关注的重要方向。此外，CTR模型从最早的LR（逻辑回归），到树模型（以GBDT为典型代表），再到如今的深度学习模型（如阿里的DIN，MIND等），也在逐渐往精深方向演进。

重排序阶段主要根据实际业务对信息进行重新排序，如广告会考虑竞价因素，信息流会考虑运营、新颖度、惊喜度等因素，此外，还包括对新上线信息的保护机制，以及一些运营逻辑的加入等一系列业务因素，都会在重排序阶段里进行综合考虑。

AB实验

AB实验是广告推荐领域里一个老生常谈的问题。试想对于快消品类，比如宝洁打算新研发一款洗发水，但是不确定柠檬味儿还是香草味儿会更受欢迎，它会怎么做？它可能让一小群用户去同时尝试两种气味的产品，然后告知他们更喜欢哪种；它也可以把这群用户分成两组，每组尝试一种气味的产品，然后比较两组的接受率。显然第一种方案更好，因为它基于同样的用户群，比较更为公平。
推荐系统能否在同一批用户上进行两种不同的实验呢？试想这样一个场景，一个用户近期打算旅游，并通过搜索表达了兴趣，但是当他去看信息流推荐时，一会儿看到的都是旅游相关的信息，一会儿又看到都是游戏相关的信息（可能是基于他既往兴趣）；或者更有甚者，对于前端样式的实验，用户一会儿看到的都是图文，一会儿看到的都是视频，用户的感受更多的是惊喜还是惊吓？可以想见，这样的实验会极大程度地削弱用户的把控感，从而带来糟糕的体验。因此，为了保持用户体验的一致性，一般来说AB实验会在同一时段内针对不同用户群进行。
除了上述原因外，这种设计其实也体现了一种哲学思想，即“人不能两次踏进同一条河流”，针对同一用户的两次不同推荐，因为时间、场景、用户心理等发生变化，其实也是不能完全公平比较的。那么对于两批不同用户，在时间等其他因素尽量控制的情况下，只要用户样本量足够，筛选足够随机，其实验效果反倒是较可信的。

AB实验框架最早来自于谷歌的研究，主要针对广告效果而进行的实验分流。通常情况下，一个新模型在上线之初会先选取少量的人群进行AB实验（一般5%-10%），当实验效果足够好且足够稳定，为了保证实验效果并非是由于小样本波动所带来的，之后可以将流量进行扩大观察，直至最后将其部署在全量人群上为止（通常情况下，还会保留一小部分基线实验来进行长期对比观察）。上图展示了一个召回服务层上的分流实验，可以看到，这个服务在同时进行两个实验，分别在实验一中增加了模型四，及实验二中增加了模型五，后续实验效果会与同样流量比例的基础实验进行指标比较。至于如何设计实验分流，以及如何能最大限度地复用现有流量，同时进行多个不同的分层实验，这个问题我们以后再展开讨论。

推荐系统的演进

随着推荐系统所依赖的周边资源逐步发展，推荐系统近十年来也经历了不小的变化。计算架构上，从离线计算到模型和特征的实时在线更新；模型上，则从早期的逻辑回归到如今的大规模深度学习。如今，以图学习和强化学习为方向的研究正引领推荐系统的潮流。技术的价值在于能够为业务而服务，而业务所遇到的瓶颈会反过来推动技术进一步发展，如今，在线旅游、外卖、社群、线下买菜等业务也在逐渐被推荐系统入侵，可以想见，未来随着业务场景的更加多样化，推荐技术也一定会出现新的改变。

深入浅出推荐系统（一）：推荐系统基本架构_慕阮的博客-CSDN博客_推荐系统基本框架

深入浅出推荐系统（一）：推荐系统基本架构_深度学习_慕阮-DevPress官方社区

参考文献：
【1】超详细：完整的推荐系统架构设计 https://xie.infoq.cn/article/e1db36aecf60b4da29f56eeb4

android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
每日一题——第八十九题互联网打工人no1 C语言程序设计每日一练 c语言
题目：在字符串中找到提取数字，并统计一共找到多少整数，a123xxyu23&8889，那么找到的整数为123，23，8889//思想：#include#include#includeintmain(){charstr[]="a123xxyu23&8889";intcount=0;intnum=0;//用于临时存放当前正在构建的整数。boolinNum=false;//用于标记当前是否正在读取一个整
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
使用LLaVa和Ollama实现多模态RAG示例 llzwxh888 python 人工智能开发语言
本文将详细介绍如何使用LLaVa和Ollama实现多模态RAG（检索增强生成），通过提取图像中的结构化数据、生成图像字幕等功能来展示这一技术的强大之处。安装环境首先，您需要安装以下依赖包：!pipinstallllama-index-multi-modal-llms-ollama!pipinstallllama-index-readers-file!pipinstallunstructured!p
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
18、架构-可观测性之聚合度量大树~~ 架构 java python 后端架构
聚合度量聚合度量是指对系统运行时产生的各种指标数据进行收集、聚合和分析，以了解系统的健康状况和性能表现。聚合度量是可观测性的关键组成部分，通过对度量数据的分析，可以及时发现系统中的异常和瓶颈。以下是对聚合度量各个方面的详细解析，并结合具体的数据案例和技术支撑。指标收集收集系统运行时产生的各种指标数据是聚合度量的基础。常见的指标包括CPU使用率、内存使用率、请求处理时间、请求数、错误率等。以下是指标
Linux MariaDB使用OpenSSL安装SSL证书 Meta39 MySQL Oracle MariaDB Linux Windows ssl linux mariadb
进入到证书存放目录，批量删除.pem证书警告：确保已经进入到证书存放目录find.-typef-iname\*.pem-delete查看是否安装OpenSSLopensslversion没有则安装yuminstallopensslopenssl-devel开启SSL编辑/etc/my.cnf文件（没有的话就创建，但是要注意，在/etc/my.cnf.d/server.cnf配置了datadir的，
Xinference如何注册自定义模型玩人工智能的辣条哥人工智能 AI 大模型 Xinference
环境：Xinference问题描述：Xinference如何注册自定义模型解决方案：1.写个model_config.json，内容如下{"version":1,"context_length":2048,"model_name":"custom-llama-3","model_lang":["en","ch"],"model_ability":["generate","chat"],"model
网络编程基础记得开心一点啊网络
目录♫什么是网络编程♫Socket套接字♪什么是Socket套接字♪数据报套接字♪流套接字♫数据报套接字通信模型♪数据报套接字通讯模型♪DatagramSocket♪DatagramPacket♪实现UDP的服务端代码♪实现UDP的客户端代码♫流套接字通信模型♪流套接字通讯模型♪ServerSocket♪Socket♪实现TCP的服务端代码♪实现TCP的客户端代码♫什么是网络编程网络编程，指网络上
1分钟解决 -bash: mvn: command not found，在Centos 7中安装Maven Energet!c 开发语言
1分钟解决-bash:mvn:commandnotfound，在Centos7中安装Maven检查Java环境1下载Maven2解压Maven3配置环境变量4验证安装5常见问题与注意事项6总结检查Java环境Maven依赖Java环境，请确保系统已经安装了Java并配置了环境变量。可以通过以下命令检查：java-version如果未安装，请先安装Java。1下载Maven从官网下载：前往Apach
「豆包Marscode体验官」 | 云端 IDE 启动 & Rust 体验张风捷特烈 ide rust 开发语言后端
theme:cyanosis我正在参加「豆包MarsCode初体验」征文活动MarsCode可以看作一个运行在服务端的远程VSCode开发环境。对于我这种想要学习体验某些语言，但不想在电脑里装环境的人来说非常友好。本文就来介绍一下在MarsCode里，我的体验rust开发体验。一、MarsCode是什么它的本质是:提供代码助手和云端IDE服务的web网站，可通过下面的链接访问https://www
BART&BERT Ambition_LAO 深度学习
BART和BERT都是基于Transformer架构的预训练语言模型。模型架构：BERT(BidirectionalEncoderRepresentationsfromTransformers)主要是一个编码器（Encoder）模型，它使用了Transformer的编码器部分来处理输入的文本，并生成文本的表示。BERT特别擅长理解语言的上下文，因为它在预训练阶段使用了掩码语言模型（MLM）任务，即
系统架构设计师需求分析篇二 AmHardy 软件架构设计师系统架构需求分析面向对象分析分析模型 UML和SysML
面向对象分析方法1.用例模型构建用例模型一般需要经历4个阶段：识别参与者：识别与系统交互的所有事物。合并需求获得用例：将需求分配给予其相关的参与者。细化用例描述：详细描述每个用例的功能。调整用例模型：优化用例之间的关系和结构，前三个阶段是必需的。2.用例图的三元素参与者：使用系统的用户或其他外部系统和设备。用例：系统所提供的服务。通信关联：参与者和用例之间的关系，或用例与用例之间的关系。3.识别参
IBM反垄断史：一个什么都卖的兼并指挥家竞争者的垄断梦
真事/故事/反垄断的故事/大公司垄断的故事曲创（原创）欢迎关注竞争者的垄断梦感谢已经看到这里的各位，因为间隔时间有点长，可能各位有点迷失。大家千万别误会，我们这一季的男一号既不是Hollerith，也不是Powers。到目前为止他俩的戏份真是不少，但只是因为必不可少，没有他俩发明的制表机，也就没有IBM；没有他俩相爱相杀的暧昧关系，也就没有后来数十年里IBM和反垄断的苦恋悲情。这是一个漫长的悲伤故
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
Armv8.3 体系结构扩展--原文版代码改变世界ctw ARM-TEE-Android armv8 嵌入式 arm架构安全架构芯片 Trustzone Secureboot
快速链接:.ARMv8/ARMv9架构入门到精通-[目录]付费专栏-付费课程【购买须知】:个人博客笔记导读目录(全部)TheArmv8.3architectureextensionTheArmv8.3architectureextensionisanextensiontoArmv8.2.Itaddsmandatoryandoptionalarchitecturalfeatures.Somefeat
【ARM Cortex-M 系列 2.3 -- Cortex-M7 Debug event 详细介绍】主公讲 ARM #ARM 系列 arm开发 debug event
请阅读【嵌入式开发学习必备专栏】文章目录Cortex-M7DebugeventDebugeventsCortex-M7Debugevent在ARMCortex-M7架构中，调试事件（DebugEvent）是由于调试原因而触发的事件。一个调试事件会导致以下几种情况之一发生：进入调试状态：如果启用了停滞调试（HaltingDebug），一个调试事件会使处理器在调试状态下停滞。通过将DHCSR.C_DE
uniapp map组件自定义markers标记点以对_ uni-app学习记录 uni-app javascript 前端
需求是根据后端返回数据在地图上显示标记点，并且根据数据状态控制标记点颜色，标记点背景通过两张图片实现控制{{item.options.labelName}}exportdefault{data(){return{storeIndex:0,locaInfo:{longitude:120.445172,latitude:36.111387},markers:[//标点列表{id:1,//标记点idin
TextFiled 中输入金额宁梓茞
要求:输入的金额不能超过六位,小数点后面只能输入两位小数如果textFIled中第一位输入的是0,后面必须输入小数点,否则禁止输入用到textfiled代理方法#pragmamark----textFiledDelegate-----(BOOL)textField:(UITextField*)textFieldshouldChangeCharactersInRange:(NSRange)range
基于STM32与Qt的自动平衡机器人：从控制到人机交互的的详细设计流程极客小张 stm32 qt 机器人物联网人机交互毕业设计 c语言
一、项目概述目标和用途本项目旨在开发一款基于STM32控制的自动平衡机器人，结合步进电机和陀螺仪传感器，实现对平衡机器人的精确控制。该机器人可以用于教育、科研、娱乐等多个领域，帮助用户了解自动控制、机器人运动学等相关知识。技术栈关键词STM32单片机步进电机陀螺仪传感器AD采集电路Qt人机界面实时数据监控二、系统架构系统架构设计本项目的系统架构设计包括以下主要组件：控制单元:STM32单片机传感器
JAVA·一个简单的登录窗口 MortalTom java 开发语言学习
文章目录概要整体架构流程技术名词解释技术细节资源概要JavaSwing是Java基础类库的一部分，主要用于开发图形用户界面（GUI）程序整体架构流程新建项目，导入sql.jar包（链接放在了文末），编译项目并运行技术名词解释一、特点丰富的组件提供了多种可视化组件，如按钮（JButton）、文本框（JTextField）、标签（JLabel）、下拉列表（JComboBox）等，可以满足不同的界面设计
ARMV8体系结构简介：概述简单同学 ARMV8体系结构 ARMV8
1.前言本文主要概括的介绍ARMV8体系结构定义了哪些内容，概括的说：ARM体系结构定义了PE的行为，不会定义具体的实现ARM体系结构也定义了debug体系结构和trace体系结构ARM体系结构采用RISC指令集（1）长度一致的寄存器；（2）load/store架构，数据处理操作只能对寄存器内容进行处理，不会直接对内存的内容进行处理；（3）简单寻址方式，load/store地址来源于寄存器或指令域
Spring Boot中实现跨域请求 BABA8891 spring boot 后端 java
在SpringBoot中实现跨域请求（CORS，Cross-OriginResourceSharing）可以通过多种方式，以下是几种常见的方法：1.使用@CrossOrigin注解在SpringBoot中，你可以在控制器或者具体的请求处理方法上使用@CrossOrigin注解来允许跨域请求。在控制器上应用：importorg.springframework.web.bind.annotation.
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
Table列表复现框实现【勾选-搜索-再勾选】～四时春～ java 开发语言 elementui vue
Table列表复现框实现【勾选-搜索-再勾选】概要整体架构流程代码实现技术细节注意参考文献概要最近在开发时遇到一个问题，在进行表单渲染时，正常选中没有问题，单如果需要搜索选中时，一个是已选中的不会回填，二是在搜索的结果中进行选中，没有实现，经过排查，查找资料后实现。例如：整体架构流程具体的实现效果如下：代码实现{{scope.row.userName}}已选区{{userItem.userName
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http