Java后端技术

PB级海量数据服务平台架构设计实践 | 文末福利

基于PB级海量数据实现数据服务平台，需要从各个不同的角度去权衡，主要包括实践背景、技术选型、架构设计，我们基于这三个方面进行了架构实践，下面分别从这三个方面进行详细分析讨论：

一、实践背景

该数据服务平台架构设计之初，实践的背景可以从三个维度来进行说明：当前现状、业务需求、架构需求，分别如下所示：

二、当前现状

收集了当前已有数据、分工、团队的一些基本情况，如下所示：

1、数据收集和基础数据加工有专门的Team在做，我们是基于收集后并进行过初步加工的基础数据，结合不同行业针对特定数据的需求进行二次加工的。

2、数据二次加工，会集成基础数据之外的其它有业务属性的数据，比如引入第三方POI数据等。

3、原始数据每天增量大约30~40TB左右。

4、计算集群采用Spark on YARN部署模式，大约400个节点。

5、所有数据各种属性、行为信息，都是围绕大约40亿的移动设备ID进行很多倍膨胀，比如每天使用微信App的设备的行为信息。

6、参与该平台的研发人员，对实际数据业务需求了解不会非常深入，因为跨多个行业及其不同数据需求的变化较快。

三、业务需求

另外，实现的该数据服务平台，需要满足当前的基本数据业务需求，主要包括使用平台的人员特点，需要支撑的各种基本数据需求，经过梳理，如下所示：

1、平台初期面向内部业务人员使用，几乎没有技术背景。

2、40亿+的移动设备大表，包含各类设备ID及其设备属性，需要提供批量匹配功能：给定一类或多类设备ID的批量文件，从大表中获取到匹配上的设备信息（ID及多个属性信息）。

3、对PB级数据进行各种快速探索，输入各种过滤条件，如地域（国家/省/市/区）、地理围栏（地图圈选/上传文件/直接输入）、使用的App及分类（安装/活跃）、时间范围（日/周/月）、POI及分类等等，理论上不限制条件个数，经验值最多在5~6个左右。

4、输出主要包括明细信息、多维度统计（画像）、图表（热力图）等。

5、平台提供的数据服务，都是批量模式的计算，所以需要为用户提交的数据作业，给予准确的状态变化反馈。

6、有小部分面向开发人员的需求：将在数据平台Web系统操作进行的数据匹配、提取、探索等操作，进行服务化以供其他系统中的服务调用。

四、架构需求

在未来业务模式变化的情况下，能够非常容易地扩展，并尽量复用大部分核心组件。同时，还要面向开发人员复用数据平台的数据业务服务，以增加平台利用率，间接产出数据价值。考虑如下一些当前需要以及未来可能演变的架构需求：

1、定义作业和任务的概念：作业是用户为满足一次业务需要而提交的数据获取请求，最终输出想要的数据结果；任务是为满足输出一个作业结果，从逻辑上拆分成的基本计算单元。一个作业由多个任务的计算组合而完成。

2、对于一个作业输入的多个过滤条件，如果作为一个单独的计算任务，根本无法在PB量级的数据上输出结果，所以需要将作业拆分成多个任务进行分别计算，最后输出结果。

3、对用户作业状态的管理，具有一定的业务含义，基本不能在公司级别进行复用，具体涉及内容包括：排队、组成作业的任务列表管理、作业优先级管理。

4、任务是最基本的计算单位，设计能够协调整个任务计算的架构，可以分离出任何业务状态，实现为无状态的任务计算架构，在公司级别可以复用，比如大量基于Spark的计算可以抽象为任务计算。

5、由于时间范围条件跨度需要支持几年（如1~3年），计算依赖的数据量级在TB甚至PB级别，所以一定要通过预计算的方式压缩数据，并能提供支持快速计算的方式。

6、预计算可以使用Spark计算集群，每天通过控制计算所需资源进行大规模ETL处理。

7、ETL处理，迫切需要一个简单、轻量的ETL作业调度系统，可以从开源产品中甄选。

8、采用原生Spark计算基本无法为平台上用户提供快速计算的体验，可能会考虑列式分布式数据库，或基于Bitmap结构的分布式计算系统。

9、面向开发人员，部分涉及业务相关内容的模块，第一阶段可以通过硬编码方式处理业务逻辑，后续第二阶段可以基于对业务流程的熟悉来进行改造，抽取通用业务逻辑规则，构建能够快速交付业务功能的模块。

10、对平台架构进行分解，分离有状态和无状态模块，分离带业务属性和不带业务属性的模块，保持模块轻量易于随架构演进进行改造、升级、维护。

五、技术选型

技术选型，主要从如下几个方面进行考虑：

5.1、数据存储

5.1.1、原始数据存储

数据量级达到PB级，所以，作为整个数据服务平台的最初输入数据，我们称为数据服务平台的原始数据，后续简称原始数据，这些原始数据是直接存储在HDFS文件系统中，根据时间的维度，分为小时数据、日数据、月数据。这样，可以根据数据计算需要，按照小时、日、月进行加工处理，能够在可允许的计算资源配额和计算时间范围内完成处理。
另外，根据每天大约30~40TB的增量数据，原始数据采用parquet格式压缩存储，我们进行二次加工的输出仍然是以parquet格式存储。

5.1.2、分布式关系数据存储

对于PB级的数据，想要在数据服务平台中快速为用户提供数据服务，根据业务特点，存储在适合快速加载、快速计算的分布式数据存储系统中。
快速加载，必然要对数据进行特殊格式处理，并在一定程度上压缩数据，这样才能减少数据加载时间。可以很容易想到，使用支持列式存储的分布式数据库。比如Vertica分布式数据库就是一款支持列式存储的MPP数据库。Vertica是HP开发的商用分布式数据库，同时也发布了开源的免费社区版本，不过社版本有一定限制：只支持1TB原始数据、3节点集群规模。如果变通一些，可以通过Vertica社区版本进行改造以支持解除3个节点集群规模和1TB存储的限制，不过要在分片逻辑控制、分片数据一致性方面做更多工作，尤其是面向上层应用提供单一的统一存取视图是非常必要的。因为列式存储支持计算时只加载用于计算的列，故而能够达到快速加载的目的。
快速计算，首先要求计算能够并行化，那么数据就应该分片存储，使数据计算本地化。Vertica自然能够实现数据的并行计算，我们在前期使用过程中验证了，对于从40亿+的大表中批量匹配出任意信息（匹配ID，以及ID对应的关联表中的其它明细信息），效率非常好，基本分钟级便可以输出匹配结果。
我们也对开源不久的MPP数据库Greenplum进行了调研，它原生支持分布式架构，支持列式和行式两种存储，自然具有Vertica对应的列式存储的优势，又不需要手动对分片进行管理控制，但性能要比Vertica差一些。然而，Greenplum数据库能够支持数组类型，支持多种编程语言的UDF，结合我们之前做过很多有关Bitmap的实践，采用开源的RoaringBitmap，能够很好的基于Greenplum实现快速的Bitmap计算。

5.1.3、消息存储

消息存储，主要是用来解耦后台多个较重的系统之间的通信。因为本身这类系统比较重，如果采用RPC调用的方式进行通信，某个系统进行升级，会导致依赖于该系统提供服务的其它系统管理更多的特殊情况处理。而采用消息机制，使得各个系统之间不需要关注交互系统处理状态，而对消息交换只需要关注消息的生成和消费。
这样，我们可以随时对系统进行改造、升级、Bug修复重启等操作，而不会使整个平台陷入不可控的状态。消息中间件，我们选择使用RabbitMQ。

5.2、数据处理

数据处理，主要包括原始数据ETL处理、应用数据计算两大类：

5.2.1、原始数据ETL处理

基于HDFS存储的数据，最方便最高效的技术方案，自然是使用Spark计算集群来对数据进行ETL处理。我们基于原生的Scala编程语言来开发各种ETL程序，实现数据清洗、抽取、转换操作。

5.2.2、应用数据计算

数据服务平台中，面向用户的应用数据计算，基于Greenplum数据库支持的SQL语言来实现数据处理，并基于Java编程语言来实现整个应用服务的开发。

5.3、ETL作业调度

数据处理需要进行大量的ETL计算，管理各种计算任务之间的依赖关系及其调度，我们采用了非常轻量的Azkaban调度系统。

5.4、业务元数据管理

业务元数据，主要用于支撑数据服务平台Web UI上面的各种业务条件选项，比如，常用的有如下一些：

（1）移动设备机型、品牌、运营商、网络、价格范围、设备物理特性

（2）应用名称、包名、哈希值

（3）应用分类

（4）地域信息，如国家、省份、城市、区县

（5）POI名称、地址

（6）POI分类，包括一级分类、二级分类

这些元数据，有些来自于基础数据部门提供的标准库，比如品牌、价格范围等，可以从对应的数据表中同步或直接读取；而有些具有时间含义的元数据，需要每天通过ETL处理生成，比如应用信息；POI数据需要从外部抓取，并进行处理，一般每个月更新一次。
这些元数据，为支撑应用计算使用，被存储在MySQL数据库中；而对于填充页面上对应的条件选择的数据，则使用Redis存储，每天/月会根据MySQL中的数据进行加工处理，生成易于快速查询的键值对类数据，存储到Redis中。

5.5、数据服务

数据服务，主要支撑后台的数据应用，全平台采用标准的REST接口风格来定义，主要使用Spring Boot来快速开发对应的接口。

5.5.1、离线批量服务进行REST接口封装

还有一点我们需要遵循的是，任何具有复杂的数据处理逻辑的服务，都通过一层REST接口进行封装，将全部的离线批量服务后置。这样得到一个聚合服务的REST接口层，该层主要负责定义和管理接口的各个请求、响应参数，REST接口不变，而对应的数据处理逻辑可以根据实际情况进行调整，以后对存储或计算方案进行升级改动，都不影响使用上层REST接口调用方。

5.5.2、Greenplum服务网关

比如，我们采用Greenplum数据库，在Greenplum前面增加了一层Greenplum服务网关，对于任何需要访问Greenplum数据库的应用，必须通过与Greenplum服务网关进行交互，而不是直接去访问Greenplum数据库。理想状态下，Greenplum服务网关可以实现为无状态的服务网关，通过Nginx做反向代理实现HA，这样后续因为业务变更，可以非常平滑地进行变更和升级，而不影响依赖于Greenplum服务网关的业务接口调用。

5.5.3、微服务

除了数据服务平台内部进行服务调用，最外层通过Web界面的风格，只需要拖动或选择可视化组件，实现对非技术背景的业务用户进行数据提取和分析，未来我们还要将全部的服务暴露到外部（数据服务平台所属部门之外的其它部门，以及公司外部），最大化数据服务的价值。
微服务部分，我们选择了Spring Cloud来快速构建微服务。

5.6、UI展示

UI层主要根据我们开发人员的技术背景，使用Vue来构建面向业务用户的数据服务Web系统。

六、架构设计

整个数据服务平台的架构设计，如下图所示：

如上图所示，对应的各个核心子平台及其服务，下面将分别详细说明：

6.1、数据服务Web系统

数据服务Web系统是面向用户使用的，主要通过可视化业务组件的方式，将数据服务暴露出来，方便业务用户使用。同时，该系统提供用户权限管理的功能，可以设置用户权限，主要包括业务用户和管理用户。
数据服务Web系统的设计，如下图所示：

该系统的设计比较容易，核心的思想就是前端和后端分离。前端定义的各种可视化组件，都是根据不同业务线的需求，经过梳理分类，将需求频度较高的抽象出来，做成业务功能组件。后端服务包括两类：一类是业务元数据服务接口，包括各种需要在页面展示的数据项，如设备机型、地域、应用、POI等；另一类是作业管理服务接口，主要负责管理作业相关内容，如作业查询、保存等。

6.3、业务作业调度平台

业务作业调度平台是整个数据服务平台最核心的子平台之一，设计该平台主要考虑除了当前支撑面向业务用户需求之外，还要能够很好的扩展以支持其他业务部门开发人员对服务的使用。该平台的架构，如下图所示：

该平台主要负责作业的解析编排、排队、调度。
作业编排采用调用外部编排服务的方式，主要考虑的是编排需要根据业务的一些属性进行实现，所以将易变的业务部分从作业调度平台分离出去。如果后续有对编排逻辑进行调整和修改，都无需操作业务作业度调度平台。
排队，支持多队列排队配置，比如根据当前及其未来的发展趋势，需要具有面向业务用户的业务队列、面向开发人员的服务队列，而这两种队列所负责的作业调度的SLA是完全不同的，业务队列中的作业每天可能成百上千个，而服务队列在初期对于每个业务线只需要每天调用一次或多次（正常会严格限制服务调用数量），初期从作业量上来看这两个作业容量的比例大概是8:2，通过队列来隔离调度，能够更好地满足具有不同需求的用户。
调度，是对作业、以及属于该作业的一组任务进行调度，为了简单可控起见，每个作业经过编排后会得到一组有序的任务列表，然后对每个任务进行调度。这里面，稍有点复杂的是，作业是一级调度，任务是二级调度，但是要保证属于同一个作业的任务能够按照先后顺序被调度运行。所以，作业是排队的基本单位，在每一个排队单元中，要包含作业ID、任务个数、作业状态，同时为能够控制任务正确调度，也需要包含当前调度运行中任务ID、运行中任务状态，可见任务是调度运行的基本单位。被调度运行的任务会发送到RabbitMQ中，然后等待任务协调计算平台消费并运行任务，这时作业调度平台只需要等待任务运行完成的结果消息到达，然后对作业和任务的状态进行更新，根据实际状态确定下一次调度的任务。
另外，还有几个点需要注意：第一，被调度运行的任务需要进行超时处理；第二，控制同时能够被调度的作业（实际上运行的是作业对应的某个任务）的数量；第三，作业优先级控制。

6.4、任务协调计算平台

任务协调计算平台也整个数据服务平台最核心的子平台之一，它是无状态的，除了能够支撑我们的数据服务平台，如果有其它想要接入的任务，都可以通过该平台协调来运行。该平台的架构，如下图所示：

该平台的设计是主从架构，Master和Slave之间通过RPC调用进行通信，通信层使用了Netty网络通信框架。Worker可以根据实际计算任务的压力，进行水平扩展。
Master负责控制从RabbitMQ中拉取任务消息，然后根据Worker节点的资源状况进行任务的协调和调度，并将Worker上作业完成的信息发送到RabbitMQ，供上游业务作业调度平台消费从而控制更新作业的运行状态。同时，Master管理注册的Worker状态、Worker资源状态、Worker上运行的任务的状态。
Worker是实际运行任务的工作节点，它负责将任务调度到后端的计算集群，或者调用数据处理服务来实现任务的运行。由于任务都是批量处理型计算任务，所以Worker要管理任务的提交，以及对已提交任务运行状态的异步查询（轮询）。

6.5、Greenplum REST服务网关

Greenplum REST服务网关，直接与Greenplum数据库进行交互，这样起到保护Greenplum数据库的作用。因为实际Greenplum数据库集群的计算容量有限，不能无限支持很高并发，所以通过控制并发来加快每个计算任务。该REST服务网关的设计，如下图所示：

上图中，通过排队机制来保护Greenplum，并进行任务的调度运行，所以该服务是有状态的。而且，该服务具有一定的业务特征，根据不同的数据需求，需要对接口以及SQL进行调整，最好的方式是将业务接口与任务计算分离：业务接口层可以将调用任务保存到Redis队列中，实现接口层的冗余部署和平滑升级，然后作为消费的任务处理服务直接消费Redis队列中的任务，提交到Greenplum数据库计算。

6.6、数据微服务平台

数据微服务平台，主要考虑复用已存在的数据服务，以及支撑数据服务的核心组件，如业务作业调度平台、任务协调计算平台等，为面向开发人员使用的服务调用，通过服务接口的方式暴露出来。数据微服务平台的架构，如下图所示：

该平台主要基于Spring Cloud构建，使用Eureka作为服务注册中心。由于整个数据服务平台是以离线计算为主，没有高并发、服务降级的、调用链跟踪等需求，所以并没有完全使用Netflix OSS中大部分组件，如Zuul、Hystrix等。如果后续需要，可以非常容地集成进来。
鉴权网关，是所有调用微服务平台的外部调用方的入口。为了保证整个微服务平台的正常运行，通过用户、时间（调用期限）、调用频率等限制调用方。比如某些业务线的应用需要使用微服务平台的服务，由于对方业务可能下线，而服务程序没有下线，仍然持续调用我们平台服务，这会对微服务平台资源造成浪费。另外，也避免了服务调用方测试、调试，对整个微服务平台造成不可控的状况。
上图左面，服务注册中心及其以上部分，是整个微服务平台的核心部分，我们在构建该平台时，也考虑了接入非微服务的组件。比如热力图服务，数据是需要批量处理生成，而访问时是同步调用的，所以在数据服务平台的Web部分提交的作业，如果是热力图类型，会调用微服务平台的热力图服务异步生成数据，而用户可以在Web系统中查看热力图（如果未生成则提示正在生成中）；对其它上层数据应用也可以直接调用微服务平台的热力图服务生成数据，并下载对应数热力图据。

6.7、其它服务/系统

其它服务/系统比较简单，所以这里只是简单说明一下：
Java REST服务网关：要对某些从Greenplum数据库中计算得到的数据，需要进行再加工处理以满足实际业务，如热力图数据生成和压缩等，将这些服务封装成REST风格接口调用。
Spark REST服务网关：对于需要对HDFS上指定数据集处理，生成需要的结果数据，使用Spark开发程序，同时将Spark计算作业封装成REST风格接口调用。
数据ETL调度系统：使用开源的Azkaban调度系统，实现所有ETL作业的统一调度。
数据采集服务：根据数据业务需要，从网上或其它渠道采集数据，比如通过高德API采集POI数据等。

七、架构总结

通过上面的架构设计实践，我们总结一下实践的经验，如下所示：

（1）底层数据处理引擎，可能会随着业务的发展，以及新技术的更迭，我们会有更多选择，所以在数据处理引擎之上，设计一层REST服务，实现上层应用与底层数据处理引擎解耦和。

（2）多个相对较重的服务，如业务作业调度平台、任务协调计算平台，它们之间通过消息解耦和，能更好的降低各个服务的复杂性，以及因为变更对双方造成的影响。

（3）系统架构分解，要考虑将有状态和无状态的部分分离，甚至在某个服务中，也有必要将有状态和无状态的部分进行分离。

（4）业务部分和非业务部分的分离，这样能够适应业务需求的变更，持续对业务部分进行更新升级，而非业务部分可能是相对稳定的。

对于无状态的服务，我们可以通过冗余部署多个服务实例，再通过反向代理的方式实现服务的高可用，甚至在演进为微服务架构时也比较容易做到。对于有状态的服务，因为单个服务需要维护状态新，所以实现高可用的思路是，启动多个实例，但是同一时刻只有一个是Active服务可以操作状态，而其它实例作为Standby服务，需要通过一种机制来监听并发现Active服务的可用性，然后在其失败时能切换到Standby服务，比如常用的Zookeeper等。

原文作者：时延军；原文地址请点击阅读原文进行查看！

送给每一位用心看完的小伙伴！

两本书中一本从留言区抽取，一本从“抽奖助手”中抽！

送书规则

1、本次活动还是在评论区随机抽取一名幸运吃瓜群众！

2、截止日期：2018年01月25日23时00分，幸运的小伙伴名单评论区留言会置顶，获奖的小伙伴请在一个工作日内在公众号界面联系我，发送手机号、姓名、收货地址，逾期则认为放弃处理；

重要的事情是：一共两本，一本从留言区选，一本从抽奖助手选！

最近热文阅读：

1、四张图带你了解Tomcat系统架构

2、三条路线告诉你如何掌握Spring IoC容器的核心原理

3、面试必备技能：JDK动态代理给Spring事务埋下的坑！

4、漫画区块链，一文带你秒懂她！

更多精彩，从关注《Java后端技术》公众号开始！

铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
抖音乐买买怎么加入赚钱?赚钱方法是什么测评君高省
你会在抖音买东西吗?如果会，那么一定要免费注册一个乐买买，抖音直播间，橱窗，小视频里的小黄车买东西都可以返佣金!省下来都是自己的，分享还可以赚钱乐买买是好省旗下的抖音返佣平台，乐买买分析社交电商的价值，乐买买属于今年难得的副业项目风口机会，2019年错过做好省的搞钱的黄金时期，那么2022年千万别再错过乐买买至于我为何转到高省呢？当然是高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自
网易严选官方旗舰店，优质商品，卓越服务高省_飞智666600
网易严选官方旗舰店是网易旗下的一家电商平台，以提供优质商品和卓越服务而闻名。作为一名SEO优化师，我将为您详细介绍网易严选官方旗舰店，并重点强调其特点和优势。大家好！我是高省APP最大团队&联合创始人飞智导师。相较于其他返利app，高省APP的佣金更高，模式更好，最重要的是，终端用户不会流失！高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
拥有断舍离的心态，过精简生活--《断舍离》读书笔记爱吃丸子的小樱桃
不知不觉间房间里的东西越来越多，虽然摆放整齐，但也时常会觉得空间逼仄，令人心生烦闷。抱着断舍离的态度，我开始阅读《断舍离》这本书，希望从书中能找到一些有效的方法，帮助我实现空间、物品上的断舍离。《断舍离》是日本作家山下英子通过自己的经历、思考和实践总结而成的，整体内涵也从刚开始的私人生活哲学的“断舍离”升华成了“人生实践哲学”，接着又成为每个人都能实行的“改变人生的断舍离”，从“哲学”逐渐升华成“
直返最高等级与直返APP：无需邀请码的返利新体验古楼
随着互联网的普及和电商的兴起，直返模式逐渐成为一种流行的商业模式。在这种模式下，消费者通过购买产品或服务，获得一定的返利，并可以分享给更多的人。其中，直返最高等级和直返APP是直返模式中的重要概念和工具。本文将详细介绍直返最高等级的概念、直返APP的使用以及与邀请码的关系。【高省】APP（高佣金领导者）是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，运行三年，稳定可靠。高省APP，
利用LangChain的StackExchange组件实现智能问答系统 nseejrukjhad langchain microsoft 数据库 python
利用LangChain的StackExchange组件实现智能问答系统引言在当今的软件开发世界中，StackOverflow已经成为程序员解决问题的首选平台之一。而LangChain作为一个强大的AI应用开发框架，提供了StackExchange组件，使我们能够轻松地将StackOverflow的海量知识库集成到我们的应用中。本文将详细介绍如何使用LangChain的StackExchange组件
数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
在一台Ubuntu计算机上构建Hyperledger Fabric网络落叶无声9 区块链超级账本 Hyperledger fabric 区块链 ubuntu 构建 hyperledger fabric
在一台Ubuntu计算机上构建HyperledgerFabric网络Hyperledgerfabric是一个开源的区块链应用程序平台，为开发基于区块链的应用程序提供了一个起点。当我们提到HyperledgerFabric网络时，我们指的是使用HyperledgerFabric的正在运行的系统。即使只使用最少数量的组件，部署Fabric网络也不是一件容易的事。Fabric社区创建了一个名为Cello
把握“三度”打造“三有”干部队伍辛德瑞拉卡卡卡
“胜败兴亡之分，不得不归咎于人事也”。干部队伍建设工作的好坏，关系到党和国家的发展全局。近日，新疆维吾尔自治区党委书记马兴瑞在部分党群单位走访调研时强调，要努力培养造就忠诚干净担当的高素质专业化干部队伍。各级组织部门应当在培养选拔干部、吸收优秀青年到党内来、培养造就优秀人才上下功夫，切实增强干部投身实践、解决问题、推进工作的能力，着力打造高素质专业化干部队伍。“天生我材必有用”，增强选育有“准度”
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
读书||陶新华《教育中的积极心理学》1—28 流水淙淙2022
读一本好书，尤如和一位高尚者对话，亦能对人的精神进行洗礼。但是若不能和实践结合起来，也只能落到空读书的状态。读书摘要与感想1、塞利格曼在《持续的幸福》一书中提出了幸福2.0理论，提出幸福由5个元素决定——积极情绪、投入的工作和生活、目标和意义、和谐的人际关系、成就感。2、人的大脑皮层在进行智力活动时，都伴有皮下中枢活动，对这些活动进行体验请假，并由此产生了情感解读。人的情绪情感体验总是优先于大脑的
2022现在哪个打车软件比较好用又便宜实惠的打车软件合集高省APP珊珊
这是一个信息高速传播的社会。信息可以通过手机，微信，自媒体，抖音等方式进行传播。但同时这也是一个交通四通发达的社会。高省APP，是2022年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入。珊珊导师，高省邀请码777777，注册送2皇冠会员，送万元推广大礼包，教你如何1年做到百万团队。高
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
穷人做什么生意最赚钱？10个适合穷人赚钱的路子？氧惠爱高省
不管在什么地方，一般都是穷人占大量数，而富人只有少数，但是它们却掌握着大量的财富。对于穷人来说，想要买车、买房等奢侈品就难如登天，因为他们只能通过打工来赚取几千元的月薪。➤推荐网购返利app“氧惠”，一个领隐藏优惠券+现金返利的平台。氧惠只提供领券返利链接，下单全程都在淘宝、京东、拼多多等原平台，更支持抖音、快手电商、外卖红包返利等。（应用市场搜“氧惠”下载，邀请码:521521，全网优惠上氧惠！
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
闲鱼鱼小铺怎么开通？鱼小铺开通需要哪些流程？高省APP大九
闲鱼鱼小铺是平台推出的一个专业程度的店铺，与普通店铺相比会有更多的权益，比如说发布的商品数量从50增加到500；拥有专业的店铺数据看板与分析的功能，这对于专门在闲鱼做生意的用户来说是非常有帮助的，那么鱼小铺每个人都能开通吗？大家好，我是高省APP联合创始人蓓蓓导师，高省APP是2021年推出的电商导购平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个可省钱佣金高，能
Redis系列：Geo 类型赋能亿级地图位置计算 Ly768768 redis bootstrap 数据库
1前言我们在篇深刻理解高性能Redis的本质的时候就介绍过Redis的几种基本数据结构，它是基于不同业务场景而设计的：动态字符串(REDIS_STRING)：整数(REDIS_ENCODING_INT)、字符串(REDIS_ENCODING_RAW)双端列表(REDIS_ENCODING_LINKEDLIST)压缩列表(REDIS_ENCODING_ZIPLIST)跳跃表(REDIS_ENCODI
ARM驱动学习之5 LEDS驱动 JT灬新一嵌入式 C 底层 arm开发学习单片机
ARM驱动学习之5LEDS驱动知识点：•linuxGPIO申请函数和赋值函数–gpio_request–gpio_set_value•三星平台配置GPIO函数–s3c_gpio_cfgpin•GPIO配置输出模式的宏变量–S3C_GPIO_OUTPUT注意点：DRIVER_NAME和DEVICE_NAME匹配。实现步骤：1.加入需要的头文件：//Linux平台的gpio头文件#include//三
直返APP是什么?直返APP是干嘛的氧惠帮朋友一起省
直返是一种电商购物模式，其核心特点是用户购买商品后可以获得直接返利。具体来说，用户在直返电商平台购买商品时，不仅可以获得商品本身的优惠，还可以获得一定的现金返利或者积分奖励。返利的金额可以提现到用户的账户余额，或者用于下次购物时抵扣。氧惠APP（带货领导者）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（每天出单带货几十万
直返的东西正品吗?直返APP安全吗?直返是正规平台吗? 氧惠购物达人
亲们，你们是不是经常在直返APP上买东西呀？但是，你们有没有想过，里面的东西到底是不是正品呢？这个APP安全吗？它是不是一个正规的平台呀？别着急，今天我就来给大家揭秘一下！氧惠APP（带货领导者）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（每天出单带货几十万单）。注册即可享受高补贴+0撸+捡漏等带货新体验。送万元推广大
福袋生活邀请码在哪里填写，福袋生活app邀请码使用教程小小编007
很多人下载福袋生活后，注册使用时需要填写邀请码。因为福袋生活是注册邀请制，所以首次使用填写邀请码才可以正常登录使用。福袋生活是广州市福袋生活信息科技有限公司旗下一家多元化社交电商导购平台，以APP为载体，社群为媒介，汇集衣食住行、吃喝玩乐生活服务板块，使用福袋生活可以领到淘宝，拼多多等电商平台的商品优惠券和返利，还可以兼职去分享赚钱。我为什么从福袋生活转到果冻宝盒呢？当然是因为福袋生活返利更高，注
与陌生人链接16 盼盼_9ba9
今天早上上班到下午下班，没有见到一个陌生人，但是与一个陌生人通电话了，他是师大音乐学院副院长，钢琴专业老师，想要找他给女儿教钢琴，昨天晚上我给他打了一个电话，他说他不教我家姑娘这样级别的孩子，我家姑娘刚刚学了10个月，也就一级的水平，而且说现在他们周末都上班，也没有时间，不知道什么原因，他说让我今天给他打电话看看孩子，今天我7点给他打电话，他说还在开会，8点半给他打电话他说刚刚散会！约我明天晚上8
2019-01-19 王小康KK
姓名:王康公司:扬州市方圆建筑工程有限公司2018年3月16日～3月18日上海361期《六项精进》感谢二组学员【日精进打卡第307天】【知～学习】《六项精进》大纲3遍共862遍《大学》通篇3遍共860遍《六项精进》全书40页【经典名句】思想决定行为，行为决定习惯，习惯决定性格，性格决定命运。【行～实践】一、修身：（对自己个人）1、践行六项精进的理念。二、齐家：（对家庭和家人）1、和女朋友视频聊天。
厉国刚：新闻学与传播学到底有何区别微观大道
厉国刚：新闻学与传播学到底有何区别头几天，有人在知乎上问我：新闻学与传播学到底有何区别。他是一位想要跨专业考研的学生，对新闻传播学学科可谓了解甚少，甚至一头雾水，想要让我帮他解释解释。在研究生学硕层面，新闻传播学是一级学科，分成新闻学、传播学这两个二级学科。有些高校，还自设了广告学、出版发行学等其他二级学科，但从官方角度，新闻传播学一级学科下，正统的就是那两个二级学科。招生时，一般会按一级学科招，
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class

PB级海量数据服务平台架构设计实践 | 文末福利

2、三条路线告诉你如何掌握Spring IoC容器的核心原理

3、面试必备技能：JDK动态代理给Spring事务埋下的坑！

4、漫画区块链，一文带你秒懂她！

你可能感兴趣的:(PB级海量数据服务平台架构设计实践 | 文末福利)