阿里云开发者

异步任务处理系统，如何解决业务长耗时、高并发难题？

简介：本文介绍了异步任务处理系统是如何解决业务长耗时、高并发难题的。

作者：不瞋（阿里云 Serverless 技术负责人）

当我们构建一个应用，总是希望它是响应迅速，成本低廉的。而在实际中，我们的系统却面临各种各样的挑战，例如不可预测的流量高峰，依赖的下游服务变得缓慢，少量请求却消耗大量 CPU/内存资源。这些因素常常导致整个系统被拖慢，甚至不能响应请求。为了让应用服务总是响应迅速，很多时候不得不预留更多的计算资源，但大部分时候，这些计算资源都是闲置的。一种更好的做法是将耗时缓慢，或者需要消耗大量资源的处理逻辑从请求处理主逻辑中剥离出来，交给更具资源弹性的系统异步执行，不但让请求能够被迅速处理返回给用户，也节省了成本。

一般来说，长耗时，消耗大量资源，或者容易出错的逻辑，非常适合从请求主流程中剥离出来，异步执行。例如新用户注册，注册成功后，系统通常会发送一封欢迎邮件。发送欢迎邮件的动作就可以从注册流程中剥离出来。另一个例子是用户上传图片，图片上传后通常需要生成不同大小的缩略图。但图片处理的过程不必包含在图片上传处理流程中，用户上传图片成功后就可以结束流程，生成缩略图等处理逻辑可以作为异步任务执行。这样应用服务器避免被图片处理等计算密集型任务压垮，用户也能更快的得到响应。常见的异步执行任务包括：

发送电子邮件/即时消息
检查垃圾邮件
文档处理（转换格式，导出，……）
音视频，图片处理（生成缩略图，加水印，鉴黄，转码，……）
调用外部的三方服务
重建搜索索引
导入/导出大量数据
网页爬虫
数据清洗
……

Slack，Pinterest，Facebook 等公司都广泛的使用异步任务，实现更好的服务可用性，更低的成本。根据 Dropbox 统计，他们的业务场景中一共有超过100种不同类型的异步任务。一个功能完备的异步任务处理系统能带来显著的收益：

更快的系统响应时间。将长耗时的，重资源消耗的逻辑从请求处理流程中剥离，在别的地方异步执行，能有效的降低请求响应延时，带来更好的用户体验。
更好的处理大量突发性请求。在电商等很多场景下，常常有大量突发性请求对系统造成冲击。同样的，如果将重资源消耗逻辑从请求处理流程中剥离，在别的地方异步执行，那么相同资源容量的系统能响应更大峰值的请求流量。
更低的成本。异步任务的执行时长通常在数百毫秒到数小时之间，根据不同的任务类型，合理的选择任务执行时间和更弹性的使用资源，就能实现更低的成本。
更完善的重试策略和错误处理能力。任务保证被可靠的执行（at-least-once），并且按照配置的重试策略进行重试，从而实现更好的容错能力。例如调用第三方的下游服务，如果能变成异步任务，设置合理的重试策略，即使下游服务偶尔不稳定，也不影响任务的成功率。
更快的完成任务处理。多个任务的执行是高度并行化的。通过伸缩异步任务处理系统的资源，海量的任务能够在合理的成本内更快的完成。
更好的任务优先级管理和流控。任务根据类型，通常按照不同的优先级处理。异步任务管理系统能帮助用户更好的隔离不同优先级的任务，既让高优先级任务能更快的被处理，又让低优先级任务不至于被饿死。
更多样化的任务触发方式。任务的触发方式是多种多样的，例如通过 API 直接提交任务，或是通过事件触发，或是定时执行等等。
更好的可观测性。异步任务处理系统通常会提供任务日志，指标，状态查询，链路追踪等能力，让异步任务更好的被观测、更容易诊断问题。
更高的研发效率。用户专注于任务处理逻辑的实现，任务调度，资源扩缩容，高可用，流控，任务优先级等功能都由任务处理系统完成，研发效率大幅提高。

任务处理系统架构

任务处理系统通常包括三部分：任务 API 和可观测，任务分发和任务执行。我们首先介绍这三个子系统的功能，然后再讨论整个系统面临的技术挑战和解决方案。

任务 API/Dashboard

该子系统提供一组任务相关的 API，包括任务创建、查询、删除等等。用户通过 GUI，命令行工具，后者直接调用 API 的方式使用系统功能。以 Dashboard 等方式呈现的可观测能力也非常重要。好的任务处理系统应当包括以下可观测能力：

日志：能够收集和展示任务日志，用户能够快速查询指定任务的日志。
指标：系统需要提供排队任务数等关键指标，帮助用户快速判断任务的执行情况。
链路追踪：任务从提交到执行过程中，各个环节的耗时。比如在队列中排队的时间，实际执行的时间等等。下图展示了 Netflix Cosmos 平台的 tracing 能力。

任务分发

任务分发负责任务的调度分发。一个能应用于生产环境的任务分发系统通常要具备以下功能：

任务的可靠分发：任务一旦提交成功后，无论遇到任何情况，系统都应当保证该任务被调度执行。
任务的定时/延时分发：很多类型的任务，希望在指定的时间执行，例如定时发送邮件/消息，或者定时生成数据报表。另一种情况是任务可以延时较长一段时间执行也没问题，例如下班前提交的数据分析任务在第二天上班前完成即可，这类任务可以放到凌晨资源消耗低峰的时候执行，通过错峰执行降低成本。
任务去重：我们总是不希望任务被重复执行。除了造成资源浪费，任务重复执行可能造成更严重的后果。比如一个计量任务因为重复执行算错了账单。要做到任务只执行一次（exactly-once），需要在任务提交，分发，执行全链路上的每个环节都做到，包括用户在实现任务处理代码时也要在执行成功，执行失败等各种情况下，做到 exactly-once。如何实现完整的 exactly-once 比较复杂，超出了本文的讨论范围。很多时候，系统提供一个简化的语义也很有价值，即任务只成功执行一次。任务去重需要用户在提交任务时指定任务 ID，系统通过 ID来判断该任务是否已经被提交和成功执行过。
任务错误重试：合理的任务重试策略对高效、可靠的完成任务非常关键。任务的重试要考虑几个因素：1）要匹配下游任务执行系统的处理能力。比如收到下游任务执行系统的流控错误，或者感知到任务执行成为瓶颈，需要指数退避重试。不能因为重试反而加大了下游系统的压力，压垮下游；2）重试的策略要简单清晰，易于用户理解和配置。首先要对错误进行分类，区分不可重试错误，可重试错误，流控错误。不可重试错误是指确定性失败的错误，重试没有意义，比如参数错误，权限问题等等。可重试错误是指导致任务失败的因素具有偶然性，通过重试任务最终会成功，比如网络超时等系统内部错误。流控错误是一种比较特殊的可重试错误，通常意味着下游已经满负荷，重试需要采用退避模式，控制发送给下游的请求量。
任务的负载均衡：任务的执行时间变化很大，短的几百毫秒，长的数十小时。简单的 round-robin 方式分发任务，会导致执行节点负载不均。实践中常见的模式是将任务放置到队列中，执行节点根据自身任务执行情况主动拉取任务。使用队列保存任务，让根据节点的负载把任务分发到合适的节点上，让节点的负载均衡。任务负载均衡通常需要分发系统和执行子系统配合实现。
任务按优先级分发：任务处理系统通常对接很多的业务场景，他们的任务类型和优先级各不相同。位于业务核心体验相关的任务执行优先级要高于边缘任务。即使同样是消息通知，淘宝上买家收到一个商品评论通知的重要性肯定低于新冠疫情中的核酸检测通知。但另一方面，系统也要保持一定程度的公平，不要让高优先级任务总是抢占资源，而饿死低优先级任务。
任务流控：任务流控典型的使用场景是削峰填谷，比如用户一次性提交数十万的任务，期望在几个小时内慢慢处理。因此系统需要限制任务的分发速率，匹配下游任务执行的能力。任务流控也是保证系统可靠性的重要手段，某类任务提交量突然爆发式增长，系统要通过流控限制其对系统的冲击，减小对其他任务的影响。
批量暂停和删除任务：在实际生产环境，提供任务批量暂停和删除非常重要。用户总是会出现各种状况，比如任务的执行出现了某些问题，最好能暂停后续任务的执行，人工检查没有问题后，再恢复执行；或者临时暂停低优先级任务，释放计算资源用于执行更高优先级的任务。另一种情况是提交的任务有问题，执行没有意义。因此系统要能让用户非常方便的删除正在执行和排队中的任务。任务的暂停和删除需要分发和执行子系统配合实现。

任务分发的架构可分为拉模式和推模式。拉模式通过任务队列分发任务。执行任务的实例主动从任务队列中拉取任务，处理完毕后再拉取新任务。相对于拉模式，推模式增加了一个分配器的角色。分配器从任务队列中读取任务，进行调度，推送给合适的任务执行实例。

拉模式的架构清晰，基于 Redis 等流行软件可以快速搭建任务分发系统，在简单任务场景下表现良好。但如果要支持任务去重，任务优先级，批量暂停或删除，弹性的资源扩缩容等复杂业务场景需要的功能，拉模式的实现复杂度会迅速增加。实践中，拉模式面临以下一些主要的挑战：

资源自动伸缩和负载均衡复杂。任务执行实例和任务队列建立连接，拉取任务。当任务执行实例规模较大时，对任务队列的连接资源会造成很大的压力。因此需要一层映射和分配，任务实例只和对应的任务队列连接。下图是 Slack 公司的异步任务处理系统架构。Worker 节点只和部分 Redis 实例相连。这解决了 worker 节点大规模扩展的能力，但是增加了调度和负载均衡的复杂度。

从支持任务优先级，隔离和流控等需求的角度考虑，最好能使用不同的队列。但队列过多，又增加了管理和连接资源消耗，如何平衡很有挑战。
任务去重，任务批量暂停或者删除等功能依赖消息队列功能，但很少有消息类产品能满足所有需求，常常需要自行开发。例如从可扩展性的角度，通常做不到每一类任务都对应单独的任务队列。当任务队列中包含多种类型的任务时，要批量暂停或者删除其中某一类的任务，是比较复杂的。
任务队列的任务类型和任务处理逻辑耦合。如果任务队列中包含多种类型的任务，要求任务处理逻辑也要实现相应的处理逻辑，对用户不友好。在实践中，A 用户的任务处理逻辑不会预期接收到别的用户任务，因此任务队列通常由用户自行管理，进一步增加了用户的负担。

推模式的核心思想是将任务队列和任务执行实例解耦，平台侧和用户的边界更加清晰。用户只需要专注于任务处理逻辑的实现，而任务队列，任务执行节点资源池的管理都由平台负责。推模式的解耦也让任务执行节点的扩容不再受任务队列的连接资源等方面的限制，能够实现更高的弹性。但推模式也引入了很多的复杂度，任务的优先级管理，负载均衡，调度分发，流控等都由分配器负责，分配器需要和上下游系统联动。

总的来说，当任务场景变得复杂后，无论拉还是推模式，系统复杂度都不低。但推模式让平台和用户的边界更清晰，简化了用户的使用复杂度，因此有较强技术实力的团队，实现平台级的任务处理系统时，通常会选择推模式。

任务执行

任务执行子系统管理一批执行任务的 worker 节点，以弹性、可靠的方式执行任务。典型的任务执行子系统需具备如下功能：

任务的可靠执行。任务一旦提交成功，无论任何情况，系统应当保证任务被执行。例如执行任务的节点宕机，任务应当调度到其他的节点执行。任务的可靠执行通常是任务分发和任务执行子系统共同配合实现。
共享资源池。不同类型的任务处理资源共享统一的资源池，这样才能削峰填谷，提高资源利用效率，降低成本。例如把计算密集，io密集等不同类型的任务调度到同一台 worker 节点上，就能更充分的利用节点上的CPU，内存，网络等多个维度的资源。共享资源池对容量管理，任务资源配额管理，任务优先级管理，资源隔离提出了更高的要求。
资源弹性伸缩。系统能根据负载的执行情况伸缩执行节点资源，降低成本。伸缩的时机和数量非常关键。常见的根据任务执行节点的 CPU，内存等资源水位情况伸缩，时间较长，不能满足实时性要求高的场景。很多系统也使用排队任务数等指标进行伸缩。另一个值得关注的点是执行节点的扩容需要匹配上下游系统的能力。例如当任务分发子系统使用队列来分发任务时，worker 节点的扩容要匹配队列的连接能力。
任务资源隔离。在 worker 节点上执行多个不同的任务时，资源是相互隔离的。通常使用容器的隔离机制实现。
任务资源配额。用户的使用场景多样，常常包含多种任务类型和优先级。系统要支持用户为不同优先级的任务或者处理函数设置资源配额，为高优先级任务预留资源，或者限制低优先级任务能使用的资源。
简化任务处理逻辑的编码。好的任务处理系统，能够让用户专注于实现单个任务处理逻辑，系统自动并行、弹性、可靠的执行任务。
平滑升级。底层系统的升级不要中断长时任务的执行。
执行结果通知。实时通知任务执行状态和结果。对于执行失败的任务，任务的输入被保存到死信队列中，方便用户随时手动重试。

任务执行子系统通常使用 K8s 管理的容器集群作为资源池。K8s 能够管理节点，将执行任务的容器实例调度到合适的节点上。K8s 也内置了作业（Jobs）和定时作业（Cron Jobs）的支持，简化了用户使用 Job 负载的难度。K8s 有助于实现共享资源池管理，任务资源隔离等功能。但 K8s 主要能力还是在POD/实例管理上，很多时候需要开发更多的功能来满足异步任务场景的需求。例如：

K8s 的 HPA 一般难以满足任务场景下的自动伸缩。Keda 等开源项目提供了按排队任务数等指标伸缩的模式。AWS 也结合 CloudWatch 提供了类似的解决方案。
K8s 一般需要配合队列来实现异步任务，队列资源的管理需要用户自行负责。
K8s 原生的作业调度和启动时间比较慢，而且提交作业的 tps 一般小于 200，所以不适合高 tps，短延时的任务。

注意：K8s 中的作业（Job）和本文讨论的任务（task）有一些区别。K8s 的 Job 通常包含处理一个或者多个任务。本文的任务是一个原子的概念，单个任务只在一个实例上执行。执行时长从几十毫秒到数小时不等。

异步任务处理系统的能力分层

根据前述对异步任务处理系统的架构和功能的分析，我们将异步任务处理系统的能力分为以下三层：

Level 1：一般需 1-5 人研发团队，系统是通过整合 K8s 和消息队列等开源软件/云服务的能力搭建的。系统的能力受限于依赖的开源软件/云服务，难以根据业务需求进行定制。资源的使用偏静态，不具备资源伸缩，负载均衡的能力。能够承载的业务规模有限，随着业务规模和复杂度增长，系统开发和维护的代价会迅速增加。
Level 2：一般需 5-10人研发团队，在开源软件/云服务的基础之上，具备一定的自主研发能力，满足常见的业务需求。不具备完整的任务优先级、隔离、流控的能力，通常是为不同的业务方配置不同的队列和计算资源。资源的管理比较粗放，缺少实时资源伸缩和容量管理能力。系统缺乏可扩展性，资源精细化管理能力，难以支撑大规模复杂业务场景。
Level 3：一般需 10+ 人研发团队，能够打造平台级的系统。具备支撑大规模，复杂业务场景的能力。采用共享资源池，在任务调度，隔离流控，负载均衡，资源伸缩等方面能力完备。平台和用户界限清晰，业务方只需要专注于任务处理逻辑的开发。具备完整的可观测能力。

	Level 1	Level 2	Level 3
任务的可靠分发	支持	支持	支持
任务定时/延时发送	取决于选择的消息队列能力。一般支持定时任务，但不支持延时任务	支持	支持
任务去重	不支持	支持	支持
任务错误自动重试	有限支持。一般依赖于 K8s Jobs 内置的重试策略。对于未使用 K8s Jobs 的任务，则需用户在任务处理逻辑中自行实现	有限支持。一般依赖于 K8s Jobs 内置的重试策略。对于未使用 K8s Jobs 的任务，则需用户在任务处理逻辑中自行实现	支持。平台和用户界限清晰，根据用户设定的策略重试
任务负载均衡	有限支持。在任务执行实例规模小的情况下通过消息队列实现	有限支持。在任务执行实例规模小的情况下通过消息队列实现	支持。系统具备大规模节点的负载均衡能力
任务优先级	不支持	有限支持。允许用户为高优先级任务预留资源，或者限制低优先级任务的资源使用	支持。高优先级任务可抢占低优先级任务资源，同时系统会兼顾公平，避免低优先级任务被饿死
任务流控	不支持	不支持。一般是为不同任务类型或者业务方配置独立的队列和计算资源	在系统的每个环节具备流控能力，系统不会因为任务爆发式提交雪崩
任务批量暂停/删除	不支持	有限支持。取决于是否为不同任务类型或者业务方配置独立的队列和计算资源	支持
共享资源池	有限支持。依赖 K8s 的调度能力。一般是为各个业务方搭建不同的集群	有限支持。依赖 K8s 的调度能力。一般是为各个业务方搭建不同的集群	支持。不同类型的任务，不同业务场景共享同一个资源池
资源弹性伸缩	不支持。K8s 的 HPA 通常难以满足任务场景下的伸缩要求	不支持。K8s 的 HPA 通常难以满足任务场景下的伸缩要求	支持。根据排队任务数，节点资源利用率等多维度实时伸缩
任务资源隔离	支持。依赖容器的资源隔离能力	支持。依赖容器的资源隔离能力	支持。依赖容器的资源隔离能力
任务资源配额	不支持	支持	支持
简化任务处理逻辑编码	不支持。任务处理逻辑需要自行拉取任务，执行任务	不支持。任务处理逻辑需要自行拉取任务，执行任务	支持
系统平滑升级	不支持	不支持	支持
执行结果通知	不支持	不支持	支持
可观测性	依赖 K8s，消息队列等开源软件自身的可观测能力。具备基本的任务状态查询	依赖 K8s，消息队列等开源软件自身的可观测能力。具备基本的任务状态查询	具备从任务到系统各个层面的完整可观测能力

结论

异步任务是构建弹性、高可用，响应迅速应用的重要手段。本文对异步任务的适用场景和收益进行了介绍，并讨论了典型异步任务系统的架构、功能和工程实践。要实现一个能够满足多种业务场景需求，弹性可扩展的异步任务处理平台具有较高的复杂度。而阿里云函数计算 FC 为用户提供了开箱即用的，接近于Level ß3能力的异步任务处理服务。用户只需要创建任务处理函数，通过控制台，命令行工具，API/SDK，事件触发等多种方式提交任务，就可以弹性、可靠、可观测完备的方式处理任务。函数计算异步任务覆盖任务处理时长从毫秒到24小时的场景，被阿里云数据库自制服务 DAS，支付宝小程序压测平台，网易云音乐，新东方，分众传媒，米连等集团内外客户广泛应用。

附录

函数计算异步任务和 K8S Jobs 的能力对比。

对比项	函数计算异步任务	K8S Jobs
适用场景	适合任务执行时长数十毫秒的实时任务和任务执行时长几十小时的离线任务	适合任务提交速度要求不高，任务负载比较固定，任务实时性要求不高的离线任务
任务可观测能力	支持。提供日志，任务排队数等指标，任务链路耗时，任务状态查询等丰富可观测能力	自行整合开源软件实现。
任务实例自动扩缩容	支持。根据任务排队数，实例资源使用率自动扩缩容	不支持。一般通过任务队列，自行实现自动扩缩容和实例负载均衡，复杂度高
任务实例伸缩速度	毫秒级	分钟级
任务实例资源利用率	用户只需要选择合适的实例规格，实例自动伸缩，按实际处理任务的时长计量，资源利用率高	需在作业（Job）提交时确定实例的规格和数目。实例难以自动伸缩和负载均衡，资源利用率低
任务提交速度	单个用户支持每秒提交数万任务	整个集群每秒最多启动数百作业（Jobs）
任务定时/延时提交	支持	支持定时任务，不支持延时任务
任务去重	支持	不支持
暂停/恢复任务执行	支持	Alpha 状态（K8S v1.21）
终止指定任务	支持	有限支持。通过终止任务实例间接实现
任务流控	支持。可在用户，任务处理函数等不同粒度进行流控	不支持
任务结果自动回调	支持	不支持
开发运维成本	只需要实现任务的处理逻辑	需维护K8S集群

2、网易云音乐音视频算法的 Serverless 探索之路： https://developer.aliyun.com/article/801501

3、其它异步任务案例：https://developer.aliyun.com/article/815182

参考链接：

[1] slack engineering：https://slack.engineering/scaling-slacks-job-queue/

[2] Facebook：https://engineering.fb.com/2020/08/17/production-engineering/async/

[3] Dropbox 统计：https://dropbox.tech/infrastructure/asynchronous-task-scheduling-at-dropbox

[4] Netflix Cosmos 平台：https://netflixtechblog.com/the-netflix-cosmos-platform-35c14d9351ad

[5] keda：https://keda.sh/

[6] Autoscaling Asynchronous Job Queues ：https://d1.awsstatic.com/architecture-diagrams/ArchitectureDiagrams/autoscaling-asynchronous-job-queues.pdf

[7] 异步任务：https://help.aliyun.com/document_detail/372531.html

[8] Sample and Hold 算法：https://dl.acm.org/doi/10.1145/633025.633056

更多内容关注 Serverless 微信公众号（ID：serverlessdevs），汇集 Serverless 技术最全内容，定期举办 Serverless 活动、直播，用户最佳实践。

原文链接：https://developer.aliyun.com/article/902613?

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

你可能感兴趣的:(消息中间件,弹性计算,Kubernetes,负载均衡,NoSQL,Serverless,API,调度,数据中心,容器,阿里云开发者)

【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
swagger访问路径 igotyback swagger
Swagger2.x版本访问地址：http://{ip}:{port}/{context-path}/swagger-ui.html{ip}是你的服务器IP地址。{port}是你的应用服务端口，通常为8080。{context-path}是你的应用上下文路径，如果应用部署在根路径下，则为空。Swagger3.x版本对于Swagger3.x版本（也称为OpenAPI3）访问地址：http://{ip
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
【加密社】Solidity 中的事件机制及其应用加密社闲侃区块链智能合约区块链
加密社引言在Solidity合约开发过程中，事件（Events）是一种非常重要的机制。它们不仅能够让开发者记录智能合约的重要状态变更，还能够让外部系统（如前端应用）监听这些状态的变化。本文将详细介绍Solidity中的事件机制以及如何利用不同的手段来触发、监听和获取这些事件。事件存储的地方当我们在Solidity合约中使用emit关键字触发事件时，该事件会被记录在区块链的交易收据中。具体而言，事件
从0到500+，我是如何利用自媒体赚钱？一列脚印
运营公众号半个多月，从零基础的小白到现在慢慢懂了一些运营的知识。做好公众号是很不容易的，要做很多事情；排版、码字、引流…通通需要自己解决，业余时间全都花费在这上面涨这么多粉丝是真的不容易，对比知乎大佬来说，我们这种没资源，没人脉，还没钱的小透明来说，想要一个月涨粉上万，怕是今天没睡醒（不过你有的方法，算我piapia打脸）至少我是清醒的，自己慢慢努力，实现我的万粉目标！大家快来围观、支持我吧！孩子
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
利用Requests Toolkit轻松完成HTTP请求 nseejrukjhad http 网络协议网络 python
RequestsToolkit的力量：轻松构建HTTP请求Agent在现代软件开发中，API请求是与外部服务交互的核心。RequestsToolkit提供了一种便捷的方式，帮助开发者构建自动化的HTTP请求Agent。本文旨在详细介绍RequestsToolkit的设置、使用和潜在挑战。引言RequestsToolkit是一个强大的工具包，可用于构建执行HTTP请求的智能代理。这对于想要自动化与外
Day17笔记-高阶函数 ~在杰难逃~ Python 笔记 python 开发语言 pycharm 数据分析
高阶函数【重点掌握】函数的本质：函数是一个变量，函数名是一个变量名，一个函数可以作为另一个函数的参数或返回值使用如果A函数作为B函数的参数，B函数调用完成之后，会得到一个结果，则B函数被称为高阶函数常用的高阶函数：map(),reduce(),filter(),sorted()1.map()map(func,iterable)，返回值是一个iterator【容器，迭代器】func:函数iterab
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
基于CODESYS的多轴运动控制程序框架：逻辑与运动控制分离，快速开发灵活操作 GPJnCrbBdl python 开发语言
基于codesys开发的多轴运动控制程序框架，将逻辑与运动控制分离，将单轴控制封装成功能块，对该功能块的操作包含了所有的单轴控制（归零、点动、相对定位、绝对定位、设置当前位置、伺服模式切换等等）。程序框架由主程序按照状态调用分归零模式、手动模式、自动模式、故障模式，程序状态的跳转都已完成，只需要根据不同的工艺要求完成所需的动作即可。变量的声明、地址的规划都严格按照C++的标准定义，能帮助开发者快速
docker igotyback eureka 云原生
Docker容器的文件系统是隔离的，但是可以通过挂载卷（Volumes）或绑定挂载（BindMounts）将宿主机的文件系统目录映射到容器内部。要查看Docker容器的映射路径，可以使用以下方法：查看容器配置：使用dockerinspect命令可以查看容器的详细配置信息，包括挂载的卷。例如：bashdockerinspect在输出的JSON格式中，查找"Mounts"部分，这里会列出所有的挂载信息
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
SpringBlade dict-biz/list 接口 SQL 注入漏洞文章永久免费只为良心 oracle 数据库
SpringBladedict-biz/list接口SQL注入漏洞POC:构造请求包查看返回包你的网址/api/blade-system/dict-biz/list?updatexml(1,concat(0x7e,md5(1),0x7e),1)=1漏洞概述在SpringBlade框架中，如果dict-biz/list接口的后台处理逻辑没有正确地对用户输入进行过滤或参数化查询（PreparedSta
OPENAIGC开发者大赛企业组AI黑马奖 | AIGC数智传媒解决方案 RPA中国人工智能 AIGC 传媒
在第二届拯救者杯OPENAIGC开发者大赛中，涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到，我们特意开设了优秀作品报道专栏，旨在展示其独特之处和开发者的精彩故事。无论您是技术专家还是爱好者，希望能带给您不一样的知识和启发。让我们一起探索AIGC的无限可能，见证科技与创意的完美融合！创未来AI应用赛-企业组AI黑马奖作品名称：AIGC数智传媒解决方案参赛团队：深圳市三象智能技术
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
【六】阿伟开始搭建Kafka学习环境能源恒观中间件学习 kafka spring
阿伟开始搭建Kafka学习环境概述上一篇文章阿伟学习了Kafka的核心概念，并且把市面上流行的消息中间件特性进行了梳理和对比，方便大家在学习过程中进行对比学习，最后梳理了一些Kafka使用中经常遇到的Kafka难题以及解决思路，经过上一篇的学习我相信大家对Kafka有了初步的认识，本篇将继续学习Kafka。一、安装和配置学习一项技术首先要搭建一套服务，而Kafka的运行主要需要部署jdk、zook
python多线程程序设计之一 IT_Beijing_BIT #Python 程序设计语言 python
python多线程程序设计之一全局解释器锁线程APIsthreading.active_count()threading.current_thread()threading.excepthook(args,/)threading.get_native_id()threading.main_thread()threading.stack_size([size])线程对象成员函数构造器start/ru
ArrayList 源码解析程序猿进阶 Java基础 ArrayList List java 面试性能优化架构设计 idea
ArrayList是Java集合框架中的一个动态数组实现，提供了可变大小的数组功能。它继承自AbstractList并实现了List接口，是顺序容器，即元素存放的数据与放进去的顺序相同，允许放入null元素，底层通过数组实现。除该类未实现同步外，其余跟Vector大致相同。每个ArrayList都有一个容量capacity，表示底层数组的实际大小，容器内存储元素的个数不能多于当前容量。当向容器中添
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
Android应用性能优化轻口味 Android
Android手机由于其本身的后台机制和硬件特点，性能上一直被诟病，所以软件开发者对软件本身的性能优化就显得尤为重要；本文将对Android开发过程中性能优化的各个方面做一个回顾与总结。Cache优化ListView缓存：ListView中有一个回收器，Item滑出界面的时候View会回收到这里，需要显示新的Item的时候，就尽量重用回收器里面的View；每次在getView函数中inflate新
react-intl——react国际化使用方案苹果酱0567 面试题汇总与解析 java 开发语言中间件 spring boot 后端
国际化介绍i18n：internationalization国家化简称，首字母+首尾字母间隔的字母个数+尾字母，类似的还有k8s(Kubernetes)React-intl是React中最受欢迎的库。使用步骤安装#usenpmnpminstallreact-intl-D#useyarn项目入口文件配置//index.tsximportReactfrom"react";importReactDOMf
笋丁网页自动回复机器人V3.0.0免授权版源码希希分享软希网58soho_cn 源码资源笋丁网页自动回复机器人
笋丁网页机器人一款可设置自动回复，默认消息，调用自定义api接口的网页机器人。此程序后端语言使用Golang，内存占用最高不超过30MB，1H1G服务器流畅运行。仅支持Linux服务器部署，不支持虚拟主机，请悉知！使用自定义api功能需要有一定的建站基础。源码下载：https://download.csdn.net/download/m0_66047725/89754250更多资源下载：关注我。安
Spring MVC 全面指南：从入门到精通的详细解析一杯梅子酱技术栈学习 spring mvc java
引言：SpringMVC，作为Spring框架的一个重要模块，为构建Web应用提供了强大的功能和灵活性。无论是初学者还是有一定经验的开发者，掌握SpringMVC都将显著提升你的Web开发技能。本文旨在为初学者提供一个全面且易于理解的学习路径，通过详细的知识点分析和实际案例，帮助你快速上手SpringMVC，让学习过程既深刻又高效。一、SpringMVC简介1.1什么是SpringMVC？Spri
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
GenVisR 基因组数据可视化实战(三) 11的雾
3.genCov画每个突变位点附件的coverage，跟igv有点相似。这个操作起来很复杂，但是图还是挺有用的。可以考虑。由于我的referencegenomebuild是hg38BiocManager::install(c("TxDb.Hsapiens.UCSC.hg38.knownGene","BSgenome.Hsapiens.UCSC.hg38"))library(TxDb.Hsapien
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
经纬恒润二面&三七互娱一面&元象二面 Redstone Monstrosity 面试前端
1.请尽可能详细地说明，进程和线程的区别，分别有哪些应用场景？进程间如何通信？线程间如何通信？你的回答中不要写出示例代码。进程和线程是操作系统中的两个基本概念，它们在计算机系统中扮演着不同的角色，并且在不同的应用场景中发挥作用。进程和线程的区别定义：进程：进程是操作系统进行资源分配和调度的基本单位。每个进程都有独立的内存空间和系统资源。线程：线程是进程内的一个执行单元，是操作系统进行调度的最小单位
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><