chy19911123

基于Spark的异构分布式深度学习平台

http://geek.csdn.net/news/detail/58867

导读：本文介绍百度基于Spark的异构分布式深度学习系统，把Spark与深度学习平台PADDLE结合起来解决PADDLE与业务逻辑间的数据通路问题，在此基础上使用GPU与FPGA异构计算提升每台机器的数据处理能力，使用YARN对异构资源做分配，支持Multi-Tenancy，让资源的使用更有效。

深层神经网络技术最近几年取得了巨大的突破，特别在语音和图像识别应用上有质的飞跃，已经被验证能够使用到许多业务上。如何大规模分布式地执行深度学习程序，使其更好地支持不同的业务线成为当务之急。在过去两年，百度深度学习实验室在徐伟的带领下开发了分布式深度学习平台PADDLE（Parallel Asynchronous Distributed Deep Learning），很好地满足了许多业务需求。但由于PADDLE是独立的深度学习平台，不能很好地跟其他业务逻辑结合，导致PADDLE与其他业务逻辑间的数据通路成为了性能的瓶颈。为了让更多的业务使用上深度学习技术，我们开发了Spark on PADDLE平台，让PADDLE变成百度Spark生态系统的一个功能模块。在第一版完成之后，我们发现CPU计算能力已经满足不了百度巨大的数据量需求，于是我们在Spark on PADDLE的基础上增加了对异构的支持，充分利用了GPU和FPGA等资源去加速PADDLE上的作业。

深度学习系统PADDLE的设计

PADDLE是一个成熟的分布式深度学习平台，广泛应用于百度的图像识别、自然语言理解、语音、无人车等领域，其主要的特点是训练算法高度优化，支持多GPU/CPU训练，训练效率高，对稀疏特征有独特的优化。

现有的深度学习平台，一般都是通过单机方式进行训练，如开源的Caffe平台也是通过单机多卡的方式进行训练。但当数据或者模型规模上去以后，要提高训练效率，必然要进行分布式训练，主要有数据并行和模型并行两种方法。

数据并行是分布式深度学习用得最多的并行方法。所谓数据并行，就是因为训练数据规模非常大，需要把数据拆分，把模型分布到N个机器训练。但是因为最终训练的是一个模型，同时每个机器只能分配到一部分数据，训练的同步和收敛性必须得到保证。最经典的做法是在《Parameter Server for Distributed Machine Learning》中提到的用参数服务器（Parameter Server）的方法。具体的想法是用模型参数服务的方法来同步参数的更新，每个参数服务器只负责同步公共参数的一部分。举个例子来说，如果模型M，被分布到N个机器上面训练，每个机器拿到一部分数据，假设训练的参数集合是W，每个机器首先进行本地训练，假设他们初始化参数都是，根据，每台机器都能算出相应的代价函数的梯度，一般按照单机神经网络反向传播的方式，每个层都可以梯度来得到参数的修正值，这样参数就变成因为是多机，每个节点对参数的修正量不同，就会多了一个步骤把各自参数的修正量push给参数服务器，由它统一决策下个训练循环的修正量，这样大家的训练模型就会被统一起来。

图1 数据并行

图1展示了深度学习数据并行的部署架构。一般分为以下步骤；

训练数据预处理，把数据切分为data shards；
每个机器得到同样的模型定义,并且统一初始化参数；
对于每个训练循环，每个机器算各自的梯度，并且把梯度修正量push给参数服务器，参数服务器统一计算，并且把下一轮迭代的参数push给本地训练机器；
不断循环，直到模型收敛。

参数服务器的更新算法还分为同步和异步的区别。因为严格同步的方法会让本地训练机在每一个训练迭代都会进行参数的同步更新，这样在有慢节点的情况下，整个训练都会被拖慢。异步参数更新的想法是让参数同步的频率变长，这样可以让本地训练机迭代好几个回合以后再进行参数同步，这样的做法有利有弊，好处是慢节点对这个训练的影响变小，坏处是每个模型训练可能会浪费训练周期，因为同步以后的修正量可能跟本地训练机做的修正量有很大的不同。这其中对于同步频率的把握和异步收敛性的问题都是研究的方向。

模型并行方法如图2所示，针对参数规模达到单机无法载入的量级或者模型间存在很少连接的区块的场景，可以考虑做模型并行，但是模型并行通信开销和同步消耗超过数据并行，效率可能没有数据并行高。

图2 模型并行

PADDLE的设计主要采用了单机做到模型并行、多机做到数据并行的方式，从而达到亿级模型规模以上，大规模数据量的分布式训练。

PADDLE与业务逻辑结合的痛点

PADDLE是一个独立的深度学习平台，不能很好地支持把数据从其他平台接入的需求。研发人员通常要等上一阶段的工作完成产生PADDLE的输入数据后，把数据先存入HDFS，再读到PADDLE集群的本地内存与硬盘，等数据准备好以后再用PADDLE去训练模型。等模型训练好后，再把模型存在HDFS里，让下一个业务逻辑去读取。这个过程不仅耗时长，成为整个计算流程的瓶颈，并且都是重复性的枯燥工作，影响了PADDLE平台的推广，让很多有需要的团队没法用上深度学习技术。

为了解决这个问题，我们设计了Spark on PADDLE架构，把Spark与PADDLE耦合起来，让PADDLE成为Spark的一个模块。如图3所示，模型训练可以与前端的功能整合，比如特征提取通过RDD的形式进行数据传递，无需通过HDFS进行数据导流。这样一来，PADDLE与业务逻辑间的数据通路不再是性能瓶颈。

图3 基于百度Spark的通用业务逻辑

Spark on PADDLE架构1.0版

Spark是近几年快速兴起的大数据处理平台，不仅仅在于它的计算模型比传统的Hadoop MapReduce要高效很多，同时在于它所带来的生态系统非常强大。基于Spark计算引擎构建的上层应用如Spark SQL、Spark Streaming、Spark MLlib等，都是很优秀的应用，比传统应用性能好几倍，并且更加稳定。同时与Yarn/Mesos的结合让Spark对计算资源的管理和分配更加灵活。

Spark在百度内部已经广泛应用，主要用于数据处理和数据分析。但是传统的数据处理平台必定会有根据数据训练模型的机制，广告系统的CTR预测就是一个例子，对于用户产生大量的点击和浏览日志，Spark可以进行处理和清洗。但是对于大规模模型的训练，Spark MLlib的支持还是有限，特别是对于深度学习的支持，所以需要解决在Spark上支持PADDLE的问题。

对于用户的应用程序，Spark叫驱动节点（Driver）,可以视为Spark用户分布式程序调度和程序流控制的主节点。Spark程序的具体运算都分布在Worker Node上面的Executor跑。Spark还有一个非常重要的概念叫RDD，这是一个分布式的分区（partitioned）数据抽象集。Spark所有输入和输出数据都是以RDD为导向的，它不仅描述了数据集的依赖关系，同时还对数据进行了逻辑上的切分，对一个RDD操作一般都是partition来并行的。

图4 Spark DNN训练运行构架

Spark DNN训练运行构架如图4所示，训练一般分为以下5个步骤：

DNN 数据预处理和训练特征准备

一般这是Spark的强项，不管是流式数据还是已经落盘的数据都通过Spark来进行数据处理，其中包括数据清洗、特征准备，然后把得到的训练数据用RDD输出。

资源申请

Spark训练任务提交的时候先从Yarn那里拿到对于DNN训练任务的节点资源，比如说一个训练任务需要4个有4 GPU机器的节点。Yarn会对资源做Container式的管理，不管CPU还是GPU对于Yarn来说都是一个虚拟的资源。后文会做具体介绍。

训练初始化

Driver会根据Yarn分配的资源相应分发模型配置。模型训练资源库，并且启动训练机和参数服务器，同时初始化模型的初始参数。

模型训练

训练的数据会以RDD的方式输入到训练机接口，以数据并行的方式进行训练，并且启动的训练机会跟参数服务器通信，完成梯度交换和参数同步，当训练最大迭代达到或者模型收敛，则训练终止。

模型预测

模型可以传入某一个服务器集群或者以Spark Streaming的方式进行载入并且预测。

在Spark on PADDLE 1.0开发的过程中，我们验证了Spark确实可以把ETL、训练数据预处理和深度学习训练结合起来，同时发现百度内部有很多深度学习需求，需要在1.0的基础上考虑把Spark on PADDLE平台化，做到Multi-Tenancy的资源管理、训练监控、训练容错等等。

Spark on PADDLE 架构2.0版

平台化是Spark on PADDLE 2.0的主要目标。它引入了更多的功能，主要包括在训练过程中引入了监控机制、容错机制，加入了ML决策模块做超参数选择等。下面是对Spark on PADDLE 2.0设计的分析。

如图5、图6所示，客户可以直接与Spark DNN Driver通信启动DNN训练，Spark DNN Driver启动一个训练实例（Training Instance），并且透传训练数据、训练网络配置等信息。一个训练实例包括了训练所需的整体服务，包括一组训练器以及对应的参数服务器。然后有一个训练Master（Training Master）来管理整个的训练进程。同时训练Master管理训练器和超参数服务器的生存周期和失败重启。参数服务器和训练器会定期给训练Master发送heartbeat，确保其正常运行。

图5 Spark on PADDLE 2.0 总体架构

图6 Spark on PADDLE 2.0 Training Instance架构

训练过程中的监控机制

当训练开始以后，用户会对训练过程中的一些数据进行监控，包括训练的每个迭代的loss值、错误率、所用的时间以及训练机和参数服务器的日志进行监控，我们在实现的过程中会在Worker端用消息传递的方式（AKKA）向Driver端汇报训练的数据。对于整个Spark Job的性能数据会依赖Spark本身提供的监控功能，所有信息都反馈在监控页面中（Web UI）。

训练过程中的容错机制

因为DNN在训练过程中，训练机和参数服务器都是有可能失败的地方。最简单的容错方式是定期对模型的参数和训练信息做备份，当模型训练失败以后，从备份点开始重启模型训练就可以。训练Master会把这些信息收集起来，并且汇报给Spark DNN Driver。对于参数服务器的容错，可以采取增加冗余的方法，如果一个参数服务器挂掉，训练Master会负责重启相应服务，但是会有一个备份的参数服务器去负责挂掉的参数服务器的参数更新。

超参数选择

图7 超参数选择训练

超参数是确立模型训练的基础，Spark在MLlib中引入了超参数选择模块，主要的做法就是通过一定的超参数选择算法对模型进行并行训练，最终选择的超参数将会被用做最终的模型训练。超参数的选择对于深度学习很有意义，包括网络拓扑、参数的衰减率、触发函数的选择都是影响深度学习的超参数。图7显示了一个大概的超参数选择流程，模型的特征选择到归化系数（Regulation Parameter）一起配对来训练一个模型，最终评估模块选择最终超参数。在Spark的场景中，DNN Driver端会跟评估端通过RPC通信来决策需要尝试什么超参数。评估端逻辑是在Spark DNN Driver依赖的MLApplication服务。如果用户需要对DNN训练模型进行超参数选择，则Spark DNN Driver会根据不同参数配对启动多个训练实例，然后根据训练来是否需要进一步搜索。

Spark异构分布式计算平台架构

如上所述，我们已经看到Spark on PADDLE能够使得传统的深度学习可以在更大规模的分布式系统上运行。但是，百度面临非常现实的问题就是巨量的数据。在百度内部，每天处理的数据量都远远超出了传统平台的能力，会使用到巨量的模型参数、特征以及训练数据。这些巨量数据对分布式系统的性能和扩展性都提出了更高的要求。一方面，我们希望提供可以比拟传统MapReduce集群规模的深度学习计算集群，可以并行运行大量的深度学习任务；另一方面，每个深度学习模型不可能无限制地切分成更小的单元，因此每个节点的模型处理能力也是至关重要的。

目前以CPU为主的计算节点受到本身计算能力的限制，远远不能满足计算的需求，因此，我们需要通过更强大的异构计算来加速现在的计算平台。目前我们的项目主要涉及到两种计算资源：GPU和FPGA。GPU可以提供强大的计算能力，适用于高密度的计算类型；FPGA有低功耗、高度可定制的特点，适合加速很多特定的动态任务（本项目使用的FPGA硬件加速由百度美国研发中心的计算团队提供）。

我们的项目正是基于Spark on PADDLE，探索了如何有效地把异构资源整合到现在的大规模分布式系统，以提供高应用性能和易用性为目标。在满足前述要求的基础上，系统需要动态地对GPU/FPGA资源进行管理，进行无缝的调度，正如CPU和Memory等资源的调度一样。这一功能是通过把资源调度整合到开源的Yarn系统来实现的，而资源隔离方案基于业界流行的Container技术。

同时，我们还需要提供简单易用的编程接口，以便现有的应用程序可以更快地迁移到我们的系统上来。因为Spark所有的数据都是基于RDD的，我们创建了一类新的RDD，通过这个RDD，程序可以直接使用到底层的GPU/FPGA来加速相应的计算。我们知道，真正在GPU/FPGA上完成程序的功能，还需要提供Kernels，这里我们采用了业界最为流行的标准OpenCL接口，以便于将程序移植到不同的GPU/FPGA。可以看到，一个特定的功能实现需要3个部分：一个Scala Driver，一个C++的Worker以及一个OpenCL Kernel（on GPU/FPGA）。如果常用的功能已经集成在MLlib中，那么用户只需要创建自己的Scala Driver，通过新的RDD调用库里面已经支持的函数，就可以无缝享受到GPU/FPGA资源的加速。

图8 Spark异构计算平台架构

异构系统架构如图8所示。系统的运行过程如下：

首先用户应用程序（Scala Driver）会由App Master启动；
然后用户应用程序会向Yarn请求其所需的资源，其中GPU、FPGA作为不同的资源类别，与请求CPU资源方式完全一致；
用户应用程序取得所有资源，由App Master在相应的App Slave上启动Container运行用户程序的一个Scala Worker；
这时，按照程序Scala Worker的需求，如果使用到了新的RDD，便会调用相应的C++的OpenCL程序，如果函数功能是MLlib内嵌的，那么这部分对用户也是完全透明的。
OpenCL程序启动后，会把所分配的数据传输到GPU或FPGA上，然后在GPU或者FPGA上动态启动特定的OpenCL Kernel，处理这些已经传输过来的数据。
OpenCL Kernel计算完成后，数据会自动被拉回到主存，这时OpenCL的程序就可以把结果返回给Scala Worker；
最后所有Scala Worker把结果提交给在App Master上运行的用户程序Scala Driver。

可以看到，整个流程支持加入了新的GPU/FPGA计算资源，还有需要用户使用新的RDD。其他方面对用户程序来说没有任何额外的改动。

Spark异构平台性能评估

在异构平台架构搭建好后，我们首先测试了机器学习底层矩阵运算库的CPU与GPU性能对比。结果显示，在执行同一个计算方程时，GPU的加速效果很好，对CPU的加速比大约是30倍。与此同时，百度美国研发中心计算团队也对Kmeans算法用FPGA进行加速，取得了15到20倍的加速化，而且FPGA能耗只是CPU的20%。在第二个实验中，我们对比了Spark on PADDLE在训练ImageNet时的GPU与 CPU加速比，发现使用GPU可以加速30倍，也就是说，在使用异构平台后我们只用3%的机器资源就可以完成同样的计算。

在很好地了解了异构平台加速比后，我们也研究了异构平台的可扩展性。测试结果如图9所示，基本上随着GPU资源的增加，计算时间也在线性地降低，表现出很强的可扩展性，可以承受很大的数据量与计算量。

图9 Spark异构计算平台性能数据

总结

本文介绍了百度基于Spark的异构分布式深度学习系统。把Spark与深度学习平台PADDLE结合起来解决了PADDLE与业务逻辑间的数据通路问题，使业务方可以很容易地使用深度学习技术。在此基础上，我们使用GPU与FPGA的异构平台极大地提升了每台机器的数据处理能力。在异构平台上，我们使用YARN对异构资源做分配，以支持Multi-Tenancy，让资源的使用更有效。下一步工作我们打算把平台推广到百度不同的业务平台，比如语音、百度秘书、百度图搜、百度无人车等，让平台在不同业务上锤炼。在平台更成熟后，我们打算把Spark on PADDLE以及异构计算平台开源，回馈社区。

张伟德：百度美国硅谷研发中心高级架构师，负责大数据、深度学习架构和开发。曾在Yahoo、微软等公司负责大型分布式搜索构架设计。

曲宁：百度美国研发中心高级架构师，负责基础架构以及异构计算平台架构与开发。CMU大学Cylab研究院研究员。曾在Nvidia以及Google工作。

刘少山：百度美国研发中心高级架构师，从事深度学习以及异构计算平台架构与开发。曾在LinkedIn、微软、微软研究院、INRIA、Intel以及Broadcom工作。

表格的属性花林似霰f html 前端
表格标签属性实际开发并不使用，仅做了解，实际开发会使用CSS。属性名·属性值描述alignleftcenterrightborder1或""规定表格单元是否有边框，默认为无cellpadding像素值规定单元格与其内容之间的空白，默认1像素cellspacing像素值规定单元格之间的距离width/height像素值或百分比规定表格宽度/高度
面试官问：什么是分布式定时任务调度？鸡米花不花 java 分布式分布式数据库网络协议 java
任务调度的背景在业务系统中有很多这样的场景：1、账单日或者还款日上午10点，给每个信用卡客户发送账单通知，还款通知。如何判断客户的账单日、还款日，完成通知的发送？2、银行业务系统，夜间要完成跑批的一系列流程，清理数据，下载文件，解析文件，对账清算、切换结算日期等等。如何触发一系列流程的执行？3、金融机构跟人民银行二代支付系统对接，人民银行要求低于5W的金额（小额支付）半个小时打一次包发送，以缓解并
留给小米汽车的时间，不到三年了智瑾财经物联网区块链 big data
留给小米汽车的时间，不到三年了出品l观点财经作者l大钊今年3月30日，小米科技创始人、董事长雷军决定向被誉为“制造业皇冠”的汽车制造领域发起冲击。“这是我人生最后一次重大创业项目。我愿意押上人生全部的声誉，全力以赴去做小米汽车！”他说。如今，距离小米官宣造车已经过去七个多月了，小米汽车的成绩如何？2021年9月1日，小米汽车正式注册；首个工厂将落户北京亦庄；截至10月18日，共收到2万多份简历，到
【迁移学习入门之域适应的背景、理论与方法】进一步理解迁移学习啦？ 985小水博一枚呀深度学习学习笔记迁移学习人工智能机器学习域适应
【迁移学习入门之域适应的背景、理论与方法】进一步理解迁移学习啦？【迁移学习入门之域适应的背景、理论与方法】进一步理解迁移学习啦？文章目录【迁移学习入门之域适应的背景、理论与方法】进一步理解迁移学习啦？1.背景介绍2.理论基础2.1分布差异（DomainShift）2.2迁移学习理论（TransferLearningTheory）2.3领域不变特征（Domain-invariantFeatures）
PostgreSQL 数据库简介 dazhong2012 数据库数据库 postgresql
一、PostgreSQL简介PostgreSQL（通常简称为Postgres）是一种功能强大的开源对象关系型数据库系统。它以其高度的可靠性和灵活性而闻名，支持复杂的查询、数据完整性、可扩展性以及对多种数据类型的处理。主要特点：开源和免费：PostgreSQL是完全开源的，采用PostgreSQLLicense，允许用户免费使用、修改和分发。对象关系型数据库：它不仅支持传统的关系型数据库功能，还支持
【论文精读】SCINet-基于降采样和交互学习的时序卷积模型打酱油的葫芦娃时序预测算法时序预测 SCINet TCN
《SCINet:TimeSeriesModelingandForecastingwithSampleConvolutionandInteraction》的作者团队来自香港中文大学，发表在NeurIPS2022会议上。动机该论文的出发点是观察到时间序列数据具有独特的属性：即使在将时间序列下采样成两个子序列后，时间关系（例如数据的趋势和季节性成分）也基本上得以保留。这个观察启发了作者去设计一种新型的神
【论文精读】PatchTST-基于分块及通道独立机制的Transformer模型打酱油的葫芦娃时序预测算法时序预测 PatchTST Transformer 预训练微调表征学习
《ATIMESERIESISWORTH64WORDS:LONG-TERMFORECASTINGWITHTRANSFORMERS》的作者团队来自PrincetonUniversity和IBMResearch，发表在ICLR2023会议上。动机Transformer模型因其自注意力机制在处理序列数据方面的优势，在自然语言处理（NLP）、计算机视觉（CV）、语音等多个领域取得了巨大成功。这种机制使得模型
红黑树详解？红黑树设计的背景？ F_windy java
红黑树详解1.红黑树的基本概念红黑树（Red-BlackTree）是一种自平衡的二叉搜索树（BST），通过节点颜色（红或黑）和一组规则来保持近似平衡，确保插入、删除、查找等操作的时间复杂度为O(logn)。它的核心思想是通过颜色标记和旋转操作，减少树的高度差异，从而提升性能。2.红黑树的五大规则红黑树必须满足以下规则：颜色规则：每个节点非红即黑。根节点规则：根节点必须是黑色。叶子节点规则：所有叶子
如何针对大Excel做文件读取？ F_windy excel
针对大Excel文件（如超过百万行）的读取，传统的一次性加载到内存的方式会导致内存溢出（OOM），需采用流式读取（Streaming）或分块读取（Chunk）的策略。以下是具体方案及优化建议：一、核心解决方案1.使用ApachePOI的SAX模式（事件驱动）适用场景：处理.xlsx文件（不支持.xls），逐行解析避免内存溢出。代码示例（Java）：importorg.apache.poi.open
WebRTC、WebSocket、EasyRTC嵌入式音视频SDK：技术差异与应用场景详细对比 EasyCVR RTC webrtc websocket 音视频 javascript 网络开发语言
WebRTC和WebSocket是两种常用于实时通信的技术，尽管它们都支持实时数据传输，但在设计目标、技术实现和应用场景上存在显著差异。一、概述1）WebRTCWebRTC是一个开源项目，旨在通过简单的API实现浏览器之间的实时音视频通信和数据传输。它支持点对点（P2P）通信，主要应用于音视频通话、屏幕共享、文件传输等场景。2）WebSocketWebSocket是一种基于TCP的通信协议，提供了
Java常用API EmbodiedTech Java架构栈 java dubbo 开发语言
一、今日内容介绍、API概述常用API（全称是ApplicationProgramInterface应用程序接口），说人话就是：别人写好的一些程序，给咱们程序员直接拿去调用。Java官方其实已经给我们写好了很多很多类，每一个类中又提供了一系列方法来解决与这个类相关的问题。比如String类，表示字符串，提供的方法全都是对字符串操作的。比如ArrayList类，表示一个容器，提供的方法都是对容器中的
字符串模板（单文件组件、JSX） By爱分享 vue.js javascript 前端
首先需要了解基本释义：字符串模板就是写在vue中的template中定义的模板，如.vue的单文件组件模板和定义组件时template属性值的模板。此外，字符串模板不会在页面初始化时参与页面的渲染，而是会被vue进行解析编译之后再被浏览器渲染，所以不受限于html结构和标签的命名总的来说，推荐遵循W3C中的自定义组件名(字母全小写且必须包含一个连字符)，这会帮助你避免和当前以及未来的HTML元素相
vue-常用指令 | 常用指令的修饰符 Cshaosun web前端 #VUE vue.js 前端 javascript
目录什么是vue指令v-cloakv-textv-htmlv-prev-show/v-ifv-else/v-else-ifv-onv-bindv-forv-model常用指令的修饰符v-model指令修饰符事件修饰符按键修饰符什么是vue指令指令就是带有v-前缀的特殊属性，不同的属性对应不同的功能。分类汇总内容渲染指令（v-html、v-text）条件渲染指令（v-show、v-if、v-else
Transformer精选问答 EmbodiedTech 大模型人工智能 transformer 深度学习人工智能
Transformer精选问答1Transformer各自模块作用Encoder模块经典的Transformer架构中的Encoder模块包含6个EncoderBlock.每个EncoderBlock包含两个子模块,分别是多头自注意力层,和前馈全连接层.多头自注意力层采用的是一种ScaledDot-ProductAttention的计算方式,实验结果表明,Multi-head可以在更细致的层面上提
HoRain云--Node.js文件下载服务实战：Express实现安全高效的文件传输 HoRain云小助手 node.js express 安全
HoRain云小助手：个人主页个人专栏:《Linux系列教程》《c语言教程》⛺️生活的理想，就是为了理想的生活!⛳️推荐前些天发现了一个超棒的服务器购买网站，性价比超高，大内存超划算！忍不住分享一下给大家。点击跳转到网站。专栏介绍专栏名称专栏介绍《C语言》本专栏主要撰写C干货内容和编程技巧，让大家从底层了解C，把更多的知识由抽象到简单通俗易懂。《网络协议》本专栏主要是注重从底层来给大家一步步剖析网
C++ 树状数组 LIUJH1233 c++开发语言
一.树状数组是什么?二.树状数组的特性？可以解决大部分区间上面的修改以及查询的问题，例如1.单点修改，单点查询，2.区间修改，单点查询，3.区间查询，区间修改等问题；三.树状数组讲解lowbit的使用如何计算一个非负整数n在二进制下的最低为1及其后面的0构成的数？答案就是lowbit(x)。那么lowbit运算时怎么实现的呢？44的二进制=(101100)，我们对44的二进制数取反+1，也即~44
字符串哈希从入门到精通 LIUJH1233 C++哈希算法算法 c++数据结构
一、基本概念字符串哈希是将任意长度的字符串映射为固定长度的哈希值（通常为整数）的技术，核心目标是实现O(1)时间的子串快速比较和高效查询。其本质是通过数学运算将字符串转换为唯一性较高的数值，例如：其中P为基数(根据题目)，M为大质数，s[i]为字符的ASCII值。二.一般哈希实现一般哈希的实现有两种方式：通俗的讲叫：1.蹲茅坑法2.拉拉链法2.1蹲茅坑法假设你现在要处理19与12（mod7）你会发
Socket（套接字）是什么，有什么作用？给我个面子中不 java
Socket（套接字）是计算机网络编程中的一个重要概念，它是应用程序和网络协议之间的接口，用于实现不同主机或不同进程之间的通信。通过Socket，程序能够在网络中发送和接收数据，实现网络应用的功能。Socket的基本概念Socket是一种抽象的概念，提供了一种编程接口（API），使得应用程序可以通过它与网络通信。它通常在操作系统的网络协议栈和应用程序之间提供一个桥梁。具体来说，Socket是由操作
hashmap为什么每次扩容都是2倍？给我个面子中不哈希算法散列表 java
HashMap扩容为什么是2倍，且可以用移位操作代替与运算？在HashMap中，哈希桶（数组）的大小总是2的幂，扩容时也是原大小的2倍。这样做的主要目的是优化哈希计算，使得索引计算可以用位运算（&）替代取模（%），提高性能。1.HashMap扩容规则HashMap的数组容量始终是2的幂（16,32,64...）。扩容时，容量翻倍。索引计算采用(n-1)&hash，而不是hash%n。2.为什么扩容
kafka相关问题给我个面子中不 Java学习 kafka 分布式 java
Kafka通过事务机制与幂等性功能相结合，实现了跨会话的幂等性。以下是详细解释：kafka是怎么通过事物保证跨会话的幂等性？1.幂等性与跨会话幂等性幂等性：指相同的操作被执行多次，其结果是一样的。在Kafka中，主要是指生产者发送相同的消息不会导致重复。跨会话幂等性：在生产者会话关闭并重启后，Kafka仍能保证发送的消息不会被重复处理。2.Kafka的幂等性原理Kafka的幂等性主要通过Produ
迁移学习基础知识 zhooooooou 深度学习迁移学习人工智能机器学习
简介使用迁移学习的优势：1、能够快速的训练出一个理想的结果2、当数据集较小时也能训练出理想的效果。注意：在使用别人预训练的参数模型时，要注意别人的预处理方式。原理：对于浅层的网络结构，他们学习到的角点信息和纹理信息都是通用的，将学习好的浅层网络的信息迁移到新的网络中，这样新的网络也拥有了识别底层通用特征的能力，从而能加快网络学习新的数据集的高维特征。常见的迁移学习的方式：1、载入权重后训练所有参数
并发编程面试题四 2301_76231794 面试
1、ReentrantLock和synchronized的区别及使用的场景synchronized关键字（是悲观锁）：自动管理：synchronized是Java提供的一种内置锁机制，使用简单，不需要显式地获取和释放锁。可重入性：同一个线程可以多次获取同一个锁而不被阻塞。不可中断：一旦一个线程开始等待获取锁，它不能被其他线程中断。内存可见性：synchronized块或方法提供了内存可见性的保证，
主从dns+nfs+nginx综合实验睡不够觉 centos linux 运维
目录1.实验要求2.配置主DNS1安装bind软件编辑主配置文件编辑区域数据文件检查配置文件和区域文件是否有误重启服务测试dns1是否生效3.配置从DNS2安装bind编辑从DNS2的主配置文件防火墙放行测试dns24.配置nfs服务创建共享目录写入指定内容，并编辑共享配置文件5.web服务配置下载nginx软件挂载共享目录到nginx的默认页面6.客服端配置安装bind-utils客户端测试7.
AUTOSAR与arxml的文档解析 dont__cry c语言 autosar
如下是文档脑图一、文档概述该文档是AUTOSAR经典平台的应用接口用户指南，主要解释**AlTable（应用接口表）**的结构、方法论及相关技术细节，帮助开发者理解如何通过标准化接口实现软件组件的互操作性。关键内容目的：定义并发布稳定、广泛接受的汽车电子系统应用接口，支持跨厂商软件组件的通信。结构：包含元模型表示、兼容性管理、生命周期状态、视图概念及XML生成规则等。二、核心概念与示例1.AUTO
提到一个项目的“验证LOV”属性？提到lov和list项目有什么区别？思维导图代码示例（java 架构) 用心去追梦 list java 架构
验证LOV（ListofValues）属性在OracleForms中，LOV(ListofValues)是一种用于显示可供选择的值列表的组件。它通常与字段或项关联，允许用户从预定义的选项列表中选择一个值，而不是手动输入。验证LOV属性确保用户只能从LOV提供的选项中选择值，从而增强了数据输入的准确性和一致性。验证LOV属性定义：当设置为“是”时，表示该字段必须从LOV中选择值；如果用户尝试输入不在
python 游戏开发cocos2d库安装与使用范哥来了 python cocos2d 开发语言
Cocos2d-x是一个广泛使用的开源游戏开发框架，支持多种编程语言，包括Python。对于Python开发者来说，通常使用的是Cocos2d-py或者更现代的Cocos2d-x的Python绑定版本。这里我将指导你如何安装和开始使用Cocos2d-py。安装步骤安装Python：确保你的系统上已经安装了Python3.x版本。你可以从Python官方网站下载最新版的Python。安装pip：pi
迁移学习入门 EmbodiedTech 人工智能大模型迁移学习人工智能机器学习
迁移学习1迁移学习的概念预训练模型定义:简单来说别人训练好的模型。一般预训练模型具备复杂的网络模型结构；一般是在大量的语料下训练完成的预训练语言模型的类别现在我们接触到的预训练语言模型，基本上都是基于transformer这个模型迭代而来的因此划分模型类别的时候，以transformer架构来划分：Encoder-Only:只有编码器部分的模型，代表：BERTDecoder-Only:只要解码器部
https握手过程给我个面子中不 https 网络协议 http
HTTPS（HyperTextTransferProtocolSecure）是HTTP的安全版本，它通过SSL/TLS协议对通信内容进行加密，确保数据在传输过程中的机密性、完整性和身份验证。以下是HTTPS握手过程的详细说明，以及它是如何保证信息安全的。1.HTTPS的核心机制HTTPS的安全性主要依赖于以下技术：加密：使用对称加密和非对称加密结合的方式，确保数据在传输过程中不被窃听。身份验证：通
通用具身智能机器人首次进厂造芯！量子位
在全球半导体产业竞争日益激烈的背景下，半导体生产在部分高度依赖人力的生产环节，传统的智能化生产模式仍暴露出效率瓶颈与污染问题。人工操作易导致污染，且效率不高、污染控制难度大。如今，随着通用智能机器人的应用，这一难题正迎来全新解决方案。3月18日，国内领先的具身智能机器人公司智平方与全球知名科技创新企业吉利科技集团旗下浙江晶能微电子有限公司正式签署战略合作协议。双方将基于智平方自研的端到端具身大模型
HarmonyOS TEXT 语音搜索场景学习和总结架构教育
在HarmonyOS中实现语音搜索功能时，涉及到麦克风权限的申请、音频数据的采集、编码和传输等多个步骤。以下是对上述代码的详细解析和补充说明：麦克风权限的申请与检查在HarmonyOS中，使用麦克风需要申请ohos.permission.MICROPHONE权限。在代码中，通过GRPermissionsUtils.checkPermissions方法来检查和申请权限。如果权限被授予，则可以继续进行
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》