SparkContext的初始化（叔篇）——TaskScheduler的启动

《深入理解Spark：核心思想与源码分析》一书前言的内容请看链接《深入理解SPARK：核心思想与源码分析》一书正式出版上市

《深入理解Spark：核心思想与源码分析》一书第一章的内容请看链接《第1章环境准备》

《深入理解Spark：核心思想与源码分析》一书第二章的内容请看链接《第2章 SPARK设计理念与基本架构》

由于本书的第3章内容较多，所以打算分别开辟三篇随笔分别展现。

《深入理解Spark：核心思想与源码分析》一书第三章第一部分的内容请看链接《深入理解Spark：核心思想与源码分析》——SparkContext的初始化（伯篇）》

《深入理解Spark：核心思想与源码分析》一书第三章第二部分的内容请看链接《深入理解Spark：核心思想与源码分析》——SparkContext的初始化（仲篇）》

本文展现第3章第三部分的内容：

3.8 TaskScheduler的启动

　　3.7节介绍了任务调度器TaskScheduler的创建，要想TaskScheduler发挥作用，必须要启动它，代码如下。

 
          taskScheduler.start()

TaskScheduler在启动的时候，实际调用了backend的start方法。

 
          override  
          def  
          start() { 
         
          backend.start() 
         
          }

以LocalBackend为例，启动LocalBackend时向actorSystem注册了LocalActor，见代码清单3-30所示（在《深入理解Spark：核心思想与源码分析》——SparkContext的初始化（中）》一文）。

3.8.1 创建LocalActor

　　创建LocalActor的过程主要是构建本地的Executor，见代码清单3-36。

代码清单3-36 LocalActor的实现

 
          private 
          [spark]  
          class  
          LocalActor(scheduler 
          :  
          TaskSchedulerImpl, executorBackend 
          :  
          LocalBackend, 
         
          private  
          val  
          totalCores 
          :  
          Int)  
          extends  
          Actor  
          with  
          ActorLogReceive  
          with  
          Logging { 
         
          import  
          context.dispatcher    
          // to use Akka's scheduler.scheduleOnce() 
         
          private  
          var  
          freeCores  
          =  
          totalCores 
         
          private  
          val  
          localExecutorId  
          =  
          SparkContext.DRIVER 
          _ 
          IDENTIFIER 
         
          private  
          val  
          localExecutorHostname  
          =  
          "localhost" 
         
          val  
          executor  
          =  
          new  
          Executor( 
         
          localExecutorId, localExecutorHostname, scheduler.conf.getAll, totalCores, isLocal  
          =  
          true 
          ) 
         
          override  
          def  
          receiveWithLogging  
          =  
          { 
         
          case  
          ReviveOffers  
          = 
          > 
         
          reviveOffers() 
         
          case  
          StatusUpdate(taskId, state, serializedData)  
          = 
          > 
         
          scheduler.statusUpdate(taskId, state, serializedData) 
         
          if  
          (TaskState.isFinished(state)) { 
         
          freeCores + 
          =  
          scheduler.CPUS 
          _ 
          PER 
          _ 
          TASK 
         
          reviveOffers() 
         
          } 
         
          case  
          KillTask(taskId, interruptThread)  
          = 
          > 
         
          executor.killTask(taskId, interruptThread) 
         
          case  
          StopExecutor  
          = 
          > 
         
          executor.stop() 
         
          } 
         
          }

Executor的构建，见代码清单3-37，主要包括以下步骤：

1) 创建并注册ExecutorSource。ExecutorSource是做什么的呢？笔者将在3.10.2节详细介绍。

2) 获取SparkEnv。如果是非local模式，Worker上的CoarseGrainedExecutorBackend向Driver上的CoarseGrainedExecutorBackend注册Executor时，则需要新建SparkEnv。可以修改属性spark.executor.port（默认为0，表示随机生成）来配置Executor中的ActorSystem的端口号。

3) 创建并注册ExecutorActor。ExecutorActor负责接受发送给Executor的消息。

4) urlClassLoader的创建。为什么需要创建这个ClassLoader？在非local模式中，Driver或者Worker上都会有多个Executor，每个Executor都设置自身的urlClassLoader，用于加载任务上传的jar包中的类，有效对任务的类加载环境进行隔离。

5) 创建Executor执行TaskRunner任务（TaskRunner将在5.5节介绍）的线程池。此线程池是通过调用Utils.newDaemonCachedThreadPool创建的，具体实现请参阅附录A。

6) 启动Executor的心跳线程。此线程用于向Driver发送心跳。

此外，还包括Akka发送消息的帧大小（10485760字节）、结果总大小的字节限制（1073741824字节）、正在运行的task的列表、设置serializer的默认ClassLoader为创建的ClassLoader等。

代码清单3-37 Executor的构建

 
          val  
          executorSource  
          =  
          new  
          ExecutorSource( 
          this 
          , executorId) 
         
          private  
          val  
          env  
          =  
          { 
         
          if  
          (!isLocal) { 
         
          val  
          port  
          =  
          conf.getInt( 
          "spark.executor.port" 
          ,  
          0 
          ) 
         
          val  
          _ 
          env  
          =  
          SparkEnv.createExecutorEnv( 
         
          conf, executorId, executorHostname, port, numCores, isLocal, actorSystem) 
         
          SparkEnv.set( 
          _ 
          env) 
         
          _ 
          env.metricsSystem.registerSource(executorSource) 
         
          _ 
          env.blockManager.initialize(conf.getAppId) 
         
          _ 
          env 
         
          }  
          else  
          { 
         
          SparkEnv.get 
         
          } 
         
          } 
         
          private  
          val  
          executorActor  
          =  
          env.actorSystem.actorOf( 
         
          Props( 
          new  
          ExecutorActor(executorId)),  
          "ExecutorActor" 
          ) 
         
          private  
          val  
          urlClassLoader  
          =  
          createClassLoader() 
         
          private  
          val  
          replClassLoader  
          =  
          addReplClassLoaderIfNeeded(urlClassLoader) 
         
          env.serializer.setDefaultClassLoader(urlClassLoader) 
         
          private  
          val  
          akkaFrameSize  
          =  
          AkkaUtils.maxFrameSizeBytes(conf) 
         
          private  
          val  
          maxResultSize  
          =  
          Utils.getMaxResultSize(conf) 
         
          val  
          threadPool  
          =  
          Utils.newDaemonCachedThreadPool( 
          "Executor task launch worker" 
          ) 
         
          private  
          val  
          runningTasks  
          =  
          new  
          ConcurrentHashMap[Long, TaskRunner] 
         
          startDriverHeartbeater()

3.8.2 ExecutorSource的创建与注册

　　ExecutorSource用于测量系统。通过metricRegistry的register方法注册计量，这些计量信息包括threadpool.activeTasks、threadpool.completeTasks、threadpool.currentPool_size、threadpool.maxPool_size、filesystem.hdfs.write_bytes、filesystem.hdfs.read_ops、filesystem.file.write_bytes、filesystem.hdfs.largeRead_ops、filesystem.hdfs.write_ops等，ExecutorSource的实现见代码清单3-38。Metric接口的具体实现，参考附录D。

代码清单3-38 ExecutorSource的实现

 
          private 
          [spark]  
          class  
          ExecutorSource( 
          val  
          executor 
          :  
          Executor, executorId 
          :  
          String)  
          extends  
          Source { 
         
          private  
          def  
          fileStats(scheme 
          :  
          String)  
          :  
          Option[FileSystem.Statistics]  
          = 
         
          FileSystem.getAllStatistics().filter(s  
          = 
          > s.getScheme.equals(scheme)).headOption 
         
          private  
          def  
          registerFileSystemStat[T]( 
         
          scheme 
          :  
          String, name 
          :  
          String, f 
          :  
          FileSystem.Statistics  
          = 
          > T, defaultValue 
          :  
          T)  
          =  
          { 
         
          metricRegistry.register(MetricRegistry.name( 
          "filesystem" 
          , scheme, name),  
          new  
          Gauge[T] { 
         
          override  
          def  
          getValue 
          :  
          T  
          =  
          fileStats(scheme).map(f).getOrElse(defaultValue) 
         
          }) 
         
          } 
         
          override  
          val  
          metricRegistry  
          =  
          new  
          MetricRegistry() 
         
          override  
          val  
          sourceName  
          =  
          "executor" 
         
          metricRegistry.register(MetricRegistry.name( 
          "threadpool" 
          ,  
          "activeTasks" 
          ),  
          new  
          Gauge[Int] { 
         
          override  
          def  
          getValue 
          :  
          Int  
          =  
          executor.threadPool.getActiveCount() 
         
          }) 
         
          metricRegistry.register(MetricRegistry.name( 
          "threadpool" 
          ,  
          "completeTasks" 
          ),  
          new  
          Gauge[Long] { 
         
          override  
          def  
          getValue 
          :  
          Long  
          =  
          executor.threadPool.getCompletedTaskCount() 
         
          }) 
         
          metricRegistry.register(MetricRegistry.name( 
          "threadpool" 
          ,  
          "currentPool_size" 
          ),  
          new  
          Gauge[Int] { 
         
          override  
          def  
          getValue 
          :  
          Int  
          =  
          executor.threadPool.getPoolSize() 
         
          }) 
         
          metricRegistry.register(MetricRegistry.name( 
          "threadpool" 
          ,  
          "maxPool_size" 
          ),  
          new  
          Gauge[Int] { 
         
          override  
          def  
          getValue 
          :  
          Int  
          =  
          executor.threadPool.getMaximumPoolSize() 
         
          }) 
         
          // Gauge for file system stats of this executor 
         
          for  
          (scheme <- Array( 
          "hdfs" 
          ,  
          "file" 
          )) { 
         
          registerFileSystemStat(scheme,  
          "read_bytes" 
          ,  
          _ 
          .getBytesRead(),  
          0 
          L) 
         
          registerFileSystemStat(scheme,  
          "write_bytes" 
          ,  
          _ 
          .getBytesWritten(),  
          0 
          L) 
         
          registerFileSystemStat(scheme,  
          "read_ops" 
          ,  
          _ 
          .getReadOps(),  
          0 
          ) 
         
          registerFileSystemStat(scheme,  
          "largeRead_ops" 
          ,  
          _ 
          .getLargeReadOps(),  
          0 
          ) 
         
          registerFileSystemStat(scheme,  
          "write_ops" 
          ,  
          _ 
          .getWriteOps(),  
          0 
          ) 
         
          } 
         
          }

创建完ExecutorSource后，调用MetricsSystem的registerSource方法将ExecutorSource注册到MetricsSystem。registerSource方法使用MetricRegistry的register方法，将Source注册到MetricRegistry，见代码清单3-39。关于MetricRegistry，具体参阅附录D。

代码清单3-39 MetricsSystem注册Source的实现

 
          def  
          registerSource(source 
          :  
          Source) { 
         
          sources + 
          =  
          source 
         
          try  
          { 
         
          val  
          regName  
          =  
          buildRegistryName(source) 
         
          registry.register(regName, source.metricRegistry) 
         
          }  
          catch  
          { 
         
          case  
          e 
          :  
          IllegalArgumentException  
          = 
          > logInfo( 
          "Metrics already registered" 
          , e) 
         
          } 
         
          }

3.8.3 ExecutorActor的构建与注册

　　ExecutorActor很简单，当接收到SparkUI发来的消息时，将所有线程的栈信息发送回去，代码实现如下。

 
          override  
          def  
          receiveWithLogging  
          =  
          { 
         
          case  
          TriggerThreadDump  
          = 
          > 
         
          sender ! Utils.getThreadDump() 
         
          }

3.8.4 Spark自身ClassLoader的创建

　　获取要创建的ClassLoader的父加载器currentLoader，然后根据currentJars生成URL数组，spark.files.userClassPathFirst属性指定加载类时是否先从用户的classpath下加载，最后创建ExecutorURLClassLoader或者ChildExecutorURLClassLoader，见代码清单3-40。

代码清单3-40 Spark自身ClassLoader的创建

 
          private  
          def  
          createClassLoader() 
          :  
          MutableURLClassLoader  
          =  
          { 
         
          val  
          currentLoader  
          =  
          Utils.getContextOrSparkClassLoader 
         
          val  
          urls  
          =  
          currentJars.keySet.map { uri  
          = 
          > 
         
          new  
          File(uri.split( 
          "/" 
          ).last).toURI.toURL 
         
          }.toArray 
         
          val  
          userClassPathFirst  
          =  
          conf.getBoolean( 
          "spark.files.userClassPathFirst" 
          ,  
          false 
          ) 
         
          userClassPathFirst  
          match  
          { 
         
          case  
          true  
          = 
          >  
          new  
          ChildExecutorURLClassLoader(urls, currentLoader) 
         
          case  
          false  
          = 
          >  
          new  
          ExecutorURLClassLoader(urls, currentLoader) 
         
          } 
         
          } 
          < 
          strong 
          >  
          < 
          /strong 
          >

Utils.getContextOrSparkClassLoader的实现见附录A。ExecutorURLClassLoader或者ChildExecutorURLClassLoader实际上都继承了URLClassLoader，见代码清单3-41。

代码清单3-41 ChildExecutorURLClassLoader与ExecutorURLClassLoader的实现

 
          private 
          [spark]  
          class  
          ChildExecutorURLClassLoader(urls 
          :  
          Array[URL], parent 
          :  
          ClassLoader) 
         
          extends  
          MutableURLClassLoader { 
         
          private  
          object  
          userClassLoader  
          extends  
          URLClassLoader(urls,  
          null 
          ){ 
         
          override  
          def  
          addURL(url 
          :  
          URL) { 
         
          super 
          .addURL(url) 
         
          } 
         
          override  
          def  
          findClass(name 
          :  
          String) 
          :  
          Class[ 
          _ 
          ]  
          =  
          { 
         
          super 
          .findClass(name) 
         
          } 
         
          } 
         
          private  
          val  
          parentClassLoader  
          =  
          new  
          ParentClassLoader(parent) 
         
          override  
          def  
          findClass(name 
          :  
          String) 
          :  
          Class[ 
          _ 
          ]  
          =  
          { 
         
          try  
          { 
         
          userClassLoader.findClass(name) 
         
          }  
          catch  
          { 
         
          case  
          e 
          :  
          ClassNotFoundException  
          = 
          > { 
         
          parentClassLoader.loadClass(name) 
         
          } 
         
          } 
         
          } 
         
          def  
          addURL(url 
          :  
          URL) { 
         
          userClassLoader.addURL(url) 
         
          } 
         
          def  
          getURLs()  
          =  
          { 
         
          userClassLoader.getURLs() 
         
          } 
         
          } 
         
          private 
          [spark]  
          class  
          ExecutorURLClassLoader(urls 
          :  
          Array[URL], parent 
          :  
          ClassLoader) 
         
          extends  
          URLClassLoader(urls, parent)  
          with  
          MutableURLClassLoader { 
         
          override  
          def  
          addURL(url 
          :  
          URL) { 
         
          super 
          .addURL(url) 
         
          } 
         
          }

如果需要REPL交互，还会调用addReplClassLoaderIfNeeded创建replClassLoader，见代码清单3-42。

代码清单3-42 addReplClassLoaderIfNeeded的实现

 
          private  
          def  
          addReplClassLoaderIfNeeded(parent 
          :  
          ClassLoader) 
          :  
          ClassLoader  
          =  
          { 
         
          val  
          classUri  
          =  
          conf.get( 
          "spark.repl.class.uri" 
          ,  
          null 
          ) 
         
          if  
          (classUri ! 
          =  
          null 
          ) { 
         
          logInfo( 
          "Using REPL class URI: "  
          + classUri) 
         
          val  
          userClassPathFirst 
          :  
          java.lang.Boolean  
          = 
         
          conf.getBoolean( 
          "spark.files.userClassPathFirst" 
          ,  
          false 
          ) 
         
          try  
          { 
         
          val  
          klass  
          =  
          Class.forName( 
          "org.apache.spark.repl.ExecutorClassLoader" 
          ) 
         
          .asInstanceOf[Class[ 
          _  
          < 
          :  
          ClassLoader]] 
         
          val  
          constructor  
          =  
          klass.getConstructor(classOf[SparkConf], classOf[String], 
         
          classOf[ClassLoader], classOf[Boolean]) 
         
          constructor.newInstance(conf, classUri, parent, userClassPathFirst) 
         
          }  
          catch  
          { 
         
          case  
          _:  
          ClassNotFoundException  
          = 
          > 
         
          logError( 
          "Could not find org.apache.spark.repl.ExecutorClassLoader on classpath!" 
          ) 
         
          System.exit( 
          1 
          ) 
         
          null 
         
          } 
         
          }  
          else  
          { 
         
          parent 
         
          } 
         
          }

3.8.5 启动Executor的心跳线程

　　Executor的心跳由startDriverHeartbeater启动，见代码清单3-43。Executor心跳线程的间隔由属性spark.executor.heartbeatInterval配置，默认是10000毫秒。此外，超时时间是30秒，超时重试次数是3次，重试间隔是3000毫秒，使用actorSystem.actorSelection (url)方法查找到匹配的Actor引用， url是akka.tcp://sparkDriver@ driverHost: driverPort/user/HeartbeatReceiver，最终创建一个运行过程中，每次会休眠10000到20000毫秒的线程。此线程从runningTasks获取最新的有关Task的测量信息，将其与executorId、blockManagerId封装为Heartbeat消息，向HeartbeatReceiver发送Heartbeat消息。

代码清单3-43 启动Executor的心跳线程

 
          def  
          startDriverHeartbeater() { 
         
          val  
          interval  
          =  
          conf.getInt( 
          "spark.executor.heartbeatInterval" 
          ,  
          10000 
          ) 
         
          val  
          timeout

你可能感兴趣的:(源码,spark,大数据,架构)

java版电子招投标采购|投标|评标|竞标|邀标|评审招投标系统源码微服务技术分享 java 企业电子招投标系统源代码企业招投标系统源码招采系统源码
功能模块：待办消息，招标公告，中标公告，信息发布描述：全过程数字化采购管理，打造从供应商管理到采购招投标、采购合同、采购执行的全过程数字化管理。通供应商门户具备内外协同的能力，为外部供应商集中推送展示与其相关的所有采购业务信息（历史合作、考察整改，绩效评价等），支持供应商信息的自助维护，实时风险自动提服务框架：SpringCloud、SpringBoot2、Mybatis、OAuth2、Secur
如何解决 Apache 直接显示 PHP 源码问题？ apachephp
在设置web服务器时，您可能会遇到浏览器直接显示原始PHP代码的问题。这通常意味着您的服务器没有正确处理PHP文件。让我们看看为什么会发生这种情况，以及如何在基于Debian和RHEL的系统上修复它。可能的原因PHP模块没有在Apache中正确安装或配置。Apache配置中.php文件没有链接到PHP模块。.htaccess文件中有错误。1.安装配置PHP首先，确保安装了PHP和ApachePHP
电子电气架构 ---常见车规MCU安全启动方案车载诊断技术 EV（电动汽车）常规知识必备车载电子与软件框架车载电子电气架构架构单片机安全人工智能 AI在整车产品领域的应用
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：简单，单纯，喜欢独处，独来独往，不易合同频过着接地气的生活，除了生存温饱问题之外，没有什么过多的欲望，表面看起来很高冷，内心热情，如果你身边有这样灵性的人，一定要好好珍惜他们眼中有神有光，干净，给人感觉很舒服，有超强的感知能力有形的无形的感知力很强，能感知人的内心变化喜欢独处，好静，
Kafka、RocketMQ、RabbitMQ三款消息中间件的原理家常凉菜 kafka rocketmq rabbitmq
最近学习了Kafka、RocketMQ、RabbitMQ三款消息中间件的原理，本文主要是记录一下Kafka、RabbitMQ、RocketMQ三款中间件之间的区别。下面先对各自的架构进行简单的介绍，然后详细对比一下他们之间的关键不同点。由于学习时间和个人水平有限，文中错误之处在所难免,敬请指正。一、Kafka简介Producer：生产者，向Kafka集群（Broker）中发送消息Consumer：
响应式设计已死？流体布局才是未来！前端javascript
ReactHook深入浅出CSS技巧与案例详解vue2与vue3技巧合集VueUse源码解读在当今的Web设计领域，挑战从未如此巨大。各种屏幕尺寸和分辨率的智能设备层出不穷，要让网站在所有设备上保持一致的用户体验，难度可想而知。但别担心，流体布局（FluidLayout）正是为了解决这一问题而生。它不仅适用于超大屏幕，同样也能完美适配小型移动设备，真正做到自适应！接下来，我们深入了解流体布局的原理
【Linux 初学篇】（1）目录结构、远程登录、vim 和 vi、用户管理 2401_83817418 程序员 linux vim 运维
/usr/local这是一个给主机额外安装软件（软件）所安装的目录。一般是通过编译源码方式安装的程序1.2.9boot存放的是启动Linux时使用的一些核心文件，包括一些连接文件以及镜像文件1.2.10proc这是一个虚拟的目录，它是系统内存的映射，访问这个目录来获取系统信息（该目录不能动）1.2.11srvservice的缩写，该目录存放一些服务启动之后所需要提取的数据（该目录不能动）1.2.1
GPU底层优化的关键语言（深入解析PTX）；PTX相比汇编语言的核心优势 AI-AIGC-7744423 rust 开发语言后端
PTX作为英伟达GPU的底层语言，既是性能优化的利器，也是打破生态垄断的突破口。其“类汇编”特性赋予开发者对硬件的极致控制权，但高昂的开发成本与生态依赖仍制约其普及。随着AI技术的介入和开源生态的成熟，PTX或将成为下一代算力竞争的关键战场。一、PTX的技术定位与核心特性中间指令集的角色PTX（ParallelThreadExecution）是英伟达GPU架构中的中间指令集架构，介于高级编程语言（
英伟达的ptx是什么？ptx在接近汇编语言的层级运行？ AI-AIGC-7744423 人工智能
PTX（ParallelThreadeXecution）是英伟达CUDA架构中的一种中间表示形式（IR）语言。以下是关于它的介绍以及它与汇编语言层级关系的说明：PTX介绍•性质与作用：PTX是一种类似于汇编语言的指令集架构，但它更像是一种抽象的、面向并行计算的中间语言。它是CUDA编程模型中，主机代码与实际在GPU上执行的机器码之间的桥梁。开发者编写的CUDAC/C++等高级语言代码，在编译过程中
Redis 部署方式有哪些十五001 基础中间件 redis
以下是Redis主从复制和分布式部署的详细方法和步骤：1.Redis主从复制部署架构主从复制是Redis最基本的分布式机制，通过将数据从主节点（Master）复制到多个从节点（Slave），实现读写分离和数据备份。部署步骤安装Redis•安装编译环境（如make和gcc）。•下载并编译Redis：wgethttp://download.redis.io/releases/redis-7.2.5.t
conda创建python虚拟环境,python虚拟环境的好处 www55597 python 开发语言人工智能
大家好，小编来为大家解答以下问题，python虚拟环境和主环境有什么区别，conda创建python虚拟环境，现在让我们一起来看看吧！Sourcecodedownload:本文相关源码和其他大多数现代编程语言一样，Python对包和模块的下载、存储以及管理有其自己的一套方法。Python的包一般存在几个地方python的皮卡丘如何写代码。比如，大部分系统包会存在sys.prefix指定的路径下。在
基于 Flink 的海量日志实时处理系统的实践 zhisheng_blog 大数据实时计算引擎 Flink 实战与性能优化
海量日志实时处理需求分析在11.5节中讲解了Flink如何实时处理异常的日志，在那节中对比分析了几种常用的日志采集工具。我们也知道通常在排查线上异常故障的时候，查询日志总是必不可缺的一部分，但是现在微服务架构下日志都被分散到不同的机器上，日志查询就会比较困难，所以统一的日志收集几乎也是每家公司必不可少的。据笔者调研，不少公司现在是有日志统一的收集，也会去做日志的实时ETL，利用一些主流的技术比如E
基于物联网的幼儿看护辅助系统设计方案神经网络15044 算法网络物联网
以下是一个基于物联网的幼儿看护辅助系统设计方案，包含系统概述、系统架构、硬件设计、软件设计、通信协议、系统功能以及安全与隐私等方面。系统概述基于物联网的幼儿看护辅助系统旨在利用传感器、网络通信和数据处理技术，实时监测幼儿的状态和环境信息，为家长和看护人员提供远程监控和预警功能，提高幼儿看护的安全性和效率。系统架构该系统主要由感知层、网络层、平台层和应用层组成。感知层：包括各种传感器，如体温传感器、
浅谈基于saas模式的ERP优劣以及未来发展分析微笑的曙光（StevenLi）业务发展 java mongodb sql
SaaS模式在ERP中的应用已经越来越广泛，尤其是在中小企业和初创企业中。SaaSERP通过云计算技术，将ERP系统部署在云端服务器上，企业用户只需通过互联网浏览器即可访问和使用，无需在本地安装和维护复杂的软件和硬件基础设施。这种模式大大降低了企业的初期投资成本，提高了业务的灵活性和响应速度。同时，SaaSERP还支持多租户架构，多个用户可以同时使用同一套系统而互不干扰，进一步提高了资源的利用率。
Python 爬虫实战：开放数据集抓取与大数据分析应用西攻城狮北 python 爬虫数据分析
引言在数据驱动的时代，开放数据集成为了各领域研究和应用的宝贵资源。通过抓取和分析开放数据集，我们可以挖掘出有价值的信息，为决策提供支持。本文将详细介绍如何使用Python爬虫技术抓取开放数据集，并进行大数据分析应用。一、项目背景与目标1.项目背景随着信息技术的飞速发展，越来越多的机构和组织开始开放其数据集，以促进创新和研究。这些开放数据集涵盖了各个领域，如气象、交通、医疗、金融等。通过抓取和分析这
Electron+Python软件系统开发记录（一）：基础环境搭建多宝鱼1998 环境配置遇到的坑 python nodejs thrift
Electron+Python软件系统开发记录（一）：基础环境搭建1.问题说明最近开始做本科毕设，其中有一部分内容是搭建一个完整的软件系统。系统要求就是常见的客户端，服务器，数据库的整体架构。因为本科不是计算机系的，所以学习的相关技能少，以前写课程设计一般用QT或者MFC，还有Mac的OC语言。本着多学习的态度，这次选用了Electron框架，可以迫使自己学学html,css,js这些东西。后端因
深入理解 RESTful API 设计与实践迪小莫学AI restful 后端
深入理解RESTfulAPI设计与实践1.什么是RESTfulAPI？RESTfulAPI是一种基于REST（RepresentationalStateTransfer）架构风格设计的应用程序接口，用于在不同系统之间进行交互和通信。它充分利用HTTP协议，遵循一组约定，使API设计更加清晰、易于维护。1.1REST的核心原则REST是一种无状态（stateless）的架构风格，它强调：资源（Res
文件上传复现爱瓒可抵漫长岁月网络
1.源码$is_upload=false;$msg=null;if(isset($_POST['submit'])){$ext_arr=array('jpg','png','gif');$file_name=$_FILES['upload_file']['name'];$temp_file=$_FILES['upload_file']['tmp_name'];$file_ext=substr($f
AI学习指南RAG篇(5)-RAG的系统架构俞兆鹏 AI学习指南 ai
文章目录一、引言二、RAG系统的四个核心组件1.知识库处理模块1.1文档收集1.2文档预处理1.3示例代码2.向量化模块2.1文本嵌入2.2向量数据库2.3示例代码3.检索引擎3.1检索算法3.2检索结果排序3.3示例代码4.生成模块4.1生成模型4.2提示工程4.3示例代码三、RAG系统的架构图四、总结一、引言RAG（Retrieval-AugmentedGeneration，检索增强生成）技术
目前人工智能的发展，判断10年、20年后的人工智能发展的主要方向，或者带动的主要产业 meisongqing 人工智能
根据2025年的最新行业研究和技术演进趋势，结合历史发展轨迹，未来10-20年人工智能发展的主要方向及带动的产业将呈现以下六大核心趋势：一、算力革命与底层架构优化核心地位：算力将成为类似“新能源电池”的基础设施，支撑大模型迭代和实时交互。中国通过DeepSeek等技术创新（如MLA注意力机制、FP8混合精度训练）突破算力瓶颈，实现与美国顶尖模型性能对标，成本降低至558万美元/项目。技术突破：量子
鸿蒙ZRouter动态路由框架—服务路由 H.ZWei HarmonyOS应用开发鸿蒙 Harmonyos Navigation router
前言源码：https://gitee.com/common-apps/ZRouterOH：https://ohpm.openharmony.cn/#/cn/detail/@hzw%2Fzrouter服务路由主要用于实现模块之间的通信，模块间是相互独立且不直接依赖于彼此。首先确保路由插件在1.0.9版本及以上一、添加配置1、在entry模块的build-profile.json5文件的buildOp
C#WPF的相关知识点 Documentlv C#wpf c#开发语言 windows
学习C#WPF的路线了解C#编程基础熟悉WPF界面设计原理掌握WPF控件的使用学习数据绑定和MVVM架构深入理解WPF动画和转换效果学习WPF中的多媒体和图形绘制掌握WPF中的布局和控件模板学习WPF中的自定义控件和样式了解C#编程基础如果你想开始学习C#编程语言，这里是一些关键的基础知识，可以帮助你快速上手。C#是什么C#是一种通用的、面向对象的编程语言，由微软公司开发。它在.NET框架上运行，
WPF与其他技术的集成：与 WinForms、WCF 等协同工作 xcLeigh WPF 从入门到精通 wpf C#优化
WPF与其他技术的集成：与WinForms、WCF等协同工作一、前言二、WPF与WinForms集成2.1技术背景与特点2.2集成的必要性2.3集成方式与代码示例三、WPF与WCF集成3.1WCF技术概述3.2集成的应用场景3.3集成步骤与代码示例3.4集成中的安全与性能考虑四、总结结束语优质源码分享WPF与其他技术的集成：与WinForms、WCF等协同工作，在软件开发领域，很少有单一技术能够满
从代码民工到架构大师：为什么顶尖程序员的价值是普通人的100倍？苏师兄编程职场发展架构职场发展
大家好！我是苏师兄，一名工作多年的程序员，也是公众号【苏师兄编程】的主理人。凌晨三点的写字楼里，小张盯着屏幕上跳动的红色报错信息，这是他本月第三次被叫去处理线上故障。与之形成鲜明对比的是，隔壁工位的王工总能优雅地抿着咖啡，在系统监控大屏前用几行脚本化解危机。这两个场景每天都在互联网公司的各个部门上演——这就是普通程序员与顶尖技术人才之间的真实差距。一、被时代抛弃的"CRUD工种"在某电商公司的后台
宇树人形机器人开源模型真相很简单 Gazebo仿真 gazebo 模型宇树人形机器人 GO2 B2 H1
1.下载源码https://github.com/unitreerobotics/unitree_ros.git2.启动Gazeboroslaunchh1_descriptiongazebo.launch3.仿真效果H1GO2B2LaikagoZ14.VMware:vmw_ioctl_commanderrorInvalidargument这个错误通常出现在虚拟机环境中运行需要OpenGL支持的应用
上万个Map运行时链接ApplicationMaster超时FAILED 500佰大数据云计算 big data mapreduce
#MapReduce业务常见故障#大数据#生产环境真实案例#MapReduce#批计算#离线业务#整理#经验总结说明：此篇总结MapReduce业务常见故障案例处理方案结合自身经历总结不易+关注+收藏欢迎留言更多专题(详见)：MapReduce计算引擎详解--项目优化(指导书)上万个Map运行时链接ApplicationMaster超时FAILED症状Mapreduce任务会并发起几万个map,会
产品更新 | 新一代系统建模语言基于SysML v2的逻辑架构建模杭州华望MBSE 华望产品更新架构经验分享制造
基于SysMLv2的逻辑架构建模摘要SysMLv2作为OMG官方提出的一种新型系统工程建模语言，在功能和模型概念等方面与SysMLv1存在较大的差别。本文基于SysMLv2语言，以“柴油发动机”为案例，实现逻辑架构的建模，从而展示其在系统设计和分析中的有效性。通过实际应用中SysMLv2与SysMLv1建模方式的对比，阐述两者的不同之处以及使用SysMLv2的优势。一、基于PartUsage的逻辑
大模型中的常用名词介绍八：【特征与数据处理、伦理与公平性等】【建议收藏】神马行空大模型人工智能深度学习计算机视觉神经网络架构自然语言处理
本文总结了大模型领域有关特征与数据处理、伦理与公平性等其他部分的名词，并解释其含义。跳出浩如烟海的大模型知识圈层，从概念上理清大模型的基础脉络！序号模块分组说明快捷访问1模型架构与基础概念介绍了【模型架构与基础概念】相关的常见名词及含义大模型中的常用名词介绍一：【模型架构与基础概念】【建议收藏】-CSDN博客2训练方法与技术介绍了【训练方法与技术】相关的常见名词及含义大模型中的常用名词介绍二：【训
HarmonyOS NEXT 全面升级：华为引领智能生态的未来海豹工匠华为 harmonyos
随着科技的飞速发展，操作系统在智能设备中的地位愈发重要。华为最新推出的HarmonyOSNEXT系统，以其卓越的性能和创新的功能，正在重新定义智能生态的未来。本文将深入探讨HarmonyOSNEXT的核心技术、主要特性及其在智能设备中的应用，帮助您全面了解这一令人期待的操作系统升级。什么是HarmonyOSNEXT？HarmonyOSNEXT是华为基于自研微内核架构的下一代操作系统，旨在为用户提供
flutter dio 组件源码解析1 阿旭哟嘿 flutter
dio使用方法看https://github.com/flutterchina/dio记录下dio配套组件dio_cookie_manager管理cookie的dio_http2_adapterhttp2适配器dio_smart_retry重试机制http_certificate_pinning配置固定证书比如就不能随意抓包curl_logger_dio_interceptorcurl生成器，比如
在windows下运行ollama用5600XT (其实旧的a卡应该都可以）步骤同时用ComfyUI + RX 5600 XT + DirectML 安装与配置 Zalo2 AI deepseek windows llama stable diffusion linux AI作画
Linux部分5600XT这个卡是gfx1010的核心，这个是rand1架构，这是被amd放弃的老古董包裹其他的rand1或者rand2都是。没钱也要玩AI(自能简单运用，不能训练，微调等)这张卡只有6g远远不够ai使用所以我发现好像是能和cpu一起混用的。#警告这张卡不要在linux下尝试安装rocm版本进行pytorch编译，然后进行模型微调，反正我是浪费时间了，根本行不通，因为amd根本就没
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那