blackproof

转 spark简单实例

1、准备文件

1	`wget http:` `//statweb.stanford.edu/~tibs/ElemStatLearn/datasets/spam.data`

2、加载文件

1	`scala> val inFile = sc.textFile(` `"/home/scipio/spam.data"` `)`

输出

1

2

3

 
          14
          /
          06
          /
          28 
          12
          :
          15
          :
          34 
          INFO MemoryStore: ensureFreeSpace(
          32880
          ) called with curMem=
          65736
          , maxMem=
          311387750 
         
 
          14
          /
          06
          /
          28 
          12
          :
          15
          :
          34 
          INFO MemoryStore: Block broadcast_2 stored as values to memory (estimated size 
          32.1 
          KB, free 
          296.9 
          MB) 
         
 
          inFile: org.apache.spark.rdd.RDD[String] = MappedRDD[
          7
          ] at textFile at <console>:
          12 
         

3、显示一行

1	`scala> inFile.first()`

输出

 
          14
          /
          06
          /
          28 
          12
          :
          15
          :
          39 
          INFO FileInputFormat: Total input paths to process : 
          1 
         
 
          14
          /
          06
          /
          28 
          12
          :
          15
          :
          39 
          INFO SparkContext: Starting job: first at <console>:
          15 
         
 
          14
          /
          06
          /
          28 
          12
          :
          15
          :
          39 
          INFO DAGScheduler: Got job 
          0 
          (first at <console>:
          15
          ) with 
          1 
          output partitions (allowLocal=
          true
          ) 
         
 
          14
          /
          06
          /
          28 
          12
          :
          15
          :
          39 
          INFO DAGScheduler: Final stage: Stage 
          0
          (first at <console>:
          15
          ) 
         
 
          14
          /
          06
          /
          28 
          12
          :
          15
          :
          39 
          INFO DAGScheduler: Parents of 
          final 
          stage: List() 
         
 
          14
          /
          06
          /
          28 
          12
          :
          15
          :
          39 
          INFO DAGScheduler: Missing parents: List() 
         
 
          14
          /
          06
          /
          28 
          12
          :
          15
          :
          39 
          INFO DAGScheduler: Computing the requested partition locally 
         
 
          14
          /
          06
          /
          28 
          12
          :
          15
          :
          39 
          INFO HadoopRDD: Input split: file:/home/scipio/spam.data:
          0
          +
          349170 
         
 
          14
          /
          06
          /
          28 
          12
          :
          15
          :
          39 
          INFO SparkContext: Job finished: first at <console>:
          15
          , took 
          0.532360118 
          s 
         
 
          res2: String = 
          0 
          0.64 
          0.64 
          0 
          0.32 
          0 
          0 
          0 
          0 
          0 
          0 
          0.64 
          0 
          0 
          0 
          0.32 
          0 
          1.29 
          1.93 
          0 
          0.96 
          0 
          0 
          0 
          0 
          0 
          0 
          0 
          0 
          0 
          0 
          0 
          0 
          0 
          0 
          0 
          0 
          0 
          0 
          0 
          0 
          0 
          0 
          0 
          0 
          0 
          0 
          0 
          0 
          0 
          0 
          0.778 
          0 
          0 
          3.756 
          61 
          278 
          1 
         

4、函数运用

（1）map

 
          scala> val nums = inFile.map(x=>x.split(
          ' '
          ).map(_.toDouble)) 
         
 
          nums: org.apache.spark.rdd.RDD[Array[Double]] = MappedRDD[
          8
          ] at map at <console>:
          14 
         

           
         

          scala> nums.first()
         
 
          14
          /
          06
          /
          28 
          12
          :
          19
          :
          07 
          INFO SparkContext: Starting job: first at <console>:
          17 
         
 
          14
          /
          06
          /
          28 
          12
          :
          19
          :
          07 
          INFO DAGScheduler: Got job 
          1 
          (first at <console>:
          17
          ) with 
          1 
          output partitions (allowLocal=
          true
          ) 
         
 
          14
          /
          06
          /
          28 
          12
          :
          19
          :
          07 
          INFO DAGScheduler: Final stage: Stage 
          1
          (first at <console>:
          17
          ) 
         
 
          14
          /
          06
          /
          28 
          12
          :
          19
          :
          07 
          INFO DAGScheduler: Parents of 
          final 
          stage: List() 
         
 
          14
          /
          06
          /
          28 
          12
          :
          19
          :
          07 
          INFO DAGScheduler: Missing parents: List() 
         
 
          14
          /
          06
          /
          28 
          12
          :
          19
          :
          07 
          INFO DAGScheduler: Computing the requested partition locally 
         
 
          14
          /
          06
          /
          28 
          12
          :
          19
          :
          07 
          INFO HadoopRDD: Input split: file:/home/scipio/spam.data:
          0
          +
          349170 
         
 
          14
          /
          06
          /
          28 
          12
          :
          19
          :
          07 
          INFO SparkContext: Job finished: first at <console>:
          17
          , took 
          0.011412903 
          s 
         
 
          res3: Array[Double] = Array(
          0.0
          , 
          0.64
          , 
          0.64
          , 
          0.0
          , 
          0.32
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.64
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.32
          , 
          0.0
          , 
          1.29
          , 
          1.93
          , 
          0.0
          , 
          0.96
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.0
          , 
          0.778
          , 
          0.0
          , 
          0.0
          , 
          3.756
          , 
          61.0
          , 
          278.0
          , 
          1.0
          ) 
         

（2）collecct

 
          scala> val rdd = sc.parallelize(List(
          1
          ,
          2
          ,
          3
          ,
          4
          ,
          5
          )) 
         
 
          rdd: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[
          9
          ] at parallelize at <console>:
          12 
         

           
         
 
          scala> val mapRdd = rdd.map(
          2
          *_) 
         
 
          mapRdd: org.apache.spark.rdd.RDD[Int] = MappedRDD[
          10
          ] at map at <console>:
          14 
         

           
         

          scala> mapRdd.collect
         
 
          14
          /
          06
          /
          28 
          12
          :
          24
          :
          45 
          INFO SparkContext: Job finished: collect at <console>:
          17
          , took 
          1.789249751 
          s 
         
 
          res4: Array[Int] = Array(
          2
          , 
          4
          , 
          6
          , 
          8
          , 
          10
          ) 
         

（3）filter

1

2

3

4

5

6

 
          scala> val filterRdd = sc.parallelize(List(
          1
          ,
          2
          ,
          3
          ,
          4
          ,
          5
          )).map(_*
          2
          ).filter(_>
          5
          ) 
         
 
          filterRdd: org.apache.spark.rdd.RDD[Int] = FilteredRDD[
          13
          ] at filter at <console>:
          12 
         

           
         

          scala> filterRdd.collect
         
 
          14
          /
          06
          /
          28 
          12
          :
          27
          :
          45 
          INFO SparkContext: Job finished: collect at <console>:
          15
          , took 
          0.056086178 
          s 
         
 
          res5: Array[Int] = Array(
          6
          , 
          8
          , 
          10
          ) 
         

（4）flatMap

 
          scala> val rdd = sc.textFile(
          "/home/scipio/README.md"
          ) 
         
 
          14
          /
          06
          /
          28 
          12
          :
          31
          :
          55 
          INFO MemoryStore: ensureFreeSpace(
          32880
          ) called with curMem=
          98616
          , maxMem=
          311387750 
         
 
          14
          /
          06
          /
          28 
          12
          :
          31
          :
          55 
          INFO MemoryStore: Block broadcast_3 stored as values to memory (estimated size 
          32.1 
          KB, free 
          296.8 
          MB) 
         
 
          rdd: org.apache.spark.rdd.RDD[String] = MappedRDD[
          15
          ] at textFile at <console>:
          12 
         

           
         

          scala> rdd.count
         
 
          14
          /
          06
          /
          28 
          12
          :
          32
          :
          50 
          INFO SparkContext: Job finished: count at <console>:
          15
          , took 
          0.341167662 
          s 
         
 
          res6: Long = 
          127 
         

           
         

          scala> rdd.cache
         
 
          res7: rdd.type = MappedRDD[
          15
          ] at textFile at <console>:
          12 
         

           
         

          scala> rdd.count
         
 
          14
          /
          06
          /
          28 
          12
          :
          33
          :
          00 
          INFO SparkContext: Job finished: count at <console>:
          15
          , took 
          0.32015745 
          s 
         
 
          res8: Long = 
          127 
         

           
         
 
          scala> val wordCount = rdd.flatMap(_.split(
          ' '
          )).map(x=>(x,
          1
          )).reduceByKey(_+_) 
         
 
          wordCount: org.apache.spark.rdd.RDD[(String, Int)] = MapPartitionsRDD[
          20
          ] at reduceByKey at <console>:
          14 
         

           
         

          scala> wordCount.collect
         

           
         
 
          res9: Array[(String, Int)] = Array((means,
          1
          ), (under,
          2
          ), (
          this
          ,
          4
          ), (Because,
          1
          ), (Python,
          2
          ), (agree,
          1
          ), (cluster.,
          1
          ), (its,
          1
          ), (YARN,,
          3
          ), (have,
          2
          ), (pre-built,
          1
          ), (MRv1,,
          1
          ), (locally.,
          1
          ), (locally,
          2
          ), (changed,
          1
          ), (several,
          1
          ), (only,
          1
          ), (sc.parallelize(
          1
          ,
          1
          ), (This,
          2
          ), (basic,
          1
          ), (first,
          1
          ), (requests,
          1
          ), (documentation,
          1
          ), (Configuration,
          1
          ), (MapReduce,
          2
          ), (without,
          1
          ), (setting,
          1
          ), (
          "yarn-client"
          ,
          1
          ), ([params]`.,
          1
          ), (any,
          2
          ), (application,
          1
          ), (prefer,
          1
          ), (SparkPi,
          2
          ), (<http:
          //spark.apache.org/>,1), (version,3), (file,1), (documentation,,1), (test,1), (MASTER,1), (entry,1), (example,3), (are,2), (systems.,1), (params,1), (scala>,1), (<artifactId>hadoop-client</artifactId>,1), (refer,1), (configure,1), (Interactive,2), (artifact,1), (can,7), (file's,1), (build,3), (when,2), (2.0.X,,1), (Apac... 
         

           
         
 
          scala> wordCount.saveAsTextFile(
          "/home/scipio/wordCountResult.txt"
          ) 
         

（5）union

 
          scala> val rdd = sc.parallelize(List((
          'a'
          ,
          1
          ),(
          'a'
          ,
          2
          ))) 
         
 
          rdd: org.apache.spark.rdd.RDD[(Char, Int)] = ParallelCollectionRDD[
          10
          ] at parallelize at <console>:
          12 
         

           
         
 
          scala> val rdd2 = sc.parallelize(List((
          'b'
          ,
          1
          ),(
          'b'
          ,
          2
          ))) 
         
 
          rdd2: org.apache.spark.rdd.RDD[(Char, Int)] = ParallelCollectionRDD[
          11
          ] at parallelize at <console>:
          12 
         

           
         

          scala> rdd union rdd2
         
 
          res3: org.apache.spark.rdd.RDD[(Char, Int)] = UnionRDD[
          12
          ] at union at <console>:
          17 
         

           
         

          scala> res3.collect
         

           
         
 
          res4: Array[(Char, Int)] = Array((a,
          1
          ), (a,
          2
          ), (b,
          1
          ), (b,
          2
          )) 
         

（6） join

 
          scala> val rdd1 = sc.parallelize(List((
          'a'
          ,
          1
          ),(
          'a'
          ,
          2
          ),(
          'b'
          ,
          3
          ),(
          'b'
          ,
          4
          ))) 
         
 
          rdd1: org.apache.spark.rdd.RDD[(Char, Int)] = ParallelCollectionRDD[
          10
          ] at parallelize at <console>:
          12 
         

           
         
 
          scala> val rdd2 = sc.parallelize(List((
          'a'
          ,
          5
          ),(
          'a'
          ,
          6
          ),(
          'b'
          ,
          7
          ),(
          'b'
          ,
          8
          ))) 
         
 
          rdd2: org.apache.spark.rdd.RDD[(Char, Int)] = ParallelCollectionRDD[
          11
          ] at parallelize at <console>:
          12 
         

           
         

          scala> rdd1 join rdd2
         
 
          res1: org.apache.spark.rdd.RDD[(Char, (Int, Int))] = FlatMappedValuesRDD[
          14
          ] at join at <console>:
          17 
         

           
         

          res1.collect
         

           
         
 
          res2: Array[(Char, (Int, Int))] = Array((b,(
          3
          ,
          7
          )), (b,(
          3
          ,
          8
          )), (b,(
          4
          ,
          7
          )), (b,(
          4
          ,
          8
          )), (a,(
          1
          ,
          5
          )), (a,(
          1
          ,
          6
          )), (a,(
          2
          ,
          5
          )), (a,(
          2
          ,
          6
          ))) 
         

（7）lookup

1

2

3

 
          val rdd1 = sc.parallelize(List((
          'a'
          ,
          1
          ),(
          'a'
          ,
          2
          ),(
          'b'
          ,
          3
          ),(
          'b'
          ,
          4
          ))) 
         
 
          rdd1.lookup(
          'a'
          ) 
         
 
          res3: Seq[Int] = WrappedArray(
          1
          , 
          2
          ) 
         

（8）groupByKey

1

2

3

4

5

 
          val wc = sc.textFile(
          "/home/scipio/README.md"
          ).flatMap(_.split(
          ' '
          )).map((_,
          1
          )).groupByKey 
         

          wc.collect
         

           
         
 
          14
          /
          06
          /
          28 
          12
          :
          56
          :
          14 
          INFO SparkContext: Job finished: collect at <console>:
          15
          , took 
          2.933392093 
          s 
         
 
          res0: Array[(String, Iterable[Int])] = Array((means,ArrayBuffer(
          1
          )), (under,ArrayBuffer(
          1
          , 
          1
          )), (
          this
          ,ArrayBuffer(
          1
          , 
          1
          , 
          1
          , 
          1
          )), (Because,ArrayBuffer(
          1
          )), (Python,ArrayBuffer(
          1
          , 
          1
          )), (agree,ArrayBuffer(
          1
          )), (cluster.,ArrayBuffer(
          1
          )), (its,ArrayBuffer(
          1
          )), (YARN,,ArrayBuffer(
          1
          , 
          1
          , 
          1
          )), (have,ArrayBuffer(
          1
          , 
          1
          )), (pre-built,ArrayBuffer(
          1
          )), (MRv1,,ArrayBuffer(
          1
          )), (locally.,ArrayBuffer(
          1
          )), (locally,ArrayBuffer(
          1
          , 
          1
          )), (changed,ArrayBuffer(
          1
          )), (sc.parallelize(
          1
          ,ArrayBuffer(
          1
          )), (only,ArrayBuffer(
          1
          )), (several,ArrayBuffer(
          1
          )), (This,ArrayBuffer(
          1
          , 
          1
          )), (basic,ArrayBuffer(
          1
          )), (first,ArrayBuffer(
          1
          )), (documentation,ArrayBuffer(
          1
          )), (Configuration,ArrayBuffer(
          1
          )), (MapReduce,ArrayBuffer(
          1
          , 
          1
          )), (requests,ArrayBuffer(
          1
          )), (without,ArrayBuffer(
          1
          )), (
          "yarn-client"
          ,ArrayBuffer(
          1
          )), ([params]`.,Ar... 
         

（9）sortByKey

1

2

3

4

 
          val rdd = sc.textFile(
          "/home/scipio/README.md"
          ) 
         
 
          val wordcount = rdd.flatMap(_.split(
          ' '
          )).map((_,
          1
          )).reduceByKey(_+_) 
         
 
          val wcsort = wordcount.map(x => (x._2,x._1)).sortByKey(
          false
          ).map(x => (x._2,x._1)) 
         
 
          wcsort.saveAsTextFile(
          "/home/scipio/sort.txt"
          ) 
         

升序的话，sortByKey(true)

转

http://my.oschina.net/scipio/blog/284957#OSC_h5_11

http://bit1129.iteye.com/blog/2171799

http://bit1129.iteye.com/blog/2171811

你可能感兴趣的:(spark,操作,基本)

Java学习，删除集合指定元素五味香 java 学习开发语言 python android kotlin golang
Java删除集合中指定元素，通常依赖于集合具体类型。不同的集合类型（如ArrayList,HashSet,LinkedList等）提供了不同的方法来执行此操作。使用ArrayList：importjava.util.ArrayList;importjava.util.List;publicclassMain{publicstaticvoidmain(String[]args){Listlist=n
深入理解 Windows Server 的核心功能：现代 IT 架构的基石 Echo_Wish 让你快速入坑运维运维探秘 windows 架构
深入理解WindowsServer的核心功能：现代IT架构的基石在现代IT基础架构中，WindowsServer一直扮演着不可或缺的角色。它不仅是一个强大的服务器操作系统，更是企业级解决方案的核心支柱。从中小型企业到跨国公司，WindowsServer提供了从身份管理到高可用性的一系列功能，帮助组织应对复杂的IT挑战。作为一名运维人员或IT架构师，理解其核心功能对于设计高效、安全、可扩展的IT环境
YOLOv10改进，YOLOv10检测头融合RepConv卷积，添加小目标检测层（四头检测）+CA注意机制，全网首发挂科边缘 YOLOv10改进 YOLO 目标检测人工智能计算机视觉
摘要作者提出了一种简单而强大的卷积神经网络架构，其推理阶段采用与VGG类似的网络体结构，仅由一堆3x3卷积和ReLU组成，而训练阶段的模型具有多分支拓扑。这种训练阶段和推理阶段架构的解耦通过结构重参数化技术实现，因此我们将该模型命名为RepVGG。#理论介绍RepConv通过将多个卷积操作合并成一个卷积操作来优化计算的。首先在训练过程中使用多种操作（如多个卷积层、跳跃连接等）来提高模型的表达能力和
【虚拟化】系统虚拟化的主要功能和分类 TrustZone_ 虚拟化
1.3系统虚拟化的主要功能和分类系统虚拟化向下管理硬件资源，向上提供硬件抽象。本节主要介绍系统虚拟化的基本功能（包括CPU、内存和I/O虚拟化），并根据Hypervisor与物理资源和操作系统交互方式的不同，介绍了两种基本的虚拟化分类。然后简要介绍三种虚拟化的实现方式，从而帮助读者在整体上了解虚拟化不同实现方式对功能和性能的影响。1.3.1虚拟化基本功能系统虚拟化架构如图1-4所示（以经典的“一虚
使用过的 DAC 器件使用总结 Major_pro 硬件嵌入式硬件
DAC器件的基本原理DAC的主要任务是将二进制数字信号转换成相应的模拟电压或电流信号。其基本工作原理可以概括为以下步骤：接收数字输入：DAC接收来自数字系统的二进制数字信号。量化处理：根据输入的二进制值，确定对应的模拟输出电平。通常，n位DAC可以表示2^n个不同的离散电平。转换为模拟信号：通过内部的电阻网络或其他方法将量化后的电平转换为模拟电压或电流信号。滤波与输出：为了去除高频噪声和阶梯波效应
C++迭代器失效倒地不起的土豆 C++语言算法 c++开发语言
目录什么是迭代器迭代器失效顺序容器迭代器失效添加操作删除操作关联容器迭代器失效swap()操作迭代器为什么不失效注意事项参考什么是迭代器迭代器不是指针，是类模板，表现的像指针。他只是模拟了指针的一些功能，通过重载了指针的一些操作符，->,*,++--等封装了指针，是一个“可遍历STL（StandardTemplateLibrary）容器内全部或部分元素”的对象，本质是封装了原生指针，他可以根据不同
Spark Livy 指南及livy部署访问实践 house.zhang 大数据-Spark 大数据
背景：ApacheSpark是一个比较流行的大数据框架、广泛运用于数据处理、数据分析、机器学习中，它提供了两种方式进行数据处理，一是交互式处理：比如用户使用spark-shell，编写交互式代码编译成spark作业提交到集群上去执行；二是批处理，通过spark-submit提交打包好的spark应用jar到集群中进行执行。这两种运行方式都需要安装spark客户端配置好yarn集群信息，并打通集群网
【SQL】掌握SQL查询技巧：数据分组与排序 m0_74825678 面试学习路线阿里巴巴 sql java jvm
目录1.GROUPBY1.1定义与用途1.2示例说明1.3注意事项1.4可视化示例2.ORDERBY2.1定义与用途2.2升序说明（默认）2.3降序排序2.4多列排序2.5可视化示例3.GROUPBY与ORDERBY的结合使用4.可视化示例总结在数据库管理中，SQL（结构化查询语言）是一个强大的工具，它允许用户从数据库中提取和操作数据。对数据的有效处理通常需要进行分组和排序操作。在这篇博客中，我们
Netty处理字符格式的报错class java.lang.String cannot be cast to class io.netty.buffer.ByteBuf kkoneone11 java 开发语言
问题背景：由于第一次处理和打印机进行通信的业务，转化格式为ByteBuf的时候报错：classjava.lang.Stringcannotbecasttoclassio.netty.buffer.ByteBuf分析：根据报错大概意思是String类型不能转化成ByteBuf，但是我印象中也没做什么操作，所以大概是在初始化Handler的时候出现了点错误，因此去看代码发现初始化里编解码是不仅有二进制
工作中常用 CMD 命令书生－w windows cmd
文章目录1.网络排障与端口检查1.1检测网络连通性1.2路由追踪1.3查看端口占用与连接状态2.进程管理2.1查看进程列表2.2结束指定进程3.文件与目录操作3.1快速查找并筛选日志3.2批量复制或镜像目录4.环境变量与系统信息4.1设置临时环境变量4.2设置系统环境变量4.3查看系统信息5.批处理脚本与自动化5.1将命令封装成`.bat`脚本5.2重定向和管道组合6.远程管理与故障排查6.1Te
大数据学习（四）：Livy的安装配置及pyspark的会话执行猪笨是念来过倒大数据 pyspark
一个基于Spark的开源REST服务，它能够通过REST的方式将代码片段或是序列化的二进制代码提交到Spark集群中去执行。它提供了以下这些基本功能：提交Scala、Python或是R代码片段到远端的Spark集群上执行；提交Java、Scala、Python所编写的Spark作业到远端的Spark集群上执行；提交批处理应用在集群中运行。从Livy所提供的基本功能可以看到Livy涵盖了原生Spar
隐语安装部署 HZGame. 大数据数据库架构
主讲老师：周爱辉讲课链接：第4讲（上）：隐语安装部署-理论篇丨隐私计算实训营第2期_哔哩哔哩_bilibili主讲老师：王祖利讲课链接：第4讲（下）：SecretFlow与Secretnote的安装部署—实操篇丨隐私计算实训营第2期_哔哩哔哩_bilibili一、SecretFlow运行要求：1、环境要求Python>=3.8操作系统：•CentOS7•Anolis8•Ubuntu18.04/20
探索数据科学新边界：Apache Livy 开源项目详解毕艾琳
探索数据科学新边界：ApacheLivy开源项目详解incubator-livyApacheLivyisanopensourceRESTinterfaceforinteractingwithApacheSparkfromanywhere.项目地址:https://gitcode.com/gh_mirrors/in/incubator-livyApacheLivy是一个为ApacheSpark提供的
[练习]简单结构体操作程序 siy2333 练习算法 c语言笔记学习
在学习C语言的过程中，我们经常会接触到各种数据结构的操作，其中数列（数组）是最基本也是最常用的一种。今天，我们分析一个简单的C语言程序，以及进行一定程度的改进。程序概述这个程序的主要目的是实现一个简单的数列操作，包括数列的内存分配、删除指定元素以及输出数列的功能。程序的核心是一个名为sequence的结构体，它包含数列的大小和指向数列元素的指针。通过几个函数的配合，程序完成了数列的创建、修改和输出
YOLOv11改进，YOLOv11检测头融合RepConv卷积，并添加小目标检测层（四头检测），适合目标检测、分割等任务挂科边缘 YOLOv8改进 YOLO 目标检测人工智能计算机视觉
摘要作者提出了一种简单而强大的卷积神经网络架构，其推理阶段采用与VGG类似的网络体结构，仅由一堆3x3卷积和ReLU组成，而训练阶段的模型具有多分支拓扑。这种训练阶段和推理阶段架构的解耦通过结构重参数化技术实现，因此我们将该模型命名为RepVGG。#理论介绍RepConv通过将多个卷积操作合并成一个卷积操作来优化计算的。首先在训练过程中使用多种操作（如多个卷积层、跳跃连接等）来提高模型的表达能力和
Windows CMD 常用命令书生－w windows cmd
文章目录1.前言2.如何进入CMD3.常用文件与目录操作命令3.1切换盘符3.2`cd`改变目录3.3`dir`查看目录内容3.4创建、删除目录3.5创建、删除文件4.文件与内容操作4.1复制、移动文件4.2批量复制—`xcopy`/`robocopy`5.网络相关命令5.1`ipconfig`查看本机IP5.2测试网络连通性—`ping`5.3路由跟踪—`tracert`5.4查看端口连接状态—
C# LINQ扩展方法探索：Enumerable.Except实现集合差集操作 AitTech C#c#linq 开发语言
在C#中，Enumerable.Except方法是一个LINQ（LanguageIntegratedQuery）扩展方法，用于返回两个序列的差集。换句话说，它会返回第一个序列中存在但第二个序列中不存在的元素集合。此方法对于从一个集合中移除另一个集合中的所有匹配项非常有用。Enumerable.Except方法有两个主要重载版本：默认比较器：使用默认相等比较器(DefaultEqualityComp
19. C语言共用体（Union）详解涛ing C语言基础 c语言 java 算法 linux c++visual studio vscode
本章目录前言1.什么是共用体？共用体与结构体的区别2.定义共用体示例：定义共用体变量3.共用体的内存布局和对齐规则内存大小计算字节对齐内存对齐原则4.访问共用体成员示例：基本访问5.共用体的实际应用场景场景1：节省内存场景2：网络通信数据包解析场景3：判断系统是大端还是小端6.高效使用共用体的技巧总结前言在C语言中，共用体（union）是一种特殊的复合数据类型，与结构体（struct）类似，但具备
6-1.Android 对话框之基础对话框（普通、单选、多选、列表）我命由我12345 Android -简化编程 android java java-ee android-studio android studio 安卓
对话框对话框（Dialog）是一种常用的UI组件，它主要用于显示信息、接收用户操作反馈对话框可以包含各种元素，但是主要还是以文本、按钮为主，其次是列表其中，基础对话框是Android中最简单的对话框，而后是进度对话框、自定义对话框等基础对话框使用4步走创建AlertDialog.Builder对象，它用于构建对话框AlertDialog.Builderbuilder=newAlertDialog.
【Python进阶】Python中的操作系统接口：使用os模块进行系统调用 m 哆哆.ღ python python 开发语言
1、操作系统接口的重要性1.1操作系统接口概览操作系统接口就像一座桥梁，连接着用户程序与底层操作系统服务。它是软件开发中不可或缺的一部分，让程序员能够借助标准化的方式与操作系统进行对话，执行诸如文件管理、进程控制、系统资源分配等各种关键任务。操作系统接口可分为以下几类：●命令行接口：通过shell或命令行工具直接与系统交互。●图形用户接口：如WindowsExplorer或MacOS的Finder
kafka 宋song一中间件 kafka big data
Kafka学习之路Kafka必知必会kafka核心原理go操作kafka消息队列之-KafkaKafka分区分配策略或(https://blog.csdn.net/u013256816/article/details/81123625)kafka怎么保证消息顺序？StickyAssignor:0.11.x版本引入,消费者尽量不离开分区.即BalanceStrategySticky:重平衡策略,适用
new[]创建对象数组会怎样？青草地溪水旁 C++学习记录 c++构造函数
当你使用new[]操作符来创建一个对象数组时，构造函数会被调用与数组大小相等的次数。每个数组元素都会通过构造函数进行初始化。以下是一个例子：#includeclassMyClass{public:MyClass(){std::cout<<"MyClassconstructorcalled."<
C++的构造函数、默认构造函数和=default 青草地溪水旁 C++学习记录 c++linux
目录1.基本概念2.为什么要加=default?3.参考资料1.基本概念构造函数(contructor)是特殊的成员函数，其作用是控制对象的初始化,初始化类的数据成员。默认构造函数的必要充分条件是构造函数无参默认构造函数分两种:一种是按照C++定义类的规则由编译器自动生成的，即：如果没有显示（隐式的）的定义默认的构造函数，则编译器会为类合成一个默认构造函数。在定义一个类的时候，如果没有定义任何一个
defer 源码分析线程A 软件随想 go
在Go语言中多个defer形成一个链表.defer语句会首先调用一个deferproc函数,new一个对应的结构体挂载到对应的G上面调用new之前会从G所绑定的P的deferpool里面取,没有取到会从全局的deferpool里取,实在没有的话才新建一个。这是Goruntime里非常常见的操作，即设置多级缓存，提升运行效率在执行RET指令之前（注意不是return之前），调用deferreturn
如何生成IP地址的自签名证书 Ceramist SSL证书
生成一个用于特定IP地址的自签名证书是一个相对直接的过程。自签名证书通常用于开发测试环境，而不是生产环境，因为它们不是由受信任的证书颁发机构（CA）签署的。下面是在命令行工具如OpenSSL中创建自签名证书的基本步骤：前提条件确保你的计算机上已经安装了OpenSSL。大多数Linux发行版默认包含了OpenSSL，而在Windows上可能需要手动安装。步骤打开命令提示符或终端：在Windows上使
Java中的NIO到底是什么 Ceramist java nio
Java中的NIO到底是什么引言JavaNIO（NewInput/Output）是Java1.4中引入的一套新的IO操作API，旨在替代传统的IO（即BIO，BlockingIO）。NIO提供了更高效的文件和网络IO操作，能够更好地满足高并发和大规模数据传输的需求。本文将详细阐述什么是NIO，为什么需要NIO，NIO解决的编程场景，以及NIO的主要框架及其应用场景。什么是NIONIO，全称为New
CentOS 端口开放指导 Ceramist centos linux 运维
CentOS端口开放指导在CentOS系统中，您可以使用一些命令来管理TCP和UDP端口的开放。本指南将介绍如何进行单端口开放、范围端口开放、查看已开放端口以及关闭已开放端口等操作。单端口开放要开放单个端口，您可以使用firewall-cmd命令：sudofirewall-cmd--zone=public--add-port=PORT_NUMBER/tcp--permanent将PORT_NUMB
无需联网的特殊版，终于找到了维度哥 PDF阅读器
今天给大家介绍一个PDF便携版的阅读器。仅仅6M多，不写系统，不写注册表，不写临时文件，不联网，一个exe搞定所有功能，无依赖支持库。PDFLitePDF编写阅读器这个软件非常的小，只有6M多，而且不需要安装，不会去写入注册表，不会写入临时文件，不需要联网，十分的干净。但是它的功能非常多，基本上我们平时用到的功能都会有，而且完全免费。而且PDF可以导出Tiff和PNG图片的格式。可以正常打印文档,
大文件上传的解决办法~文件切片、秒传、限制文件并发请求。。。行咘行啊细狗 javascript 开发语言 ecmascript
1、项目背景：针对大文件上传，如果将文件作为一个请求去发送给后端，会有以下几种问题，首先是上传时间长，用户不能进行其他操作，包括页面刷新等操作，其次有的接口会设置响应时间限制，可能大文件还没上传完就触发响应限制了，这样对用户很不友好，那么怎么解决呢？2、首先前端针对大文件使用文件切片技术，将大文件切成多个小文件，然后再将多个小文件传给后端，由后端进行组合即可。（文件切片）import{ref}fr
iOS开发入门（一） ape阿浩 ios objective-c swift
iOS开发是做什么的呢？这一点嘛，主要做iOS操作系统上的应用软件，包括iPhone和iPad上的各种App，主要使用的语言是Objective-C和Swift开发语言，这两种语言都是面向对象的编程语言。iOS开发使用什么开发工具呢？统一使用Xcode进行开发，Xcode可以从AppStore进行获取，这个集成开发工具（IDE）既可以开发iOS应用软件，也可以开发macOS应用软件，Xcode中可
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs