豆沙糕

Spark系列(一) —— SparkCore详解

1. =》Spark 引入

首先看一下 MapReudce 计算和 Spark 计算的区别：

MapReudce : 分布式计算框架

缺点：执行速度慢，shuffle 机制：数据需要输出到磁盘，而且每次 shuffle 都需要进行排序操作

框架的机制：只有 map 和 reduce 两个算子，对于比较复杂的任务，需要构建多个job来执行，当存在 job 依赖的时候，job 之间的数据需要落盘（输出到HDFS上），所以有IO瓶颈（磁盘IO，网络IO）。

Spark ：基于内存的分布式计算框架

基于内存并不是所有数据都放在内存，只是说可以基于内存，速度很快。

Spark 是一个执行引擎，包括Spark SQL；Spark Streaming；MLib；Graphx，运行平台主要有：1. hadoop 即 yarn；2. Mesos(资源管理框架)；3. standalone(spark自带的资源管理框架)；4. local即本地；5. 云资源管理框架，例如阿里云等等

详细比较如下图：

如下图，MapReudce 运行时job之间的数据需要落盘（输出到HDFS上），Spark则是有选择性的放在内存中：

Spark运行模式（即spark应用运行在哪里）

local：本地运行（测试和开发）

standalone：使用spark自带的资源管理框架运行spark应用

yarn：将spark应用类似mr一样，提交到yarn上运行

mesos:类似yarn的一种资源管理框架

一般是standalone和yarn，更多的是yarn，特别大的公司，技术能力足够的情况下，有可能会选择mesos

2. =》SparkCore 案例

先用 WordCount 感受一下 spark 应用的编写。

这个案例主要是统计文本中的单词数量。

文件内容如下：

代码如下：

// 读取HDFS上的文件形成RDD
scala> var lines = sc.textFile("/spark/data/word.txt")
// scala> lines.map(line => line.split(" ")) 返回的数据结构：==> RDD[Array[String]]
// 以上操作之后，数据还是一行行的数据，只是每行数据从原来的一条字符串变成了一个数组的字符串，并不是 
// 我们想要的效果，所以这里要使用flatMap
//转换处理
scala> var word = lines.flatMap(line => line.split(" ")) // 返回的数据结构：==> RDD[String]
scala> val word2 = words.map(word => (word,1)) // 返回的数据结构：==> RDD[(String,Int)]
scala> val wordCountRdd = words2.reduceByKey(_ + _) 
scala> wordCountRdd.collect() // 先看一下统计结果
// 结果保存（要求输出文件夹不存在）
scala> wordCountRdd.saveAsTextFile("/spark/data/core/result0")
// 获取Top10单词
scala> wordCountRdd.sortBy(t => t._2 * -1).take(10)
scala> wordCountRdd.map(_.swap).top(10)

打印出来的统计结果如下：

最后做成文件保存到HDFS上，如下：

这里可以把rdd当成是list，里面是一行一行的数据，注意rdd的数据以行为单位，每次操作都是对一行的数据进行操作。

为什么不用 groupByKey 而选择 reduceByKey ，groupByKey 可能导致加载所有的 key-value对到内存中，如果有某些 key 有特别多的 value，会导致 OOM , Spark 的源码 PairRDDFunctions 类中明确写道建议使用 reduceByKey，有更好的性能

3. =》Spark 应用的监控

应用监控

1. 运维人员有专门的监控工具进行监控，比如：zabbix 等，可以监控服务器是否正常：内存、cpu、网络、磁盘IO、网络IO ，服务进程是否存在

2. 使用CM (CDH)，Ambari (Apache)

3 .软件自带的 web 界面进行监控

4. oozie 等调度工具监控 job 的运行情况，调度异常，执行 java 程序发送短信

jps / jps | grep ...

针对正在运行的应用，可以通过webUI来查看，端口号默认4040，如果是运行在yarn上，直接在yarn的监控界面查看即可端口号默认8088

对于已经执行完的job，可以通过 Spark 的 job history 服务来查看，端口号默认18080

4. =》Spark 应用结构

MapReduce应用架构：

一个应用就是一个 job

一个 job 包含两个 stage，分别是 map 阶段和 reduce 阶段

每个阶段一个 task 任务（mapTask/ReduceTask）

执行任务的角色来讲：ApplicationMaster + container

Spark应用架构

一个应用可以包含多个 job，如下图1 所示的 0-11 个job

一个job可以包含多个 stage，如下图2 所示的 3 个stage

一个stage可以包含多个 task，如下图3 所示的 5 个task

====》图一：

====》图2：

====》图3：

执行任务的角色来讲：

Driver + Executor

Driver :进行初始化操作的进程, main 方法的运行的JVM的地方，主要功能是：saprkContext上下文创建，RDD构建，RDD调度，RDD运行资源调度

Executor：真正运行Task任务的进程。

完整的运行架构如下：

5. =》Spark on yarn 运行方式

bin/spark-submit \

--master yarn \

--deploy-mode cluster \

--class com.bigdata.spark.app.core.SparkWordCount \

/home/logs-analyzer.jar

脚本参数讲解：

--master 给定运行的spark应用的执行位置信息

--deploy-mode 给定driver在哪执行

client: driver 在执行spark-submit的那台机器上运行

cluster:driver 在集群中任选一台机器运行

--driver-memory MEM：指定driver运行时候的JVM的内存大小，默认1G，一般情况下要求比单个executor的内存要大。因为应用执行的结果是有可能返回给driver的。

--driver-cores MEM：spark on yarn cluster,给定driver运行需要多少个core，默认一个

--executor-memory MEM：指定单个executor的内存大小

--executor-cores NUM:运行环境为standalone/yarn，给定应用运行过程中每个executor包含的core数目 yanr默认1

--num-executors NUM:盛情多少个executor，默认2，这里即是nodemanager中的container数目

6. =》Spark RDD Job提交执行流程讲解

Spark应用的执行过程：

- 1. client 向资源管理服务（ResourceManager,Master等）申请运行的资源（driver资源），如果是client模式下，driver的资源不用进行申请操作，因为driver是在本地启动的，直接就有资源支持启动。只有在集群其他机器上，才需要申请。

- 2. 启动 driver

- 3. driver 向资源管理服务（ResourceManager,Master等）申请运行的资源（executor资源，可以理解为内存等资源）

- 4. 启动 executor

- 5. rdd 构建和 rdd 执行

① Driver中RDD的构建

② RDD job被触发（需要将RDD的具体执行步骤提交到executor中执行）

③ Driver中的DAGScheduler将RDD划分为Stage阶段

④ Driver中的TaskScheduler将一个一个stage提交到executor上执行

具体如下图：

7. =》Spark内存资源管理机制

这里只讨论 Spark1.6 版本之后的内存管理机制：

内存管理分3个部分：

1. Reserved Memory：固定300M，不能进行修改，作用主要是加载class相对比较固定的对象以及计算最小Spark的Executor内存 = 1.5 * Reserved Memory = 450M

2. User Memory：用户代码中使用到的内存，默认占比 1 - spark.memory.fraction - 300M，即默认占比 25% - 300M

3. Spark Memory：Spark应用执行过程中进行数据缓存和shuffle操作使用到的内存

spark.memory.fraction:0.75，即默认占比 75%

缓存（Storage Memory，spark中所有数据缓存，包括RDD）和 shuffle（Execution Memory）的内存分配是动态的。spark.memory.storageFraction：默认0.5 => storage最少固定占用的内存大小比例

- a. 如果 Storage Memory 和 Execution Memory 都是空的（都有容量）如果有数据需要缓存，storage会占用execution部分的空余内存，同理，execution也会占用storage部分的空余内存。

- b. 如果 Storage Memory 满了，Execution Memory 有空余，如果有数据缓存操作，storage会占用execution部分的空余内存

如果有执行过程内存需要，execution操作会占用storage部分的内存，会将storage部分存储的数据进行删除

- c. 如果 Storage Memory 有空余，Execution Memory 满了，如果数据有缓存操作，不能占用execution部分的内存。

如果有执行过程内存需要，execution操作会占用storage部分的内存

备注：execution过程中使用到的内存是不允许进行删除操作的，storage的数据可以进行删除。

举个例子，假设Sparrk应用申请到了 1G 的资源，那么如何分配：

Reserved Memory : 300M

Spark Memory : (1G - 300M) * 0.75 = 543M , 其中Storage Memory最小 543M * 0.5 = 271M

User Memory : 1G - 300M - 543M = 181M

Spark 动态资源分配：

含义：指 Executor 的数量可以根据 job 中需要的资源来申请。有的job需要的Executor多，有的少，根据不同的Job的情况调整分配的 Executor 的数量，可以保证job能够快速执行，也保证不会出现资源浪费。

现阶段来讲，SparkStreaming中实现的不太好，SparkCore和SparkSQL都可以应用。

注意，下面的参数如果要配置，需要全部配置上去。

spark.dynamicAllocation.enabled：false，开启动态资源分配（true）

spark.dynamicAllocation.initialExecutors：初始化的时候给定默认executor的数量

spark.dynamicAllocation.maxExecutors：动态资源最多允许分配多少资源

spark.dynamicAllocation.minExecutors：0，动态资源最少允许分配多少资源

8. =》Spark RDD

工作中用到的API最多的就是4个：flatMap，filter，map，reduceByKey

RDD（弹性分布式数据集）：

数据存储在HDFS上是以block形式存在的，spark读取并形成RDD的时候，没有限制条件的情况下，每一个block对应一个分区。每一个分区进行操作的时候，同样是一个分区对应一个分区，如下图4个分区，进行flatMap操作的时候，也是上面的4个分区进行操作生下一步的一一对应的4个分区。

弹性：可以存在给定不同数目的分区、数据缓存的时候可以缓存一部分数据，也可以缓存全部数据。

分布式：分区可以分布到不同的executor上执行，也就是不同的workwer/NM上。

数据集：内部存储是数据。

RDD中的数据是不可变的，是分区的。操作过程中不断形成新的RDD。

RDD五大特性：

1. 一系列的分片，类似Hadoop中的split

2.在每个分片上都有一个函数去迭代、执行、计算它

3. RDD之间一系列依赖

4. 对于key-value的RDD可指定一个partitioner，告诉它如何分片；常用的有hash,range

5. 数据本地化：要运行的计算最好在哪（几）个机器上运行，为什么会有哪几个呢？比如，Hadoop默认有3个位置，或者spark cache到内存是可能通过StorageLevel1设置了多个副本，所以一个partiton可能返回多个最佳位置。

RDD构建底层原理：

- 1. RDD分区数量 = InputFormat的getSplit方法返回的集合中split的数量

- 2. RDD中不包含数据，只包含数据存储的位置信息，这里的RDD指的是应用运行的第一个RDD，比如split，rdd的计算转换不算做构建。

RDD的创建：

- 1. 外部数据（非内存数据）：基于MapReduce的InputFormat进行创建

sc.textFile ==> 底层使用TextInputFormat读取数据形成RDD；使用旧API

sc.newAPIHadoopFile ==> 底层使用TextInputFormat读取数据形成RDD；使用新API，可以指定使用哪个InputFormat读取数据。例如，读取redis的数据，只需要指定redis的InputFormat即可。

- 2. 内存中数据：基于序列化进行创建

val seq = List (1,2,3,4,5)

用户应用new SparkContext后，集群就会为在Worker上分配executor,但是增加executor的时候需要考虑好内存消耗，因为一台机器的内存分配给越多的executor，每个executor的内存就越小，以致出现过多的数据spill over甚至out of memory的情况。CPU的core数量，每个executor可以占用一个或多个core，可以通过观察CPU的使用率变化来了解计算资源的使用情况，如此根据CPU的使用情况来分配executor数量，没有固定分配数量模式。

一个rdd分成几个partition，则有几个task，task被分配到节点中，每个节点的executor有几个core，则有几个task可以被并行执行，最大并行度即为节点数*core(虚拟核，并不是每个节点的cpu物理核，但一般虚拟核<=物理核) 。

假设：有5个节点，每个节点的executor有2个core；有1万条数据组成一个rdd，分成10个partition，则有10个task 。则每个节点分配到两个task并行执行。

9. =》RDD三大类型API

Spark应用的一般步骤：

创建上下文 => 读取RDD => RDD的转换 => 数据结果

RDD的方法类型（API类型）

1. transformation (transformation 算子):转换操作

功能：有一个RDD产生一个新的RDD。不会触发job的执行，在这些类型的API调用过程中，只会构建RDD依赖，也称为构建RDD的执行逻辑图（DAG图），即依赖关系。

2. action (action算子)::动作/操作

功能：触发rdd的job执行，并将rdd对应的job提交到executor上执行，最终的结果输出到其它文件系统，或者返回给driver.每次有一个action算子，spark监控页面上该应用的job页面

上就会多一条job记录。

transformation 算子执行和DAG创建都是在driver上完成的。DAG中间过程的执行是在action算子提交之后，到executor上执行

3. persist (RDD缓存/RDD持久化)：

rdd将数据进行缓存操作或者清除缓存的rdd数据。或者数据进行了checkpoint（只在streaming中使用）

rdd.cache() 数据缓存到内存中

rdd.persist(xxx) 数据缓存到指定级别的存储系统中（内存/内存+磁盘/磁盘）

rdd.unpersist() 清除缓存数据

如下图，绿色的点就表示从绿色点的位置读取数据。原本reduceByKey触发的时候是从开始第一个RDD的数据源读取数据，但是如果cache()之后，后面的步骤会直接从cache()的位置读数据。缓存在内存中，那直接读，很快。缓存在磁盘中，是存储在本地磁盘，不需要通过网络IO，同样很快。

下图为缓存的信息，如图所示，缓存是以分区为最小单位的。缓存整数个分区。如果有内存就多存一点，否则就少存一点。具体见之前讲到的内存管理机制。图上是缓存了两个分区，如果只缓存一个分区，那么只有一个分区的数据会从内存读，另外一个分区的数据会从原始数据源开始读。

缓存级别如下：

10. =》SparkCore案例：分组排序TopN实现

按照第一个字段分组；同一组中按照第二个字段排序；每一组中，获取出现最多的钱k个数据。

案例数据如下：

案例代码如下：

val path = "data/groupsort.txt"
// 1. 创建SparkContext上下文
val conf = new SparkConf()
    .setMaster("local")
    .setAPPName("wordcount")
val sc = new SparkContext(conf)

// 2. 创建RDD
val rdd = sc.textFile(path)

// 3. RDD操作
val arrRDD = rdd.map(_.split(" ")) //一行数据整体做考虑的用map,一行数据单个元素做考虑的用faltMap
val tupleRDD = arrRDD.map(arr => (arr(0),arr(1).toInt))
val groupedRDD:RDD[(String,Iterable[Int])] = tupleRDD.groupByKey() // 注意groupByKey()之后的数据结构，key不变，而value变成了一个迭代器
val resultRDD = groupedRDD.map { // 下面开始组内排序
   case (item1,iter) => {  // 这里item1是key,iter是value
     // 对iter进行排序然后获取数值最大的前k个数据
     val topKItem2 = iter.toList //迭代器没有排序方法，需要转换成list
                         .sorted //list是有排序方法的，默认是升序排列
                         .takeRight(K) //因为是升序，要去取最大的，所以从右边开始获取K个元素,返回一个list
     // 返回结果
     (item1,topKItem2) // (key,(value1,value2,value3))的形式
     topKItem2.map(item2 => (item1,item2 )) // (key,value1),(key,value2)，(key,value3)的形式
  }
}

// 4. 结果输出
resultRDD.forEachPartition (iter => { // 优先选择forEachPartition API
  iter.foreach(println)
})
resultRDD.saveAsTextFile("result/topn")

Spark优化：

1.代码优化

a.如果一个RDD只使用一次，那么不赋值，直接转换操作 ( 链式编程 )。

b.对于多次使用的RDD，需要对 rdd 进行 cache 操作 ( rdd.cache() )，记住使用完成后，需要释放 ( rdd.unpersist() )。当然，如果只是SparkCore或者SparkSQL程序，job不是很多的情况下，也可以不释放，等应用执行完关闭的时候会自动清空内存，但是在运行过程中就不会释放了。

c. 优先选择 reduceByKey 和 aggregateByKey 替代 groupByKey。原因：groupByKey可能导致OOM，性能没有前两个API好（前两个API存在combine操作，在聚合之前会进行combine，和mapreduce的combine一模一样）

2. 资源优化（见上第7点：Spark内存资源管理机制）

3.数据倾斜优化

导致原因：数据重新分配(shuffle)不均匀导致的，某几个key有大量的value,可能会导致某些 task 处理数据过多(分组的时候一个 key对应一个分区对应一个task)，执行速度比较慢，或者出现OOM，去task监控界面看各个task的执行时间是否差距很大并且有异常即可判断是否出现数据倾斜。把数据拉下来，把这个代码统计之后看一下，各个分区的数据是多少。如何看：

rdd.foreachPartition(iter => {

iter.toList.size 或者 iter.count(t => true)

})

a. 更改分区策略（机制<自定义数据分区器>+分区数）例如groupByKey可以传参分区器和分区数。

b. 两阶段聚合

把 key 转换成 (random.nextInt(100),key)，其中 random.nextInt(100) 表示0-99的随机值，这样聚合的时候就会先按照第一个元素(随机数)比较，然后再按第二个元素比较，这样就会把原来某个key的数据拆分到多个分区。第一阶段按随机数+key进行聚合，第二阶段将随机数去掉，再按key进行聚合。

只适用于聚合类shuffle操作（groupByKey、reduceByKey等），不适用于非聚合类shuffle操作（join等），可以将 reduce join 转为 map join

11. =》RDD依赖和RDD容错机制

RDD依赖

窄依赖：子RDD的每个分区的数据来常数个父RDD分区；父RDD的每个分区的数据到子RDD的时候在一个分区中进行处理。

父RDD和子RDD 一对一、多对一

常用方法：map、flatmap、filter、union、join（这种join要求两个父RDD具有相同的partitioner(指相同key的数据在两个父RDD中是在相同的分区，比如都在1分区或者都在2分区，不可能一个在1分区，一个在2分区)同时两个父RDD的分区数目一致）等

宽依赖：子RDD的每个分区的数据来自所有父RDD分区；父RDD的每个分区的数据都有可能分配到所有的子RDD分区中。

父RDD和子RDD 多(所有)对多

常用方法：xxxxByKey、join ( 不满足上面窄依赖join条件的join) 、repartition、distinct等。

如下图，左边是窄依赖，右边是宽依赖。

SparkCore 的容错：

1. driver宕机：

client：程序直接挂了

cluster：saprk on standalone/mesos：通过spark-submit的参数：--supervise可以指定driver宕机的时候，在其他的节点上重新恢复。

spark on yarn：自动恢复4次

2. executor宕机：

直接自动在worker或者nodeManager上重新启动一个executor重新执行任务

3. task 执行失败：

自动进行恢复，最大失败次数4次

4. 如果后续rdd执行过程中，出现数据丢失，容错方式为：lineage（生命线）==》 rdd的依赖。提供的一种容错机制，当子rdd执行失败的时候，可以从父rdd进行恢复操作；如果父rdd的执行结果进行了缓存操作，子rdd直接从缓存位置获取结果数据。如果cache的不是全部数据的话，那么部分数据从缓存中读取，其他数据从父rdd的数据来源读取(会存在父RDD代码逻辑的执行)。如果子rdd失败的是单个分区，那么如果父rdd和子rdd的关系是窄依赖，只需回复父rdd对应分区的数据即可。如果关系是宽依赖，需要将所有父rdd的数据都执行一遍。

11. =》Spark应用调度详解、Stage划分规则、SparkContext源码解析

Spark应用的组成

Driver+Executors

Driver:SparkContext上下文的构建、RDD的构建、RDD的调度

Executor：具体task执行的位置

一个application ==> 多个 jobs ==> 多个stages ==> 多个tasks

job的产生：由于调用了RDD的action类型的API，所以触发rdd对应的job提交到executor中执行。

Stage:划分规则：当rdd的DAG图进行提交之前，Driver中的SparkContext中的DAGScheduler会对DAG进行划分，形成Stage；从DAG图的最后往前推，直到遇到一个宽依赖的API，那么就形成一个Stage，继续直到第一个RDD。Stage的执行是由依赖关系的，前一个Stage的数据结果是后一个Stage的数据输入；只有上一个Stage中的所有task都执行完了下一个Stage才会执行。

Stage的意义：数据本地化。

Task：executor 中执行的最小单位，task 实质上就是分区，一个分区的数据的代码执行就是一个task.

分区：从数据的分布情况来讲

task：从数据的执行逻辑情况来讲，每个task中的执行逻辑是一样的，只有处理的数据不一样，代码逻辑其实就是rdd的API组成的一个执行链

Saprk应用提交流程：

1. RDD调用transformation类型的API形成RDD的DAG执行图

2. RDD调用action类型的API触发job执行的提交操作

3. SparkContext中的DAGScheduler对RDD的DAG执行图进行Stage划分

4. SparkContext中的TaskScheduler对Stage进行task任务提交执行，将task提交到executor中执行（进行调度操作）

5. 等待task执行完成，当一个stage的所有task均执行完成后，开始下一个stage的调度执行，直到job执行完成。

Spark应用的执行过程：

Driver+Executor

spark on yarn: client: driver:负责applicationmaster的资源申请和任务调度

applicatonMaster：Executor中的资源申请

Executor: Task执行

cluster: Driver（applicatonMaster）：资源申请和任务调度

Executor: Task执行

12. =》Spark Shuffle机制

上一个stage的数据到下一个stage需要进行一个重新的分配，在此过程中存在shuffle.

只存在于RDD的宽依赖中，有一个宽依赖就有一个shuffle过程。

mapreduce shuffle 是先把数据读到内存中，内存满的时候溢写到磁盘，形成一个一个文件，等到mapTask执行完成后进行合并。然后reduceTask去拿数据。

Spark shuffle 由 Spark shuffle manager 进行管理，参数spark.shuffle.manager:sort

shuffle优化：

-1. Spark shuffle manager ： sort

当task的数量小于200的时候，会自动启动by_pass模式(没有数据排序的操作)

saprk.shuffle.sort.bypassMergeThreshold:200

-2. Spark shuffle manager ：hash

当应用中的数据不需要进行排序的时候，可以直接考虑使用hash shuffle manager;当使用Spark shuffle manager的时候(当分区数比较多的时候)，需要将参数：saprk.shuffle.consolidateFiles设置为true,表示开启文件合并功能。

未完待续：本文会比较长，打算把所有 SparkCore 的东西都总结在这一篇文章中，后续基本会每天更新一点。

你可能感兴趣的:(大数据)

nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
[转载] NoSQL简介 weixin_30325793 大数据数据库运维
摘自“百度百科”。NoSQL，泛指非关系型的数据库。随着互联网web2.0网站的兴起，传统的关系数据库在应付web2.0网站，特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心，暴露了很多难以克服的问题，而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战，尤其是大数据应用难题。虽然NoSQL流行语
Kafka详细解析与应用分析芊言芊语 kafka 分布式
Kafka是一个开源的分布式事件流平台（EventStreamingPlatform），由LinkedIn公司最初采用Scala语言开发，并基于ZooKeeper协调管理。如今，Kafka已经被Apache基金会纳入其项目体系，广泛应用于大数据实时处理领域。Kafka凭借其高吞吐量、持久化、分布式和可靠性的特点，成为构建实时流数据管道和流处理应用程序的重要工具。Kafka架构Kafka的架构主要由
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
疫情，疫情东山草
2020年，疫情爆发，至今已近三年，反反复复，此起彼伏。不但没被消灭，还自我发展，从德尔塔到奥密克戎，与时俱进的变异着。去年11月，疫情之下，大数据800米范围内，都成为时空伴随者。“你的码儿有没有变颜色”“你绿码还是黄码”成为那段时间的流行语，当然少不了的还有全员核酸。段子手整出来一首歌：我走过你走过的路,这算不算相逢？我吹过你吹过的风，这算不算相拥？800米内我们不曾擦肩而过，你却要我14天相
在服务器计算节点中使用 jupyter Lab ranshan567 程序人生
JupyterLab是一个基于网页的交互式开发环境,用于科学计算、数据分析和机器学.jupyterlab是jupyternotebook的下一代产品,集成了更多功能,使用起来更方便.在进行数据分析及可视化时，个人电脑不能满足大数据的分析需求，就需要用到高性能计算机集群资源，然而计算机集群的计算节点往往没有联网功能，所以在计算机集群中使用jupyterLab需要进行一些配置。具体的步骤如下：
大数据真实面试题---SQL The博宇大数据面试题——SQL 大数据 mysql sql 数据库 big data
视频号数据分析组外包招聘笔试题时间限时45分钟完成。题目根据3张表表结构，写出具体求解的SQL代码（搞笑品类定义：视频分类或者视频创建者分类为“搞笑”）1、表创建语句：createtablet_user_video_action_d(dsint,user_idstring,video_idstring,action_typeint,`timestamp`bigint)rowformatdelimi
Flume：大规模日志收集与数据传输的利器傲雪凌霜，松柏长青后端大数据 flume 大数据
Flume：大规模日志收集与数据传输的利器在大数据时代，随着各类应用的不断增长，产生了海量的日志和数据。这些数据不仅对业务的健康监控至关重要，还可以通过深入分析，帮助企业做出更好的决策。那么，如何高效地收集、传输和存储这些海量数据，成为了一项重要的挑战。今天我们将深入探讨ApacheFlume，它是如何帮助我们应对这些挑战的。一、Flume概述ApacheFlume是一个分布式、可靠、可扩展的日志
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
架构评审的自动化与人工智能: 如何提高效率光剑书架上的书架构自动化人工智能运维
1.背景介绍架构评审是软件开发过程中的一个关键环节，它旨在确保软件架构的质量、可维护性和可扩展性。传统的架构评审通常是由人工进行，需要大量的时间和精力。随着大数据技术和人工智能的发展，自动化和人工智能技术已经开始应用于架构评审，从而提高评审的效率和准确性。在本文中，我们将讨论如何通过自动化和人工智能技术来提高架构评审的效率。我们将从以下几个方面进行讨论：背景介绍核心概念与联系核心算法原理和具体操作
【数字化供应链】数字化供应链架构、全景管理、全流程贯通方案数字化建设方案数字化转型数据治理主数据数据仓库供应链数字仓储智慧物流智慧仓储物流园区架构微服务数据挖掘大数据人工智能
原文《数字化供应链架构、全景管理、全流程贯通方案》PPT格式。主要从供应链管理全景、智慧供应链建设总体目标、供应链总体业务流程、供应链总体功能架构、供应链总体技术架构、供应链全流程贯通、供应链全领域管理、供应链数据数据分析、供应链决策中台等进行建设。本文仅对主要内容进行介绍。来源网络公开渠道，旨在交流学习，如有侵权联系速删，更多参考公众号：优享智库基于先进IT技术、大数据能力、物联网应用、区块链平
80 鑫_259b
科普一个谈恋爱的方法。在以前，谈恋爱千难万难，就难在对对方不知底细，不知道对方希望自己是一个怎样的人，要耗费大量的时间去试探、再磨合，往往会因为一些小事一些细节，满盘皆输。在一个信息化的时代，在一个大数据近乎变成了流行语的时代，我们要跟上时代的步伐，通过大数据，去寻找异性最希望自己展现出来的形象是什么，才可以在爱情的道路上少走弯路。那这个大数据怎么操作呢？上街发问卷？问别人的择偶标准？一来会被打死
解锁企业潜能，Vatee万腾平台引领智能新纪元自媒体经济说其他
在数字化转型的浪潮中，企业正站在一个前所未有的十字路口，面对着前所未有的机遇与挑战。解锁企业内在潜能，实现跨越式发展，已成为众多企业的共同追求。而Vatee万腾平台，作为智能科技的先锋，正以其强大的智能赋能能力，引领企业步入一个全新的智能纪元。Vatee万腾平台，是一个集成了人工智能、大数据、云计算等前沿技术的综合性智能服务平台。它不仅仅是一个技术工具，更是企业转型升级的加速器，能够深入企业运营的
释放“AI+”新质生产力，深算院如何“把大数据变小”？ YashanDB YashanDB 国产数据库数据库数据库大数据
近期，南都·湾财社推出《新质·中国造》栏目，深入千行百业，遍访湾区企业，解锁湾区新质生产力，共探高质量发展之道。本期对话深圳计算科学研究院YashanDB首席技术官陈志标，探讨国产数据库如何实现创新突围，抢抓数字经济时代的新机遇。以下是专访内容：如何应对AI时代所面临的算力挑战？南都·湾财社：数据、算力和算法是发展人工智能的三要素，深算院做了怎样的前瞻性布局？陈志标：今年，政府工作报告中首次提及开
数字化智能工厂数字化供应链架构、全景管理、全流程贯通方案数字化建设方案智能制造数字工厂制造业数字化转型工业互联网架构
随着信息技术的飞速发展，数字化转型已成为制造企业提升竞争力的关键途径。数字化智能工厂通过集成先进的物联网(IoT)、大数据、云计算、人工智能(AI)等技术，实现了生产过程的智能化、供应链管理的精准化及决策的科学化。本方案旨在构建一套完善的数字化供应链架构，实现全景管理、全流程贯通、智慧化升级，以数据为驱动，强化技术支撑与安全管理体系，推动企业向智能制造迈进。一、数字化供应链架构1.**集成化平台构
日记——我的歌单静若小猴
又到一年一度大数据汇总的时候了，听歌已经成为很多人生活里的一种乐趣。春夏秋冬，我们都有自己喜欢的歌，歌词歌曲唱出沃尔玛你的心声。还记得大学时候最喜欢听的《春天里》，我有一天单曲回放了30遍，总觉得听着仿佛看到自己声音。还有的歌，初听不知曲中意，再听已经是曲终人，听着歌流泪，听着歌入睡……还记得那些年少的故事吗，总觉得自己才是故事外的人，却不是自己已经入歌。一段时间会喜欢一个人的音乐，一段时间会沉静
Linux dmesg命令：显示开机信息 fafadsj666 linux 数据库数据挖掘机器学习大数据
通过学习《Linux启动管理》一章可以知道，在系统启动过程中，内核还会进行一次系统检测（第一次是BIOS进行加测），但是检测的过程不是没有显示在屏幕上，就是会快速的在屏幕上一闪而过那么，如果开机时来不及查看相关信息，我们是否可以在开机后查看呢？答案是肯定的，使用dmesg命令就可以。无论是系统启动过程中，还是系统运行过程中，只要是内核产生的信息，都会被存储在系统缓冲区中，已经为大家精心准备了大数据
大数据新视界 --大数据大厂之揭秘大数据时代 Excel 魔法：大厂数据分析师进阶秘籍青云交大数据新视界 Excel 数据分析函数公式数据透视表图表功能规划求解数据分析工具库大数据新视界数据库
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：Ja
大数据新视界 --大数据大厂之数据挖掘入门：用 R 语言开启数据宝藏的探索之旅青云交大数据新视界数据库大数据数据挖掘 R 语言算法案例未来趋势应用场景学习建议大数据新视界
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：Ja
高职人工智能训练师边缘计算实训室解决方案武汉唯众智创人工智能训练师边缘计算实训室人工智能训练师实训室边缘计算实训室
一、引言随着物联网（IoT）、大数据、人工智能（AI）等技术的飞速发展，计算需求日益复杂和多样化。传统的云计算模式虽在一定程度上满足了这些需求，但在处理海量数据、保障实时性与安全性、提升计算效率等方面仍面临诸多挑战。在此背景下，边缘计算作为一种新兴的计算模式应运而生，通过将计算能力推向数据生成或用户所在的网络边缘，显著降低了数据传输的延迟，提升了处理效率，并增强了数据安全性。针对高等职业院校的人工
python基于django/flask的NBA球员大数据分析与可视化python+java+node.js QQ_511008285 python django flask java spring boot 数据分析
前端开发框架:vue.js数据库mysql版本不限后端语言框架支持：1java(SSM/springboot)-idea/eclipse2.Nodejs+Vue.js-vscode3.python(flask/django)--pycharm/vscode4.php(thinkphp/laravel)-hbuilderx数据库工具：Navicat/SQLyog等都可以本文针对NBA球员的大数据进行
Java基于spring boot的国产电影数据分析与可视化python+java+node.js QQ_511008285 java spring boot 数据分析 python django vue.js flask
前端开发框架:vue.js数据库mysql版本不限后端语言框架支持：1java(SSM/springboot)-idea/eclipse2.Nodejs+Vue.js-vscode3.python(flask/django)--pycharm/vscode4.php(thinkphp/laravel)-hbuilderx数据库工具：Navicat/SQLyog等都可以该系统使用进行大数据处理和
数字化（电子化）招标采购平台系统核心功能详细介绍 xinyuan_123456 oracle
数智化招标采购平台覆盖全业务类型、全采购流程、全采购方式，是郑州信源公司运用“互联网+”、大数据、人工智能、区块链、物联网等新兴技术，结合供应链管理理念，以招标采购为核心，提供交易、管理、数据、服务、监管为一体的高标准采购管理平台，赋能政企用户实现采购业务全流程的电子化、数字化、智慧化。根据产品功能及应用领域，产品包括：企业数智化招采供应链平台、金融数智化招采平台、政府数智化采购平台、公共资源数智
xml解析小猪猪08 xml
1、DOM解析的步奏准备工作： 1.创建DocumentBuilderFactory的对象 2.创建DocumentBuilder对象 3.通过DocumentBuilder对象的parse(String fileName)方法解析xml文件 4.通过Document的getElem
每个开发人员都需要了解的一个SQL技巧 brotherlamp linux linux视频 linux教程 linux自学 linux资料
对于数据过滤而言CHECK约束已经算是相当不错了。然而它仍存在一些缺陷，比如说它们是应用到表上面的，但有的时候你可能希望指定一条约束，而它只在特定条件下才生效。使用SQL标准的WITH CHECK OPTION子句就能完成这点，至少Oracle和SQL Server都实现了这个功能。下面是实现方式： CREATE TABLE books ( id &
Quartz——CronTrigger触发器 eksliang quartz CronTrigger
转载请出自出处：http://eksliang.iteye.com/blog/2208295 一.概述 CronTrigger 能够提供比 SimpleTrigger 更有具体实际意义的调度方案，调度规则基于 Cron 表达式，CronTrigger 支持日历相关的重复时间间隔（比如每月第一个周一执行），而不是简单的周期时间间隔。二.Cron表达式介绍 1）Cron表达式规则表 Quartz
Informatica基础 18289753290 Informatica Monitor manager workflow Designer
1. 1）PowerCenter Designer：设计开发环境，定义源及目标数据结构；设计转换规则，生成ETL映射。 2）Workflow Manager：合理地实现复杂的ETL工作流，基于时间，事件的作业调度 3）Workflow Monitor：监控Workflow和Session运行情况，生成日志和报告 4）Repository Manager：
linux下为程序创建启动和关闭的的sh文件，scrapyd为例酷的飞上天空 scrapy
对于一些未提供service管理的程序每次启动和关闭都要加上全部路径，想到可以做一个简单的启动和关闭控制的文件下面以scrapy启动server为例，文件名为run.sh： #端口号，根据此端口号确定PID PORT=6800 #启动命令所在目录 HOME='/home/jmscra/scrapy/' #查询出监听了PORT端口
人--自私与无私永夜-极光
今天上毛概课,老师提出一个问题--人是自私的还是无私的,根源是什么? 从客观的角度来看,人有自私的行为,也有无私的
Ubuntu安装NS-3 环境脚本随便小屋 ubuntu
将附件下载下来之后解压，将解压后的文件ns3environment.sh复制到下载目录下（其实放在哪里都可以，就是为了和我下面的命令相统一）。输入命令： sudo ./ns3environment.sh >>result 这样系统就自动安装ns3的环境，运行的结果在result文件中，如果提示 com
创业的简单感受 aijuans 创业的简单感受
2009年11月9日我进入a公司实习，2012年4月26日，我离开a公司，开始自己的创业之旅。今天是2012年5月30日，我忽然很想谈谈自己创业一个月的感受。当初离开边锋时，我就对自己说：“自己选择的路，就是跪着也要把他走完”，我也做好了心理准备，准备迎接一次次的困难。我这次走出来，不管成败
如何经营自己的独立人脉 aoyouzi 如何经营自己的独立人脉
独立人脉不是父母、亲戚的人脉，而是自己主动投入构造的人脉圈。“放长线，钓大鱼”，先行投入才能产生后续产出。现在几乎做所有的事情都需要人脉。以银行柜员为例，需要拉储户，而其本质就是社会人脉，就是社交！很多人都说，人脉我不行，因为我爸不行、我妈不行、我姨不行、我舅不行……我谁谁谁都不行，怎么能建立人脉？我这里说的人脉，是你的独立人脉。以一个普通的银行柜员
JSP基础百合不是茶 jsp 注释隐式对象
1,JSP语句的声明 <%! 声明 %> 　　声明：这个就是提供java代码声明变量、方法等的场所。表达式 <%= 表达式 %> 　　这个相当于赋值，可以在页面上显示表达式的结果，程序代码段/小型指令　<% 程序代码片段 %> 2,JSP的注释
web.xml之session-config、mime-mapping bijian1013 java web.xml servlet session-config mime-mapping
session-config 1.定义： <session-config> <session-timeout>20</session-timeout> </session-config> 2.作用：用于定义整个WEB站点session的有效期限，单位是分钟。 mime-mapping 1.定义： <mime-m
互联网开放平台（1） Bill_chen 互联网 qq 新浪微博百度腾讯
现在各互联网公司都推出了自己的开放平台供用户创造自己的应用，互联网的开放技术欣欣向荣，自己总结如下： 1.淘宝开放平台(TOP) 网址：http://open.taobao.com/ 依赖淘宝强大的电子商务数据，将淘宝内部业务数据作为API开放出去，同时将外部ISV的应用引入进来。目前TOP的三条主线： TOP访问网站：open.taobao.com ISV后台：my.open.ta
【MongoDB学习笔记九】MongoDB索引 bit1129 mongodb
索引可以在任意列上建立索引索引的构造和使用与传统关系型数据库几乎一样,适用于Oracle的索引优化技巧也适用于Mongodb 使用索引可以加快查询,但同时会降低修改,插入等的性能内嵌文档照样可以建立使用索引测试数据 var p1 = { "name":"Jack", "age&q
JDBC常用API之外的总结白糖_ jdbc
做JAVA的人玩JDBC肯定已经很熟练了，像DriverManager、Connection、ResultSet、Statement这些基本类大家肯定很常用啦，我不赘述那些诸如注册JDBC驱动、创建连接、获取数据集的API了，在这我介绍一些写框架时常用的API，大家共同学习吧。 ResultSetMetaData获取ResultSet对象的元数据信息
apache VelocityEngine使用记录 bozch VelocityEngine
VelocityEngine是一个模板引擎，能够基于模板生成指定的文件代码。使用方法如下： VelocityEngine engine = new VelocityEngine();// 定义模板引擎 Properties properties = new Properties();// 模板引擎属
编程之美-快速找出故障机器 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; public class TheLostID { /*编程之美假设一个机器仅存储一个标号为ID的记录，假设机器总量在10亿以下且ID是小于10亿的整数，假设每份数据保存两个备份，这样就有两个机器存储了同样的数据。 1.假设在某个时间得到一个数据文件ID的列表，是
关于Java中redirect与forward的区别 chenbowen00 java servlet
在Servlet中两种实现： forward方式：request.getRequestDispatcher(“/somePage.jsp”).forward(request, response); redirect方式：response.sendRedirect(“/somePage.jsp”); forward是服务器内部重定向，程序收到请求后重新定向到另一个程序，客户机并不知
[信号与系统]人体最关键的两个信号节点 comsci 系统
如果把人体看做是一个带生物磁场的导体,那么这个导体有两个很重要的节点,第一个在头部,中医的名称叫做百汇穴, 另外一个节点在腰部,中医的名称叫做命门如果要保护自己的脑部磁场不受到外界有害信号的攻击,最简单的
oracle 存储过程执行权限 daizj oracle 存储过程权限执行者调用者
在数据库系统中存储过程是必不可少的利器，存储过程是预先编译好的为实现一个复杂功能的一段Sql语句集合。它的优点我就不多说了，说一下我碰到的问题吧。我在项目开发的过程中需要用存储过程来实现一个功能，其中涉及到判断一张表是否已经建立，没有建立就由存储过程来建立这张表。 CREATE OR REPLACE PROCEDURE TestProc IS fla
为mysql数据库建立索引 dengkane mysql 性能索引
前些时候，一位颇高级的程序员居然问我什么叫做索引，令我感到十分的惊奇，我想这绝不会是沧海一粟，因为有成千上万的开发者（可能大部分是使用MySQL的）都没有受过有关数据库的正规培训，尽管他们都为客户做过一些开发，但却对如何为数据库建立适当的索引所知较少，因此我起了写一篇相关文章的念头。最普通的情况，是为出现在where子句的字段建一个索引。为方便讲述，我们先建立一个如下的表。
学习C语言常见误区如何看懂一个程序如何掌握一个程序以及几个小题目示例 dcj3sjt126com c 算法
如果看懂一个程序，分三步 1、流程 2、每个语句的功能 3、试数如何学习一些小算法的程序尝试自己去编程解决它，大部分人都自己无法解决如果解决不了就看答案关键是把答案看懂，这个是要花很大的精力，也是我们学习的重点看懂之后尝试自己去修改程序，并且知道修改之后程序的不同输出结果的含义照着答案去敲调试错误
centos6.3安装php5.4报错 dcj3sjt126com centos6
报错内容如下: Resolving Dependencies --> Running transaction check ---> Package php54w.x86_64 0:5.4.38-1.w6 will be installed --> Processing Dependency: php54w-common(x86-64) = 5.4.38-1.w6 for
JSONP请求 flyer0126 jsonp
使用jsonp不能发起POST请求。 It is not possible to make a JSONP POST request. JSONP works by creating a <script> tag that executes Javascript from a different domain; it is not pos
Spring Security（03）——核心类简介 234390216 Authentication
核心类简介目录 1.1 Authentication 1.2 SecurityContextHolder 1.3 AuthenticationManager和AuthenticationProvider 1.3.1 &nb
在CentOS上部署JAVA服务 java--hhf java jdk centos Java服务
本文将介绍如何在CentOS上运行Java Web服务，其中将包括如何搭建JAVA运行环境、如何开启端口号、如何使得服务在命令执行窗口关闭后依旧运行第一步：卸载旧Linux自带的JDK ①查看本机JDK版本 java -version 结果如下 java version "1.6.0"
oracle、sqlserver、mysql常用函数对比[to_char、to_number、to_date] ldzyz007 oracle mysql SQL Server
oracle &n
记Protocol Oriented Programming in Swift of WWDC 2015 ningandjin protocol WWDC 2015 Swift2.0
其实最先朋友让我就这个题目写篇文章的时候，我是拒绝的，因为觉得苹果就是在炒冷饭，把已经流行了数十年的OOP中的“面向接口编程”还拿来讲，看完整个Session之后呢，虽然还是觉得在炒冷饭，但是毕竟还是加了蛋的，有些东西还是值得说说的。通常谈到面向接口编程，其主要作用是把系统设计和具体实现分离开，让系统的每个部分都可以在不影响别的部分的情况下，改变自身的具体实现。接口的设计就反映了系统
搭建 CentOS 6 服务器(15) - Keepalived、HAProxy、LVS rensanning keepalived
（一）Keepalived （1）安装 # cd /usr/local/src # wget http://www.keepalived.org/software/keepalived-1.2.15.tar.gz # tar zxvf keepalived-1.2.15.tar.gz # cd keepalived-1.2.15 # ./configure # make &a
ORACLE数据库SCN和时间的互相转换 tomcat_oracle oracle sql
SCN（System Change Number 简称 SCN）是当Oracle数据库更新后，由DBMS自动维护去累积递增的一个数字，可以理解成ORACLE数据库的时间戳，从ORACLE 10G开始，提供了函数可以实现SCN和时间进行相互转换；　　用途：在进行数据库的还原和利用数据库的闪回功能时，进行SCN和时间的转换就变的非常必要了；　　操作方法：　　1、通过dbms_f
Spring MVC 方法注解拦截器 xp9802 spring mvc
应用场景，在方法级别对本次调用进行鉴权，如api接口中有个用户唯一标示accessToken,对于有accessToken的每次请求可以在方法加一个拦截器，获得本次请求的用户，存放到request或者session域。 python中，之前在python flask中可以使用装饰器来对方法进行预处理，进行权限处理先看一个实例,使用@access_required拦截： ?