airfan92

分布式空间分析引擎-Simba架构分析与源码阅读之分区器源码

分区器是Spark中的一个概念，Spark依据分区器定义的分区规则把数据划分到多个数据分区，每个数据分区在一个task中由一个executor进行处理。开发者可以方便地继承Partitioner接口实现自己的分区器，定义numPartitions规定RDD的分区数以及在getPartition中实现分区规则。

abstract class Partitioner extends Serializable {
  def numPartitions: Int
  def getPartition(key: Any): Int
}

Simba扩展了Partitioner实现了自己的分区器，将数据按照取值划分到多个spark partition中。分区的划分是simba算法优化的重要部分，建立数据分区之后，simba会在分区内部建立local index，以及根据数据在各个分区的分布建立global index，从而在计算时最大程度地过滤不相关的数据。本章会介绍一种基础的空间划分算法STR和各类分区器的具体实现。

STR算法

在介绍simba分区器的具体实现之前，首先会先介绍在simba各类分区器以及后面spatial join运算中应用广泛的STR算法。STR(Sort-Tile-Recursive )算法由Scott T. Leutenegger等人在其发表的《STR: A Simple and Efficient Algorithm for R-Tree Packing》论文中提出，最初是用于构建RTree索引。

不同于原始的RTree索引会伴随数据的插入逐步进行树节点的分裂（动态RTree），STR Tree适用于已经具备了全部数据，一次性建立RTree索引的场景（bulkload）。由于不会有数据的插入，所以可以根据数据的分布建立更均衡合理的RTree索引，相对于原始RTree能够具有更高的查询性能。在simba中主要应用于为数据找到合理的分区个数，以及在spatial join中将数据空间划分为多个MBR。
假设在K维空间存在N条数据，给定STR Tree单个节点的最大容量b，STR算法的主要步骤是：
1）按照MBR中心点第一维坐标对数据点进行排序，利用S=sqrt(N/b)个垂直slice切割数据空间，使每个slice包含S个节点和S*b个MBR；
2）在每个垂直slice中，按照MBR中心点第二维坐标进行排序，每b个MBR一组压入节点；
3）递归进行上述步骤，直至生成整个RTree，每个slice的MBR数据不超过b。

哈希分区器

Simba中的Hash分区器的实现很简单，将原始数据key值的hashCode对分区数取余结果相同的数据放入相同的数据分区：

class HashPartitioner(num_partitions: Int) extends Partitioner {
  override def numPartitions: Int = num_partitions
  override def getPartition(key: Any): Int = {
    key.hashCode() % num_partitions
  }
}

分区数赋值为传入的参数，分区规则为key的hashCode对分区数取余。

KDTree分区器

Simba中的KDTree分区器的实现思路是：首先将所有数据放到一个树节点，然后递归的按照每一维的取值将节点的数据进行二分到两个新节点中，直至生成的叶子节点包含的数据条数不超过给定的KDTree的节点最大容量。步骤如下：

1）对整体RDD执行聚合算子计算最大值、最小值、空间占用、和数据总条数：

rdd.aggregate[(Bounds, Long, Int)]((null, 0, 0))((bound, data) => {
        val new_bound = if (bound._1 == null) {
          new Bounds(data._1.coord, data._1.coord)
        } else {
          new Bounds(bound._1.min.zip(data._1.coord).map(x => Math.min(x._1, x._2)),
            bound._1.max.zip(data._1.coord).map(x => Math.max(x._1, x._2)))
        }
        (new_bound, bound._2 + SizeEstimator.estimate(data._1), bound._3 + 1)
      }

2）对数据进行取样：

val seed = System.currentTimeMillis()
    val sampled = if (total_size * sample_rate <= transfer_threshold){
      rdd.sample(withReplacement = false, sample_rate, seed).map(_._1).collect()
    }
    else {
      rdd.sample(withReplacement = true, transfer_threshold / total_size, seed).map(_._1).collect()
    }

3）按照上述思路，依据取样数据和数据分布边界递归地从根节点开始将整体数据划分到多个叶子节点中，并对每个叶子节点的数据生成一个MBR，从而将整体取值空间划分为多个MBR：

def recursiveGroupPoint(entries: Array[Point], low_bound: Seq[Double],
                            high_bound: Seq[Double], cur_dim: Int): Array[MBR] = {
      var ans = mutable.ArrayBuffer[MBR]()
      val grouped = entries.sortWith((a, b) =>
        a.coord(cur_dim) < b.coord(cur_dim)).grouped(Math.ceil(entries.length / 2.0).toInt).toArray
      val center = grouped(1).head.coord
      require(grouped.length == 2)
      val new_high = 0 until dimension map {i =>
        if (i != cur_dim) high_bound(i)
        else center(i)
      }
      val new_low = 0 until dimension map { i =>
        if (i != cur_dim) low_bound(i)
        else center(i)
      }
      if (grouped(0).length >= max_entries_per_node){
        ans ++= recursiveGroupPoint(grouped(0), low_bound,
          new_high, (cur_dim + 1) % dimension)
      } else {
        ans += new MBR(new Point(low_bound.toArray.clone()),
          new Point(new_high.toArray.clone()))
      }
      if (grouped(1).length >= max_entries_per_node){
        ans ++= recursiveGroupPoint(grouped(1), new_low,
          high_bound, (cur_dim + 1) % dimension)
      } else {
        ans += new MBR(new Point(new_low.toArray.clone()),
          new Point(high_bound.toArray.clone()))
      }
      ans.toArray
    }
    val mbrs = recursiveGroupPoint(sampled, data_bounds.min, data_bounds.max, 0)

这部分代码是递归对整体数据代码递归建立MBR划分的核心代码：首先按照当前维的取值进行排序并分为两部分（二分），然后判断两个部分的数据是否大于给定的节点最大容量max_entries_per_node，如果不大于就把这个节点的全部数据生成一个MBR放入数组；如果大于就对于这个部分的数据按照下一维的取值继续进行划分，将划分的结果汇总到数组中。

4）以最终生成的数组中MBR个数作为partition个数，利用划分好的MBR块构建RTree，分区规则为：为当前点找到最近的MBR；

val rt = RTree(mbrBound.map(x => (x._1, x._2, 1)), 25) // the default value is fine
override def numPartitions: Int = partitions
override def getPartition(key: Any): Int = {
    val k = key.asInstanceOf[Point]
    rt.circleRange(k, 0.0).head._2
  }

MapD分区器

MapD分区器的逻辑也很简单，接受入参作为分区数，将key值转化为Int作为分区ID（partitionID）

class MapDPartitioner(num_partitions: Int) extends Partitioner {
  def numPartitions: Int = num_partitions
  def getPartition(key: Any): Int = {
    val k = key.asInstanceOf[Int]
    require(k >= 0 && k < num_partitions)
    k
  }
}

RangeD分区器

RangeD分区器的逻辑是：接受传入的range_bounds，对给定key值进行二分查找key值恰好小于哪个rangeBound的上边界，从而确定属于哪个分区

class RangeDPartitioner[K: Ordering: ClassTag](range_bounds: Array[K],
                                               ascending: Boolean) extends Partitioner {
  def numPartitions: Int = range_bounds.length + 1
  private val binarySearch: ((Array[K], K) => Int) = CollectionsUtils.makeBinarySearch[K]
  def getPartition(key: Any): Int = {
    val k = key.asInstanceOf[K]
    var partition = 0
    if (range_bounds.length < 128) {
      while (partition < range_bounds.length && Ordering[K].gt(k, range_bounds(partition)))
        partition += 1
    } else {
      partition = binarySearch(range_bounds, k)
      if (partition < 0) partition = -partition - 1
      if (partition > range_bounds.length) partition = range_bounds.length
    }
    if (ascending) partition
    else range_bounds.length - partition
  }
}

Range分区器

Range也是根据一维数据的取值将数据分段，进而根据处于哪个数据分段确定分区ID。分区器的分区过程可以分为以下四个部分：

1）使用reservoir Sample（水库抽样）方法对每个原始数据分区进行分别抽样

val sketched = rdd.mapPartitionsWithIndex { (idx, iter) =>
      val seed = byteswap32(idx ^ (shift << 16))
      val (sample, n) = SamplingUtils.reservoirSampleAndCount(
        iter, sampleSizePerPartition, seed)
      Iterator((idx, n, sample))
    }.collect()

2）对数据量大(大于sampleSizePerPartition)的分区进行重新抽样

 val fraction = math.min(sampleSize / math.max(numItems, 1L), 1.0)
        val candidates = ArrayBuffer.empty[(K, Float)]
        val imbalancedPartitions = mutable.Set.empty[Int]
        sketched.foreach { case (idx, n, sample) =>
          if (fraction * n > sampleSizePerPartition) {
            imbalancedPartitions += idx
          } else {
            // The weight is 1 over the sampling probability.
            val weight = (n.toDouble / sample.length).toFloat
            for (key <- sample) {
              candidates += ((key, weight))
            }
          }
        }
        if (imbalancedPartitions.nonEmpty) {
          // Re-sample imbalanced partitions with the desired sampling probability.
          val imbalanced = new PartitionPruningRDD(rdd.map(_._1), imbalancedPartitions.contains)
          val seed = byteswap32(-rdd.id - 1)
          val reSampled = imbalanced.sample(withReplacement = false, fraction, seed).collect()
          val weight = (1.0 / fraction).toFloat
          candidates ++= reSampled.map(x => (x, weight))
        }

每个分区的记录数*fraction如果大于该partition中设定的样本数(这是由于不同的分区中包含的数据量不同，数据量较大的分区中抽样数将会大于平均值)，则用imbalancedPartitions存储，并重新抽样以确保每个分区中都有足够数量的样本。最后计算权重——分区记录总数/分区样本数。

3）由取样信息计算出合理的每个分区的最大值；

def determineBounds[K : Ordering : ClassTag](candidates: ArrayBuffer[(K, Float)], partitions: Int): Array[K] = {
    val ordering = implicitly[Ordering[K]]
    val ordered = candidates.sortBy(_._1)
    val numCandidates = ordered.size
    val sumWeights = ordered.map(_._2.toDouble).sum
    val step = sumWeights / partitions
    var cumWeight = 0.0
    var target = step
    val bounds = ArrayBuffer.empty[K]
    var i = 0
    var j = 0
    var previousBound = Option.empty[K]
    while ((i < numCandidates) && (j < partitions - 1)) {
      val (key, weight) = ordered(i)
      cumWeight += weight
      if (cumWeight > target) {
        // Skip duplicate values.
        if (previousBound.isEmpty || ordering.gt(key, previousBound.get)) {
          bounds += key
          target += step
          j += 1
          previousBound = Some(key)
        }
      }
      i += 1
    }
    bounds.toArray
  }

在上一步计算出了每种的取值和权重，这一步会从第一种取值开始累加每种取值的权重，如果累加的权重和大于了特定的target+step，则把当前取值作为一个分区的分隔符存入bounds中，直至生成所有分区的bound。

4）由rangeBounds计算分区数和key的所属分区

采用二分查找的方式根据当前key值和rangeBounds计算partitionID

STR分区器

STR分区器的算法流程与KDTree分区器的四个步骤基本是一致的，除了第三步递归划分MBR的部分略有区别（主要区别在于每层进行节点分裂时不进行二分，而是排序分组，分裂成多个节点）：

def recursiveGroupPoint(entries: Array[Point], now_min: Array[Double],
                            now_max: Array[Double], cur_dim: Int, until_dim: Int): Array[MBR] = {
      val len = entries.length
      val grouped = entries.sortWith(_.coord(cur_dim) < _.coord(cur_dim))
        .grouped(Math.ceil(len * 1.0 / dim(cur_dim)).toInt).toArray
      var ans = mutable.ArrayBuffer[MBR]()
      if (cur_dim < until_dim) {
        for (i <- grouped.indices) {
          val cur_min = now_min
          val cur_max = now_max
          if (i == 0 && i == grouped.length - 1) {
            cur_min(cur_dim) = data_bounds.min(cur_dim)
            cur_max(cur_dim) = data_bounds.max(cur_dim)
          } else if (i == 0) {
            cur_min(cur_dim) = data_bounds.min(cur_dim)
            cur_max(cur_dim) = grouped(i + 1).head.coord(cur_dim)
          } else if (i == grouped.length - 1) {
            cur_min(cur_dim) = grouped(i).head.coord(cur_dim)
            cur_max(cur_dim) = data_bounds.max(cur_dim)
          } else {
            cur_min(cur_dim) = grouped(i).head.coord(cur_dim)
            cur_max(cur_dim) = grouped(i + 1).head.coord(cur_dim)
          }
          ans ++= recursiveGroupPoint(grouped(i), cur_min, cur_max, cur_dim + 1, until_dim)
        }
        ans.toArray
      } else {
        for (i <- grouped.indices) {
          if (i == 0 && i == grouped.length - 1) {
            now_min(cur_dim) = data_bounds.min(cur_dim)
            now_max(cur_dim) = data_bounds.max(cur_dim)
          } else if (i == 0) {
            now_min(cur_dim) = data_bounds.min(cur_dim)
            now_max(cur_dim) = grouped(i + 1).head.coord(cur_dim)
          } else if (i == grouped.length - 1) {
            now_min(cur_dim) = grouped(i).head.coord(cur_dim)
            now_max(cur_dim) = data_bounds.max(cur_dim)
          } else {
            now_min(cur_dim) = grouped(i).head.coord(cur_dim)
            now_max(cur_dim) = grouped(i + 1).head.coord(cur_dim)
          }
          ans += MBR(new Point(now_min.clone()), new Point(now_max.clone()))
        }
        ans.toArray
      }
    }

递归地按照每一维的取值对整体数据进行分组：当前维的取值进行排序并分为每b条数据分为一组（b的计算参照STR算法介绍部分），然后对当前维的每个分组继续按照下一维进行划分。

Voronoi分区器

Voronoi分区器保存了一个key值到partitionID的映射数组，partition数目通过参数传入。

class VoronoiPartitioner(pivot_to_group: Array[Int], num_group: Int) extends Partitioner {
  override def numPartitions: Int = num_group
  override def getPartition(key: Any): Int = {
    val k = key.asInstanceOf[Int]
    pivot_to_group(k)
  }
}

QuadTree分区器

QuadTree的算法步骤同样是与KDTree相比，只有第三步划分取值空间为多组MBR有区别（主要区别在于每层节点进行分裂时，进行四分）：

val tmp_qtree = QuadTree(sampled.zipWithIndex,
      (data_bounds.min.head, data_bounds.min(1), data_bounds.max.head, data_bounds.max(1)))
def searchMBROnQuadTree(node: QuadTreeNode): Array[(MBR, Int)] = {
      val ans = mutable.ArrayBuffer[(MBR, Int)]()
      if (node.children == null){
        val mbr = new MBR(Point(Array(node.x_low, node.y_low)),
          Point(Array(node.x_high, node.y_high)))
        ans += (mbr -> count)
        node.objects = Array((mbr.centroid.coord(0), mbr.centroid.coord(1), count))
        count += 1
      } else for (child <- node.children) ans ++= searchMBROnQuadTree(child)
      ans.toArray
}
val mbrs = searchMBROnQuadTree(tmp_qtree.root)

首先根据数据的取值范围建立QuadTree（建立QuadTree的代码在索引部分，所以这部分逻辑会在索引部分详细介绍），然后会递归地先序遍历生成的QuadTree，将QuadTree的所有叶子节点对应的MBR放入数组。

你可能感兴趣的:(#)

数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb