MasterT-J

高阶数据结构：SSTable

1. 前言

最近在组会上面通过小组讨论论文时，发现了SSTable这个数据结构。课后为了深入分析和学习这个数据结构，我做了一些资料查阅。在查询相关分布式的书籍后，找到了SSTable的数据结构，现将其作为笔记记录下来。之前整理的BigTable论文里面提及到了SStable，但是当时并没有引起我的注意。现在将深入理解这个数据结构——SSTable。

2. SSTable的定义

Google SSTable文件格式在内部用于存储Bigtable数据。它的格式为文件本身就是一个排序的、不可变的、持久的Key/Value对Map，其中Key和value都可以是任意的byte字符串。提供操作以查找与指定键相关联的值，并遍历指定键范围内的所有键/值对。使用Key来查找Value，或通过给定Key范围遍历所有的Key/Value对。每个SSTable包含一系列的Block（一般Block大小为64KB，但是它是可配置的），在SSTable的末尾是Block索引，用于定位Block，这些索引在SSTable打开时被加载到内存中，在查找时首先从内存中的索引二分查找找到Block，然后一次磁盘寻道即可读取到相应的Block。还有一种方案是将这个SSTable加载到内存中，从而在查找和扫描中不需要读取磁盘。

3. BigTable的架构

BigTalbe构建在GFS之上，为文件系统增加了一层分布式索引层。另外，BigTable依赖Google的Chubby（即分布式锁）进行服务器选举以及维护全局信息维护。

如图，Bigtable将大表划分为大小在100M~200M的子表（tablet），每个子表对应一个连续的数据范围。Bigtable主要由三个部分组成：客户端程序库（client）、一共主控服务器（Master）和多个子表服务器（tablet server）。

客户端程序库（Client）：提供Bigtable到应用程序的接口，应用程序通过客户端程序库对表格的数据的单元进行增、删、改、查等操作。客户端通过Chubby锁服务器获取一些控制信息，但所有表格的数据内容都在客户端与子表服务器之间进行传输。
主控服务器（Master）：管理所有的子表服务器，包括分配子表给子表服务器，指导子表服务器实现子表的合并，接收来自子表服务器的分裂信息，监控子表服务器，在子表服务器之间进行负载均衡并实现子表服务器的故障恢复。
子表服务器（tablet server）：实现子表的装载/卸出、表格内容的读和写，子表的合并和分裂。Tablet Server服务的数据包括操作日志以及每个子表上的sstable数据，这些数据都存储在底层的GFS中。

4. BigTable中的存储引擎

Bigtable采用Merge-dump存储引擎。数据写入时需要先写操作日志，成功后应用到内存中的MemTable中，写操作日志是往磁盘中的日志文件追加数据，很好地利用了磁盘设备顺序读写的特性。当内存中的MemTable达到一定大小，需要将MemTable转储(Dump)到磁盘中生成SSTable文件。由于数据同时存在MemTable和可能多个SSTable中，读取操作需要按从旧到新的时间顺序合并SSTable和内存中的MemTable数据。数据在SSTable中连续存放，因此可以同时满足随机读取和顺序读取两种需求。为了防止磁盘中的SSTable文件过多，需要定时将多个SSTable通过Compaction过程合并成一个SSTable，从而减少后续读操作需要读取的文件个数。一般情况下，如果写操作比较少，我们总是能够使得对每一份数据同时只存在一个SSTable和一个MemTable，也就是说，随机读取和顺序读取都只需要访问一次磁盘。插入、删除、更新、增加等操作在Merge-dump引擎中都看成一回事，除了最早生成的SSTable外，SSTable中记录的只是操作，而不是最终的结果，需要等到读取时才合并到最终结果。

Bigtable中包含三种Compaction策略：Minor Compaction、Merging Compaction和Major Compaction。其中，Minor Compaction把内存中的MemTable转储到GFS中，Merging Compaction和Major Compaction合并GFS中的多个SSTable文件生成一个更大的SSTable。Minor Compaction主要是为了防止内存占用过多，Merging和Major Compaction则是为了防止读取文件个数过多。Merging Compaction和Major Compaction的区别在于Major Compaction会合并所有的SSTable文件和内存中的MemTable，生成最终结果；而Merging Compaction生成的SSTable文件可能包含一些操作，比如删除、增加等。

5. SSTable的数据结构

数据在SSTable中按照主键有序存储，每个SSTable由若干个大小相近的数据块（Block）组成，每个数据块包含若干行。数据块的大小一般在8~64KB之间，允许用户配置。Tablet Server的缓存包括两种：块缓存（Block Cache）和行缓存（Row Cache）。其中，块缓存的单位为SSTable中的数据块，行缓存的单位为一行记录。随机读取时，首先查找行缓存；如果行缓存不命中，接着再查找块缓存。另外，Bigtable还支持布隆过滤器(Bloom Filter)，如果读取的数据行在SSTable中不存在，可以通过布隆过滤器（Bloom Filter）发现，从而避免一次读取GFS文件操作。注：布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都比一般的算法要好的多，缺点是有一定的误识别率和删除困难。

SSTable中的数据按主键排序后存放在连续的数据块(Block)中，块之间也有序。接着，存放数据块索引，由每个Block最后一行的主键组成，由于数据查询中的Block定位。接着，存放布隆过滤器和表格的Schema信息。最后，存放固定大小的Trailer以及Trailer的偏移位置。

SSTable数据存储结构

Data Block：存放连续的数据块

Block Index：存放连续的块索引。描述一个data block，存储着对应data block的最大Key值，以及data block在文件中的偏移量和大小

Bloom Filter：布隆过滤器（Bloom Filter），用于判断读取的数据是否在当前SSTable上。

Table Schema: 当前SSTable的表格Schema信息

Fixed Trailer：当前SSTable的Block Index的块索引大小

Trailer Offset：当前SSTable的Block Index的块索引在文件存储下的偏移量

查找SSTable时，首先从子表的索引信息中读取SSTable Trailer的偏移位置，接着获取Trailer信息。根据Trailer中记录的信息，可以获取块索引的大小和偏移，从而将整个块索引加载到内存中。根据块索引记录的每个Block的最后一行的主键，可以通过二分查找定位到查找的Block。最后将Block加载到内存中，通过二分查找Block中记录的行索引查找到相应的偏移量，然后查找到具体某一行Row X。本质上看，SSTable是一个两级索引结构：块索引以及行索引；而整个ChunkServer是一个三级索引结构：子表索引、块索引以及行索引。

SSTable分为两种格式：稀疏格式和稠密格式。

稀疏格式：某些列可能存在，也可能不存在，因此，每一行只存储包含实际值的列，每一列存储的内容为：<列ID，列值>();

稠密格式：每一行都需要存储所有列，每一列只需要存储列值，不需要存储列ID，这是因为列ID可以从表格Schema中获取。

5.1 举例说明

假设有一张表格包含10列，列ID为1~10，表格中有一行的数据内容为：

那么，采用稀疏格式存储，内容为：<2, 20>,❤️, 30>,<5, 50>,<7, 70>,<8, 80>；如果采用稠密格式存储，内容为：null，20，30，null，50，null，70，80，null，null。

ChunkServer中的SSTable为稠密格式，而UpdateServer中的SSTable为稀疏格式，且存储了多张表格的数据。另外，SSTable支持列组Cloumn Group，将同一个列组下的多个列的内容存储在一起。列组是一种行列混合存储模式，将每一行的所有列分成多个组(称为列组)，每个列组内部按行存储。

当一个SSTable中包含多个表格/列组时，数据按照[表格ID，列组ID，行主键]([table_id, column group id, row_key])的形式有序存储。

6. SSTable在BigTable中的相应操作

6.1 Tablet Serving

在新数据写入时，这个操作首先提交到日志中作为redo纪录，最近的数据存储在内存的排序缓存memtable中；旧的数据存储在一系列的SSTable 中。在recover中，tablet server从METADATA表中读取metadata，metadata包含了组成Tablet的所有SSTable（纪录了这些SSTable的元数据信息，如SSTable的位置、StartKey、EndKey等）以及一系列日志中的redo点。Tablet Server读取SSTable的索引到内存，并replay这些redo点之后的更新来重构memtable。

当写操作到达tablet server时，tablet server将检查其格式是否正确，以及发送方是否有权限执行该写操作。通过从Chubby文件中读取允许写操作的权限列表来执行授权（这在Chubby客户端缓存中几乎总是命中）。有效的变动将写入提交日志。Group Commit通过提交多个写操作用于提高吞吐量[13，16]。提交写入后，其内容将插入到memtable中。

在读操作时时，完成格式、授权等检查后，读会同时读取SSTable、memtable（HBase中还包含了BlockCache中的数据）并合并他们的结果，由于SSTable和memtable都是字典序排列，因而合并操作可以很高效完成。

6.2 Compaction

Bigtable中包含三种Compaction策略：Minor Compaction、Merging Compaction和Major Compaction。

Minor Compaction：随着memtable大小增加到一个阀值，这个memtable会被冻住而创建一个新的memtable以供使用，而旧的memtable会转换成一个SSTable而写入到底层存储GFS中，这个过程叫做minor compaction。这个minor compaction可以减少内存使用量，并可以减少日志大小，因为持久化后的数据可以从日志中删除。在minor compaction过程中，可以继续处理读写请求。
Merge Compaction：每次minor compaction会生成新的SSTable文件，如果SSTable文件数量增加，则会影响读的性能，因而每次读都需要读取所有SSTable文件，然后合并结果，因而对SSTable文件个数需要有上限，并且时不时的需要在后台做merging compaction，这个merging compaction读取一些SSTable文件和memtable的内容，并将他们合并写入一个新的SSTable中。当这个过程完成后，这些源SSTable和memtable就可以被删除了。
Merge Compaction：如果一个merging compaction是合并所有SSTable到一个SSTable，则这个过程称做major compaction。一次major compaction会将mark成删除的信息、数据删除，而其他两次compaction则会保留这些信息、数据（mark的形式）。Bigtable会时不时的扫描所有的Tablet，并对它们做major compaction。这个major compaction可以将需要删除的数据真正的删除从而节省空间，并保持系统一致性。

6.3 SSTable的locality和In Memory

在Bigtable中，它的本地性是由Locality group来定义的，即多个column family可以组合到一个locality group中，在同一个Tablet中，使用单独的SSTable存储这些在同一个locality group的column family。HBase把这个模型简化了，即每个column family在每个HRegion都使用单独的HFile存储，HFile没有locality group的概念，或者一个column family就是一个locality group。

在Bigtable中，还可以支持在locality group级别设置是否将所有这个locality group的数据加载到内存中，在HBase中通过column family定义时设置。这个内存加载采用延时加载，主要应用于一些小的column family，并且经常被用到的，从而提升读的性能，因而这样就不需要再从磁盘中读取了。

6.4 SSTable压缩

客户端可以控制是否压缩locality group的SSTable，以及如果压缩，则使用哪种压缩格式。用户指定的压缩格式将应用于每个SSTable块（其大小可通过特定于位置组的调整参数来控制）。尽管我们通过分别压缩每个块而损失了一些空间，但我们的好处是，可以读取SSTable的一小部分而无需解压缩整个文件。许多客户端使用两遍自定义压缩方案。第一遍使用Bentley和McIlroy的方案[6]，该方案在一个大窗口中压缩长的公共字符串。第二遍使用快速压缩算法，该算法在一个小的16 KB数据窗口中查找重复项。两种压缩过程都非常快-在现代机器上，它们的编码速度为100-200 MB / s，解码速度为400-1000 MB / s。

6.5 SSTable的读缓存

为了提升读的性能，Bigtable采用两层缓存机制：

Scan Cache：Scan Cache是一个更高级别的缓存，它将SSTable接口返回的Key/Value缓存到tablet server code。

Block Cache：Block Cache对于倾向于读取与其最近读取的数据接近的数据的应用程序很有用（例如，顺序读取或对热点行内同一locality group中不同列随机读取）

Block Cache是较低级的缓存，它缓存从GFS读取的SSTables块。 Scan Cache对于倾向于重复读取相同数据的应用程序最有用。

6.6 Bloom Filter

前文有提到Bigtable采用合并读，即需要读取每个SSTable中的相关数据，并合并成一个结果返回，然而每次读都需要读取所有SSTable，自然会耗费性能，因而引入了Bloom Filter，它可以很快速的找到一个RowKey不在某个SSTable中的事实（注：反过来则不成立）。

7. SSTable设计成Immutable的好处

在SSTable定义中就有提到SSTable是一个Immutable的order map，这个Immutable的设计可以让系统简单很多：

关于Immutable的优点有以下几点：

在读SSTable是不需要同步。读写同步只需要在memtable中处理，为了减少memtable的读写竞争，Bigtable将memtable的row设计成copy-on-write，从而读写可以同时进行。
永久的移除数据转变为SSTable的Garbage Collect。每个Tablet中的SSTable在METADATA表中有注册，master使用mark-and-sweep算法将SSTable在GC过程中移除。
可以让Tablet Split过程变的高效，我们不需要为每个子Tablet创建新的SSTable，而是可以共享父Tablet的SSTable。

你可能感兴趣的:(数据结构与算法分析)

2020-02-19 Log_ARG
疫情严重在家工作学习python数据结构与算法分析一书日更希望能坚持下去第一章python基础1.python语句中变量存的是指向数据的引用A=[1,2,3,4]B=AA.append(5)print(B)[1,2,3,4,5]上例所示’B=A‘语句中，B存储的是A的地址所以当A发生变化时，B也会随之变化再举一例：a=1b=1c=1print(id(a),id(b),id(c))>>>187134
DFS应用——遍历无向图 PacosonSWJTU 数据结构 DFS深度优先搜索无向图
【0】README0.1）本文总结于数据结构与算法分析，源代码均为原创，旨在理解如何对无向图进行深度优先搜索的idea并用源代码加以实现；0.2）本文还引入了背向边（定义见下文描述），并用源代码找出了给定图的在DFS过程中产生的背向边，但是要注意背向边不是深度优先搜索树的边，该树是由对给定图进行DFS生成的；0.3）通过打印parent（可以看做是深度优先搜索树的边），我们可以大致知晓深度优先搜索
线性表 —— 数组、栈、队、链表卡列尼娜翠花数据结构与算法链表数据结构栈队列线性表
本文以typescript实现数据结构，虽说是ts实现，但更准确说是面向对象的方式实现，因此可以无缝切换成Java等面向对象语言。什么是数据结构（DataStructure）？“数据结构是ADT（抽象数据类型AbstractDataType）的物理实现。”—《数据结构与算法分析》“数据结构（datastructure）是计算机中存储、组织数据的方式。通常情况下，精心选择的数据结构可以带来最优效率的
JavaScript数据结构与算法001|初识数据结构与算法一只前端小菜鸟~ javascript 前端数据结构算法
第一章初识数据结构与算法“数据结构是数据对象，以及存在于该对象的实例和组成实例的数据元素之间的各种联系。这些联系可以通过定义相关的函数来给出。”——SartajSahni，《数据结构、算法与应用》“数据结构是ADT（抽象数据类型AbstractDataType）的物理实现。”——CliffordA.Shaffer，《数据结构与算法分析》“数据结构（datastructure）是计算机中存储、组织数
前端知识体系思维导图梦之归途前端前端
绝大部分分类方法、专业术语，出自专业书籍，如《JavaScript高级程序设计（第4版）》、《JavaScript权威指南（第7版）》《CSS权威指南（第四版）》、《HTML5权威指南》、《计算机网络（第5版）》、《数据结构与算法分析——C语言描述》等，欢迎爱读书的小伙伴一起探讨！思维导图大纲及重难点文章链接1.JavaScript语言核心语法、类型、语句、关键字、保留字、操作符、全局对象与浏览器
计算机算法中用到的对数log 進撃的Friday
来源于：https://www.cnblogs.com/huaxingtianxia/p/7842862.html之前一直不解为何算法中经常会看到log今天看《数据结构与算法分析Java语言描述》（第3版）2.4.3节求最大子序列和的分治算法实现时才注意到原因翻看第29页的最后一句部分内容如下：即若N=2^k，则T(N)=N*(k+1)=NlogN+N=O(NlogN)我们根据上面的N=2^k可得
数据结构与算法分析（C++语言版）_张琨版第六章树和二叉树课后习题答案赵卓不凡计算机考研课后习题答案数据结构与算法分析
一、选择题1.A2.C3.C4.A5.D6.A7.D8.C9.D10.D二、填空题三、判断题√2.√3．×4.√5.×6.√7.√8.×9.√10.×四、简答题答案如下：采用前序和后序两个序列来判断二叉树上结点B必定是结点F的祖先。在前序序列中某结点的祖先都排在其前。若结点B是F的祖先,则B必定在F之前。而在后序序列中，某结点的祖先排在其后，即若结点B是F的祖先，则B必在F之后。根据这条规则来判断
数据结构与算法分析1.2 Python创建循环链表解决约瑟夫环问题 Ezreal Explorer 链表 python 数据结构
#创建结点类，类中有数据、指针两个对象，数据域通过输入获得，指针域默认为空classLinkNode:def__init__(self,data,next=None):self.data=dataself.next=next#创建链表类，创建默认头指针为空classLinkList:def__init__(self):self.head=None#判断链表是否为空defis_empty(self)
python实现最小二叉堆---最小堆结构 MADAO_luv java 算法开发语言
#来源于MOOC学习以及数据结构与算法分析#在我们学习最小二叉堆代码实现之前，我们需要去了解一下，什么是最小二叉堆（也有最大二叉堆，也叫最大堆）。也就是说什么是二叉堆？？？？对于这个问题，我们得先知道“优先队列和二叉堆”它们之间的关系。队列中有一种变体，我们称之为“优先队列”。根据优先级来决定：优先级最高的在最前面，优先级最低的在最后面。二叉堆BinaryHeap便是用来实现优先队列的数据结构。（
解析树构建器以及相关计算 MADAO_luv 数据结构 python
#数据结构与算法分析##慕课学习#二叉树的应用：解析树：可以解析现实生活中的自然语言，人工创键的语言：机器语言等等。今天来学习使用解析树来解析数学表达式。让我们看看一个简单的数学表达式层次的结构。如下图所示。我们用子节点保存操作数，而用根节点保存操作符。一.解析树的重点1.如何根据完全括号表达式构建解析式2.如何计算解析树中的表达式3.如何将解析树还原成最初的数学表达式构建解析树的第一步式将表达式
数据结构停车场管理系统设计早点睡嘛数据结构
数据结构与算法分析课程设计之数据结构停车场管理系统设计。主要应用到数据结构中的栈与队列。运用到的编程语言为C++。目录一设计要求二思路分析三设计流程先附上完整代码：#include#include#includeusingnamespacestd;intposition=0;//便道内位置typedefstructCarData{charch;//车辆的识别符，到达or离去intcartime[1
[数据结构与算法分析笔记]-递归思想的初探 ASTHENIA 笔记算法数据结构
当我们输入一串整数，希望依次打印其值（一次一位）譬如输入"12345"，依次打印1,2,3,4,5。如何设计程序？解决这个问题方法十分多样，我们这里采取“递归”思维进行设计#includevoidPrintDigit(intn){printf("%d\n",n);}voidPrintOut(intn){if(n>=10){PrintOut(n/10);}PrintDigit(n%10);}intm
算法与数据结构 Fitz_Lee
数据结构数据结构与算法分析_Java语言描述(第2版)算法计算机算法基础算法导论编程之法_面试和算法心得coding程序员代码面试指南_IT名企算法与数据结构题目最优解LeetCode/LintCode
在读书籍勘误 Hoper.J 经验及避坑分享书籍勘误
文章目录普林斯顿微积分读本线性代数及其应用matlab相关数据错误CSAPPC程序设计语言（K&R）中文版C陷阱与指针SICP数据结构与算法分析--C语言描述计算机组成与设计硬件/软件接口RISC-V版操作系统导论计算机网络：自顶向下数据库系统概念Linux命令行大全利用Python进行数据分析深入浅出统计学普林斯顿微积分读本P190图10-9中坐标轴右侧数字不对应，会导致定义域判断的错误P224
数据结构与算法分析第五章树和二叉树作业讲解 Hello_Zhang_ 数据结构与算法分析作业讲解算法数据结构霍夫曼树
参考教材：《数据结构（C语言版第2版）》严蔚敏，李冬梅，吴伟民编著，人民邮电出版社，2022年版。截图未标明出处均为原创或取自《数据结构（C语言版第2版）》~本文对应的作业题讲解视频：数据结构与算法分析作业讲解视频合集https://www.bilibili.com/video/BV1NN411A7hd/?share_source=copy_web&vd_source=7fbf4cbf97db09
关于数据结构树的高度从0还是1开始计算的思考 curry昊数据结构
今天做到老师网课发布的一道题，让求树高h有多少个node，这应该是个挺简单的问题，但是重要的是树从0开始算，还是从1开始算。当时记得老师说的挺清楚的，但是没记笔记，时间长了，也忘了。网上查也是各种答案都有。于是我仔细阅读了《数据结构与算法分析：C语言描述》这本书，并得到了以下的答案。书上是这样描述的：对任意节点n，n的深度为从根到n的唯一路径的长。因此，根的深度为0。n的高是从n到一片树叶的最长路
DFS应用——寻找欧拉回路 PacosonSWJTU 数据结构 dfs 欧拉回路
【0】README0.1）本文总结于数据结构与算法分析，源代码均为原创，旨在理解“DFS应用——寻找欧拉回路”的idea并用源代码加以实现（源代码，我还没有找到一种有效的数据结构和DFS进行结合，往后会po出）；【1】欧拉回路1.1）欧拉回路定义：我们必须在图中找出一条路径，使得该路径对图的每条边恰好访问一次。如果我们要解决“附加的问题”，那么我们就必须找到一个圈，该圈恰好经过每条边一次，这种图论
数据结构（一）基本概念叫我皮卡丘数据结构数据结构（浙大）数据结构浙江大学基本概念
一、数据结构1.其他定义数据结构是数据对象，以及存在于该对象的实例和组成实例的数据元素之间的各种联系。这些联系可以通过定义相关的函数来给出。——SartajSahni《数据结构、算法与应用》数据结构是ADT（AbstractDataType，数据抽象类型）的物理实现。——CliffordA.Shaffer《数据结构与算法分析》数据结构（datastructure）是计算机中存储、组织数据的方式。通
Python数据结构与算法分析（第二版） oh panda python 开发语言
文章目录第二章算法分析2.3.1列表对列表进行加长操作，比较不同方法的性能pop性能分析2.3.2字典比较列表和字典的包含操作第三章基本数据结构3.3栈3.3.1何为栈3.3.2栈抽象数据类型3.3.3用Python实现栈代码清单3-1用Python实现栈代码清单3-2栈的另—种实现3.3.4匹配括号代码清单3-3匹配括号3.3.5普通情况:匹配符号3-4匹配符号3.3.6将十进制数转换成二进制数
C++数据结构与算法分析——二分查找 L_Hygen 笔记题解二分算法 c++二分法
二分查找介绍二分查找，也叫折半搜索、对数搜索。是用来在一个有序数组中查找一个数的算法。例题题目描述给定一个n个元素有序的升序整型数组nums和一个目标值target，写一个函数搜索nums中的target，如果目标值存在返回下标，否则返回-1。示例1:输入:nums=[-1,0,3,5,9,12],target=9输出:4解释:9出现在nums中并且下标为4示例2:输入:nums=[-1,0,3,
【数据结构与算法】浅谈尾递归兰亭风雨数据结构与算法数据结构与算法随笔尾递归数据结构
在《数据结构与算法分析：C描述》（DataStructuresandAlgorithmAnalysisInC）的第三章中，以打印链表为例，提到了尾递归（tailrecursion）并指出了尾递归是使用递归极其不当的例子，它指出虽然编译器会对尾递归自动优化，但即便如此最好还是不要去写尾递归。而我在《算法精解：C语言描述》（MasteringAlgorithmswithC）中也看到书中提到编译器会对尾
计算机的基本数据结构与算法分析,数据结构与算法分析 Yufeng Bai 计算机的基本数据结构与算法分析
《数据结构与算法分析》是2007年人民邮电出版社出版的一本图书，作者是MarkAllenWeiss。书名数据结构与算法分析作者MarkAllenWeiss原作品DataStructuresandAlgorithmAnalysis出版社人民邮电出版社出版时间2007年定价49元开本16开ISBN9787115139238数据结构与算法分析图书简介编辑语音《数据结构与算法分析C++描述>(第3版)是数
【啃书】Python数据结构与算法分析(第二版)---导论 Al6n Lee #数据结构与算法分析 python 算法数据结构
文章目录前言数据类型内建原子数据类型(int、float、bool)内建集合数据类型(有序：list、str、tuple；无序：set、dict)输入与输出控制结构(循环与分支)异常处理函数类__xx__魔法方法属性方法成员继承前言算法计算机科学的研究对象是问题、解决问题的过程，以及通过该过程得到的解决方案。给定一个问题，计算机科学家的目标是开发一个能够解决该问题的算法。算法是具有有限步骤的过程，
LinkedList与ArrayList通过Iterator迭代器源码效率探究沙琪玛～ java源码数据结构与算法分析数据结构 java源码
前言先来点废话，最近发现每日总结效益太低，不适合博文，因此以后不写每日总结，多写一些干货和学习记录，个人感觉这样更适合我。最近在学习《数据结构与算法分析-java语言描述》这本书，书的3.3.4小节探索对于remove()方法而言ArrayList和LinkedList的区别ArrayListCollection接口源码publicinterfaceCollectionextendsIterabl
【啃书】Python数据结构与算法分析(第二版)---算法分析 Al6n Lee #数据结构与算法分析算法 python 开发语言数据结构
文章目录何谓算法分析大O记法异序词检测示例清点法排序法蛮力法计数法Python数据结构的性能列表字典何谓算法分析首先，算法的本质就是解决问题的方案。算法通过程序来实现。程序存在优劣之分，算法分析关心的是基于所使用的计算资源比较算法。计算资源指什么？空间与内存执行时间产生一个问题在描述算法的执行时间，指标是实际时间，但这个时间依赖于计算机、程序、时间、编辑器、编辑语言等众多因素，所以我们需要找到一个
【啃书】Python数据结构与算法分析(第二版)---基本数据结构 Al6n Lee #数据结构与算法分析 python 数据结构开发语言
文章目录引子栈LIFO(last-infirst-out)队列FIFO(first-infirst-out)双端队列列表无序列表有序列表引子接下学习的栈、队列、双端队列、列表都是有序的数据集合，其元素的顺序取决于添加顺序或移除顺序。一旦某个元素被添加进来了，他的前后元素的相对位置将保持不变。这样的数据集合也被称之为线性数据结构栈LIFO(last-infirst-out)定义栈是一个有序集合，添加
数据结构与算法java语言描述_数据结构与算法分析 Java语言描述（原书第3版）pdf... jian bao 数据结构与算法java语言描述
数据结构与算法分析Java语言描述(原书第3版)内容简介本书是国外数据结构与算法分析方面的经典教材，使用卓越的Java编程语言作为实现工具，讨论数据结构(组织大量数据的方法)和算法分析(对算法运行时间的估计)。随着计算机速度的不断增加和功能的日益强大，人们对有效编程和算法分析的要求也不断增长。本书将算法分析与最有效率的Java程序的开发有机结合起来，深入分析每种算法，并细致讲解精心构造程序的方法，
《数据结构与算法》基本概念宋季辛数据结构数据结构
一、什么是数据结构1.1关于数据组织——例：图书摆放1.1.1定义“数据结构是数据对象，以及存在于该对象的实例和组成实例的数据元素之间的各种联系。这些联系可以通过定义相关的函数来给出。”——SartajSahni《数据结构，算法与应用》“数据结构是ADT（AbstractDateType）的物理实现”——CliffordShaffer《数据结构与算法分析》“数据结构是计算机存储、组织数据的方式。通
跳跃表数据结构与算法分析纪卓志数据结构链表
文章著作权归纪卓志（https://github.com/jizhuozhi）所有，转载需注明引用地址（https://blog.csdn.net/ji_1218060852/article/details/128605716），侵权必究跳跃表[1,2,3]是一种用于在大多数应用程序中取代平衡树的概率数据结构。跳跃表拥有与平衡树相同的期望时间上界，并且更简单、更快、是用更少的空间。在查找与列表的线
数据结构与算法分析(C++)(第3版)-笔记二-线性表、栈和队列找不到我吧我独一无二数据结构队列链表数据结构
1.线性表的定义和基本操作的设计与其顺序存储结构和链式存储结构实现定义：线性表L是n个数据元素a0，a1，a2，......，an-1的有限序列，记作L=(a0，a1，a2，......，an-1)。其中元素个数n(n>=0)定义为表L的长度。当n=0时，L为空表，记作()。第一个元素a0称为表头元素；最后一个元素an-1称为表尾元素；顺序表定义：采用连续的存储单元依次存储线性表中各元素，这种存储
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他