Hekaton的神话与误解

最近这段时间，我花了很多时间来更好的理解Hekaton——SQL Sever 2014里的全新内存表技术。我看了很多文章，了解了Haktaon的各种内部数据存储结构（主要是哈希索引和Bw-tree）。另外我也看了不少关于这方面的讲座。

但不止一次，有很多的误报，神话和误解出现，人们对Hektaton的认识发生了错误。从大家对Hekaton的提问就可以看出，我们需要整理Hekaton的知识，向大家重新传达它的相关知识，让大家更好的理解Hekaton，在Hekaton合适的场景来更好的使用它。

下面只是一些我罗列听到的大家关于Hekaton的问题：

“Hekaton是内存存储技术，是否意味着数据不再永驻？”
“Hekaton只在特定架构的CPU里可以运行？”
“当你迁移到Hekaton，对于你的工作量，你会获得100倍的性能提升？”
“在Hekaton里，没有锁，阻塞，自旋锁。”

这只是在过去我听到的误解中，头条的一部分。因此这篇文章的目的澄清这些最大误解和问题，我也会告诉你为什么它们是错误的。嗯，让我们从我的最头条开始（没特定顺序）！

“对于事务，Hekaton也提供ACID属性么？”

当我开始讨论Hekaton时，这个总是我第一个想澄清的：当你使用Hekaton时，对于你的事务，它还是有ACID属性的！Hekaton里的事务一直是有原子性（Atomicity）、一致性（Consistency）、隔离性（Isolation）和持久性（Durability）的。SQL Server只是内部使用不同的概念和方法来保证这4个重要属性。

原子性（Atomicity）：对于你处理的事务，还是可以前滚（rolled forward）和后滚（rolled back），即使你的SQL Server崩溃，对于你启用Hekaton的数据库，SQL Server还是可以通过故障修复（crash recovery ）（只要通过SQL Server重启，你的数据还是持续的（persisting ）——下面会详细描述）
一致性（Consistency）：Hekaton也提供“总是”有一致的数据。这个在当前很容易做到，因为Hekaton的最大局限性之一是不能创建外键（Foreign-Keys），只能本身约束。因此基本上启用Hekaton的表，是在内部进行约束的。
隔离性（Isolation）：几天前，有人想说服我，Hekaton提供你脏读（Dirty Reads），因为没有锁和阻塞（Locking and Blocking）。错了！！！Hekaton使用所谓的多版本并发控制（Multi Version Concurrency Control ，MVCC）的方法，才有没锁的神奇可能。当你读取数据的时候，你取回的是在你开始的语句/事务后不在有效的数据（取决于使用的事务隔离级别（Transaction Isolation Level））。因此在Hekaton里没有脏读（Dirty Reads）。
持久性（Durability）：这个要分情况。当你使用架构和数据（DURABILITY=SCHEMA_AND_DATA）持久性创建你的Hekaton表，在SQL Server崩溃时，数据还是存在的。它会从事务日志里恢复，即Hekaton写的检查点文件。这点非常重要：当你想要你的数据持久时，Hekaton还是会使用事务日志，这也意味着你的事务日志是Hekaton的最后性能瓶颈之一。当和传统基于传统硬盘的表相比，Hekaton这里使用非常高效的日志模型。这里其中一个改变是，只有数据修改被日志，不是在索引级别。当你在基于传统硬盘表里执行INSERT，SQL Server需要为“每个”索引（聚集和非聚集索引）的INSERT日志。在Hekaton里，SQL Server只日志一次INSERT，因为在SQL Server启动期间，所有的Hekaton索引（哈希索引，范围索引）都会重建。因此对事务日志的影响是尽可能小的。

当你使用只有架构，不包含数据（DURABILITY = SCHEMA_ONLY）的Hekaton表时，你的Hekaton事务的持久性就没有了：当你的SQL Server崩溃了，或者你重启SQL Server，在Hekaton表里的所有数据会丢失。因此没有持久性。因此在事务日志里也没有日志记录。当然这个用法只在特殊场景里使用才有意义，例如为你的数据仓库进行数据加载。如果SQL Server崩溃，你就要重启你的ETL进程。你是可以重建你丢失的数据。

“Hekaton是微软提供的No-SQL方法？”

这个误解也非常有意思。有人想说服我说Hekaton是微软开发的No-SQL的新方法。得了吧，使用Hekaton我们还是在讨论有所有ACID属性的关系数据库（参阅刚才说的）。Hekaton和No-SQL是2个完全不同的东西，也没有共同点。Hekaton内部使用优雅而快速的方法来实现关系数据库的特性——就这样！

“Hekaton只在特定架构的CPU上运行？”

哇哦，我想我站错了地方！Hekaton只在特定模型/架构上运行，因为Hekaton内部使用所谓的原子CAS运算（原子比较与交换Atomic Compare & Swap, or Atomic Compare & Exchange）。那句话是完全错误的！当然，内部的Bw-tree使用CAS运算作为多个原子步骤做出树里SMOs（结构修改运算，Structure Modification Operations）。Hekaton这里内部使用“InterlockedCompareExchange”的WIN32 API函数。这个函数只在特定内存位置的值和原始值比较，如果2个一样的话，在内存位置会写入新值。函数本身在CPU级别作为一个原子汇编指令执行，意味着没有别的线程可以干涉那个汇编函数。它作为一个原子块（atomic block）从开始到结束执行。

这里的神话是，需要的汇编函数只在特定CPU架构上支持。这没错，但是这个汇编函数从奔腾处理器开始就支持了！在386和486架构上，函数本身是不支持的……从刚才提到的MSDN文章里的要求部分看到，支持的最低系统版本是Windows XP！因此当你在前Windows XP系统里安装SQL Server 2014时，这个神话倒是真的！

“在Hekaton里，没有锁，阻塞，自旋锁。”

理论上这句话是对的。这句话可以从不同方面辩论。我们从第1个方面开始。Hekaton“本身”是没有锁，阻塞和自旋锁的，但是你还是和SQL Server的传统关系引擎打交道。这就意味着，当你离开Hekaton宇宙时，你还是和基于原始代码的SQL Server打交道（对此，我表示遗憾……），例如事务日志管理器（ Transaction Log Manager）。这些代码还是有闩锁（latches）和自旋锁（spinlocks）用来保持不同线程访问的同步。从这个角度来说，上述语句是部分正确的。

第2个方面在Hekaton里你还是有阻塞（blocking）的地方是，当你进行原子CAS操作时，一个原子CAS操作不能被不同的线程中断。因此在Bw-Trees里SMOs（结构修改运算，Structure Modification Operations）可以以聪明、优雅的方式实现。着也意味着当你想在同个Bw-Tree里的同个页里同时执行一个SMO是，一个线程会胜出，其他的线程需要重试原子CAS操作。同时发生了什么呢？线程会旋转，再次尝试CAS操作。我的基本理解是，原子CAS操作本身是就像一个Criticial Section同步概念包装的汇编函数。这就意味着你的线程需要旋转，你在丢失CPU周期，并增加了你事务的闭锁性。当然，SMOs应该非常非常少见，因此这没什么大不了的——但还是有线程旋转的可能，当有为底层同步对象（或者汇编函数）的竞争时。

这是我在原子CAS操作上的基本理解。如果我对此的理解是错误的，欢迎随时纠正我！

“因为在Hekaton里不支持INT IDENTITY值，使用序列（Sequences）？”

这句也非常有意思。我没有在吹嘘这句话！为什么？因为在你的SQL Server数据库里，序列（Sequences）是一个共享对象，意味着访问的当前值是由SQL Server同步的。这个同步在竞争中结束，意味着你不能延伸你的工作量，Hekaton的一切都是延伸工作量。

我用序列值在CTP1上做过一些测试，一旦你在你的Hekaton表/存储过程上执行大量的并行线程，你就会触发序列生成器（Sequence Generator）里的竞争。当然在一些内部页，序列生成器（Sequence Generator）存储着当前值，当序列生成器读写这些特定页时，就会发生闩锁（latch）。在序列生成器里，你就用闩锁竞争（Latch Contention）结束它了，你的Hekaton工作量也不会延伸。在我的测试里也没太大区别，如果我请求整个范围的序列值，或者当我使用缓存，也没有区别。序列生成器始终是瓶颈。

那你如何克服这个特定问题？使用老好朋友UNIQUEIDENTIFIER。这些值彼此间是完全独立生成的，意味着当你生成新值时，没有涉及到共享资源，因此你可以剔除这个瓶颈，直到你触发CPU 的100%的使用率（包括像事务日志，网络带宽等其他瓶颈）前，Hekaton的工作量是可以不断延伸的。

“对于你的程序，Hekaton是完全透明的（is completely transparent）。”

这句话是对的，只要你对数据库设计没想法。我刚才已提过，在第1个发布里不能创建外键（Foreign-Keys）来检查约束。我从没看过任何基于磁盘的表，可以逐个迁移到内存优化表（Memory-Optimized table）。还记得么，INT IDENTITY 值目前尚不支持。当你迁移到Hekaton时，你做的不只是简单的切换来获得100倍的性能提升。抱歉！

“对于你的程序，Hekaton是完全透明的。”

“对于范围索引（Range Indexes），Hekaton使用传统的B+树结构。”

错！范围索引使用所谓的Bw-Tree，这个当前SQL Server为聚集和非聚集索引使用的B+树结构几乎一样。Bw-tree是基于B-Link tree——大家可能有点迷糊了，和传统的B+树相比，Bw-Tree有3个重大不同：

中间层的页存储大范围的键值，在下一层的页存储小范围的键值。因为在页上存储了大范围的键值，Smos（例如页分裂）可以在2个原子操作实现（通过2个原子CAS执行）。这个概念来自于B-Link tree的设计原则。
页“从不”改变，因此这个会导致CPU缓存线无效，这个会穿越传播到整个内存架构，这是非常昂贵的（在浪费CPU周期这方面）。当Hekaton需要改变内存中的页，不会接触到原始内存位置，Hekaton只创建一个新的Delta记录，这就是修改操作。所谓的”页面映射表（Page Mapping Table）“指向新的Delta记录，Delta记录对应的原始记录并未修改。因为这个方式CPU缓存线无效可以避免。
页大小是弹性的，并不是一直的8kb大小。

“在数据库里，Hekaton提供你超快的业务逻辑。”

从微软观点来说这个是对的，因为自SQL Server 2012起SQL Server是在CPU核心层授权的。你用的CPU周期越多，需要的CPU就越多，你付给微软的授权就越多。但从架构观点来说是错的！数据库处理的是存储和获取数据，但是数据库不是一个应用服务器，应用服务器才处理业务……想想看。当你有CPU竞争时，因为你在数据库服务器里运行大量的业务逻辑，你应该重构你的数据库，因此你把你的业务逻辑移向专用的应用服务器，作为SQL Server的授权完全不一样——你为操作系统付钱，这就是错的原因！

“我如何迁移我的整个SAP数据库到Hekaton。微软对此有提供工具么？”

当你想把整个数据库迁移到Hekaton时，请先好好想想。Hekaton是用来解决特定问题的，像闩锁竞争（Latch Contention）。只有把特定的表和存储过程迁移到Hekaton时才有意义——并不是“所有”的数据库！对于每个数据库对象（表，存储过程），SQL Server需要把它们编译和链接成对应的DLL文件（然后载入sqlservr.exe的运行空间，这样要花费时间）。当你重启你的SQL Server时或者进行故障群集转移时，也会执行编译和链接。这会直接影响你HA方式的目标恢复时间（Recovery Time Objective，RTO）。

小结

我希望已经帮你澄清了Hekaton的一些神话，误报和误解。而且我一直强调的是：如果是“对的”问题，Hekaton可以帮解决；如果你有传统的问题（错误的索引设计，糟糕的存储性能）果断放弃Hekaton吧，先做好你的家庭作业先。

Hekaton就像F1赛车：

你技术不好的话，F1赛车也帮不了你！

感谢关注，期待您的留言！

你可能感兴趣的:(on)

ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str