changtao381

高效存储技术研究

1 引言

物质、能量和信息是自然科学研究的三个基本对象，处理、传输和存储是信息计算的三大基本任务。随着信息化技术水平的不断提高，数据已经取代计算成为了信息计算的中心，数据将成为企业最终有价值的财富。1998年图灵奖获得者Jim Gray曾断言：现在每18个月新增的存储量等于有史以来存储量之和。根据预测，2020年数据宇宙将达到35.2 ZB（1 ZB = 1百万PB），比2009的0.8ZB增加44倍。在如此强大的实际需求推动下，人们不断追求海量存储容量、高性能、高安全性、高可用性、可扩展性、可管理性等特性，对存储的需求不断提高。信息量呈现爆炸式增长趋势，使得存储已经成为急需提高的瓶颈。

面对数据量的急剧膨胀，企业需要不断购置大量的存储设备来应对不断增长的存储需求。权威调查机构的研究表明，目前世界大公司的年度存储需求增长率为100%。然而，这似乎并不能从根本解决问题。首先，存储设备的采购预算越来越高，大多数企业难以承受如此巨大的开支。其次，随着数据中心的扩大，存储管理成本、占用空间、制冷能力、能耗等也都变得越来越严重，其中能耗尤为突出。在美国，数据中心大约消耗掉2%总电量，每年电费开销高达40亿美元。Gartner曾预测，2009年全世界将会有一半以上的数据中心电力供应不足。Emerson的调研则显示2011年96%的数据中心将缺乏电力，美国许多企业的数据中心被迫迁至其它电力供应充足的地方。再者，大量的异构物理存储资源大大增加了存储管理的复杂性，容易造成存储资源浪费和利用效率不高。研究发现，企业的存储利用率往往不足50%，存储投资回报率水平较低。

因此，我们需要另辟蹊径来解决信息的急剧增长问题。高效存储理念正是为此而提出的，它旨在缓解存储系统的空间增长问题，缩减数据占用空间，简化存储管理，最大程度地利用已有资源，降低成本。

2 何谓高效存储？

高效存储目前还没有统一的定义，各个存储厂商分别有各自的定义和诠释，但目标是基本一致的，即提高存储利用效率、简化存储管理、降低存储能耗，从而获得较低的总持有成本和运营成本。高效存储的关键是平衡，需要在存储成本、商业价值以及运营风险之间作好平衡。

从现有的高效存储技术和存储产品来看，高效存储的基本策略主要有存储资源整合、动态存储容量配置、缩减存储容量、信息生命周期管理和降低能耗，高效存储技术基于这五种基本策略来实现高效的存储。SNIA GSI（Green Storage Initiative）针对绿色存储给出了四种基本策略：提高设备能耗效率、使用更少的冗余、提供更少的空间、存储更多的数据，相应的高效存储技术和管理策略概览如表1所示。

表1　高效存储技术和管理策略概览

NO.	高效存储技术	简要说明
1	Mange Your Data	减少冗余数据副本，减缓数据增长率；根据数据价值和SLA定制数据管理和保护策略，降低总成本
2	Select the Appropriate Storage RAID Level	根据数据价值和SLA选择合适的RAID级别，结合其他高效存储技术来减少存储量和能耗
3	Leverage Storage Virtualization	将分散物理存储资源整合成虚拟的存储资源池，最大化存储利用率，减缓存储需求
4	Use Data Compression	有效减小数据通信量和存储量，同是产生一定的性能负载，有些数据压缩有限，操作顺序影响压缩效果
5	Incorporate Data Deduplication	删除块级冗余数据，减小存储量
6	File Deduplication	删除文件级冗余数据，减小存储量
7	Thin Provisioning of Storage to Servers	自动精减配置在满足存储需求的同时按需分配存储，最小化存储需求
8	Leverage Resizeable Volumes	根据需要动态调整数据卷大小，提高存储利用率，减小存储需求
9	Writeable Snapshot	减少测试、仿真、建模等应用的存储空间需求
10	Deploy Tired Storage	根据数据价值和访问频度自动在不同存储层次之间流动，降低成本
11	Solid State Storage	SSD具有高性能、低能耗的特点，但成本高、写抖动、使用寿命短等问题
12	MAID and Slow-Spin Disk Technology	将空闲磁盘转换成非活动或低速旋转模式，可有效节省能耗
13	Tape Subsystem	容量大、存储有效期长、无能耗，磁带仍是数据长期归档的最佳选择
14	Fabric Design	网络设计影响能耗和冷却系统
15	File System Virtualization	管理物理分布的数据，提高存储效率、安全性、访问性能和数据保护，降低能耗
16	Server, Fabric and Storage Virtualization	综合多种虚拟化技术减缓存储需求、提高存储利用率、降低能耗
17	Flywheel UPS Technology	针对不同价值的存储采用不同的电源保护策略
18	Data Center Air Conditioning Improvement	改进空调系统帮助节省能耗
19	Increased Data Center temperatures	保证数据中心正常运行的前提下，提高　温度以节省大量能耗
20	Work with Your Regional Utilities	寻求本地电力提供机构帮助节省能耗

表1中所罗列的高效存储技术和管理策略均是最佳实践，但是单一技术往往难以显著地提高存储利用效率、降低能耗、降低成本，实际中通常综合运用其中多种技术以获得更佳的整体效果。另外，一定要根据实际的数据特征和应用环境来选择合适的技术和策略，不可照搬乱套，否则可能效果甚微，甚至得不偿失。

3 高效存储技术

目前业界公认的五项高效存储技术分别是数据压缩、重复数据删除、自动精简配置、自动分层存储和存储虚拟化，已经在存储产品得到广泛推广和应用，IBM最新推出的Storwize V7000存储阵列甚至同时集这五项技术与一身。其他的相关技术还包括固态硬盘SSD、MAID技术、动态卷、RAID级别等，它们分别利用自身的特点提高存储效率、简化存储管理和节约成本。

3.1 数据压缩

数据压缩是一种对数据进行编码以减小数据量的处理方法和过程。在有些应用中，采用有损压缩压缩过程中会丢失一部分的原始信息对某些格式的数据如数字图像进行压缩；但是对大多数的IT应用，需要的是无损压缩压缩过程能够保存完整的原始信息，并且能够从压缩数据精确地重构原始数据。存储技术中使用无损数据压缩技术来减小数据量，根据目前的技术水平，无损压缩算法一般可以把普通数据压缩到原来的1/2～1/4，常用的无损压缩算法有霍夫曼(Huffman)、Lempel-Ziv（LZ）、LZW(Lempel-Ziv & Welch)、LZR (LZ-Renau)等压缩算法。其中，LZ算法应用广泛，PKZIP、gzip、PNG、CAB格式均使用该算法或变体；GIF图像格式使用LZW算法，LZR是ZIP方法的基础。

数据压缩要求在写入数据前进行编码，在读取数据前进行解码，因此会对存储系统性能产生一定的影响。然而，数据压缩技术可以有效缩减数据存储容量以及存储硬件需求，在存储技术中应用非常广泛，尤其是近线和离线存储。数据压缩并非对任何数据都会效果显著，诸如JPEG、MPEG、MP3等文件格式，这类数据已经由应用层作过压缩处理，存储系统对它的再次压缩几乎没有效果，而且会产生额外的性能损失。另外，数据压缩和加密机制往往同时被应用，压缩和加密操作需要按照合适的顺序执行。加密会对数据进行转置和变换，通常会增加字节冗余数据发现的难度以及降低数据压缩率，所以数据压缩应当先于数据加密执行，而解压缩则以相反次序执行，以获得更高的压缩率。

数据压缩可以有效缩减数据存储容量，缓解数据增长压力，不足之处是相应产生一定性能损失。因此在存储系统中实际运用时，需要根据存储的性能、容量、成本等因素综合考虑，不能由于采用数据压缩而导致性能指标不能达标，为了提高性能而又增加总成本。通常来看，性能要求高的实时在线数据存储不适合采用数据压缩；而以数据备份、容灾、归档、复制为主的近线和离线存储，存储容量需求大但性能要求较低，非常适合采用数据压缩技术。然而，如果有方法可以解决压缩和解压所产生的性能损失问题（如专用芯片、高效算法），在线存储采用数据压缩也是可行的。

3.2 重复数据删除

重复数据删除（Deduplication）是一种数据缩减技术，可对存储容量进行有效优化。它通过删除数据集中重复的数据，只保留其中一份，从而消除冗余数据。Dedupe技术可以有效提高存储效率和利用率，数据可以缩减到原来的1/20～1/50。这种技术可以很大程度上减少对物理存储空间的需求，减少传输过程中的网络带宽，有效节约设备采购与维护成本。同时它也是一种绿色存储技术，能有效降低能耗。

图1 重复数据删除技术原理

Dedupe按照消重的粒度可以分为文件级和数据块级。文件级的dedupe技术也称为单一实例存储（SIS, Single Instance Store），数据块级的重复数据删除，其消重粒度更小，可以达到4-24KB之间。显而易见，数据块级可以提供更高的数据消重率，因此目前主流的 dedupe产品都是数据块级的。Dedupe将文件分割成定长或变长的数据块，采用MD5/SHA1等Hash算法为数据块计算指纹（FP, Fingerprint）。可以同时使用两种及以上hash算法计算数据指纹，以获得非常小的数据碰撞发生概率。具有相同指纹的数据块即可认为是相同的数据块，存储系统中仅需要保留一份。这样，一个物理文件在存储系统就对应一个逻辑表示，由一组FP组成的元数据。当进行读取文件时，先读取逻辑文件，然后根据FP序列，从存储系统中取出相应数据块，还原物理文件副本。

Dedupe技术可以帮助众多应用降低数据存储量，节省网络带宽，提高存储效率，减小备份窗口，有效节省成本。Dedupe技术目前最成功的应用领域是数据备份、容灾和归档系统，然而事实上dedupe技术可以用于很多场合，包括在线数据、近线数据、离线数据存储系统，可以在文件系统、卷管理器、NAS、SAN中实施。Dedupe也可以用数据传输与同步，作为一种数据压缩技术可用于数据打包。为什么dedupe技术最成功的应用是数据备份领域，而其他领域应用很少呢？这主要由两方面的原因决定的，一是数据备份应用对数据进行多次备份后，存在大量重复数据，非常适合这种技术。二是dedupe技术的缺陷，主要是数据安全、性能。Dedupe使用hash指纹来识别相同数据，存在产生数据碰撞并导致数据不一致性的可能性。Dedupe需要进行数据块切分、数据块指纹计算和数据块检索，消耗可观的系统资源，对存储系统性能产生影响。

信息呈现的指数级增长方式给存储容量带来巨大的压力，而dedupe是最为行之有效的解决方案，因此固然其在性能和安全方面有一定的不足，它大行其道的技术趋势无法改变。更低碰撞概率的hash函数、多核、GPU、SSD等，这些技术推动dedupe走向成熟，由作为一种产品而转向作为一种功能，逐渐应用到近线和在线存储系统。ZFS已经原生地支持dedupe技术，我们相信将会不断有更多的文件系统、存储系统支持这一功能。此外，数据压缩可以与dedupe技术结合应用以获得更大的数据缩减比率，写入数据时去重得先于压缩执行，读取数据的执行顺序则相反，如此可以达到最佳效果。

Dedupe的衡量维度主要有两个，即重复数据删除率（Deduplication ratios）和性能。Dedupe性能取决于具体实现技术，而重复数据删除率则由数据自身的特征和应用模式所决定，目前各存储厂商公布的重复数据删除率从20:1到500:1不等。对何种数据进行消重，时间数据还是空间数据，全局数据还是局部数据？何时进行消重，在线还是离线？在何处进行消重，源端还是目标端？如何进行消重？实际应用Dedupe技术时应该考虑各种因素，因为这些因素会直接影响其性能和效果。另外值得一得的是，hash碰撞问题现在还没有根本的解决方法，因此对于关键业务数据应该慎重考虑应用dedupe技术。

3.3 自动精简配置

自动精简配置（Thin Provisioning）的概念最早由3PAR公司提出，是一种全新的存储空间管理技术，利用虚拟化方法减少物理存储部署，可最大限度提升存储空间利用率。它的核心原理是“欺骗”操作系统，让其认为存储系统中有很大的存储空间，而实际上的物理存储空间并没有那么大。自动精简配置减少已分配但未使用的存储容量的浪费，根据用户的实际所需自动分配和利用存储资源。目前，IBM、HDS、EMC、3PAR的高端磁盘阵列均支持该项技术。

图2 传统存储空间分配与自动精简配置比较

传统的存储系统中，为确保存储容量足够使用，用户往往会部署多于实际需求的充足物理存储空间。但在实际使用过程中，部署容量通常未受到充分利用。行业研究组织发现在某些项目中，实际使用容量仅占部署容量的20%—30%。因此，“自动精简配置”技术应运而生，旨在实现更高的存储容量利用率，并带来更大的投资回报。

自动精简配置不会一次性的划分过大的空间给某项应用，而是根据该项应用实际所需要的容量，多次的少量的分配给应用程序，当该项应用所产生的数据增长，分配的容量空间已不够的时候，系统会再次从后端存储池中补充分配一部分存储空间。自动精简配置技术扩展了存储管理功能，虽然实际分配的物理容量小，但可以为操作系统提供超大容量的虚拟存储空间。随着应用写入的数据越来越多，实际存储空间也可以及时扩展，而无须手动扩展。换句话说，自动精简配置提供的是“运行时空间”，可以显著减少已分配但是未使用的存储空间。利用自动精简配置技术，能够帮助用户在不降低性能的情况下，大幅提高存储空间利用效率，降低初始投资成本；需求变化时，无需更改存储容量设置；通过虚拟化技术集成存储，降低运营成本；减少超量配置，降低总功耗。

毫无疑问，自动精简配置技术是一项非常有效的存储管理工具，但在实际应用过程中也会产生一些问题，需要根据所处的数据环境和存储需求来权衡。首先，当预先分配的存储空间不够时，系统会从存储资源池中补充存储空间。然而，如果已经分配的空间不再使用而空闲下来，空间回收相对困难，现在的产品支持较少。可见这种技术呈现只增不减的态势，弹性不足。其次，当存储空间超过预先设置的阈值，系统会触发存储空间分配。对于高负载的数据应用来说，面对突发的访问峰值，有可能在配置更多的物理存储空间之前系统就变得过载，导致磁盘和应用程序错误使得整个系统运行极其缓慢。再者，为了维持精简配置环境增加了存储系统复杂性，如果一旦发生故障，系统恢复可能比传统的存储系统更加缓慢。

3.4 自动分层存储

自动分层存储(Automated Tiered Storage，ATS)属于分层存储，而分层存储其实由来已久。分层存储（Tiered Storage），也称为层级存储管理（Hierarchical Storage Management），广义上讲，就是将数据存储在不同层级的介质中，并在不同的介质之间进行自动或者手动的数据迁移，复制等操作。同时，分层存储也是信息生命周期管理（ILM）的一个具体应用和实现。分层存储发展至自动分层存储，主要摈弃了甄别数据和迁移数据的人工操作，而实现了智能化和自动化。

图3 自动分层存储结构

数据有生命周期，从创建到删除的时间内，信息的商业价值和访问频度不断降低。存储设备有高低贵贱之分，性能好、可靠性高、读写速度快的设备，自然价格就高；而性能较低、读写速度慢的设备，价格也就相对低廉。“分层”是指，对数据的访问需求增加或减少时，将数据在不同类型的存储介质之间迁移，即把那些不常被访问的数据或过时的数据转移到速度较慢、成本较低的存储介质上，如SATA磁盘或磁带，以此来降低硬件成本；而把那些经常被访问或重要的数据放在速度较快、成本较高的光纤磁盘甚至固态硬盘（SSD）上，以此来提升性能。自动分层存储就是要让数据和设备“门当户对”，不仅可以降低存储容量成本和管理成本，同时还维持适当的性能水平。

分层存储的概念已经出现已久，并且这一概念被EMC、STK等厂商升华为信息生命周期管理（ILM）。不过，这一数据管理的理想因为操作复杂、成本较高，实现起来却不那么理想，ILM叫好而不叫座。以往，数据的分层存储依靠存储管理员的手工操作。如今，这一过程实现了自动化，智能软件可以自动将数据转移到最经济高效的存储介质上。SSD的出现使自动分层技术显得更加有必要，它能使一个两层甚至三层的存储系统享有SSD级的性能,同时，反过来又促进了SSD的应用。随着自动化数据分层技术不断成熟，它也许有助于促进SSD的采用，因为它可以帮助管理员将分层技术调整到足够优化的地步，从而确保能够从性能最高但成本也最高的存储介质中获得最大效益。

目前提供ATS存储产品的厂商主要有3PAR、DELL、Compellent、EMC、IBM，它们都是自动实现对热点数据的甄别和迁移，但彼此之间其实还是存在较大的差别。第一大区别体现在热点数据的甄别方式上。一种是基于策略的方式，如EMC的FAST2；一种是支持全自动方式，用户不需要制定任何策略，如IBM的Easy Tier、Compellent的Data Progression、DELL的EqualLogic 5.0。另一大区别体现在被迁移数据的粒度方面，分为卷级、子卷级、文件级和数据块级。目前，大多数厂商的ATS技术都能实现子卷级数据迁移。是否为子卷级的数据迁移是评价ATS技术的一个很重要的参数，因为它关系到ATS技术的实际运行效果。数据块级是自动分级存储的最高境界，只有这一步才能做到真正的对于应用完全自动化和透明。目前，EMC、3PAR是子卷级，NetAPP是文件级，Compellent做到了数据块级。不过，各厂商的ATS都在向数据块级逼近。

自动分层存储具有许多优点，被存储业内人士所推崇，但也需要注意一些潜在的问题。首先，从性能的角度看，大部分自动分层系统都是使用SSD加快I/O和减少延迟性。这种做法的好处在于它可以让存储管理员自动地利用SSD，缺点在于整个环境的其他部分也必须足够快才能够充分利用它的优点。同时，大量部署SSD目前在成本上还是难以接受的。其次，一些自动分层解决方案通过将非活跃数据迁移到SATA存储层来减少成本，并减小购买更多光纤或SAS容量的必要性。这对性能提升并没有任何帮助，自动分层系统只是为了处理好旧数据，而许多数据中心多的就是这种数据。但是，主存储系统并不是为了在更长的时间内存储旧数据而设计的，归档到磁盘或许是更行之有效的方案。再者，对于访问模式频繁变化的存储系统，数据频繁在不同存储层次之间迁移，可能会对系统性能产生影响，甚至抵消原来带来的性能提升。另外，如果数据被以近似均匀的频率访问，则数据分层会异常困难和复杂。最后，数据被分成为多个数据小块分别存储与不同的存储层次，增加了元数据管理的复杂性，一旦系统发生故障，数据的恢复将会更加复杂和缓慢。

3.5 存储虚拟化

随着存储的需求不断激增，物理存储资源（如服务器、磁盘阵列、网络设备）也随之成倍增长。这种分布的异构存储资源的蔓延发展最终使管理变得异常困难，从而导致存储资源未被充分发挥效用，存储利用率只有50%的现象很普遍，导致新存储的投资白白浪费掉。对于这种存储管理困境的一种解决办法便是存储虚拟化。

图4 存储虚拟化简化存储管理

存储虚拟化将分散的物理存储资源整合抽象成单一逻辑资源池，使得管理员仅以单一的逻辑视图对存储资源进行识别、配置和管理，如图4所示。虚拟化将存储资源的物理特性隐藏起来，对于用户来说虚拟化的存储资源就像是一个巨大的“存储池”，而不必关心其背后的物理存储设备。存储虚拟化是存储整合的一个重要组成部分，它能减少管理问题，而且能够最大化存储利用率，减缓存储需求，这样可以降低新增存储的费用。如果没有存储虚拟化，只能分别管理物理存储设备，不仅管理复杂性很大，并且容易造成存储资源的浪费。

存储虚拟化是通过将一个（或多个）目标服务或功能与其他附加的功能集成，统一提供有用的全面存储服务。典型的虚拟化包括如下一些情况：屏蔽系统的复杂性，增加或集成新的功能，仿真、整合或分解现有的服务功能等。虚拟化是作用在一个或者多个实体上，而这些实体则是用来提供存储资源或服务的。存储虚拟化是一个抽象的定义，它并不能够明确地指导用户怎么去比较产品及其功能，这个定义只能用来描述广义的技术和产品。存储虚拟化同样也是一个抽象的技术，几乎可以应用在存储的所有层面：文件系统、文件、块、主机、网络、存储设备等等。存储虚拟化可以在三个不同的层面上实现：基本专用卷管理软件在主机服务器上实现，或者利用阵列控制器的固件在磁盘阵列上实现，或者利用专用的虚拟化引擎在存储网络上实现。而具体使用哪种方法来实现，应根据实际需求来决定。

存储虚拟化其实算不上是全新的概念，RAID、LVM、SWAP、VM、文件系统等这些都归属于其范畴。存储的虚拟化技术有很多优点，比如提高存储利用效率和性能，简化存储管理复杂性，绿色节省，降低运营成本等。现代数据应用在存储容量、I/O性能、可用性、可靠性、利用效率、管理、业务连续性等方面对存储系统不断提出更高的需求，基于存储虚拟化提供的解决方案可以帮助数据中心应对这些新的挑战，有效整合各种异构存储资源，消除信息孤岛，保持高效数据流动与共享，合理规划数据中心扩容，简化存储管理以及绿色节能等。它还是自动精简配置、动态卷、快照等存储技术的基础。存储虚拟化是目前的存储热点技术，也是未来的存储技术趋势，受到众多存储软硬件厂商的大力推崇。

存储虚拟化的不利方面是额外增加的复杂性。存储层是存储环境新增的部分，随着虚拟产品打补丁和更新，必须进行管理和维护。同样，存储设备之间的互操作性和兼容性也会有所影响。另外，虚拟层可能会与存储系统的某些特性相干扰，比如远程复制。另一个问题就是一旦存储虚拟化实施后，重新恢复或是取消操作存在的困难。这并不是不可能，但是重新将应用与存储位置进行关联的过程很容易出错。

3.6 其他技术

除了上述的五大基本的高效存储技术之外，还有其他许多高效存储技术和策略，罗列如下。（1）管理数据：根据数据价值和SLA定制数据管理和保护策略，减少冗余数据副本，减缓数据增长速率，降低成本；（2）选择RAID级别：根据数据价值和SLA选择合适的RAID级别，并结合其他高效存储技术来减少存储量和能耗；（3）动态数据卷：按照实际存储需求动态调整数据卷大小，提高存储利用率，减小存储需求；（4）SSD：具有高性能、低能耗的特点，有效缓解高性能应用的I/O瓶颈问题，并可作为分层存储的顶层存储介质，提高整合性能和降低成本；（5）MAID：将空闲磁盘转换成非活动或低带旋转模式，可有效节省能耗。（6）可写快照：减少用于测试、仿真、建模等应用的存储空间需求。下面重点分析一下SSD和RAID技术。

3.6.1 固态硬盘SSD

固态硬盘(SSD, solid state disk)是目前倍受存储界广泛关注的存储新技术，它被看作是一种革命性的存储技术，可能会给存储行业甚至计算机体系结构带来深刻变革。在计算机系统内部，L1 cache、L2 cache、总线、内存、外存、网络接口等存储层次之间，目前来看内存与外存之间的存储鸿沟最大，磁盘I/O通常成为系统性能瓶颈。SSD与传统磁盘不同，它是一种电子器件而非物理机械装置，它具有体积小、能耗小、搞干扰能力强、寻址时间极小（甚至可以忽略不计）、IOPS高、I/O性能高等特点。因此，SSD可以有效缩短内存与外存之间的存储鸿沟，计算机系统中原本为解决I/O性能瓶颈的诸多组件和技术的作用将变得越来越微不足道，甚至最终将被淘汰出局。试想，如果SSD性能达到内存甚至L1/L2 cache，后者的存在还有什么意义，数据预读和缓存技术也将不再需要，计算机体系结构也将会随之发生重大变革。

对于存储系统来说，SSD最大突破是大幅提高了IOPS，摩尔定理的效力再次显现，通过简单地用SSD替换传统磁盘，就可能可以达到和超越综合运用缓存、预读、高并发、数据局部性、磁盘调度策略等软件技术的效用。SSD目前对IOPS要求高的存储应用最为有效，主要是大量随机读写应用，这类应用包括互联网行业和CDN行业的海量小文件存储与访问（图片、网页）、数据分析与挖掘领域的OLTP等。SSD已经开始被广泛接受并应用，当前主要的限制因素包括价格、使用寿命、写性能抖动等。从最近两年的发展情况来看，这些问题都在不断地改善和解决，SSD的发展和广泛应用将势不可挡。

3.6.2 磁盘阵列RAID

1988 年美国加州大学伯克利分校的 D. A. Patterson 教授等首次在论文 “A Case of Redundant Array of Inexpensive Disks” 中提出了 RAID 概念，即廉价冗余磁盘阵列（ Redundant Array of Inexpensive Disks ）。RAID即独立磁盘冗余阵列，通常简称为磁盘阵列。简单地说， RAID 是由多个独立的高性能磁盘驱动器组成的磁盘子系统，从而提供比单个磁盘更高的存储性能和数据冗余的技术。 RAID 是一类多磁盘管理技术，其向主机环境提供了成本适中、数据可靠性高的高性能存储。 SNIA 对 RAID 的定义是：一种磁盘阵列，部分物理存储空间用来记录保存在剩余空间上的用户数据的冗余信息。当其中某一个磁盘或访问路径发生故障时，冗余信息可用来重建用户数据。磁盘条带化虽然与 RAID 定义不符，通常还是称为 RAID （即 RAID0）。RAID 技术具有大容量、高性能、可靠性、可管理性等显著的特征和优势，基本可以满足大部分的数据存储需求。

RAID 的两个关键目标是提高数据可靠性和 I/O 性能。磁盘阵列中，数据分散在多个磁盘中，然而对于计算机系统来说，就像一个单独的磁盘。通过把相同数据同时写入到多块磁盘（典型地如镜像），或者将计算的校验数据写入阵列中来获得冗余能力，当单块磁盘出现故障时可以保证不会导致数据丢失。在这样的冗余机制下，可以用新磁盘替换故障磁盘， RAID 会自动根据剩余磁盘中的数据和校验数据重建丢失的数据，保证数据一致性和完整性。数据分散保存在 RAID 中的多个不同磁盘上，并发数据读写要大大优于单个磁盘，因此可以获得更高的聚合 I/O 带宽。当然，磁盘阵列会减少全体磁盘的总可用存储空间，牺牲空间换取更高的可靠性和性能。比如，RAID1 存储空间利用率仅有 50%，RAID5 会损失其中一个磁盘的存储容量，空间利用率为(n-1)/n 。

RAID 中主要有三个关键概念和技术：镜像（ Mirroring ）、数据条带（ Data Stripping ）和数据校验（ Data parity ） [3][4][5]。镜像，将数据复制到多个磁盘，一方面可以提高可靠性，另一方面可并发从两个或多个副本读取数据来提高读性能。显而易见，镜像的写性能要稍低，确保数据正确地写到多个磁盘需要更多的时间消耗。数据条带，将数据分片保存在多个不同的磁盘，多个数据分片共同组成一个完整数据副本，这与镜像的多个副本是不同的，它通常用于性能考虑。数据条带具有更高的并发粒度，当访问数据时，可以同时对位于不同磁盘上数据进行读写操作，从而获得非常可观的 I/O 性能提升。数据校验，利用冗余数据进行数据错误检测和修复，冗余数据通常采用海明码、异或操作等算法来计算获得。利用校验功能，可以很大程度上提高磁盘阵列的可靠性、鲁棒性和容错能力。不过，数据校验需要从多处读取数据并进行计算和对比，会影响系统性能。不同等级的 RAID 采用一个或多个以上的三种技术，来获得不同的数据可靠性、可用性和 I/O 性能。至于设计何种 RAID （甚至新的等级或类型）或采用何种模式的 RAID ，需要在深入理解系统需求的前提下进行合理选择，综合评估可靠性、性能和成本来进行折中的选择。

RAID 这种设计思想很快被业界接纳， RAID 技术作为高性能、高可靠的存储技术，已经得到了非常广泛的应用。 RAID 主要利用数据条带、镜像和数据校验技术来获取高性能、可靠性、容错能力和扩展性，根据运用或组合运用这三种技术的策略和架构，可以把 RAID 分为不同的等级，以满足不同数据应用的需求。目前业界公认的标准是 RAID0 ~ RAID5 ，除 RAID2 外的五个等级被定为工业标准，而在实际应用领域中使用最多的 RAID 等级是 RAID0 、 RAID1 、 RAID3 、 RAID5 、RAID6 和 RAID10 。RAID每一个等级代表一种实现方法和技术，等级之间并无高低之分。在实际应用中，应当根据用户的数据应用特点，综合考虑可用性、性能和成本来选择合适的 RAID 等级，以及具体的实现方式。

4 总结

现代信息呈现爆炸式增长趋势，数据总量急剧膨胀。信息在带来价值和财富的同时，也使给我们带来许多挑战，诸如存储空间巨大、管理复杂性、存储利用率低下、电力消耗巨大、冷却能力不足、总体拥有成本高昂。数据压缩、重复数据删除、自动精简配置、自动分层存储、存储虚拟化等高效存储技术有效解决或缓解了这些难题。然而，目前还没有从根本上解决，挑战和压力依然很巨大，我们期待高密度、超低能耗、高可靠的存储硬件技术发展以及全新的存储体系结构的出现。因为潜在的巨大存储需求和市场，存储将仍然是最为热门的IT领域，现有的高效存储技术会得到长足发展，新的存储技术将会层出不穷。

你可能感兴趣的:(高效存储技术研究)

MCP vs LangChain：标准化协议与开发框架的优劣对比 guohuang MCP 人工智能深度学习大模型
随着大型语言模型(LLM)技术的迅速发展，开发者需要高效的工具来构建基于LLM的应用。MCP(ModelContextProtocol)和LangChain作为两种主流解决方案，各有优缺点。本文将从技术入门者的角度，对这两种技术进行深入对比分析。1.概述MCP：标准化协议MCP（ModelContextProtocol）是由Anthropic提出的一种标准化协议，旨在统一大模型API的调用方式，简
一种文档与代码双轨处理的RAG架构方案木鱼时刻大模型人工智能深度学习
1.目标如何构建一个能同时高效处理文档和代码的RAG系统？本文提出的融合架构，旨在解决这一核心挑战。2.整体架构概览该系统的顶层设计思想是专业分工，统一调度。它将复杂的知识处理流程拆解为清晰的模块，各模块各司其职，最终由一个核心服务进行统一编排。+-------------------+|前端||(DifyWeb界面)|+-------------------+|+----------------
嵌入式硬件中电容的基本原理与详解嵌入式开发星球单片机项目实战操作之优秀单片机智能硬件
大家好我们今天重讨论点知识点如下：1．电容在电路中的作用2.用生活中水缸的例子来比喻电容3.电容存储能力原理4.电容封装的种类介绍电容种类图片辨识5．X电容的作用介绍6．Y电容的作用介绍7．钽电容的优点及特性7．钽电容的缺点及特性8.铝电解电容的优点及特性9.铝电解电容的缺点及特10.贴片铝电解电容和插件铝电解电容缺点特性对比
C/C++联合体(union)完全指南：从内存共享到高级用法
1.联合体基础概念联合体(union)是一种特殊的数据类型，允许在相同内存位置存储不同的数据类型，但同一时间只能使用一个成员。unionData{inti;floatf;charstr[20];};核心特性所有成员共享同一块内存大小由最大成员决定同一时间只有一个成员有效常用于节省内存或类型转换场景2.C语言中的联合体2.1基本用法unionNumber{intinteger;floatreal;}
11套宝藏特效视频素材大约263GB 免费分享最爱吃南瓜 html5
链接：阿里云盘分享https://www.aliyundrive.com/s/DZJmfKb4c3m链接：百度网盘请输入提取码百度网盘为您提供文件的网络备份、同步和分享服务。空间大、速度快、安全稳固，支持教育网加速，支持手机端。注册使用百度网盘即可享受免费存储空间https://pan.baidu.com/s/1JwY0kIqLOafHw-YFdgdHDQ?pwd=2022
DM数据库安装与配置指南：实现高效部署的详细步骤 H03004 oracle 数据库
随着信息技术的飞速发展，数据库作为信息系统的核心组件之一，在企业数据管理中扮演着至关重要的角色。DM数据库（达梦数据库）是一款由中国武汉达梦数据库有限公司自主研发的高性能、高可用性、安全可靠的数据库管理系统，广泛应用于政府、金融、能源等多个领域。本文将详细介绍如何在Linux环境下高效地安装和配置DM数据库，帮助读者掌握从环境准备到后期维护的全流程。一、环境准备操作系统选择：确保您的服务器或计算机
数据恢复原理深度解析：从二进制碎片到完整文件
数据恢复原理深度解析：从二进制碎片到完整文件数据恢复看似神奇，实则是计算机科学与数字取证技术的精妙结合。本文将深入剖析数据恢复的核心原理，带您了解被删除文件如何"起死回生"的技术奥秘。一、存储介质的数据记录原理1.磁性存储（HDD）的数据印记磁畴取向：硬盘通过磁畴的南北极方向表示0和1读写头悬浮：纳米级高度的磁头不接触盘片（3-5nm）实际案例：即使格式化后，磁畴的物理状态仍可通过MFM（磁力显微
牛客AI面试「情景模拟」独家首发，将能力验证从“说”变为“做” 牛客企业服务人工智能面试职场和发展
今日，牛客重磅推出AI面试「情景模拟」功能——Roleplay，首次在AI面试中实现真实职场场景还原。通过动态角色扮演+实时压力测试，让候选人“现场应战”，直接暴露真实能力边界，更好预测员工实际工作表现。一、高效筛选“能做”而非“知道”的人，避免自我报告偏差传统面试依赖候选人“自述经历”，易包装虚构，可能筛选出“知道正确回答”的人（如销售流程），难以验证真实执行能力。牛客AI面试情景模拟逼近真实职
The Django Book-----第一章：介绍Django 日常发霉 Django Django
第一章：介绍Django本书所讲的是Django：一个可以使Web开发工作愉快并且高效的Web开发框架。使用Django，使你能够以最小的代价构建和维护高质量的Web应用。从好的方面来看，Web开发激动人心且富于创造性；从另一面来看，它却是份繁琐而令人生厌的工作。通过减少重复的代码，Django使你能够专注于Web应用上有趣的关键性的东西。为了达到这个目标，Django提供了通用Web开发模式的高
AI--提升效率、驱动创新的核心引擎保持学习ing AI编程自动化低代码
自动化代码生成、低代码/无代码开发、算法优化实践等新兴技术在软件开发领域正逐渐崭露头角。这些技术为开发者提供了更高效、更便捷的开发方式，大大提升了软件开发的效率和质量。本文重点探讨的是这些技术在实际应用中的价值和优势。1、自动化代码生成1.1优势自动化代码生成是利用机器学习和人工智能技术，通过分析需求和已有代码，生成可用的代码片段或完整的程序。这种技术可以极大地减少开发人员的工作量，提高开发效率。
InnoDB 索引数据结构的详解 lanbing Mysql 数据结构 mysql
InnoDB存储引擎的索引结构基于B+树（B+Tree），这是其核心特性之一。B+树的设计结合了磁盘存储特性和数据库查询需求，能够高效地处理大规模数据的查找、插入、删除和范围查询操作。以下是InnoDB索引数据结构的详细说明：1.B+树的结构特点B+树是一种自平衡的多路搜索树，其核心特性如下：所有数据存储在叶子节点：B+树的非叶子节点仅存储键值（Key）和子节点指针，而实际的数据（记录）只存在于叶
Springboot整合Elasticsearch及常用方法大全水木石画室 spring boot elasticsearch jenkins
SpringBoot整合Elasticsearch是企业级开发中常见的需求，用于实现高效的全文检索、日志分析等功能。以下是整合的核心步骤和常用方法大全，涵盖从基础配置到高级操作的完整流程。一、环境准备与依赖配置1.环境要求Elasticsearch：需先安装并启动（建议7.10+或8.x版本，与SpringDataElasticsearch兼容）。SpringBoot：推荐2.7.x或3.x版本（
文件同步·使用同步软件来管理文件（外接大脑）让我安静会配置与安装 zotero
个人使用文件同步软件分享。管理文件/信息V1：Obsidian（信息图文：外接大脑；知识链接的形式）Zotero（文章存储：与Obsidian连接）Notion（各种文件存储：可分类、搜索、文字记录）【手机联动】坚果云（1G·小文件临时存储）【手机联动】Gitee（5G）阿里云盘（600G·比较大的文件）外接硬盘其他资源（不必存储：增加负担）管理文件/信息V2：Obsidian（信息图文：外接大脑
LangGraph 多智能体系统深度解析：从监督式到群体式架构实战佑瞻 LangGraph LangChain langgraph
在智能体开发过程中，我们常常会遇到这样的困境：当单个智能体需要同时处理多个领域的任务（如同时管理航班预订和酒店预订）时，其处理效率和专业性会大幅下降。是让单个智能体强行兼容多领域？还是寻找更合理的架构方案？今天我们就来聊聊LangGraph中的多智能体系统，看看如何通过分解任务到独立智能体，再组合成高效协作的系统，解决这一现实挑战。一、多智能体系统的核心概念与优势1.1为什么需要多智能体系统想象一
【功能测试02-测试计划】子善. 功能测试功能测试
测试计划主要是用来明确方向，指导测试过程。一般包含以下核心内容：【测试目的】：明确本次测试目的，明确各个模块要做的测工作和实现的功能【测试范围】：在当前敏捷开发模式下，在每个迭代的计划环节，规定测试范围能提高效率。测试的时间和资源都是有限的，所以必须明确“测什么”和“不测什么”。【测试策略】：我们后面开展测试的思路，明确“先测什么，后测什么”和“如何来测”，需要说明采用什么测试类型和测试方法，测试
如何在宝塔面板中配置SSL证书？奔跑吧邓邓子高效运维 ssl 服务器网络协议
提示：“奔跑吧邓邓子”的高效运维专栏聚焦于各类运维场景中的实际操作与问题解决。内容涵盖服务器硬件（如IBMSystem3650M5）、云服务平台（如腾讯云、华为云）、服务器软件（如Nginx、Apache、GitLab、Redis、Elasticsearch、Kubernetes、Docker等）、开发工具（如Git、HBuilder）以及网络安全（如挖矿病毒排查、SSL证书配置）等多个方面。无论
MySQL数据库段帅龙呀 Linux 数据库 mysql linux
数据库（Mysql）默认端口###port=3306数据文件默认位置/usr/local/mysql/data数据库的引擎###InnoDB存储引擎:默认引擎,最常用的。（支持事务）###查看当前默认存储引擎showvariableslike'%storage_engine%';数据库的种类###关系型数据库###非关系型数据库。sql语句#SQL（StructuredQueryLanguage即
如何进行 iOS App 混淆加固？IPA 加壳与资源保护实战流程 2501_91600747 http udp https websocket 网络安全网络协议 tcp/ip
在日常iOS开发中，应用打包完成后，如何对成品IPA文件进行安全加固，一直是很多团队关注的重点。尤其是当源码无法提供、或交付时间紧张的情况下，直接对IPA文件进行处理成为一种可行且高效的方案。以下是一套我们在实际项目中使用过的IPA级别混淆与资源保护流程，每一步都使用了不同工具协同完成，通过工具组合来覆盖各个安全角度。实战流程总览静态扫描→类与符号提取→代码混淆与重命名→资源文件处理→重签名测试工
Golang基础笔记七之指针，值类型和引用类型后端go指针引用
本文首发于公众号：Hunter后端原文链接：Golang基础笔记七之指针，值类型和引用类型本篇笔记介绍Golang里的指针，值类型与引用类型相关的概念，以下是本篇笔记目录：指针值类型与引用类型内存逃逸减少内存逃逸的几种方案1、指针在计算机内存中，每个变量都存储在特定的内存地址上，而指针是一种特殊的变量，它存储的是一个变量的内存地址。我们可以通过指针访问变量的内存地址，也可以通过指针访问或修改这个变
中小团队零成本搭建PHP任务管理系统：4大核心工具实测推荐 php
引言在现代软件开发和团队协作中，高效的任务管理系统是提升生产力的核心要素。PHP作为全球最受欢迎的服务器端编程语言之一，凭借其成熟的生态系统、丰富的框架选择和强大的社区支持，成为构建任务管理系统的理想选择。一个优秀的PHP任务管理系统不仅能够实现任务的全生命周期管理，还能通过智能化的功能提升团队协作效率，降低项目管理成本。构建这样一个系统需要考虑多个层面：从底层的数据库设计到前端的用户体验，从安全
一文读懂Kubernetes：架构、优势与应用 t0_54program 大数据与人工智能 kubernetes 架构容器个人开发
在当今的云原生计算领域，容器和Kubernetes的应用极为广泛。尽管Kubernetes是一项相对较新的技术，但众多全球企业已在生产环境中用它来管理关键业务应用程序。它之所以广受欢迎，得益于其一系列强大的功能，如增强的安全性、更出色的微服务管理能力、更高的可观测性，以及更高效的扩展和资源利用。什么是Kubernetes？Kubernetes，常简称为k8s，是谷歌实验室于2014年开发的开源容器
Oracle 进阶语法实战：从多维分析到数据清洗的深度应用(第四课) AI、少年郎 oracle 数据库
在《Oracle树形统计再进阶》(第三课)基础上，我们跳出传统SQL聚合框架，探索Oracle特有的高级语法特性，包括多维分析神器MODEL子句、数据清洗利器正则表达式、PL/SQL存储过程优化，以及基于执行计划的查询调优技巧。这些技术能解决传统方法难以处理的复杂场景，如动态列生成、不规则数据清洗、批量数据处理等。一、MODEL子句：多维数据建模与动态透视业务场景：动态生成各部门全年度各季度请假类
本地文件自动提交到仓库从未、淡定 gitee 服务端前端
背景将本地目录做一个存储仓库，将归档的文件放入其中。自动同步到远程仓库。仓库配置省略配置密钥用户可以gitpull\gitpush\gitcommit自动拉取、更新脚本文件名：autosave.sh#!/bin/zsh#设置变量LOCAL_DIR=$1#进入工作目录cd"$LOCAL_DIR"||{echo"无法进入目录$LOCAL_DIR";exit1;}#拉取代码pvsh(){gitrev-p
ARM CMSIS 资源文件下载介绍马沛茂
ARMCMSIS资源文件下载介绍【下载地址】ARMCMSIS资源文件下载介绍ARMCMSIS资源库为开发者提供了ARMCortex-M处理器系列的标准化软件接口，助力嵌入式系统开发更加高效。该库包含ARMCMSIS5.5.0和5.6.0版本的打包资源，涵盖了核心的软件接口标准，帮助开发者简化代码设计，提升开发效率与代码可重用性。无论是初学者还是经验丰富的开发者，都能通过这些资源快速构建稳定、高效的
【Go语言-Day 12】解密动态数组：深入理解 Go 切片 (Slice) 的创建与核心原理吴师兄大模型 Go 语言从入门到精通 golang 开发语言后端 go语言人工智能 LLM python
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
数字累加序列求和伊欧温 C语言刷题记录算法 c语言
题目描述求s=a+aa+aaa+aaaa+aa…a的值，其中a是一个数字，例如：2+22+222+2222+22222(此时共有5个数相加)，几个数相加由键盘控制。程序分析：关键是计算出每一项的值输入输入每一项的基础数字及相加的项数，中间用空格隔开输出输出序列和样例输入25样例输出24690源代码#includeintmain(){intsum=0;//存储结果的变量intbase,terms;/
Python数据可视化-----制作全球地震散点图从未止步.. python python json 数据结构
为了制作全球地震散点图，我在网上下载了一个数据集，其中记录了一个月内全球发生的所有地震，但这些数据是以JSON格式存储的，因此需要用json模块来进行处理。查看JSON数据：首先我们先打开下载好的数据集浏览一下：你会发现其中的数据密密麻麻，根本不是人读的，因此，接下来我们将对数据进行处理，让它变得简单易读。importjson#导入json模块，以便于加载文件中的数据filename='eq_da
数据结构循环队列C++实现只需倾听数据结构C++实现 c++数据结构
1.队列的概念队列只允许在表的一端插入，另一端删除。允许插入的一端叫做队尾，允许删除的一端叫做对首。队列的特性叫“先进先出”。和栈一样，队列的存储形式也有两种，基于数组的存储表示和基于链表的存储表示。本文先实现基于数组的存储队列，也叫顺序队列。在顺序队列中设置两个指针，front和rear，front指示队头的位置，rear指示队尾的位置（说是指针，实际仍不是c语言的指针*，而是类似下标或索引的作
力扣第88题-合并两个有序数组清风序来力扣算法(python)python 开发语言
力扣链接:88.合并两个有序数组-力扣（LeetCode）给你两个按非递减顺序排列的整数数组nums1和nums2，另有两个整数m和n，分别表示nums1和nums2中的元素数目。请你合并nums2到nums1中，使合并后的数组同样按非递减顺序排列。注意：最终，合并后数组不应由函数返回，而是存储在数组nums1中。为了应对这种情况，nums1的初始长度为m+n，其中前m个元素表示应合并的元素，后n
3258. 统计满足 K 约束的子字符串数量 I Joyner2018 python 算法 python leetcode 开发语言数据结构
高效计算满足K约束的子字符串数量：两种解法解析在字符串处理问题中，如何高效地计算满足特定条件的子字符串个数是一个常见的挑战。在本篇博客中，我们将探讨一个典型的字符串问题：给定一个二进制字符串s和一个整数k，要求我们计算所有满足如下条件的子字符串数量：子字符串中0的数量不超过k，或者子字符串中1的数量不超过k我们将展示两种不同的解法：一种是暴力解法，另一种是使用滑动窗口技术的优化解法。问题分析假设我
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置