唐名威

基于新型存储的大数据存储管理

基于新型存储的大数据存储管理

金培权1,2

1. 中国科学技术大学计算机科学与技术学院，安徽合肥 230027

2. 中国科学院电磁空间信息重点实验室，安徽合肥 230027

摘要：如何高效地存储大数据并支持实时大数据处理与分析是大数据技术发展面临的首要问题。近年来，以相变存储器、闪存等为代表的新型存储为实现高效的大数据存储和管理提供了新思路。以相变存储器为代表的存储级主存技术为切入点，针对大数据存储与管理中的高效存储、实时处理等存在的挑战，讨论了面向新型存储的大数据存储管理研究现状，并对未来基于新型存储的大数据研究进行了展望。

关键词：相变存储器；大数据管理；新型存储；存储管理

doi:10.11959/j.issn.2096-0271.2017053

论文引用格式：金培权. 基于新型存储的大数据存储管理[J]. 大数据, 2017, 3(5): 70-82.

JIN P Q. Big data storage management based on new storage[J]. Big Data Research, 2017, 3(5): 70-82.

1 引言

大数据已经成为目前的一个研究热点[1]。如何改进现有的数据存储与管理技术或者设计全新的体系结构，以满足大数据应用中的大数据量和高速数据流实时处理需求，是大数据技术中的核心问题之一。如果采用传统数据库管理系统（database management system， DBMS）的集中式数据存储方式，大数据存取性能就会受到极大的影响。Hadoop技术虽然提供了对大规模数据的快速、低成本存储和管理，但它是一个离线、批量的数据处理系统，对于实时数据处理与分析的支持较弱，难以满足许多应用的要求。例如，在城市公共安全中，通常要求能够对高达每秒几千帧的高清监控视频流进行实时处理与分析。但目前在传统计算体系结构下，单台计算机只能支持每秒150～300帧的低分辨率图像实时异常事件检测[2,3]。如果要做进一步的目标识别，根据目前的处理技术，性能将下降到每秒16帧左右[4,5]，远远不能满足每秒几千帧高清图像的实时处理要求。因此，迫切需要研究能够满足大数据高效存储与实时处理的新型体系结构与新方法。

针对大数据高效存储与管理问题，目前除了Hadoop技术之外，学术界和工业界也提出了一些其他的设计，包括以NoSQL数据库为代表的大规模分布式数据库系统设计[6]、基于动态随机存取存储器（dynamic random access memory， DRAM）的内存数据库技术[7]等。但现有的NoSQL分布式数据库技术仍以磁盘存储或者“磁盘＋闪存（flash memory）”混合存储的方式存储数据，本质上还是传统的“CPU－DRAM－二级存储”的存储架构，依然存在着内存和磁盘之间的“存储墙”问题，难以从本质上解决大数据实时存取的问题。此外，由于DRAM能耗和成本较高，也限制了其在大规模数据处理中的应用。

过去5年来，闪存作为新型存储的代表性技术取得了快速发展，对现有的数据管理技术提出了极大的挑战，同时也带来了许多新的机遇[8]。但是，闪存由于其存取方式（按页）、存取性能（1次存取通常需要约2[17个CPU时钟周期）的限制，仍适合作为二级存储器。基于闪存的数据管理只是优化了I/O延迟，并没有从本质上改变计算架构。

除了闪存之外，近年来另一种新型存储介质——相变存储器（phase change memory，PCM）引起了学术界和工业界的广泛关注[9]。与闪存相比，PCM可以被CPU直接按位存取，而且存取性能更高。因此PCM可以与DRAM一样与CPU交互。但与DRAM相比，PCM存储具有非易失性，能够进行持久的数据存储。传统硬盘基于磁性存储机理存储数据，闪存基于微型电容储存电荷的机理存储数据，存储密度都有理论上限，而PCM基于微型相变单元存储数据的机理使其能够迅速超越固态盘的存储密度，并且在未来还有更大的提升空间。IBM公司把PCM这一类具有DRAM的存取性能，同时又具有持久存储能力的介质称为存储级主存（storage class memory，SCM）[10,11]。PCM等存储级主存以其非挥发、存储速度快、易实现高密度等技术特点，在高速与海量存储方面具有巨大的潜能，已被认为是下一代非易失存储技术的发展方向。另外，因该技术兼有DRAM的高速随机访问和闪存的非易失特性，模糊了主存和外存的界限，有望突破原有的存储架构，实现更高性能的存储。

因此，如果能够利用PCM等新型存储器件设计出适合大数据存储与管理的新型存储架构（如图1所示），同时设计新的分布式多节点存储技术，则可以将大数据存取集中在DRAM和PCM上，充分发挥DRAM和PCM的高性能特性以及PCM的随机存取和非易失优点，而且可以利用分布式多节点存储的优势建立高扩展的大数据存储系统，从而有望彻底解决大数据存取中的性能与容量问题，为大规模的大数据分析与应用提供有力的支撑。

图1 引入PCM等存储级主存后的存储体系结构

目前，公共安全、智能交通、物联网等许多应用都要求实现大数据的实时存取。但是，现有的Hadoop等技术还很难达到这一目标，主要的困难在于无法提供低延迟、高吞吐的大数据实时存取能力。新型存储的出现为解决这一难题提供了可能。首先，PCM等非易失内存的出现为实现大规模的内存计算奠定了基础，使得人们有可能在内存中支持高并发的事务处理，而不需要传统DRAM导致的大量I/O操作，从而实现低延迟的大数据存取。其次，借助基于新型存储的分布式内存文件系统等技术[12]，可以大规模提升外存和内存的写吞吐速率。

本文综述了基于新型存储的大数据存储管理技术，分析了现有大数据存储技术的局限性，介绍了新型存储的特点和发展概况，总结了基于新型存储的大数据存储架构、基于新型存储的大数据存储管理等方向的研究现状，在此基础上给出了基于新型存储的大数据存储与管理的若干未来研究方向。

2 大数据存储技术

2.1 常见的大数据存储技术

目前，大数据存储一般采用分布式存储技术，主要应用在NoSQL数据库系统中。现有的主流的NoSQL数据库系统，例如文档数据库系统MongoDB、列存储数据库系统HBase[13,14]、内存数据库系统Redis等，均采用了分布式集群架构实现大数据的存储。也有一些分布式数据库系统在存储架构设计上考虑了异构存储的特性，例如RAMCloud[15]和RethinkDB，从而有效提升了系统的存取性能。

但是，现有的大数据存储技术还存在着以下的局限性[16]。

● 以NoSQL数据库为代表的大规模分布式数据库系统设计了基于磁盘存储的读写方式、索引结构、查询执行、查询优化、恢复策略，但是磁盘固有的读写性能差等弊端限制了大数据存取尤其是大数据分析性能的提升。

● 在以Hadoop分布式文件系统（Hadoop distributed file system，HDFS）为代表的大规模分布式文件系统中，虽然它们提供了大数据的存储支持能力，但由于这些文件系统在设计时并没有考虑对实时、高性能的数据处理的支持，因此无法满足日益增长的大数据在线分析的需求。此外，随着数据量的急剧增加，元数据的大小也急剧增加，传统的元数据架构、元数据备份管理、元数据动态负载均衡等越来越难适应大数据应用需求。

● 基于DRAM的内存数据管理技术旨在通过海量的内存提高大数据的处理性能。但是，由于DRAM本身能耗高、价格相对昂贵，使得构建基于大内存的大数据存储集群在环境支持、成本上存在较大的困难。此外，DRAM的掉电易失特性导致的大数据环境下的数据一致性也是一个棘手的问题。

2.2 新型存储技术

鉴于磁盘存储、内存存储在面临大数据管理与分析时的困难，学术界和工业界开始将目光转向新型存储技术。目前，从技术成熟度和应用前景上看，闪存和相变存储器最有可能形成大规模应用，因此也吸引了国内外学者的关注[8,9,16,17]。

闪存是一种可以被电子化擦除和重写的非易失性存储设备[8]。基于闪存的固态盘（solid state drive，SSD）是目前市场上常见的闪存存储设备。与传统的磁存储介质相比，闪存具有传输速率高、低延迟、低能耗、低噪音、抗震等优良特性。同时也有一些特殊性质：写前擦除，对闪存的写操作不是简单地改变某个二进制位，而是需要将整个擦除块的所有二进制位置改为1，这带来了闪存的读写不对称性，一般采用异地更新的方式缓解写前擦除带来的延迟，减少读写不对称带来的影响；寿命限制，目前企业级闪存能耐受3万次写循环，消费级闪存仅为3 000次；读写与擦除的单位不一致，一个擦除块中包含若干个闪存页，擦除的单位是一个闪存擦除块，读写的单位是闪存页。

相变存储器是一种非易失类型的存储器，由硫系玻璃材质构成[17]。由于这种材质的特质，通过施以电脉冲热，它可以在非晶态和多晶态这两种状态之间进行切换。PCM兼具速度快、耐用、非挥发性和高密度性等多种优势，其读写数据和恢复数据的速度是闪存的100倍[18]。

随着云计算和物联网等新一代信息技术的涌现，对海量存储系统的低能耗、高速及高可靠性的需求日益凸显，以新型存储取代传统存储介质的呼声越来越高，而PCM有望成为未来新型存储的主要技术。与DRAM、闪存等存储介质相比，PCM具有非易失性、存取速度快、节能、可字节寻址、写寿命长等优点[19]。韩国三星（Samsung）公司与美国美光（Micron）公司是目前在PCM技术方面较为领先的两家公司，其中三星公司开发出的65 nm制程、512 MB容量的PCM芯片已投入量产，并应用在三星公司的手机存储卡中；同时三星公司已经推出了20 nm制程、8GB容量的相变内存颗粒。美光公司已经成功研制了45 nm制程、1GB容量的LPDDR2接口的PCM芯片产品，并已经量产[20]。我国中国科学院上海微系统与信息技术研究所近年来也研制了中国自主知识产权的PCM芯片（8 MB），为研制我国自主产权的新型存储系统奠定了基础[21]。此外，华中科技大学自2007年开始研究高密度低功耗的电阻式相变存储器、相变存储器功能芯片、相变存储器芯片的关键材料以及相关专用测试设备等，已经自主研制出具有简单读、擦、写功能的相变存储器功能芯片[22]。

总体而言，传统的磁盘存储技术在大数据存储与管理方面面临着严重的性能瓶颈。内存数据管理技术由于价格、容量以及易失等特点难以作为PB级大数据存储的最终解决方案，但在大数据存储与管理中可以借鉴内存数据处理的一些思路。闪存、PCM等新型存储器件提供了高性能、非易失的数据存储支持。从目前的技术发展现状看，PCM是现有最为成熟，且性能、容量与DRAM最为接近的存储技术。PCM以其非挥发、存储速度快、易实现高密度等技术特点以及与CMOS工艺兼容性好、易于与CPU集成形成片上系统（system on chip，SoC）芯片等优点，具有广泛的应用前景。

3 大数据存储架构

新型存储的出现为构建新的大数据存储架构提供了可能。目前，学术界针对基于新型存储的大数据存储架构提出了多种设计，包括基于PCM的主存架构、基于闪存的主存扩展架构、分布式存储与缓存架构等。

3.1 基于PCM的主存架构

PCM与闪存相比，其存取延迟更短，而且可以直接按位存取，因此能够被CPU直接存取，更适合作为DRAM的扩展。与DRAM相比，PCM具有非易失性特点，因此适合存储文件等静态数据。总而言之， PCM可以看作兼有DRAM和闪存的优点。从存储架构设计的角度来看，PCM既可以作为主存使用，也可以作为外存使用。但由于PCM的可字节寻址特性（与闪存不同），目前学术界对基于PCM的主存架构研究相对较多。

在利用PCM替代DRAM方面，理论上可以有两种架构，即纯PCM主存架构和DRAM/PCM混合主存架构。在纯PCM主存架构中，PCM完全替代DRAM作为唯一的主存，而在DRAM/PCM混合主存架构中，DRAM和PCM共同作为主存。在后一种架构中，又存在着两种可能的设计：一是将DRAM作为PCM缓存的层次架构，另一种是DRAM和PCM并列的平等架构。目前，大多数的研究都假设DRAM/PCM的混合主存架构[10,11,23-25]。研究者针对DRAM/PCM的混合主存架构，提出了多种PCM写操作优化[23]以及负载均衡算法[10,11,24]。由于PCM的写次数有限制，因此如何在混合主存中减少PCM上的写操作是目前的研究重点。

基于PCM的主存架构为实现大数据的实时处理提供了可能。首先，PCM的低能耗特性使得在集群系统中使用大量的PCM存储代替DRAM成为可能，从而降低系统成本。其次，PCM的持久存储特性可以通过设计有效的算法提高分布式存储环境中的数据一致性。第三，PCM的高密度特性可以为内存计算提供有力的支持。

3.2 基于闪存的主存扩展架构

闪存是目前相对较成熟的新型存储技术。基于闪存的SSD已经大量装备在服务器上，成为企业级存储解决方案中的重要组成。由于闪存的整体存取性能优于磁盘，因此理论上可以借助闪存提升大数据存储和管理的性能。在早期的一些研究工作中，研究人员往往假设未来存储系统中闪存可以完全替代磁盘作为外存，但是，由于闪存的读写不均衡特性以及寿命问题，目前实际的系统中往往是DRAM、闪存和磁盘共存。

在DRAM、闪存、磁盘共存的存储架构下，闪存通常作为主存的扩展，即作为DRAM和磁盘之间的中间层，提升大数据存取的性能[26-28]。SSDAlloc[26]是基于闪存的主存扩展系统，它将闪存作为磁盘的缓存，实现了系统整体性能的提升。也有一些学者提出了将闪存作为虚拟内存，在DRAM容量不够的情况下，将闪存作为虚拟内存设备进行页面交换[27]。由于闪存性能总体优于磁盘，因此这种以闪存作为虚拟内存的架构理论上在大数据应用场景下性能优于传统的DRAM+磁盘的架构。

对于大数据处理而言，基于PCM的主存扩展总体上比基于闪存的主存扩展更具可行性。这是因为大容量的闪存本身仍然采用按页存取的方式，与CPU按位存取模式之间存在不一致性，而且在存取性能上PCM也高于闪存，因此更有望减小与CPU之间的性能差距，构建能够充分发挥CPU、DRAM和PCM各自优势的高性能数据处理系统。

3.3 分布式存储与缓存架构

目前，基于分布式观点的数据管理是大数据存储与管理研究中的一个热点。一种观点是将闪存应用于分布式文件系统中进行元数据存储。元数据对于整个大数据管理系统的性能起着决定性作用，对于大数据解析、大数据统计、大数据操作优化等起着重要作用。基于闪存的分布式文件系统元数据管理的基本思路是在元数据服务器（metadata server，MDS）上使用SSD作为存储设备加速文件系统，如参考文献[29]在Lustre分布式文件系统架构中的元数据服务器上使用闪存作为存储介质，加速元数据的读写速度。此外，基于Memcached的内存分布式缓存技术也被广泛用来加速大规模数据的访问，而在更为复杂的大数据环境下，其局限性主要体现在：一方面内存分布式缓存受限于集群内存容量，只能服务容量较小的热点数据，会造成性能下降；另一方面，如果采取扩大集群内存容量满足更多数据缓存需求，会带来高额的成本和巨大的能耗。现阶段解决方法是将小容量、高I/O负载的缓存处理与大容量、中低等I/O负载的缓存处理分离，形成“热缓存”与“冷缓存”的缓存策略，其中在“冷缓存”方面主要采用了闪存技术。例如，Facebook设计了基于闪存的键—值存储系统McDipper，代替Memcached为大量访问频率较低的图片提供缓存服务，降低成本和能耗，为了减少闪存I/O延迟，将闪存层分成两个区域，一个区域存放数据，另一个区域配置散列桶存放键值数据的指针，并将散列桶元数据放入内存。

分布式存储技术将是解决大数据存储与管理问题的主要途径之一。一方面是由于Hadoop分布式技术已经为现有的大数据管理提供了一种行之有效的存储方案，而且已经在Google、Facebook等公司的实际应用中得到了验证，为大数据未来研究提供了有用的借鉴；另一方面也是因为在大数据应用中数据来源、用户等本身存在天然的分布特性，适合采用分布式存储技术。

4 大数据存储管理

闪存、PCM等新型存储的物理特性、读写特性等均与磁盘有着非常显著的不同，而目前已有的大数据数据库，其设计理念均是基于磁盘存储，在面对闪存、PCM等新型存储时，并不能最大限度地发挥新型存储的性能。目前，在基于新型存储的大数据存储管理方面也有一些研究工作。

在基于PCM的存储管理方面，Ramos L E等人[30]提出了一种针对DRAM/PCM混合主存的硬件驱动的页面置换策略。该策略依赖一个内存控制器（memory controller，MC）监控内存页面的使用频率和写密集程度。MC在DRAM和PCM之间进行页面迁移，保证性能攸关的页面和频繁写的页面保存在DRAM中，而性能不太敏感以及很少写的页面存储在PCM中。Qureshi M K等人[23]提出了一个层次型混合主存系统。他们将DRAM设计为CPU和PCM之间的缓冲区。所有的数据页都存储在PCM中，只有当DRAM发生页面置换或者需要访问新的页面时系统才存取PCM。Wu Z L等人[31,32]在PCM存储管理方面也提出了动态桶列表（dynamic bucket list）以及写敏感的混合时钟存储管理方法。

索引作为优化数据存取性能的重要技术，是数据存储管理中的关键问题之一。传统的B+树索引在数据库系统和文件系统中被广泛应用，近年来在云计算[33-36]、位置服务[37,38]等应用中也有一些针对B+树的优化工作。虽然B+树具有很好的搜索性能，但它常常导致较高的更新代价。在面向闪存的数据库领域，研究人员提出了多种针对B+树的改进设计，例如µ*-Tree[39]、BF-Tree[40]、LA-Tree[41]、HashTree[42]、BloomTree[43]等。这些方法以减少对闪存的写操作为主要目标，采用了利用溢出节点延迟更新、利用额外的缓存节点的更新等方法，最终减少B+树叶节点的更新次数以及索引的合并和分裂操作。

虽然目前在基于闪存的索引设计方面已经有了不少的工作，但由于在大数据存储中引入了PCM等其他类型的新型存储介质，而且在计算架构上产生了根本性的变化（闪存定位在二级存储，而PCM则可以用于直接的内存扩展），因此，近年来研究人员也探讨了针对PCM的B+树索引优化问题。Chen S M等人[44]最早在2011年的国际创新数据库研究会议（International Conference on Innovative Database Research，CIDR）上测试了B+树在采用了PCM主存技术的服务器上的性能。其研究结果表明，当PCM技术应用到数据库服务器上后，因其具备高速随机访问特性，传统的索引技术应进行新的设计。他们在后续的工作中继续研究了针对PCM等非易失内存的B+树索引结构[45]，类似的工作还有Hu W W等人[46]提出的BP-tree、Chi P等人[47]提出的写优化B+树以及Li L等人[48]提出的面向PCM的读写趋势感知的CB+-tree索引。这些工作基本都采用了针对PCM特性优化传统的B+树的思路。

5 未来研究展望

5.1 基于新型存储的大数据存储架构

以PCM为代表的新型存储技术进一步提升了非易失存储的性能极限。PCM类似于DRAM的高速随机访问模式使其有机会直接与CPU连接，而其高密度潜力也使它能够适应大数据时代的容量需求。当存储静态数据的非易失存储允许CPU通过直接寻址的方式访问时，存储体系的进化不仅仅带来性能的大幅提升，同时还将改变应用程序访问数据的方式。由于PCM等存储级主存能够直接支持随机读写，因此可以将其与DRAM共同连接于主存控制器上，与DRAM实现统一编址，CPU可直接寻址到PCM的任何地址。

由于计算机系统的系统集成度较高、构成复杂，不易完成架构改动，因此基于新型存储的大数据存储架构可以采用嵌入式系统方式构建验证用的硬件平台，在平台上直接实现新存储架构及相应软件，从而能够准确地评估新存储架构带来的性能优势。通过搭建新型嵌入式存储架构软硬件验证平台，实现对存储系统的硬件级访问检测，为验证软件系统性能提供准确的数据。

5.2 基于新型存储的分布式内存文件系统

PCM等存储级主存的出现及应用打破了传统的硬盘驱动器（hard disk drive，HDD）/SDD＋DRAM的存储架构，为适应PCM等存储级主存PCM和DRAM共存的新存储架构，需研究新型的可支持以内存访问形式访问各种文件数据的新型文件系统。同时，由于大数据时代数据一般需要分布式存储与计算，因此在文件管理上还需要考虑对分布式环境的支持。因此，需要结合新型存储架构和分布式环境的需求，研究新型的大数据文件系统。该方向的一些研究要点包括以下几方面。

（1）支持新型存储架构的单节点文件系统

单节点文件系统是研制分布式随机访问内存文件系统的基础，具体包括新型存储架构下的文件原位访问技术、文件系统管理与控制技术、基于新型存储架构的内存管理机制等。

（2）支持新型存储架构的分布式文件系统

本地节点的数据访问仅能够提升应用程序访问本地数据时的效率。分布式存储技术可以基于新型存储架构搭建支持海量数据存储的分布式环境，从而满足大数据存储的容量需求。因此，将单节点文件系统向多节点扩充，完成支持新型存储架构的分布式内存文件系统，是实现基于新型存储的大数据存储管理的关键，研究要点包括分布式文件系统虚拟访问接口、基于统一寻址的分布式文件管理技术、存储空间的全局划分和寻址技术等。

5.3 基于新型存储的大数据管理

PCM等存储级主存给存储与计算架构带来了极大的挑战，包括异构存储上的数据分配与调整机制、异质缓存管理机制、基于新型存储的大数据索引技术等。

（1）基于新型存储架构的数据存储分配与调整机制

由于DRAM、PCM、SSD/HDD等多种存储介质同时用于数据存储，因此需要研究一种自适应的多粒度数据存储分配机制。具体而言，该机制首先根据数据访问频度将数据划分为3种状态：热（hot）、温（warm）、冷（cold），然后根据数据的状态进行存储分配与调整。所谓多粒度是指在存储分配时，同时采用文件和页两种粒度。在PCM与SSD/HDD之间进行数据分配时，PCM作为持久存储介质，采用文件粒度进行数据分配；在DRAM与SSD/HDD之间进行数据分配时，DRAM作为缓存，采用页粒度进行数据分配；在DRAM与PCM之间进行数据分配时，以键值记录粒度进行数据迁移和交换。

在数据存储调整方面，一种可能的方法是基于应用对数据的访问模式变化，自适应、动态地调整数据存储策略。访问模式的度量基于数据的访问频度以及存取方式（读/写）两类因素，通过周期性考察的方法确定当前数据访问模式的变化程度，并基于访问模式的变化程度确定是否重新执行数据存储分配。一旦确定了新的数据存储分配策略，将对相应的数据进行介质之间的迁移操作。

（2）基于新型存储架构的异质缓存管理

数据缓存是传统数据库领域中的核心技术之一，它对于提升系统存取性能有着非常重要的作用。在大数据环境下，由于数据量的急剧增加，数据缓存的重要性尤为突出，因为如果让每个应用直接在全部的大数据上运行将很难保证访问性能。目前一种普遍的观点认为，虽然大数据环境下数据量很大，但对一个具体应用而言，涉及的只是大数据集合中的一部分（小数据）。但是，在新型存储架构下，数据存储涉及了DRAM、PCM、SSD等具有完全不同访问特性的存储介质，在缓存层也同样面临着多种介质共存的局面，例如数据既可以缓存在DRAM中，也可以缓存在PCM中，甚至也可以缓存在SSD中。这类异质缓存管理问题是传统数据缓存研究中不曾面临的新问题，也是构建基于新型存储的高效大数据管理系统的关键所在，需要首先分析异质缓存管理中的普遍性问题，阐明异质缓存管理的一些新的准则，在此基础上研究新的方法。

（3）基于新型存储架构的大数据索引

在传统的基于“DRAM＋SSD/HDD”的存储架构下，DRAM与外存之间的I/O是影响系统查询处理性能的瓶颈。但在基于新型存储架构的大数据应用系统中，索引的设计不仅要考虑内外存之间的I/O代价，还要考虑异质内存之间的数据迁移代价（从DRAM到PCM以及从PCM到DRAM），此外还要考虑PCM等新型存储的器件特性（例如芯片写次数有限制）。另一方面，大数据应用系统往往构建在分布式环境之上，由于数据的分布以及涉及的数据量过大，传统的单一索引机制不能从根本上解决问题。因此，需要针对新型存储和分布式查询处理要求，设计相应的大数据索引结构以及操作算法。

6 结束语

高效的大数据存储与管理如果仅从软件体系结构考虑很难取得本质性突破，因为在大数据环境下内存与外存之间的I/O瓶颈很难克服。以PCM为代表的新型存储为大数据高效存储与实时处理提供了可能。研究适合高效大数据存储和管理的新型存储架构，借助创新的系统软件设计，改变大数据处理过程中对外存I/O的依赖，有望克服目前大数据存储与管理中的性能瓶颈，并进一步带动大数据技术的未来发展。本文讨论了新型存储的特点以及现有大数据存储技术的局限性，在此基础上综述了基于新型存储的大数据存储管理领域的研究现状，最后给出了未来研究展望，以期能对新型存储与大数据管理的未来研究提供有价值的参考。

目前，由于非易失内存技术仍处于研发阶段，工业界还没有推出真正可用的新型存储系统，因此目前的研究还只能在新型存储模拟器[49]上展开。随着非易失内存芯片工艺上的突破，预计几年内会出现可用的新型存储系统。届时，可以基于实际的平台开展理论和实验，对基于新型存储的理论研究成果进行验证。

点击下方阅读原文即可获取全文

作　者　简　介

金培权（1975-），男，博士，中国科学技术大学计算机科学与技术学院和中国科学院电磁空间信息重点实验室副教授、硕士生导师，目前主要从事大数据与数据库领域的研究工作，近年来主持了20余项科研项目，包括5项国家自然科学基金项目和2项“863”计划项目，在VLDB Journal、TKDE、TPDS、ICDE、WWW等本领域著名期刊和会议上发表论文20余篇，曾获中国科学院院长奖、NPC 2014最佳论文奖、DASFAA 2015最佳海报奖、NDBC 2012最佳论文提名奖以及NDBC 2011最佳系统演示奖。

《大数据》期刊

《大数据（Big Data Research，BDR）》双月刊是由中华人民共和国工业和信息化部主管，人民邮电出版社主办，中国计算机学会大数据专家委员会学术指导，北京信通传媒有限责任公司出版的科技期刊。

关注《大数据》期刊微信公众号，获取更多内容

你可能感兴趣的:(基于新型存储的大数据存储管理)

【go语言】Gin框架介绍和使用加油，旭杏 Go语言 gin
一、简单使用Gin框架搭建一个服务器packagemainimport("github.com/gin-gonic/gin")funcmain(){//创建一个默认的路由引擎r:=gin.Default()//GET请求方法r.GET("/hello",func(c*gin.Context){//c.JSON返回的是JSON格式的数据c.JSON(200,gin.H{"message":"hell
IPC Kit基础入门：理解HarmonyOS的进程间通信架构 SameX-4869 harmonyos 架构华为
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）的技术细节，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。在HarmonyOS应用开发中，进程间通信（IPC）是构建复杂应用架构的关键要素。IPCKit为开发者提供了强大的进程间通信能力，使不同进程之间能够高
DeepSeek 与云原生后端：AI 赋能现代应用架构一ge科研小菜菜后端人工智能后端
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注1.引言在当今快速发展的互联网时代，云原生（CloudNative）架构已成为后端开发的主流趋势。云原生后端的核心目标是利用云计算的弹性、可扩展性和高可用性，为现代应用提供稳定可靠的后端支持。而人工智能（AI）技术的发展，使得智能化成为云原生后端的新趋势。DeepSeek作为新一代AI技术，在云原生后端的自动化运维、智能资源调度、安全增强和高效数
【数据结构】栈和队列加油，旭杏数据结构 java 开发语言
一、栈1.1栈的概念以及结构栈：一种特殊的线性表，其只允许在固定的一端进行插入和删除元素的操作，进行数据插入和删除操作的一端称为栈顶，另一端称为栈底。栈中的数据元素遵守后进先出的原则。压栈：栈的插入操作叫做进栈/压栈/入栈，入数据在栈顶出栈：栈的删除操作叫做出栈，出数据在栈顶1.2栈的实现栈的实现一般可以使用数组或者链表实现，相对而言数组的结构实现更加优一些，因为数组在尾上插入数据的代价比较小。二
javaweb中@Component和@Mapper和@Service和@RestController这几个注解要加在哪?为什么? 瑞金彭于晏 maven java spring boot spring
在JavaWeb开发中特别是在使用Spring框架（包括SpringBoot）时，@Component、@Mapper、@Service、@RestController这些注解扮演着非常重要的角色，它们用于定义组件的类型，并帮助Spring框架进行自动装配和依赖注入。下面分别解释这些注解应该加在哪里以及为什么：1.@Component加在哪里：@Component可以加在任何类上，表示这个类是一个
HarmonyOS NEXT开发实战：短信服务我很英俊小名男男 OpenHarmony HarmonyOS 鸿蒙开发 harmonyos 华为前端开发语言鸿蒙移动开发鸿蒙系统
鸿蒙开发实战往期文章必看：HarmonyOSNEXT应用开发性能实践总结一分钟了解”纯血版！鸿蒙HarmonyOSNext应用开发！“非常详细的”鸿蒙Har
Java Stream 去重的多种方法坎布里奇 java java python 开发语言
在JavaStream中实现去重有多种方法，具体取决于需求和场景。以下是常见的几种方法及示例：1.使用distinct()方法适用于对象已正确实现equals()和hashCode()，基于对象整体去重并保留顺序：ListuniquePersons=persons.stream().distinct().collect(Collectors.toList());2.根据对象的属性去重方法一：使用C
HarmonyOS NEXT开发笔记：@Computed装饰器计算属性我很英俊小名男男 OpenHarmony 鸿蒙开发 HarmonyOS harmonyos 华为开发语言前端鸿蒙移动开发鸿蒙系统
鸿蒙开发往期必看：一分钟了解”纯血版！鸿蒙HarmonyOSNext应用开发！“非常详细的”鸿蒙HarmonyOSNext应用开发学习路线！（从零基础入门到精通）
java数组 TwitCoder java 算法
目录一、数组概念二、数组的声明与初始化三、数组操作示例四、数组属性与注意事项五、内存结构分析六、常见操作七、二维数组八、稀疏数组一、数组概念数组是Java中用于存储相同类型数据的有序集合，具有以下特性：类型一致性：所有元素必须属于同一数据类型有序性：元素按顺序排列，通过索引访问长度固定：创建后无法改变容量二、数组的声明与初始化声明数组//推荐写法int[]numbers;初始化方式：动态初始化nu
R语言使用table1包绘制（生成）三线表实战：单变量分列构建三线表、编写自定义函数在三线表中添加p值 statistics.insight R语言入门课 r语言数据挖掘机器学习
R语言使用table1包绘制（生成）三线表实战：单变量分列构建三线表、编写自定义函数在三线表中添加p值目录R语言使用table1包绘制（生成）三线表、使用单变量分列构建三线表、编写自定义函数在三线表中添加p值#三线表是什么？#导入包并构建仿真数据#R语言使用table1包绘制（生成）三线表、使用单变量分列构建三线表、编写自定义函数在三线表中添加p值#三线表是什么？三线表本来是微软公司的word编辑
【Attention】SEAttention shanks66 Attention 各种深度学习模块人工智能深度学习 python
SEAttention摘要卷积神经网络（CNNs）的核心构建模块是卷积算子，它使网络能够通过在每一层的局部感受野内融合空间和通道信息来构建有价值的特征。此前大量研究聚焦于这种关系中的空间成分，试图通过在整个特征层级中提升空间编码质量来增强CNN的表征能力。在这项工作中，我们将重点放在通道关系上，并提出一种新颖的架构单元，称为“挤压与激励”（Squeeze-and-Excitation，简称SE）模
算法学习之路——贪心算法蒋楠鑫算法算法贪心算法
文章目录一、前言二、什么是算法三、什么是贪心算法1.含义2.基本思路3.适用场景四、代码实现五、经典例题分析六、总结一、前言先来看一道简单的数学问题：小明有30元钱，每瓶酒要5元钱，每3个空瓶子可以换1瓶酒，请问小明最多可以喝到多少瓶酒？这道题目显然是一道求最优解的问题，由于数据量小我们可以用最简单最直接的枚举法来解决，但是如果将题目泛化一下呢：小明现在购买了m瓶酒，每n个空瓶子可以换1瓶酒，请问
python网格插值站点_在python中，在二维零网格上两点之间插值一条值线 weixin_39965490 python网格插值站点
TLDR:在2dnumpy数组中找到2个点后，如何在0数组中在它们之间插值一条1行？在上下文：目前我正在尝试从二值化的医学图像数据(0和1)对一个3d数组执行2d操作。最终目标是在填充体素/像素(即第一个和最后一个实例)的起点和终点之间添加一条1s的线。在为此，我使用SimpleITK分割一行，然后将其转换为numpy数组。在其他示例之后，我编写了返回一组数组的函数，这些数组显示填充(1)个像素和
python 网格数据插值_python – 网格数据的快速插值 weixin_39747399 python 网格数据插值
当然！有两个选项可以做不同的事情，但是既能利用原始数据的定期网格性质。第一个是scipy.ndimage.zoom.如果你只想通过内插原始数据生成一个更加密集的规则网格，那就是要走的路。第二个是scipy.ndimage.map_coordinates.如果你想在你的数据中插入一些(或许多)任意点，但仍然利用原始数据的定期网格性质(例如，不需要四叉树)，那就是去的方式。作为一个快速示例(这将使用三
springboot是如何在没有web.xml的情况下在外部tomcat启动的菜鸟王老汉 spring
最近在公司部署测试环境的时候遇到了问题，本地用springboot内嵌tomcat启动没有问题，部署到测试环境的外部tomcat就不加载，在咨询了同事之后在启动类上继承了SpringBootServletInitializer之后就没有了问题，但并没有深入去想。由于servlet的规范是要配置web.xml的，包括Struts2和spring都是要在web.xml配置的，有一天在服务器上看编译后的
PySpark安装及WordCount实现（基于Ubuntu） uui1885478445 ubuntu linux 运维
在Ubuntu上安装PySpark并实现WordCount，需要以下步骤：安装PySpark：安装Java：PySpark需要Java运行环境。你可以使用以下命令安装OpenJDK：sudoaptupdatesudoaptinstalldefault-jredefault-jdk安装Scala：PySpark还需要Scala，可以使用以下命令安装：sudoaptinstallscala安装Pyth
CMake 保姆级教程爱吃巧克力的程序媛 CMake c++
CMake是一个跨平台的构建工具，用于生成适合不同平台和编译器的构建系统文件（如Makefile或VisualStudio项目文件）。在Windows下使用CMake构建项目时，CMake会根据CMakeLists.txt文件生成适合Windows的构建系统文件（如VisualStudio项目文件）。以下是Windows下使用CMake的基本规则和步骤：https://subingwen.cn/c
Mybatis传递多个不同类型的参数我的身前一尺是我的世界 Mybatis传递多个参数
一、同时传递List和String实现类@OverridepublicListfun(StringshopId,Listlist){Mapmap=newHashMap();map.put("shopId",shopId);map.put("list",list);ListlistCommodity=appCommodityMapper.fun(map);returnlistCommodity;}m
地理数据中的分辨率转换木叶清风666 地理信息数据处理 matlab python 开发语言
数据分辨率问题气象海洋数据在实际应用中，常常涉及到重采样，即分辨率的提高或降低等操作。本文提供了matlab以及python的样例程序，以降低（网格平均）或提高（线性插值）数据的分辨率。1.高分辨率——>低分辨率可以使用循环逐个网格进行操作,但循环次数过多,存在效率低下的问题。%---需要的分辨率0.25°,以及经纬度网格点deg=0.25;lat_era=16:deg:47.75;lon_era
学习SpringBoot过程中常见问题汇总及多工程项目使用 IntelliJ IDEA 打开 KunQian_smile springBoot
一：SpringBoot:redisClientine.test.serviceImpl.RedisServiceImplrequiredabeanoftype‘com.examp1:没有自动注入导致。service类上面没有@service注解或者mapper上没有@Repository注解，但是这种情况比较少见，一般不会忘记。2:配置了mybatis，但没有指定扫描的包。（1）直接在生成出来的
Spring Data JDBC 详解 m0_74823933 面试学习路线阿里巴巴 spring java 数据库
目录一、JPA背景?二、SpringBoot整合SpringdataJDBC??1.配置数据源?2.配置Druid的admin后台??3.Spring-data-jdbc常用接口查询策略1)?CrudRepository增删改查2)PagingAndSortingRepository分页排序一、JPA背景早期的JPA的特性是懒加载和关联查询，一下能查出所有的关联信息，但我们开发者在查询SQL的时候
SpringBoot中Server层以及Mapper层常用注解 π大星的日常 java java-rabbitmq
最近看了一下SpringBoot2的课程，发现好多的注解并不是很了解，只是简单的会用，但是真是发生的作用却不知道，最近花了一些时间把这些注解进行了一下整理，针对不同的层级进行了细致的划分，最近几天会依次给大家更新关于注解的内容，对大家有帮助的话点赞支持一下哦！4.Service层注解@Service注解一般写在业务层的接口实现类上，而不是接口上。4.1@Service@Service:@Servi
HarmonyOS NEXT开发实战：Navigation页面跳转对象传递案例一晃有一秋鸿蒙实例鸿蒙 harmonyos 华为鸿蒙鸿蒙系统 android
介绍本示例主要介绍在使用Navigation实现页面跳转时，如何在跳转页面得到转入页面传的类对象的方法。实现过程中使用了第三方插件class-transformer，传递对象经过该插件的plainToClass方法转换后可以直接调用对象的方法，效果图预览使用说明从首页进入本页面时，会传递一个类对象UserBookingInfo。点击“换个座位”按钮会调用该类对象的generateRandSeatN
HarmonyOS NEXT开发实战：视频全屏切换案例一晃有一秋鸿蒙鸿蒙实例 harmonyos 华为鸿蒙鸿蒙系统 android 音视频
介绍本示例介绍了@ohos.multimedia.media组件和@ohos.window接口实现媒体全屏的功能。该场景多用于首页瀑布流媒体播放等。效果图预览使用说明：点击全屏按钮，横屏媒体窗口。点击恢复窗口按钮，恢复媒体窗口。实现步骤初始化@ohos.multimedia.media的AVPlayer。asyncInit():Promise{awaitthis.release();constco
【C++游戏开发】零基础手写完整飞机大战游戏（基于EasyX图形库/详细注释/源码分享）小乌龟登顶记 stm32 单片机嵌入式硬件
一、开发环境与资源准备1.1环境要求VisualStudio2019+（推荐2022）EasyX图形库（官网下载适配VS版本）WindowsSDK（安装VS时勾选）1.2资源文件在项目目录创建res文件夹，存放以下素材（素材自备）：plane.png玩家飞机（50x50）enemy.png敌机（50x50）bullet.png子弹（10x20）bg.jpg滚动背景（600x700）boom.wav
AI 大模型应用数据中心建设：高性能计算与存储架构 AI智能涌现深度研究 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
AI大模型、数据中心、高性能计算、存储架构、分布式训练、GPU加速、数据管理1.背景介绍近年来，人工智能（AI）技术取得了飞速发展，特别是深度学习模型的突破性进展，催生了一系列基于大规模数据训练的强大AI模型，例如GPT-3、BERT、DALL-E等。这些AI大模型在自然语言处理、计算机视觉、语音识别等领域展现出强大的应用潜力，但也对计算资源和数据存储提出了极高的要求。传统的计算架构难以满足AI大
解决注入mapper报红的问题 Jyannis spring Spring Boot spring mybatis spring boot java bean
在spring系列集成mybatis时，我们经常遇到这样的问题：明明注入没有问题，但是intellijidea会报红。这是因为我们没有手动在代码里把mapper接口注入spring容器中，而@Autowired注入方式默认要求注入的对象必须是在spring容器中存在的。所以idea认为这里的userMapper不存在，而用户（我们）选择注入，是一种错误操作，就报红。那么怎么解决这个问题呢？以下提供
[QMT量化交易小白入门]-二十二、deepseek+cline+vscode,让小白使用miniQMT量化交易成为可能 python自动化工具 QMT量化交易小白入门 vscode ide 编辑器
本专栏主要是介绍QMT的基础用法，常见函数，写策略的方法，也会分享一些量化交易的思路，大概会写100篇左右。QMT的相关资料较少，在使用过程中不断的摸索，遇到了一些问题，记录下来和大家一起沟通，共同进步，自己淋过雨了，希望大家都有一把伞。文章目录相关阅读DeepSeek新用户注册cline集成指令测试相关阅读小白也能做量化：零门槛QMT、Ptrade免费送量化交易入门：如何在QMT中配置Pytho
Storyboard 之segue用法总结月未央 iOS学习总结 iOS
Storyboard的好玩之处在于它可以帮我们省略了很多要手动写的代码，其中segue的功劳功不可没，现总结一下学习心得，若有错误之处，望指正。创建工程，选择SingleViewApplication，给工程起个名字，这里是SegueDemo，注意要把下面的UseStoryboard选项勾选上，我使用ARC，这里可以随意。点选工程文件中的MainStoryboard.storyboard文件，可以
ubuntu 24.10安装mysql linuxxx110 ubuntu mysql
1.更新软件包列表在安装MySQL之前，先更新系统的软件包列表sudoaptupdate2、安装MySQL服务器sudoaptinstallmysql-server3.启动MySQL服务sudosystemctlstatusmysql4、运行安全脚本MySQL提供了一个安全脚本，用于设置root密码、移除匿名用户、禁止远程root登录等。运行以下命令sudomysql_secure_install
java观察者模式 3213213333332132 java 设计模式游戏观察者模式
观察者模式——顾名思义，就是一个对象观察另一个对象，当被观察的对象发生变化时，观察者也会跟着变化。在日常中，我们配java环境变量时，设置一个JAVAHOME变量,这就是被观察者，使用了JAVAHOME变量的对象都是观察者，一旦JAVAHOME的路径改动，其他的也会跟着改动。这样的例子很多，我想用小时候玩的老鹰捉小鸡游戏来简单的描绘观察者模式。老鹰会变成观察者，母鸡和小鸡是
TFS RESTful API 模拟上传测试 ronin47
TFS RESTful API 模拟上传测试。　　细节参看这里：https://github.com/alibaba/nginx-tfs/blob/master/TFS_RESTful_API.markdown 模拟POST上传一个图片： curl --data-binary @/opt/tfs.png http
PHP常用设计模式单例, 工厂, 观察者, 责任链, 装饰, 策略,适配,桥接模式 dcj3sjt126com 设计模式 PHP
// 多态, 在JAVA中是这样用的, 其实在PHP当中可以自然消除, 因为参数是动态的, 你传什么过来都可以, 不限制类型, 直接调用类的方法 abstract class Tiger { public abstract function climb(); } class XTiger extends Tiger { public function climb()
hibernate 171815164 Hibernate
main,save Configuration conf =new Configuration().configure(); SessionFactory sf=conf.buildSessionFactory(); Session sess=sf.openSession(); Transaction tx=sess.beginTransaction(); News a=new
Ant实例分析 g21121 ant
下面是一个Ant构建文件的实例，通过这个实例我们可以很清楚的理顺构建一个项目的顺序及依赖关系，从而编写出更加合理的构建文件。下面是build.xml的代码： <?xml version="1
[简单]工作记录_接口返回405原因 53873039oycg 工作
最近调接口时候一直报错，错误信息是: responseCode:405 responseMsg:Method Not Allowed 接口请求方式Post.
关于java.lang.ClassNotFoundException 和 java.lang.NoClassDefFoundError 的区别程序员是怎么炼成的
真正完成类的加载工作是通过调用 defineClass来实现的；而启动类的加载过程是通过调用 loadClass来实现的；就是类加载器分为加载和定义 protected Class<?> findClass(String name) throws ClassNotFoundExcept
JDBC学习笔记-JDBC详细的操作流程 aijuans jdbc
所有的JDBC应用程序都具有下面的基本流程：　　1、加载数据库驱动并建立到数据库的连接。　　2、执行SQL语句。　　3、处理结果。　　4、从数据库断开连接释放资源。下面我们就来仔细看一看每一个步骤：其实按照上面所说每个阶段都可得单独拿出来写成一个独立的类方法文件。共别的应用来调用。 1、加载数据库驱动并建立到数据库的连接： Html代码 St
rome创建rss antonyup_2006 tomcat cms xml struts Opera
引用 1.RSS标准 RSS标准比较混乱，主要有以下3个系列 RSS 0.9x / 2.0 : RSS技术诞生于1999年的网景公司(Netscape)，其发布了一个0.9版本的规范。2001年，RSS技术标准的发展工作被Userland Software公司的戴夫温那(Dave Winer)所接手。陆续发布了0.9x的系列版本。当W3C小组发布RSS 1.0后，Dave W
html表格和表单基础百合不是茶 html 表格表单 meta 锚点
第一次用html来写东西,感觉压力山大,每次看见别人发的都是比较牛逼的再看看自己什么都还不会, html是一种标记语言,其实很简单都是固定的格式 _----------------------------------------表格和表单表格是html的重要组成部分,表格用在body里面的主要用法如下; <table> &
ibatis如何传入完整的sql语句 bijian1013 java sql ibatis
ibatis如何传入完整的sql语句？进一步说，String str ="select * from test_table"，我想把str传入ibatis中执行，是传递整条sql语句。解决办法： <
精通Oracle10编程SQL(14)开发动态SQL bijian1013 oracle 数据库 plsql
/* *开发动态SQL */ --使用EXECUTE IMMEDIATE处理DDL操作 CREATE OR REPLACE PROCEDURE drop_table(table_name varchar2) is sql_statement varchar2(100); begin sql_statement:='DROP TABLE '||table_name;
【Linux命令】Linux工作中常用命令 bit1129 linux命令
不断的总结工作中常用的Linux命令 1.查看端口被哪个进程占用通过这个命令可以得到占用8085端口的进程号，然后通过ps -ef|grep 进程号得到进程的详细信息 netstat -anp | grep 8085 察看进程ID对应的进程占用的端口号 netstat -anp | grep 进程ID &
优秀网站和文档收集白糖_ 网站
集成 Flex, Spring, Hibernate 构建应用程序性能测试工具-JMeter Hmtl5-IOCN网站 Oracle精简版教程网站鸟哥的linux私房菜 Jetty中文文档 50个jquery必备代码片段 swfobject.js检测flash版本号工具
angular.extend boyitech AngularJS angular.extend AngularJS API
angular.extend 复制src对象中的属性去dst对象中. 支持多个src对象. 如果你不想改变一个对象，你可以把dst设为空对象{}: var object = angular.extend({}, object1, object2). 注意: angular.extend不支持递归复制. 使用方法: angular.extend(dst, src); 参数:
java-谷歌面试题-设计方便提取中数的数据结构 bylijinnan java
网上找了一下这道题的解答，但都是提供思路，没有提供具体实现。其中使用大小堆这个思路看似简单，但实现起来要考虑很多。以下分别用排序数组和大小堆来实现。使用大小堆： import java.util.Arrays; public class MedianInHeap { /** * 题目：设计方便提取中数的数据结构 * 设计一个数据结构，其中包含两个函数，1.插
ajaxFileUpload 针对 ie jquery 1.7+不能使用问题修复版本 Chen.H ajaxFileUpload ie6 ie7 ie8 ie9
jQuery.extend({ handleError: function( s, xhr, status, e ) { // If a local callback was specified, fire it if ( s.error ) { s.error.call( s.context || s, xhr, status, e ); }
[机器人制造原则]机器人的电池和存储器必须可以替换 comsci 制造
机器人的身体随时随地可能被外来力量所破坏,但是如果机器人的存储器和电池可以更换,那么这个机器人的思维和记忆力就可以保存下来,即使身体受到伤害,在把存储器取下来安装到一个新的身体上之后,原有的性格和能力都可以继续维持..... 另外,如果一
Oracle Multitable INSERT 的用法 daizj oracle
转载Oracle笔记-Multitable INSERT 的用法 http://blog.chinaunix.net/uid-8504518-id-3310531.html 一、Insert基础用法语法： Insert Into 表名 (字段1,字段2,字段3...） Values (值1,
专访黑客历史学家George Dyson datamachine on
20世纪最具威力的两项发明——核弹和计算机出自同一时代、同一群年青人。可是，与大名鼎鼎的曼哈顿计划（第二次世界大战中美国原子弹研究计划）相比，计算机的起源显得默默无闻。出身计算机世家的历史学家George Dyson在其新书《图灵大教堂》（Turing’s Cathedral）中讲述了阿兰·图灵、约翰·冯·诺依曼等一帮子天才小子创造计算机及预见计算机未来
小学6年级英语单词背诵第一课 dcj3sjt126com english word
always 总是 rice 水稻，米饭 before 在...之前 live 生活，居住 usual 通常的 early 早的 begin 开始 month 月份 year 年 last 最后的 east 东方的 high 高的 far 远的 window 窗户 world 世界 than 比...更
在线IT教育和在线IT高端教育 dcj3sjt126com 教育
codecademy http://www.codecademy.com codeschool https://www.codeschool.com teamtreehouse http://teamtreehouse.com lynda http://www.lynda.com/ Coursera https://www.coursera.
Struts2 xml校验框架所定义的校验文件蕃薯耀 Struts2 xml校验 Struts2 xml校验框架 Struts2校验
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 15:54:59 星期六 http://fa
mac下安装rar和unrar命令 hanqunfeng mac
1.下载：http://www.rarlab.com/download.htm 选择 RAR 5.21 for Mac OS X 2.解压下载后的文件 tar -zxvf rarosx-5.2.1.tar 3.cd rar sudo install -c -o $USER unrar /bin #输入当前用户登录密码 sudo install -c -o $USER rar
三种将list转换为map的方法 jackyrong list
在本文中，介绍三种将list转换为map的方法： 1）传统方法假设有某个类如下 class Movie { private Integer rank; private String description; public Movie(Integer rank, String des
年轻程序员需要学习的5大经验 lampcy 工作 PHP 程序员
在过去的7年半时间里，我带过的软件实习生超过一打，也看到过数以百计的学生和毕业生的档案。我发现很多事情他们都需要学习。或许你会说，我说的不就是某种特定的技术、算法、数学，或者其他特定形式的知识吗？没错，这的确是需要学习的，但却并不是最重要的事情。他们需要学习的最重要的东西是“自我规范”。这些规范就是：尽可能地写出最简洁的代码；如果代码后期会因为改动而变得凌乱不堪就得重构；尽量删除没用的代码，并添加
评“女孩遭野蛮引产致终身不育 60万赔偿款1分未得”医腐深入骨髓 nannan408
先来看南方网的一则报道：再正常不过的结婚、生子，对于29岁的郑畅来说，却是一个永远也无法实现的梦想。从2010年到2015年，从24岁到29岁，一张张新旧不一的诊断书记录了她病情的同时，也清晰地记下了她人生的悲哀。　　粗暴手术让人发寒　　2010年7月，在酒店做服务员的郑畅发现自己怀孕了，可男朋友却联系不上。在没有和家人商量的情况下，她决定堕胎。　　12月5日，
使用jQuery为input输入框绑定回车键事件 VS 为a标签绑定click事件 Everyday都不同 jsp input 回车键绑定 click enter
假设如题所示的事件为同一个，必须先把该js函数抽离出来，该函数定义了监听的处理： function search() { //监听函数略...... } 为input框绑定回车事件，当用户在文本框中输入搜索关键字时，按回车键，即可触发search(): //回车绑定 $(".search").keydown(fun
EXT学习记录 tntxia ext
1. 准备（1）官网：http://www.sencha.com/ 里面有源代码和API文档下载。 EXT的域名已经从www.extjs.com改成了www.sencha.com ，但extjs这个域名会自动转到sencha上。（2）帮助文档：想要查看EXT的官方文档的话，可以去这里h
mybatis3的mapper文件报Referenced file contains errors xingguangsixian mybatis
最近使用mybatis.3.1.0时无意中碰到一个问题： The errors below were detected when validating the file "mybatis-3-mapper.dtd" via the file "account-mapper.xml". In most cases these errors can be d