移动互联网、物联网、云计算、电子商务、商业智能、信息搜索、社会化网络,......,IT领域从来都不缺乏热门技术趋势和商业噱头。这可苦了我等IT人,毕竟时间和精力是很有限的,我们需要选择一两个方向作为自己的职业或事业目标,所谓术业有专攻,选对了方向有可能事半功倍。我在这里给力地推荐存储行业,一个非常有潜力的领域,它是网络技术后的又一个技术浪潮。推荐理由呢?其一,物质、能量和信息是自然科学研究的三个基本对象,处理、传输和存储是信息计算的三大基本任务。信息存储成为技术浪潮可以说是一种必然。其二,事实上,数据已经取代计算成为了信息计算的中心。信息量呈现爆炸式增长趋势,根据预测,2020年数据宇宙将达到35.2 ZB,相比2009年增加44倍,而这其中80%以上为非结构化数据。实际需求对存储的要求为断提高,主要表现在超大存储容量、高性能、可扩展性、高安全性、高可用性、高可管理性等方面。其三,存储发展势头迅猛,未来市场空间巨大,新技术层出不穷,热门技术词儿包括PCIe3.0, FCOE, iSCSI, 10GbE, SSD, pNFS(NFSv4.1), NoSQL, 文件系统, 集群存储, 云存储, 高效存储(压缩、重复数据删除、自动精简配置、分层存储、虚拟化), 智能存储, 绿色存储, 数据容错技术, 数据安全。
对于想转入存储行业的同学来说,存储的基础知识是学习的必修课。而对于已经处于存储行业的同学来说,要想进阶就得不断地学习、思考和实践,并且紧密关注和跟踪存储技术的最新发展动态。无论是学习打基础,还是研究实践进阶,最直接的就是来自知识和经验的传播和交流,这方面的来源包括图书、行业和学术会议、网站和论坛以及开放源码等。图书的知识更为系统全面和专业,泛盖基础入门级别和研究进阶级别,手上应该常备几本经典存储图书以便随时学习和查阅。存储行业会议通常会报告和分享大量的最新存储事件、技术发展状态以及最新研究成果,有机会亲身参加这些会议自然最好,不能参会的可以下载Slides和Papers进行学习和研究,都能够了解和跟踪存储的最新前沿发展。我们有幸处于一个好的时代,互联网的资源最为丰富和便捷,专业存储网站提供最新的业界信息,技术牛人会经常在博客上发表技术文章,论坛是各路技术达人进行技术讨论和交流的好地方。开源社区有大量的开放源码可供阅读、测试和使用,如果有时间和精力的话,还是尽量多看看源码,自己也可以动手写点开源软件,实践之外可以为开源贡献一点微薄之力。这里给大家推荐一些存储学习的相关资源,并作扼要的个人点评,希望对存储行业志同道合的朋友有些许帮助,如有不当还请指正。
[存储图书]
WatchStor搞了个存储精品图书展览,推荐的存储图书比较中肯,详情请参见http://tech.watchstor.com/spec/watchstor。下面的几本存储图书我基本都研读过,简要说说我的体会。
成就存储专家之路,存储基础知识、存储市场前景和技术趋势两部分内容可圈可点,为初学者提供了从入门到精通、成就存储专家的职业规划与培训认证的建议。另外,对主流存储厂商及其存储产品、不同行业的存储需求与规划、行业存储解决方案及应用和存储架构的介绍和分析非常透彻和到位,对中高级读者非常有价值。这本书已经读过多次,并且经常翻阅。
大话存储,这本书在行文上颇具特色,其作者冬瓜头常年混迹在各大存储论坛,近期时而出没在弯曲评论。此书知识面比较全面,广度有余但深度不是很够,不过对于初学者作为入门学习还是绰绰有余的。大话存储2将于2011.3出版,传说深度加强很多,甚至达到代码实现的级别和粒度,即时一定买本学习一下。
网络存储技术导论|网络存储技术,这两本中规中矩,作为入门级网络存储学习也都是不错的选择,作为高校的教科书非常合适。
信息存储与管理,EMC出版的技术图书,所涵盖的概念、原理和方案部署理念贯穿了整个信息存储和管理技术的范畴。EMC在存储界地位很重要,是很多存储标准和协议的主要制定者和参与者。因此,该书中介绍的术语、概念、标准、技术都是标准规范的,与工业界一致的,阐述精辟到位,是非常难得的一本存储好书。一点不足之处,书中案例都是EMC的存储产品。
数据重现,是大话存储的姐妹篇,对主流文件系统的原理和数据恢复技术进行了详解,详细程度是绝无仅有的。这本书行文严谨专业,风格与大话存储迥然不同,我同时购买了这两本书。
基于对象的网络存储,深入论述了对象网络存储的协议标准SCSI和iSCSI以及相关文件系统,诸如pNFS, Lustre, PanFS, zFS, OBFS等,是本好书。
海量网络存储系统原理与设计,分专题介绍了RAID, 对象存储系统, 大规模网络存储系统, 可用性、安全性研究, CDP以及数据备份等课题。它的最大特点是不仅讨论基本原理和概念、当前的国内外状况、设计和评价方法,还会给出一些具体的设计优化和实现方案的实例,对于研发人员非常有参考意义,这本书我从中受益颇多。
数据存储备份与灾难恢复,从事数据保护相关工作人同学们可以多看看。数据备份、归档、容灾在存储软件市场中占的比率最大,其他存储同学看看也是没有坏处的。
SAN存储区域网络|IPSAN权威指南,这是SAN和IPSAN方面的两本权威图书,致力与存储网络研究和开发的同学可以深入学习一下。顺便提一下,前一本书的译者是我以前研究所的老师。
[存储行业会议]
SNIA(Storavcbe Netwokring Industry Association)即存储网络工业协会,目前会员几乎包括了主流的存储厂商。它每年组织的Storage Developer Conference规模非常大,吸引了众多工业厂商和学术研究机构参加,影响非常广泛。另外,它还会定期组织SNIA Tutorials,这也是非常有用的存储学习材料。SNIA的SDC会议资料和Tutorials资料我基本都会下载下来学习和研究,并且重点研究自己感兴趣的方向。它的资料均会公开免费下载,可以从下面URL获取:
http://www.snia.org/events/storage-developer2010/presentations
http://www.snia.org/events/storage-developer2009/presentations
http://www.snia.org/events/storage-developer2008/presentations
(今后或更早的下载地址,你懂的!)
http://www.snia.org/education/tutorials
Storage-Academy是SNIA的下属机构,对这个会议我以前了解较少,还是看了crquan老大在Tektalk上发表的文章才了解的,后面下载了2010会议资料,感觉总体上和SNIA差不多。据这个会议可以申请免费参会,大家可以试试。
http://www.storage-academy.com/
http://www.storage-academy.com/presentations/sg/ (密码是sgdel10,crquan提供的,运气不错的话的应该还有效)
Linux Storage & Filesystem workshop, 读研时经常研读该会议的论文, USENIX大家应该比较熟悉吧,LSF以前一直是由其举办的,2009年之后转由Linux Foundation 举办。LSF偏学术研究,主要涉及Linux系统上的存储技术和文件系统,相对来说比较适合在读的同学,学术科研界存储前沿信息比较充足。值得称道的是,所有资料都是免费下载的,而且是永久存档的。
http://www.usenix.org/event/lsf08/tech/
http://www.usenix.org/event/lsf07/tech/
http://events.linuxfoundation.org/events/lsf-summit
Usenix FAST(Conference on File and Storage Technologies)即文件与存储技术会议,FAST可能是存储领域最好的专业会议,该会议只针对存储相关的内容,属于本领域最顶级的会议。它与LSF一样属于学院派风格,充满学术研究气氛。会上的模型、算法、理论等ideas很多,但大多仅限于学术理论研究,没有原型系统实现更别说工业级产品转化。FAST学术研究价值非常高,值得各位同学学习和研究。
http://www.usenix.org/events/fast/
IEEE Storage Conference,大名鼎鼎的IEEE相信大家都不陌生,它的历史非常悠久(1974年就有举办),在业务影响力很大,主要关注高性能计算领域的海量存储技术。它的参会费用高,资料也不大容易免费获取到。以前在研究所时,倒是可以免费下载部分论文资料,现在只是偶尔从网上搜索到相关资料。如果条件允许的话,推荐各位同学多关注它。
http://storageconference.org/
系统架构师大会|WEB性能与运维大会,这两个国内会议都不是专业的存储行业会议。然而近两年互联网行业发展迅猛,这方面的存储需求很大而且与传统存储有很大区别,比如小图片存储、VOD存储、CDN存储以及NoSQL等,包括结构化和非结构化的数据存储。这些会议上互联网和存储厂商会分享大量在存储方面新的尝试和经验,涉及架构、算法、开发、测试与运维等。参会费用较低,如果公司是赞助商,会有一定的免费参会名额;会议大多在北京、上海召开,这两城市是IT人员的聚集地,参会很方便。如果有条件推荐大家亲身参加,交流和经验会少走很多弯路。
http://sacc.it168.com/index.html
http://velocity.oreilly.com.cn/index.php?func=schedule&page=2010-12-07
[存储网站论坛]
InfoStor: http://www.infostor.com
InfoStor杂志主办的专业存储信息网站,发布存储工业界新闻和分析、专家博客和存储Whitepapers。信息量非常大,影响也较大,基本涵盖存储的所有领域,重点内容包括NAS, SAN, 存储管理, 数据保护RAID, 归档等。我的很多存储业内消息最初都是由它获取的,我加入了其邮件列表,基本上每天都会收到邮件并看上几篇文章。
DoStor: http://www.dostor.com/
DOIT论坛: http://bbs.doit.com.cn
WatchStor: http://www.watchstor.com/
WatchStor论坛: http://bbs.watchstor.com/
这是国内比较有名的两家存储专业媒体以及它们的存储论坛,信息量也非常丰富,很多信息主要源自InfoStor等国外站点,非常适合国内存储人士。它们的论坛和博客还是很有人气的,经常有大牛和专家出没发表评论和交流技术问题。
ChinaUnix存储备份论坛: http://bbs.chinaunix.net/forum-34-1.html
CU存储论坛是个卧虎藏龙之所,聚集了一大批Linux资深人士和存储业内人士,包括存储厂商内部人员及软文写手、存储销售和代理、存储系统管理员、存储开发人员以及存储专家,人气非常给力,讨论和交流的技术问题以存储为主但不限于此。如果有存储问题咨询或者相关技术交流,极力推荐到此一游。非常有意思的,这里经常因为技术问题而争得不可开交,时而有大批潜水员浮出水面围观,甚至不乏也有相互对骂和人身攻击。总之,这个地方很有意思。
InfoQ: http://www.infoq.com
InfoQ关注企业软件开发领域的变化与创新,经常也会讨论存储相关的话题,当然这里比较专业和严肃,比较适合架构师和开发人员。
Tektalk: http://www.tektalk.org
陈首席发起的弯曲评论,如果你是从事网络和存储技术行业的,这个必须有。弯曲上发表的文章普遍非常专业并有深度,评论和回复则是更是精辟和激烈,在这里不管是初学者还是资深人士都可以汲取到各自所需的东西。以前弯曲主要以网络技术话题为主,最近存储的话题开始多了起来,有不少存储专业人士加入进来。弯曲的读者太多太多,往往你去公司面试的时候不知不觉就聊到了弯曲,可见影响力之广泛。上弯曲的都知道,弯曲作者并不是很多,因为在弯曲上发表文章是需要实力的,COPY+PASTE绝对会被批得体无完肤,相信都丢不起这个面子。所以提醒大家,弯曲的水很深,水平不够的话请谨慎试水,围观自然是倍受欢迎的。
[存储开源软件]
http://www.kernel.org
http://sourceforge.net
http://code.google.com/
http://www.oschina.net/
http://code.taobao.org/
源码之前,没有密秘可言。Linux torvalds, "Talk is cheap, show me the code". 对于开发和研究人员来说,源码是最好的参考资料。存储开放源码中,首推linux内核源码和SourceForge上的源码,这些大家都懂的。Google Code以小型开源和代码片段为主,中国开源社区则主要是开源软件信息的汇集。值得一提的是,Alibaba和Taobao最近对开源很是上心,Taobao Code上开放了一些公司内部使用的存储系统源码,诸如Tair、TFS,不过目前平台上第三方源码比较少。官方称,TFS(Taobao FileSystem)是一个高可扩展、高可用、高性能、面向互联网服务的分布式文件系统,其设计目标是支持海量的非结构化数据。对分布式文件系统感兴趣的一定不要错过TFS,毕竟国内这方面的开源是凤毛麟角。