【260期门诊集锦】大数据 不用怕--CommVault技术专家为您排忧解难!

  技术门诊是51CTO社区品牌栏目,每周邀请一位客座专家,为广大技术网友解答疑问。从热门技术到前沿知识,从技术答疑到职业规划。每期一个主题,站在最新最热的技术前沿为你引航!


  本期特邀
CommVault中国区售前工程师牟皓,针对大数据话题给予解答,欢迎网友积极提问,与专家一起讨论!

查看本期门诊精彩实录:http://doctor.51cto.com/develop-274.html

精选本期网友提问与专家解答,以供网友学习参考。

Q:

大数据与虚拟化,云计算有什么相同与不同的吗?请详细介绍...

大数据在企业中的应用场景分别有什么?

给企业分别能带来那些效益?

那些企业成功的运用大数据,解决了些什么问题,规范了什么?

A:

你好,这是三个概念。大数据我们通常指的是现在各企业的业务越来越多,数据量比原来大的多,我们称之为大数据时代;虚拟化指的是应用平台,将一台或几台物理主机模拟出多个系统平台,如VmwareCitirex等;云计算是分布式计算Distributed Computing)、并行计算Parallel Computing)、效用计Utility Computing)、网络存储Network Storage Technologies)、虚拟化Virtualization)、负载均衡Load Balance)等传统计算机网络技术发展融合的产物。

你好,大数据在企业应用场景很多,例如通信行业的经分数据库很多地方都是几十T,客服的电话录音文件、银行保险业的扫描件等等都可以称之为大数据。CommVault软件能够很好管理这些数据,最大效益是能够帮助企业在管理数据的时候结成TCO

你好,大数据指的是用户的业务系统的数据量。 并不是大数据量解决了什么问题。也许我没有理解你的意思?呵呵

Q:

问一个有关于虚拟化的问题,如果同时存在VMWare vSphere ESX,Citrix XenServer, Microsoft HyperV三个虚拟化环境同时并存。那么 备份的CommVault Spinma是部署一套还是三套?

如果是一套,对每种不同的虚拟机镜像vmdk,xva,vhd文件备份处理或者消重的方式是否都一样?如何确保中间的一致性?

如果是三套,那之前有什么不一样的地方需要独立三套的备份?

A:

你好,

1.三种虚拟化环境同时存在的时候我们只需要部署一套simpana软件。

2.重复数据删除是一种数据缩减技术,通常用于基于磁盘的备份系统,旨在减少存储系统中使用的存储容量。它的工作方式是在某个时间周期内查找不同文件中不同位置的重复数据块。重复的数据块用指示符/指针/索引取代。高度冗余的数据集从数据重复删除技术的获益极大。不同类型数据的消重比是不一样的,CommVault采用SHA-512的算法,其安全性和重删率更高。

Q:

重复数据删除还是数据压缩,或是两者都用?我看各个厂商实现的不一样啊,有何优势和劣势?

A:

你好,面对数据的急剧膨胀,企业需要不断购置大量的存储设备来应对不断增长的存储需求。然而,单纯地提高存储容量,这似乎并不能从根本解决问题。首先,存储设备的采购预算越来越高,大多数企业难以承受如此巨大的开支。其次,随着数据中心的扩大,存储管理成本、占用空间、制冷能力、能耗等也都变得越来越严重,其中能耗尤为突出。再者,大量的异构物理存储资源大大增加了存储管理的复杂性,容易造成存储资源浪费和利用效率不高。因此,我们需要另辟蹊径来解决信息的急剧增长问题,堵住数据“井喷”。高效存储理念正是为此而提出的,它旨在缓解存储系统的空间增长问题,缩减数据占用空间,简化存储管理,最大程度地利用已有资源,降低成本。目前业界公认的五项高效存储技术分别是数据压缩、重复数据删除、自动精简配置、自动分层存储和存储虚拟化。目前,数据压缩和重复数据删除是实现数据缩减的两种关键技术。简而言之,数据压缩技术通过对数据重新编码来降低冗余度,而重复数据删除技术侧重于删除重复的数据块,从而实现数据容量缩减的目的。

Q:

CommVault软件是如何对邮件系统数据进行保护的?CommVault为邮件系统的数据保护提供了邮件归档和邮件备份两种数据管理方式,这两种方式的优缺点是哪些呢,好像网上资料都谈优点了?

A:

你好,你说的只是CommVault软件对邮件系统管理的2个方面,CommVault软件针对邮件系统进行全面保护,主要体现在如下方面:

数据分析:

–分析邮件系统中数据分布情况,这样才能更好的制定归档、保护策略。

数据归档:

–将历史邮件,迁入二级存储,释放主存空间,提高邮件系统的效率

–节省在线、备份存储空间,节省备份时间窗口

–能利用归档存根访问归档的邮件

–对归档数据做内容索引,方便查找

数据备份:

–定时将邮箱中当前数据备份到备份介质上

–可以恢复单个的邮件、邮箱

快速恢复:

–针对Exchange整个系统 ,避免数据丢失,快速恢复应用

–数据丢失量可以控制在分钟级别,而且能够避免系统的硬件和逻辑故障

–发生故障,能够在几分钟内恢复系统运行

–可以利用邮件挖掘工具,恢复快照副本中的单个邮件

法规遵从:

–是为了满足法律上的要求

–必须开启Exchange的日志功能,将相应需要监控人员的邮件存放到日志邮箱

–通过归档功能,将日志数据写入WORM或其他设备

Q:

请问老师IBMAIX+DB2数据库,想用第三方的备份软件来备份DB2数据库,数据库大小在1T出头,不知道CommVault是否胜任?如果需要一个星期一全备、每天一差备,软件操作起来是否方便?备份期间是否会影响数据库的使用?备份文件可否自动压缩存放(不压缩每个星期1T存储受不了)?

A:

你好,CommVault软件完全胜任AIX+DB2的备份。备份策略定制非常灵活,可以用户自己定义。CommVault软件的操作是全图形化中文界面,并且真正实现备份恢复零脚本。CommVault软件的第三代数据重删技术能够使你的备份空间得以最大的利用。  

Q:
老师您好:

1.我们公司有有一台ibm存储,容量是2TB,如今已经满足不了业务需求,需要增加一个存储扩展柜,但是增加前需要备份这2TB的数据,以免在添加的时候出现数据丢失,这样的情况如何快速备份?

2.公司有虚拟化的平台,对于虚拟化平台的数据如何做好数据备份和扩容的问题

3.commVault技术对于不同平台的数据库备份和存储厂商有没有什么兼容性的限制问题

A:

你好,

问题1:看你的数据类型了,如果是结构化数据可以通过CommVault软件的响应数据库模块备份即可,如果是非结构化数据,可以采用块级备份进行快速保护。具体内容你可以登录我们网站进一步了解。www.commvault.com.cn

问题2CommVault软件有专门针对虚机的备份模块,对于数量达到几百甚至上千台虚机的情况,我们还可以结合硬件快照对数据进行快速保护。

问题3CommVault软件支持主流数据库的备份,对存储厂商基本没有不兼容的情况(目前看来)。对数据库兼容列表可查看网址:http://documentation.commvault.com/commvault/release_9_0_0/books_online_1/english_us/prod_info/backup.htm

Q:

老师:

你好,看了前面很多朋友的提问,非常精彩!但是这个软件究竟与当今市场上的备份软件比如赛门铁克的:BE,以及微软的DPM,以及其他常见备份软件有什么根本区别呢。透过赛门铁克之类的优势有劣势,究竟Commvault给我们带来了哪些便利?有没有一些具体的对比数字或者具体例子呢!

谢谢老师!

A:

你好,这个问题回答起来涉及方面很多。CommVault软件和友商软件上最大的区别是:CommVault软件是数据管理软件,备份是其中的一部分,提供真正意义上的数据管理解决方案。CommVault软件所有模块都构建在一个统一代码库和平台上,而不是靠多个收购软件的名字的统一。举个例子:CommVault软件的索引结构采用分级索引,而其他软件多采用单一索引,因此在大数据时代备份和恢复的效率CommVault会更显优势。

CommVault软件能够给用户带来什么体验呢?

CommVault软件在一个平台实现数据备份、数据归档、数据复制、快照、内容检索、异地灾备和法规遵从等功能,实现对各种应用系统进行集中管理。

–性能更高效:充分利用现有硬件性能,数据保护和恢复速度更快。

–费用更便宜:集中管理可以大大节省管理成本和硬件投入。

–数据更安全:数据保护的可靠性有极大提高。

–管理更规范:完善的权限管理、监控、报告及审计。

Q:

牟老师,你好。

我想问下,在大量虚拟机环境下如何缩短有效的备份时间,如何缩短大数据量的窗口呢?因为我们现在虚拟机很多。系统分类也杂。各种系统都有。有没有好的解决整合方案?

A:

你好,可以考虑结合硬件快照的方式对虚拟机进行保护(SnapProtect快照技术),SnapProtect技术完全集成了基于硬件的持久的快速快照功能,具有保护最大型的、最苛刻的虚拟和物理服务器环境的功能,并且能够在几分钟时间内实现恢复。 通过创建存储阵列的内部硬件快照副本,可以创建高速恢复副本,同时对生产服务器几乎没有任何影响。在短短的几分钟时间里,可以保护数以百计的系统及其相关业务应用。

你可能感兴趣的:(大数据,云计算,数据存储,技术门诊)