荣刚:中国航信数据中心与灾备中心的运行

2009年4月17日,由国际灾难恢复协会、中国信息安全测评中心、成都市人民政府主办,成都市信息化办公室和万国数据服务有限公司承办,中国国际文化交流中心支持,北京博思商通资讯有限公司策划执行的“国际灾难恢复与服务 外包峰会暨第四届中国灾难恢复行业高层论坛”在“天府之国”成都隆重召开。
  会上中国民航信息 网络股份有限公司副总经理荣刚先生做了主题为中国航信数据中心与灾备中心的运行的精彩演讲:各位同仁,下午好!我介绍一下中国航信,中国航信为38家企业专门做数据中心运行的IT企业,公司总部在北京,共有300多人,有3个数据中心都在北京。目前,有两个大的数据中心一个在北京东四大概四千平方米,三里屯数据中心两千多平方米,目前东四已经满了,三里屯还有一千多平方米的数据中心,目前数据中心的等级从主机到网络到UPS到柴油发电机到强电的供电系统都是双备份的。
荣刚:中国航信数据中心与灾备中心的运行
中国民航信息网络股份有限公司副总经理荣刚先生
  目前我们主要的业务有三大业务。主要是提供民航行业内的信息服务,目前国内的所有航空公司除了春秋航空公司以外,所有的航空公司的销售平台,离港平台,货运平台都是进入我们的系统,还有中国5000多家售票代理点,旅行社,所有的机场包括成都机场在内,都是通过北京的总数据中心来运行,如果数据一旦出现故障,全国的航班就要停运,所有旅客将滞留在机场,所以运行的压力非常大。
  我们有很多的系统,基于分销平台,电子商务平台扩展出来的,包括 携程网这些机票销售的数据都是从我们系统里面,销售平台里面取得的,他们销售任何一张机票将访问我们北京的主数据中心,它是与全球航空公司相连的。我们可以销售全世界任何一个地点任何一个航空公司的航班,美国有两家大的系统,欧洲有一家,在亚洲我们公司最大,我们目前在全球排第四。
  介绍一下运行规模和主机平台,主要运用在三个核心运行系统,ICS定做系统,CRS和DCS离港平台,这三大系统都运行在IBM的传统主机上。在传统主机外面我们又加了近千台 服务器,把对外联络的票价计算,收益管理,常规系统等等系统,还有电子客票,每个客人定好电子客票之后拿你的第二代身份证到POSS机上一打就可以进去了,只要我们打一个 电话就可以拿到我们的号码,飞机号什么时候登记,只看一身份证就可以登机了,为社会节约了大量成本,非常便利。为了实现整个应用服务,目前建了十个核心网和结点,北京有两个结点,通过互联网有两个出口联络到欧洲联络到亚洲,联络到东南亚,另外通过国际民航组织和国外的同行进行渠道的沟通。
  另外我们交给国际 电信商的有7000万人民币,三大主机的处理能力,三大主机每秒钟可以处理5000个事物,每秒钟可以有5000个人同时订票,目前处理的和美国的处理能力相等。但是有一个比较大的挑战,因为现在互联网,也就是开放平台对我们的挑战非常之大,在上周,由于中国的风险投资,有一个网站叫做去哪儿网站,它通过它的网站,通过它的机器人,有些公司是手工输入,有些公司是采用模拟人的输入,通过计算机到计算机抓取数据,大量耗费了我们的开放平台和主机资源的平台,包括一家网站叫做去哪儿网站,占了我们开放平台容量的37%,假如我们投入了1个亿,其中3700万被它拿到了,现在我们采取行动了,按流量收费,把成本限制住。通过商业的服务方式进行服务,而不是完全的把互联网公司生成价值,产生价值的公司赶出去,同时满足我们系统的安全,不能他不交钱不限制的获取你的资源,我们的兄弟单位也遇到了这种情况,有人模仿机器人来盗取数据,获得它自己的商业价值,同时在主机资源里面也同样存在这样的问题。
  目前我们采用用三台大型主机来跑一个运用,有两方面得好处,如果单独用一 台机器无法满足每秒5000个事务处理的能力,必须要两台以上,为什么又加上第三台呢?相当于三台发动机一样,任何停止一台还有两台可以支持我们的运用,所以我们用三台,可能明年将加到四台,这样既节约了容量不够问题,同时加到四台之后可以解决危机问题,我们将四台大型主机每台要1500万到2000万美金左右。备份是比较贵的,另外还有一个我们在三里屯机房装了东四一样的系统,一套系统可能是120或者130在东四,每当东四主机房进行修改的时候我们在千分之一秒通过SRDF/A三里屯将自行启动,数据不会丢失。做到在同机房先备份,在同城两个机房再备份,当然我们在异地还没有,在一千公里以外还没有做到。
  这就是它的开放平台,也是基于刚才和主机平台一样,开放平台进行备份和三里屯也是一样的拷贝技术。另外我们讲了比较有特点的就是民航通过20多年所发起来的离港系统的三点备份体系,离港系统是我们中国民航最关键的系统,如果一旦停止了所有的旅客都将滞留在机场,因为现在没有纸质机票都是电子客票,如果系统停了,旅客说有这个航班,但是不知道你在哪儿,为了这个系统万无一失,我们做了三级备份。前面我们已经介绍了两级,一级是主机房三台主机跑一个应用,任何一台到两台主机坏了还能持续运行。第二个东四机房一旦停机三里屯机房可以接管业务继续运行,即使东四和三里屯机房都停了我们在机场自住开发的离港前端备份,我们在旅客离港之前把当天所有的数据都放到机场的服务器里面,当主机更改一个旅客的时候同时在机场的服务器上更改这个旅客的数据,一旦城里的两个机房都报费的时候,在机场还可以继续办理登机手续,除非机场的 电源段了,机场的局域网也坏了,这就没有办法了,这就是离港三级体系,即使机场的服务器坏了,局域网坏了,旅客还可以继续旅行,因为我们的机房还有一个PC机,把所有旅客走了和没有走的名单都放在PC机里面,这个时候打出来,每年还要做手工演练,我们可以用手工让旅客继续登机,这一点比较麻烦,必须要看身份证号一个一个对,慢一点,所以我们采用了三级备份体系加人工。这是在全世界都独一无二的,没有过的。
  整个方案是为了去年的奥运保障而做的工作,三级离港口三级备份,手工演练与主机联动机制,去年为了奥运保障,整个投资了6亿人民币来实现我们刚才说的主机和同机房备份,同城之间备份和机场的离港三级备份。去年我们的主机遇到了四次故障,这四次故障都是三台主机跑一次应用,旅客一点感觉不出来,用户一点也感觉不出来,真正起到了作用,如果去年没有这样做,正好奥运会期间出一次故障,9月份残奥会时会出现一次故障,否则会引起全社会引起很大的反响。
  安全体系,目前我们的行业和组织机构成立了安全中心也就是运行中心,运行中心目前有460多人基本上在北京,在东四机房和三里屯机房有460多人负责整个大小一千多套系统的运行,运行了20多年有很多流程,安全管理的制度,安全的策略,组织机构,方针目标有太多,一般都记不过来,每个岗位我们要求就记两个常用的就可以了,不常见的故障处理方案可以查手册就行了。
  我们有专门的审计体系,每年请外面的第三方对我们的系统进行安全审计,包括我们的测评中心公安部都要审计一次,还有一年两次的以前是国新办的专家组,以前是每年两会期间和10月份进行审计,每次审计都是按照刚才前面上海证券交易所那位同志介绍的一样,PDCA,按照这个流程走,发现问题,分析问题,解决问题,最后到反馈。
  目前6000平方米的机房已经用完了,今后我们会在上海和北京建立两个数据中心。今后在北京建三到四万平方米的主机房,在长三角这边的土地已经谈好了,离上海市区90公里的地方93亩地,建第二个数据中心,在北京买的370亩地,建四万平方米的机房,这样的话我们在广州未来可能还将建第三个数据中心,因为中国最大的三个航空公司在北京、上海、广州,所以在这三个地方我们的顾客在哪儿,我们就服务上门,在就哪儿建数据中心,目前前期先考虑北京、上海,未来两三年后再在广州也考虑,所以三个数据中心的将覆盖全国的数据服务。
  这是北京是总部科技园区375亩地,上海也是300亩,广州也在谈目前100亩。发改委4万亿里面的投资按,我们报了70亿,其中40亿是北京的,30亿是上海的,北京40亿里面20亿是基础建设,20亿是设备投入,我就讲到这儿,谢谢大家!
  嘉宾介绍:荣刚先生生于1962年,高级工程师,拥有北京大学光华管理学院工商管理硕士学位,在中国民航业拥有20余年管理经验。1983年8月~1996年5月任职于民航计算机信息中心;1996年5月~1999年5月就职于中国民用航空总局;自1999年5月~2002年9月担任民航计算机信息中心(现称为中国民航信息集团公司)副总裁;2002年9月~2008年6月,担任中国民航信息集团公司副总经理;在2000年10月~2009年3月期间担任中国民航信息网络股份有限公司非执行董事;2004年3月~2009年3月,担任中国民航信息网络股份有限公司战略委员会委员;自2008年12月起,担任中国民航信息网络股份有限公司副总经理。

你可能感兴趣的:(职场,休闲,中国航信,数据灾备)