张福波:云计算在电信级IDC中的应用

2009年9月21日,由工业和信息化部节能与综合利用司指导,中国通信企业协会通信运维专业委员会、中国联通国家数据中心主办,中国IDC产业联盟网和C114中国通信网联合承办的“2009中国绿色数据中心发展与实践高峰论坛”在北京京都信苑饭店隆重召开。

张福波:云计算在电信级IDC中的应用

Platform大中华区技术与销售总经理 张福波

张福波:各位领导、各位嘉宾,大家上午好!

我非常荣幸能够代表Platform公司给大家介绍Platform公司在云计算方面的发展,同时非常高兴能够在这次大会上跟大家做一个沟通。

我今天给大家简单地介绍一下Platform公司,然后讲一下关于目前基本的概念,叫做Cluster,就是集群、网格、云,还有Platform公司推出的云计算的产品和它的案例。

Platform公司是一个加拿大公司,也是一个华人公司,今天我们很荣幸,我们公司的创始人之一专家从加拿大过来。这是我们大陆的华人的创建公司,在加拿大也是排在前几名的大的软件公司,所以我们看数字。

Platform公司在资源调度和资源整合管理方面,是世界一流的公司。而且,整个公司的创始,是很少的没有VC投入的公司,同时连续17年利润的增长。我们公司有500多名员工,在中国有200人,因为我们是一个华人公司,所以在中国我们有除了总部以外的第二大研发基地。我们全球目前有2000个客户,这是非常高含金量的,世界500强有70%的用户是属于Platform的。在世界上我们有500万到600万之间的高新的处理器在使用Platform的产品。

下面简单给大家介绍一下云,云在前几年已经流传起来了,很多人说云计算是虚拟化,云计算是下一代互联网的浪潮,还有人说就是网格,就像盲人摸象一样。我大概看一下,大概有21位国际上知名的专家和公司对于云计算的理解是一致,我们认为所谓的云计算就是把一些资源放在云端,通过互联网把它卖出去。所以,别人说网格技术是把互联网上的资源整合起来,云计算是把它卖出去。

这张胶片是我当初“863”给国家谈网格的时候,我们2000年初的时候这是互联网的变化,这是起源于IT黑洞的问题,大家觉得IT是烧钱的地方,但是并没有感觉到它的回报。比如说花了几亿买了一台大的计算机,发现网络还不行,要搞网络,然后觉得数据不行,又搞存储,后来觉得操作系统的磨合又1、2年过去了,当你运行的时候,3年以后机器又该淘汰了,又要购买计算机,所以我们的系统总是变化。造成这个原因,是我们当初像用电一样,我们IT用电的人是需要买发电机,这是一个笑话,我们不需要这么做,但是IT的人就是这么用的。所以,IT的资源为什么不能像水、电、煤气那么简单,成为管道资源?对于用户来说,我用了多少可以像用水、电、煤气一样的。所以,在IT的世界,把这个盒子打开之后,让所有人都非常困难,投入非常巨大,就是因为我们用户也要介入IT的技术。但是,我们用电是不  介入IT的技术。但是,简单才是高级的,比尔·盖茨比较伟大的地方,是把计算机变成了我们的祖父母和孩子都可以运作的软件。

我们上大学的时候觉得计算机是专业人员用的,但是今天计算机是无处不在,所以把IT资源变得简单这是一个趋势,整合是一个趋势。所以,当资源整合起来,用户需要得到什么呢?就是服务。就像我们的水、电、煤气一样的,我们达到这种资源是通过服务的运营商来提供的。所以,我们通过这样一个综合的体系,我们把它归类成两种云,一种叫做私有云,像我们企业自己内部的发电机一样,自己提供资源,还有一种叫做公有云,以后像联通、电信他们面对的一样是公有的云,是面向整个的社会。

我们在国内外做了十多年的企业的资源整合,这是我们的一个经验。实际上,传统IT资源的整合我们叫做孤岛式、烟囱式的,部门A要上系统业务,需要计算机,部门B要上业务,也要买计算机,各个部门的标准是不一样的,系统也是不一样的。同样的计算机,比如说戴尔、IBM操作系统也是不一样的,有的是用SUSE,有的是用红旗等等。大家知道,我们现在硬件资源利用有多少吗?35%不到,软件资源有多少?17%不到。在石油行业连10%都不到,因为石油行业买了一个几百万的软件,一年当中只用1个月,剩下的11个月软件就是在那里睡觉。所以,我们的航天造导弹的,原来的导弹设计只能最关键的步骤验证一下,比如说30步计算一次,这对于产品的仿真和模拟来说都拖得时间很长,而且非常耗时耗力。

我们希望IT推出改革,是一种演变,这里面有三个关键词,第一个是生产商,第二个是运营商,第三个是用户。像这种模式早就存在了,这就是在线游戏。20年以前给一个学生100元,可以买3个游戏,所以100元是网下游戏。今天给一个学生100元可以买多少游戏?不知道。大家看到街上很难有卖游戏光盘的,因为游戏是上网就可以用。而这样模式的改变,实际上催生了在线游戏大的市场,是几十亿、几百亿美元的市场。

最终得到好处的是谁呢?是用户。现在的游戏可以无处不在,包括我们的孩子、我们的祖父母、我们的父亲和母亲退休了都可以玩游戏,这就是一个改革。在这些东西的实现当中,需要一个技术来支撑,我们叫做一个平台,现在大家归类成云计算平台,它需要整合,它要进入这个三赢的局面。

所以,我们做了航天、航空网络中心,包括做了新加坡的云。做资源整合对于企业和用户来说得到这几方面的好处。

第一个,我们提高了资源的利用率。像上海超算,它的资源利用是80%到100%,它有60T在等待排队,我们消除了他使用资源的瓶颈,今年上了曙光5000是200T,所以它一半的资源已经完成了。软件的利用率我们是50%到60%,有一个用户是航天的,全部通过浏览器的方式来使用资源,从原来的几百个CPU,现在上升到几千个,这是非常大的变化。这是我们为企业构造私有云,怎么样把资源进行整合。同时,我告诉大家在我们的整合当中,我们觉得对于一个企业来说,最关键的是整合一种方法和软件结构,买计算机是后悔的举动,大概是前几个月,我到上海超算去问他们,你们上了曙光5000,曙光4000怎么办?他说这台机器我们要仍了或者是送人,谁要拿走,我问他们为什么?因为他说现在电费比计算机还贵,因为他们每年要花800万电费。

我去过合肥,就是中国科大,见了他们的计算机主任,是HP还是联想送了他一套计算机,他说张总能不能找一个单位把这个机器拖走,我说你很聪明,别人也不傻,很难有傻子把这台计算机拿过来,因为它的性价比很低,而且在耗电。比如说2000个节点的计算机,上海超算可以白送给你,所以买计算机我们都是后悔的,我们只要够用就可以了,当我们的资源利用到80%到100%的时候才有必要购买资源,而现在很多的企业资源利用达到30%或者是40%的还在购买,而这种购买不能解决他根本性的问题。

我们的云是早就有的名词,这家说要做云,那家说也要做云,我们认为有三种途径。第一种途径是网格,网格技术是把互联网或者是网络上的资源整合起来,我们说叫做SOA。加上我们的web、虚拟化,这就可以构造一个云。

第二种途径是搞虚拟化,我们知道VM  Ware,它是把一个物理的计算机虚拟成标准的计算机,然后把它使用出去。这是搞虚拟化的,加上资源整合、网格技术,加上web也可以做云。

第三种是运营,像Google,当然也有电信、移动,他们所拥有的是资源、大量的客户。所以,Google做云也是比较基本、比较简单的动机和想法。它拥有那么多的数据、客户,他在想能不能给这些客户提供更多的内容服务,而不是简单地搜索引擎,这是他们做云的动力所在。
    讲云需要什么改变?一种技术的改变,往往会改变人的生态环境,改变使用模式。

我有一个同学现在在微软做,他说相信未来我们不再需要电脑,我去了一趟中关村,上网本的市场越来越大,因为人需要最简单的客户端,而上网本依赖于运营商,所以现在的上网本如果数量要增加,一定是服务内容的丰富和服务质量的提高,才需要上网本。我们的服务都应该放作IDC中心,所以我们叫做PC  Cloud,所以当有一天有PC  Cloud的时候,我不需要带任何的电脑,我演讲我的演讲稿就在那里。而且我不会受病毒的困扰,数据中心已经给我解决好了。

我们这种连接,不管是有线和无线,应该是无处不在,我们在任何的地方,爬黄山的时候也可以拿上手机和上网本来进行你的业务,因为现在信息的技术包括带宽网络的技术,使得我们在世界任何一个角落在上网,可以进入到这个IDC服务中心,所以这个上网本才有真正的市场。我们相信将来的世界,将是上网本的世界,所以中关村以后不会卖电脑,就卖上网本。

当在线有戏有了运营商提供的服务质量之后,实际上玩游戏变成了非常简单的事情,当一件事情变得简单之后,事实就是用户急剧攀升,因为谁都可以用。我们相信做云计算之后,将会把PC  cloud、数据银行,我们知道我们现在有很多的数码相机,我们每天数码相机在更新换代,但是我们的照片,我们小孩的照片1到20岁还放在那里,放在自己的电脑,电脑会坏。所以,我们放在哪里?我们放在银行,就是放在云端,这是将来新的生态环境。

下面,我们稍微讲一点技术上的东西。云是一个很大的概念,如果我们剖析一下,云是世界比较公认的有三层,像网络协议一样。最底下那一层叫做IaaS,主要是把资源卖出去,比如说其中一个业务就是把计算机的服务卖给这些企业、单位,他自己不需要购买计算机和服务器,只要借用IDC服务中心的服务器就够了。我们叫做IaaS。中间叫做PaaS,是把中间商和PC商业的应用接入到这个云里面。第三个叫做我SaaS,这是内容服务商,比如说上海超算也可以做一个云,主要是服务制造业,比如说宝钢、上海大客、一汽大众都在使用他的服务。

Platform目前主要的技术是做IaaS  F,同时,我们支撑PaaS和SaaS的情况。有了这个东西,我们想数据中心为什么要搞云?首先我们回到数据中心IDC,它有四大方面的挑战,当时我们也有一个共识。第一个,数据中心的体系是庞大的、复杂的,管理难度很大。第二个,IT的成本过高,因为每一个业务系统,如果按照峰值去构建系统,那是很大的投资,我们没有那么多的钱。所以,如果我们按照峰值去构造,就意味着浪费。比如说我们的短信,我们短信的峰值在哪一天会发生呢?就是年三十晚上,那一天是几亿条的短信,其他的时间没有那么多的短信,只有在年三十晚上。我记得01年的时候,我年三十发的短信初三、初四才可以收到,但是现在基本上一小时就可以收到。

一旦由人工来做,人会犯错误,这就会影响我们服务的质量。我们都知道,建立一个好印象,你要做10件的好事。人要把自己的事情搞砸,一件就够了。所以,你必须满足高质量的服务,你才能吸引你的客户。

第四个是系统IT的僵化,我们说比较死板。我去过一些单位,他们说我们领导要我们上一个业务系统需要80天,因为要从0开始。但是我们家里装电脑是不需要80天的,买了电脑插上电就可以用了。所以,我们从80天能不能缩短到半小时呢?这是灵活变化的,因为有了IT的服务可以面向更多的客户。

我们知道觉得云计算可以给企业带来六大好处,第一个是可以做资源的集中化的管理、全局共享,它的好处就是节省投资。所以,这是绿色减排,我觉得其中总是的就是共享、减少浪费。

第二个叫做SOA框架,就是面向服务的框架。我们都知道,当我们增加电力的时候,我们的终端服务器,我们的电视机是不用换的,IT是不一样的,就是我要上一套系统,我连应用软件都要一块换,因为它的操作系统不一样、硬件不一样,这不是SOA。所谓的SOA,是IT的资源有更多的需求的时候,在几秒钟、几分钟就可以把这个资源调动过来,而不需要重新构建。所以,它的好处是提高了业务的支撑能力。

第三个是打破孤岛式的IT的构建方式,使得一个或者是几个管理人员可以把这个管理好,它的效果就是提高运维效果。

第四个是消除单点故障,实际上我们很多的企业当中有很多的双级备份,上一次我去了一趟湖南的工商银行,他们是双级备份,有一条线坏了,启动备用的时候才用到,但是我们的主机2、3年不坏的时候,谁能够保证这个备用机能够起来,但是这个机器花同样的钱。但是,我们用云计算的时候,我们不需要双级备份,为什么它可以消除我们的单点故障提供可靠性呢?

第五个是帮助IT投资风险和决策。我们解决可靠性不是说我出现的错误,在它出现的时候才去堵,所以我们可以避免。

最后一个是节能减排,我们叫做绿色IT,如何降低能耗,我们在云计算当中也必须考虑到如何降低能源的消耗。

所以,搞了云之后,我们知道有困难,第一个是谁都知道云,那给我构造云,对不起没有成熟的产品,大家只讲一个理念,用户也很生气。说了老半天搞云,你们没有办法做云,没有产品和成熟的技术。

我相信用户很糊涂,每个人都宣传云,每个人都有一个看法,好像都对,好像都不对。
    第三个,大家搞云的时候有一个最大的担心,就是IT的改动和风险,老机器如果不能用了,我就要买新的设备,还有改动的风险在哪?

第四个,我现在的业务不在云上面跑,我的算法和我的软件是不是要改动。

第五个我们没有什么成功的经验,你告诉我在哪一天搞了云,让我看一下,看不到。

第六个是,我们很多的人对于这个云计算的认识还有待于提高,很多人把云看得很困难,有的人把云看得太简单。

我们最近有一个真正的云计算叫做ISF,我们这个产品不是自己凭空想象的,我们有实际的用户的需求。比如说JP摩根、新加坡电信等,我们的策略是帮助用户降低风险,我们叫做小步快跑。我们的时间短一点,但是跨步小一点,但是通过一点点的改进,实现一个成功。

如果有需要我们可以带上我们的客户或者是领导,我们可以参观,百闻不如一见,我们去了解一下云究竟是怎么回事。

这是Platform的产品线,我们是三块,集群、网格和云。今天我讲一下云。

实际上云计算ISF的商业模式是这样的,我们有一个云计算中心,就像一个餐馆一样的,我们把资源变成一个个菜单,通过服务的方式提供给左边的客户。这些客户可以是阿里巴巴,也可以是腾讯,也可以是淘宝网,给我1万台虚拟计算机,我需要1个月,这种交易的工作合同签字半天就可以完成,下午阿里巴巴就可以拿到1万台虚拟机,这是非常了不起的,可以解决用户实实在在的问题。

云计算的服务内容我们认为主要做四个方面,第一个是资源的整合,第二个是角度和管理,第三个是应用和集成,第四个是计费,我给阿里巴巴1万台计算机一个月,你用多少我不管,另外以及是计费,你用多少收多少。

有云和没有云的差别是,我们的IDC每一个业务是独立的一块,有了云之后我们整合了,所有的资源全部可以共享。所以,我们都知道,当我们在对给短信构造大量的资源的时候,只是在年三十的晚上。平时是给其他的资源在用,但是年三十晚上有些资源用得不多了,首先信用卡刷卡的消费没有了,另外一个是玩游戏的人没有了。所以,可以把这些资源给短信来用,所以这是很好的策略。

怎么消除单点故障呢?我们对每一个业务只配备基本的资源,我们有共享资源池,这些共享资源池就看哪个地方的资源吃紧了就会支援上去。所以,这就是SOA,我说你可以拿着锤子砸任何的计算机,如果你的系统崩溃了,这个责任是我们的。上海超算曙光计算机每周换来台,现在也是每周换一台,但是对于用户没有任何的影响,所以它由量求到了质。那么,曙光计算机的质量可以不太重要,因为我用了SOA的方法,对它的要求降低了,所以我们的航空、航天制造业,都在大量采用曙光的计算机。

现在我们的联通、移动、电信,大家主机是X86,这其中一个面向的技术,就是虚拟化的技术和共享资源池技术的成熟,使得我们用便宜的计算机替代原来贵重的计算机,这是一个趋势。

那么,作为Platform的产品,时间的关系我不会再讲,我们主要分三个方面,一个是资源整合,这是我们的界面和产品,如果大家有机会可以做一些演示,大家可以来试用一下,这是服务的清单。

第二个是资源分配引擎,在这个当中有非常重要的调度,北京的交通系统除了红绿灯,最最重要的是调度,99%汽车出问题,不是车祸,也不是引擎,而是撞车,两个车撞车的概念很大,会造成你的系统崩溃,所以调度策略很重要。就是我减少资源的碎片就是节能,它有几千台的计算机和机柜,他希望调度资源不太多的时候,统统把资源调到第一个和第二个机柜里面,而把其他的统统关掉省电。

第二个是分散,我们希望它的利用率永远不超过50%,这是一个安全的问题。我们害怕超过50%以后,它会崩溃。当然,我们还有一些聪明的调配策略,不再一一地讲。还有一个是节能,在美国是这样的,白天的电费比晚上要贵,非常希望在白天尽可能少开计算机,能不开尽量不开,把有一些任务和有些东西可以到网上使用。

另外,有一些VIP的用户放在比较贵的计算机计算,免费的用户放在比较便宜的计算机上算,这是收支最大的效率。

这是我们如何通过互联网一个简单的得到一个服务和计算机,这张胶片是跟大家介绍一下关于计费,我们知道计费是很重要的,我们在计费当中已经产生了很多的数据,给用户非常好的报表。

下面讲一个案例,就是JP摩根,它有几百个备份,但是它有峰值。所以,它把所有的资源调动起来集中,然后打破孤岛,所以就形成了云。

这个是新加坡,新加坡政府希望吸引投资,希望通过新加坡电信构造一个云,由新加坡的政府提供软硬件。这在1年多以前和Platform合作,我们为他构造了一个新加坡的云,主要是提供资源的服务、高性能计算的服务,第二类是提供运营商服务器的服务。这样,为了提高它在市场上吸引投资方的竞争力,所以像我们的北京、上海,上海超算为什么搞超算?也是为了吸引人家到张江高科技园区来投资,政府买单给这些单位提供优质的资源。

今天我的演讲完了,谢谢大家!

你可能感兴趣的:(网络应用,企业应用,云计算,电信,中国电信)