OCP开放计算项目,如何推动数据中心持续创新?

640?wx_fmt=gif&wxfrom=5&wx_lazy=1

OCP是什么?


OCP开放计算项目(Open Compute Project),是由Facebook联合Intel、Rackspace、高盛和Arista Networks在2011年发起的开源硬件组织,其使命是通过开放开源硬件技术,实现可扩展的计算,提供高效的服务器、存储和数据中心硬件设计,以减少数据中心的环境影响,致力于围绕网络、服务器、存储和OpenRack的开源贡献进行创新。


OCP开放计算项目,如何推动数据中心持续创新?_第1张图片

目前,OCP已经成为全球最大的硬件开源社区之一,有数据中心基础设施、服务器、存储、硬件管理等10个技术项目组,以及欧洲、中国大陆、日、韩、台湾等5个地区项目组,制定了不同领域的众多开放标准,其中OCS、OpenRack等开放标准在业内有着广泛的影响力。


OCP的成员企业


经过8年时间发展,OCP的成员企业约有200家,涵盖了数据中心不同产业环节最领先的厂商,包括:Google、微软、Facebook、LinkedIn、VMware、百度、腾讯、阿里巴巴等超大规模互联网运营商,诺基亚、AT&T等电信运营商,以及Intel、AMD、IBM、浪潮、思科、希捷、西部数据等产品和方案提供商。


数据中心变革的直接动力是大型化和现代化,根据Synergy Research数据,2018年全球超大规模数据中心为430个,可容纳的服务器总量相当于全球服务器年销量的3倍以上,这些数据中心的拥有者是微软等超大规模互联网运营商。数据中心技术升级的另一个动力则是新兴的业务需求,如云、大数据和AI,显然在这些新应用领域投入最多、技术最成熟的也是超大规模互联网运营商,也是OCP成员。


这些OCP成员一直在进行着最领先、最前沿的数据中心应用实践,这些实践在方案供应商、芯片供应商等其他成员的协助下,逐步实现了标准化、开放,成为各类OCP开放标准。


成员企业在实际应用中提出创新方案,将IP提交到OCP,然后进行公示、升级,经过十分漫长的过程,才会成为一个新的技术标准,开放、严密而漫长的流程,保证了OCP开放标准的普适性、实用性,OCP在成立后的几年中,增长速度惊人,在全球范围内形成了一个开放的计算产业生态。


OCP备受电信行业青睐


超大规模数据中心运营商仍是OCP硬件的最大用户群,电信和服务提供商等非超大规模用户对基于OCP的系统展现出更浓厚的兴趣。随着基于云的虚拟架构应用增加,以及5G无线技术和物联网工作场景的出现,电信行业可能在未来几年成为OCP设计部署增速最快的领域之一。


网络服务提供商开始将核心网络组件和其他通信应用转移至搭载在商用硬件上的云架构(在可扩展软件上运行的网络功能)。这种转变使电信公司能够部署基于云的技术,如软件定义网络和网络功能虚拟化。OCP将这一转变视为新机遇,并与Telecom Infra Project合作开发基于OCP设计的uCPE规范。


在此背景下,集结了AI、边缘计算等前沿技术的话题的首届OCP China Day(开放计算中国日)将于6月25日落地北京。本届大会由浪潮与OCP联合主办,汇集了众多数据中心领域的技术专家,以及前沿创新技术和应用,将提供AI、边缘计算在内的5个技术专题交流和20多场演讲,600㎡的展区将展示各类成熟的OCP产品和方案。对于关注数据中心领域的从业者以及相关技术爱好者来讲,这是难得的一次技术盛会。以下就来看看有哪些精彩技术看点。


OCP开放计算项目,如何推动数据中心持续创新?_第2张图片


OCP+OAM ,简化AI基础架构设计


随着AI的发展,ASIC、GPU等AI加速器越来越多,技术更新也越来越快,AI硬件系统的技随着AI的发展,ASIC、GPU等AI加速器越来越多,技术更新也越来越快,AI硬件系统的技术挑战和设计复杂性也越来越大,将加速器集成到系统中通常需要大约6-12个月。这种延迟阻碍了新的竞争性AI加速器的快速采用。


OCP社区在服务器项目组下设立了OAI(Open Accelerator Infrastructure)小组,负责开发OCP加速器模块OAM(OCP Accelerator Module)规范,将加速器模块标准化,简化AI基础架构的设计,缩短硬件设计周期。


不同于普通的CPU服务器,AI硬件系统是一个深度定制化的系统,需要通过AI硬件加速模块之间的高速互联通信来实现纵向扩展,通过多节点之间的高速互联通信来实现横向扩展,通过新的高速信号、供电和散热技术来解决AI硬件加速模块和系统设计中的硬件挑战。OAM标准,就是针对上述问题设计的一套指导AI硬件加速模块和系统设计的标准。它集合定义了AI硬件加速模块本身、主板、互联拓扑、机箱、供电、散热以及系统管理等系列设计规范,主要目标是通过模块化、标准化来增强不同AI硬件加速模块和系统的互操作性,加速新的AI硬件加速模块的落地和应用。


目前,OAM规范仍在开发阶段,3月14日公布了第一个非正式版本V0.85,4月30日公布了第二个非正式版本0.9。规范的内容包括电源/冷却、稳健性、可维护性、配置、编程、管理和调试,以及模块间通信,以扩展和输入/输出带宽。


在本次OCP China Day上,Facebook、百度等项目成员将带来OAM的最新进展。


边缘计算的应用探索与实践


伴随着5G的到来,边缘计算也来了。自动驾驶、VR/AR等应用场景提出了低延迟、高带宽的需求,智慧城市、工业互联网等除了有高带宽低延时的要求之外,还有安全方面的诉求。如何发展边缘计算,如何满足边缘计算的需求,仍然不清楚,这时边缘计算的实践就尤为重要,百度提出了“DEC”(Device、Edge、Cloud)算力部署,中国移动认为运营商提供分流管道,边缘计算业务由行业客户自营。


在本次OCP China Day,诺基亚、中国移动、百度、浪潮等将分享边缘计算领域的最新探索与实践。


倍受关注的OpenRack3.0


OpenRack是OCP社区最具有影响力的标准项目,当前的OpenRack2.0已经被众多的互联OpenRack是OCP社区最具有影响力的标准项目,当前的OpenRack2.0已经被众多的互联网企业和电信运营商企业所采用,帮助这些用户解决了部署密度、能效等一系列具体的技术挑战,优化了整体投资回报。但是OpenRack2.0在进一步提高性能密度时,遇到了根本性的屋里条件的限制,难以适应AI等新业务的需求。所以,OCP开发了OpenRack3.0,这版本支持了48V供电、水冷散热,并将高度从41OU增加到44OU,调整了内部结构,适应了新的业务需求,该标准仍未正式发布,还将进一步调整。


在OCP China Day上,Facebook、LinkedIn、百度、浪潮等将带来三大开放计算组织在整机柜技术的设计特点,OCP机架和电源项目组负责人Steve Mills将系统的讲解OpenRack3.0。


OpenRMC项目,下一代数据中心的管理框架


OpenRMC是OCP社区硬件管理项目组下的子项目组,由浪潮牵头成立。该项目目标是完成OpenBMC与Redfish的融合,形成下一代数据中心管理的统一框架。


OpenBMC是Facebook发起的开源项目,希望解决闭源的BMC(Baseboard Management Controller,基板管理控制器)以及相关的软件包标准不一的问题,这个问题给数据中心统一管理带来了很多技术障碍。DMTF(Distributed Management Task Force,分布式管理任务组)制定了下一代服务器管理技术标准Redfish,以取代当前IPMI 2.0,Redfish具有扩展性好、功能丰富、针对地址不同和供应商不同的基础设施向客户提供规范化管理接口的优点,能够满足现代数据中心的管理需求。


OpenRMC项目希望能够解决两个标准之间的互操作性等一系列问题,并建立协同机制,形成规范,推进下一代数据中心管理技术和产业的发展。


本次OCP China Day,浪潮相关技术负责人也将进行相应的主题分享。


SONiC,开放融合的SDN技术生态


SONiC是微软发布的开源交换机操作系统,是一个成熟的SDN软件平台,实现了数据控制面与转发面的分离,用户可以采购白牌交换机搭载SONiC实现不同的网络功能,SONiC使得用户能够更快的调试、修复并测试软件,通过改变软件策略和拓扑实现新的网络架构,让网络实践更为灵活。


另外,ODCC社区的凤凰项目同SONIC也十分类似,都是在构建一个标准开放融合的网络技术生态,从根本上改变传统网络紧耦合、高成本、灵活性差等问题。


本次OCP China Day,微软将携手阿里共同展现SONiC的最新进展,微软相关技术负责人也将进行专门的讲解和分享。


OCP China Day议程

OCP开放计算项目,如何推动数据中心持续创新?_第3张图片


还可以扫描下图二维码观看大会直播:

OCP开放计算项目,如何推动数据中心持续创新?_第4张图片



温馨提示:

点击原文链接获取更多即可了解2019 OPC开放计算中国日详情及观看直播!

640?wx_fmt=jpeg

640?wx_fmt=gif&wxfrom=5&wx_lazy=1

你可能感兴趣的:(OCP开放计算项目,如何推动数据中心持续创新?)