2016 年 8 月 31 日SAP正式向全球推出了新一代的数据仓库产品 SAP BW/4 HANA ,在2016年10月21日举办的SAP贵阳大数据峰会上,SAP正式面向中国市场发布了这一划时代的产品。
SAP BW/4 HANA是SAP基于内存计算技术推出的下一代数据仓库解决方案,通过该解决方案,无论企业内外的历史信息或实时信息,都能够通过全新的逻辑数据仓库达到更加简化、更加强大、更加灵活、更加实时的分析。
由于该产品基于全新的架构和设计,因此大家对BW/4 HANA一定有很多关注,下面我们分四个章节来详细阐述一下BW/4 HANA解决方案的亮点。
更加简化的系统
对象的简化
将传统的虚拟提供者全部切换到Composite Provider和Open ODS View,其中Open ODS View主要基于HANA视图提供数据,Composite Provider通过组合其他虚拟对象对外提供数据。而传统的Cube、DSO等则全部转换为Advanced Data Store Object –ADSO。信息对象的概念得以保留。
数据流的简化
通过引入虚拟提供者的概念,BW/4 HANA上的提供者能够访问从数据来源直到整合完毕之后的数据,而传统我们通常是在最后的Data Mart数据集市上出具业务分析。
数据温度管理的简化
按照传统数据仓库的概念,操作性数据存储在DSO中用以出具操作性的报表,汇总的数据存储在Cube中,出具汇总分析报表。在BW/4 HANA中,系统可以将数据进行不同温度级别的管理,依据数据的访问频次和可能性,将数据分为“热数据”、“温数据”、“冷数据”,在新的架构下,冷数据可以通过SAP IQ或者Hadoop予以管理,温数据可以通过扩展结点的方式予以管理,而热数据则常驻内存。
开放性
对象的SQL访问
我们知道,传统的数据输出载体(信息提供者+Query)到了BW/4 HANA中被简化的只剩下查 询、Composite Provider、Advanced DSO、Infoobject了,而基于HANA平台的BW为了统一数据的访问,允许在HANA底层产生这些输出载体的计算视图,这样就能够像一般的HANA视图那样被前端工具单独或者联合起来使用了。
真正的实时数据集成
困扰传统BW的一大主要原因就是数据无法实时复制,尽管后续推出了Daemon的方式,但是使用者寥寥。全新的BW/4 HANA充分利用了HANA数据集成的相关功能,通过提供Smart Data Integration和Operational Data Queue的方式最大限度的保证数据的实时同步/复制,从而一举解决了数据的时效性问题。当然,如果用户能够使用类似于SAP SLT的工具进行同步和管理就再好不过了。
简化的源系统
传统的BW发展到730、740版本的时候,已经出现了多达10种类型的源系统,这些源系统既有传统的Business Suite应用系统和文本文件系统,也有新增加的Data Service和ODP等,以至于很多时候,我们自己都有点选择困难。比如针对ERP的数据,我们不知道到底采用传统的数据源,还是使用ODP的数据源。全新的BW/4 HANA将源系统大大的简化为“HANA源系统连接”、“ODP”、“文件系统”等三种。其中所有的数据库和文件系统采用"HANA源系统"连接;所有的SAP Suite相关的应用采用“ODP” 连接;文本文件的上载则依然采用“文件系统”的方式。
全新的界面
BWMT的全面使用
在传统的BW中,我们通常戏称“一个T-Code走天涯”,那就是RSA1(虽然实际上我们还有RSD1 RSH1 RSANWB等事务代码,但是大多数可以通过RSA1进行跳转)。在全新的BW/4 HANA中,我们主要设计工具已经转换到基于Eclipse的BW Modeling Tool上来了,简称BWMT。一般情况下,安装BWMT的先决条件是安装了HANA Studio以及ABAP Development Tool (简称ADT)。全新的对象ADSO以及Composite Provider的编辑等工作只能在BWMT中进行,传统SAP GUI的方式不再支持。
全新的用户界面
基于Excel的Business Explorer Analyzer(简称Analyzer)伴随着BW的出现而诞生,从BW 3.5开始,SAP又引进了Besiness Explorer Web组件(简称Bex Web)。随着技术的升级换代和对于Business Object公司的收购,在BW/4 HANA之前,大家主要还是使用Webi或者Dashboard进行数据的展现和在线分析。针对BW/4 HANA,SAP推出了几种全新的BI工具。
Analysis for Office替代了传统的Analyzer
针对BI cloud,推出了对应的基于云计算的分析工具
而传统基于Flash技术的Dashboard将会逐步的退出历史舞台,取而代之的是基于HTML5技术的Design Studio (后续Design Studio也会和Lumira合并为新的Lumira产品)
全新的系统监控界面
对于数据仓库管理员而言,最大的痛点就是不能够更加直观的管理系统的数据加载。一般来说,我们要么采取管理员主动登录SAP GUI并且使用RSPC或者RSMO等方式进行PULL式样的查看,这样的方式不是很方便灵活;要么在系统出错时通过邮件的方式通知管理员,但是这样又丢失了正确处理的信息。全新的BW/4 HANA推出的基于HTML5界面的处理链监控界面很好的兼顾了二者的优点,同时支持移动管理。
高性能
基于内存计算的数据仓库
由于全新设计的BW/4 HANA只能基于HANA产品,因而在HANA“闪电般速度”的基础上,我们就不再需要"聚集"和"上翻"动作了,同时传统方式下为了解决性能问题而特定为某种场景创建的提高性能的方式也可以摒弃了。
由于传统的BW数据仓库设计的时候采取的是扩展的多维星型结构,指标和维度表之间通过Dimesion ID予以连接,维度表和主数据表(属性、文本、层次结构)之间再次通过SID进行连接,因此就产生了很多的索引ID,而BW/4 HANA则取消了维度表,降低了索引的数量。
同时,基于HANA的数据比较和修改都比传统数据库来的更加快捷,因此在数据的装载,特别是DSO数据的激活上能够极大的提升性能。
算法的下推
在传统BW模式下,由于系统采用三层架构,任何数据的运算必须首先从数据库服务器传输至应用服务器,在应用服务器执行完相关的算法之后,再将得到的结果回传至数据库服务器进行更改,这样一来,数据处理的速度就大为降低。全新一代的BW/4 HANA基于SAP HANA内存数据库,将前端数据分析、数据管理以及可能涉及到的计划功能(BPS、BPC等)大部分都向下内置到HANA数据库中进行,减少了数据足迹,因此能够大大的提升系统的性能。
全新的分析处理HAP
在传统BW模式下,从数据来源到数据目标的处理,我们都是通过转换来进行处理,转换执行的过程大多数可以理解为ABAP程序的执行,在结构化的数据处理上显得完全满足,但是大数据时代下的数据分析需求显然远远超过了结构化数据的要求。
全新一代的BW/4 HANA产品通过引入HANA Analysis Procee的方式,集成使用HANA内置的相关函数库、R语言的使用、或者自定义功能处理,可以进行预测性分析、文本分析、数据挖掘、机器学习等任务。
全新的系统架构
架构决定了一套系统的前景,恰如其分的架构设计能够最大限度的发挥系统本身的作用,传统BW基于三层的系统架构已经不太适用大数据时代的数据处理需求,因此BW/4 HANA推出了全新的系统架构。
在BW/4 HANA的系统架构中,数据仓库分为HANA平台和BW/4 HANA Server两层,其上则是SAP Business Objects或者第三方BI工具。这样一来,我们就不再需要Java Stack,而且由于BW/4 HANA建模环境基于HANA运行,因此系统也更加的扁平,更有利于发挥SAP HANA闪电般速度的特质。