商业智能简述

一、概念
商业智能(Business Intelligence),简称BI,又称商业智慧或商务智能,主要指利用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术 进行数据分析 以实现商业价值。
商业智能技术提供 使企业迅速分析数据 的技术和方法,包括 收集、管理和分析数据,将这些数据转化为有用的信息,然后分发到企业各处。
商业智能是对商业信息的收集、管理和分析的过程,目的:使企业的各级决策者获得知识或洞察力,促使他们作出对企业更有利的决策。
商业智能一般由数据仓库、联机分析处理(OLAP)、数据挖掘、数据备份和恢复等部分组成
商业智能的实现涉及到:软件、硬件、咨询服务、应用,基本体系结构包括:数据仓库、联机分析处理(OLAP)、数据挖掘三个部分。

综上,把商业智能看成是一种解决方案应该比较恰当。其关键是:

  1. 从许多来自不同的企业运作系统的数据中提取出有用的数据并进行清洗,以保证数据的正确性
  2. 然后经过抽取(Extraction)、转换(Transformation)、装载(Load),即ETL过程,合并到一个企业级的数据仓库里,从而得到企业数据的一个全局视图
  3. 在此基础上利用合适的查询和分析工具、数据挖掘工具、OLAP工具等对其进行分析和处理(这时信息变为辅助决策的知识),最后将知识呈现给管理者,为管理者的决策过程提供支持

二、相关定义

  1. OLAP工具:提供多维数据管理环境,其典型的应用是对商业问题的建模与商业数据分析,OLAP也被称为多维分析

  2. 数据挖掘(Data Mining)软件:使用如 神经网络、关联分析等技术来发现数据之间的关系,做出基于数据的推断

  3. 数据仓库(Data Warehouse)和数据集市(Data Mart)产品:包括数据转换、管理和存取等方面的预配置软件,通常还包括一些业务模型,如财务分析模型

  4. 联机分析处理(OLAP):此概念最早是由关系数据库之父E.F.Codd于1993年提出,他同时提出了关于OLAP的12条准则,OLAP的提出引起了很大的反响,OLAP作为一类产品同 联机事务处理(OLTP) 明显区分开来

  5. 现今的数据处理大致可以分为两大类:
    联机事务处理OLTP(On-Line Transaction Processing)
    联机分析处理OLAP(On-Line Analytical Processing)

    OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,如银行交易

    OLAP主要是数据仓库系统的应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果

    OLAP是使分析人员、管理人员或执行人员能够从多角度对信息进行快速、一致、交互的存取,从而获得 对数据的更深入了解的一类软件技术。

    OLAP的目标是:满足决策支持或者满足在多维环境下特定的查询和报表需求,它的技术核心是“”这个概念

    通过把一个实体的多项重要的属性(如:性别、年龄、籍贯等)定义为多个(dimension),使用户能更方便的对不同维上的数据进行比较,因此OLAP也可以说是多维数据分析工具的集合

    OLAP的基本多维分析操作有:钻取(roll up和drill down)、切片(slice)、切块(dice)、旋转(pivot)、drill across、drill through等

    1、钻取是改变维的层次,变换分析的粒度。包括向上钻取( roll up)和向下钻取(drill down),roll up是在某一维上将低层次的细节数据概括到高层次的汇总数据,或者减少维数;而drill down则相反,他从汇总数据深入到细节数据进行观察或增加新维
    
    2、切片和切块是在一部分维上选定值后,关心度量数据在剩余维上的分布,如果剩余的维只有两个,则是切片,如果有三个或以上,则是切块
    
    3、旋转是变换维的方向,即在表格中重新安排维的放置(例如行列互换)
    

    OLAP有多种实现方法,根据存储数据的方式不同可以分为ROLAP、MOLAP、HOLAP

    1、ROLAP表示基于关系数据库的OLAP实现(Relational OLAP):以**关系数据库**为核心,以关系型结构进行多维数据的表示和存储。
    ROLAP将多维数据库的多维结构划分为两类表:(1)事实表,用来存储数据和维关键字;(2)维表,对每个维至少使用一个表来存放维的层次、成员类别等维的描述信息
    维表和事实表通过主关键字和外关键字联系在一起,形成了“星型模式”。对于层次复杂的维,为避免冗余数据占用过大的存储空间,可以使用多个表来描述,这种星型模式的扩展称为“雪花模式”
    
    2、MOLAP表示基于多维数据组织的OLAP实现(Multidimentional OLAP):以**多维数据组织方式**为核心,也就是说MOLAP使用多维数组存储数据。多维数据在存储中将形成“立方块(Cube)”的结构,在	MOLAP中对“立方块”的“旋转”、“切块”、“切片”是产生多维数据报表的主要方式
    
    3、HOLAP表示基于混合数据组织的OLAP实现(Hybrid OLAP),如底层是关系型的,高层是多维矩阵型的,这种方式具有更好的灵活性
    
    4、还有其他的一些对OLAP的实现方式,如提供一个专用的SQL Server,对某些存储模式(如星型模式、雪花模式)提供对SQL查询的特殊支持
    

    OLAP工具是针对特定问题的联机数据访问与分析,他通过多维的方式对数据进行查询、分析和报表。维是人们观察数据的特定角度

    例如:
    一个企业在考虑产品的销售情况时,通常从时间、地区和产品的不同角度来观察产品的销售情况,这里的时间、地区和产品就是维,而这些维的不同组合和所考察的度量指标构成的多维数组则是OLAP分析的基础,可形式化表示为(维1,维2,........,维n,度量指标),如(地区、时间、产品、销售额)。多维分析是指对以多维形式组织起来的数据采取切片(slice)、切块(dice)、钻取(roll up 和drill down)、旋转(pivot)等各种分析动作,以求剖析数据,使用户能从多个角度、多侧面的观察数据库中的数据,从而深入理解包含在数据中的信息
    

总结
商业智能作为一个工具,用来处理企业现有数据,并将其转换成知识、分析和结论,辅助业务或决策者做出正确且明智的决定。是帮助企业更好的利用数据提高决策质量的技术

三、数据质量

(一)、数据质量角色
1、对于增强数据资产准确度和价值而言,将数据质量规则与活动(探查、清洗、监测)和MDM(主数据管理)流程结合显得十分关键
2、在启动任何MDM项目之前都需要了解源数据的内容、质量、结构

(二)、数据质量水平与商业智能的关系
1、企业的商业智能只会与企业的数据质量水平相当

你可能感兴趣的:(概念)