风险数据集市是构建一个适应商业银行数据特点和信用风险管理需求的数据中心系统,为进一步完善商业银行全方位,多层次的信用风险管控体系服务,通过对海量的内外部数据按不同主题进行区分和加工,计算出各类指标等中间数据和衍生数据,将逐句中的隐含信息最大程度的加以挖掘,表达和运用,为信用风险管理提供服务.
定位于企业级风险数据的统一管理中心,对企业包括资产业务,风险评级,风险缓释,外部市场等风险相关业务数据进行汇总整合,通过统一的风险指标计算,有效识别,计量,监测预警和控制企业面对的各类风险,为业务决策,经营管理,外部监管等提供数据基础,持续提升企业风险管理的精细化水平,切实落实风险管理要求.
3.1.依赖数据仓库
依赖数据集市纯粹来自数据仓库,所有分组的依赖将形成企业数据仓库,它纯粹是数据仓库的一个子集,因为它是从中央dw创建的
由于中央数据仓库ETL流程或提取转换和传输中已经存在干净和汇总的数据,因此简化了.我们只需要在这里识别特定的子集并在其上执行ETL
这些数据集市通常旨在通过更好的控制和效率实现更好的可用性和大量改进的性能
3.2.独立数据集市
这不是从中央数据仓库创建的,其来源可能不同.由于数据来自中央DW之外的其他ETL过程有点不同.
大多数独立数据集市被较小的组织使用,其来源也有限.当我们需要在相对较短的时间内获取解决方案时.通常会创建独立数据集市.
3.3 混合数据集市
混合数据集市将允许来自中央数据仓库DW以外的所有其他数据来源的数据分组.当我们处理临时集成时,这将大大有利于外部添加到组织的所有产品的定级工作.
4.1.由于数据源集中于主体,因此通过使用它可以提高用户响应时间.
4.2.对于经常需要的数据,使用数据集市是有益的.
4.3.数据量有限,相对于数仓相比,效率会大幅度提高
4.4.基础设施依赖性非常有限,数据可以在分段后存储在不同的硬件平台上.
5.1.处理一小部分数据的数据仓库,这是最具成本效益的替代方案之一.
5.2.从源中分离数据将使数据集市高效,因为特定的一组人可以处理来自特定源的数据,而不是所有人都使用数据仓库
5.3.如果我们知道需要访问哪个子集,则可以使用数据集市更快的访问数据.
5.4.数据集市更易于使用,因此最终用户可以轻松的对其进行查询.
5,5.由于数据是按组隔离的,因此与数据仓库相比,进入实施时间所需的时间更少.
5.6.来自特定主题的历史数据可用于轻松的趋势分析.
6.1.设计:
其中确定了收集技术和业务信息所需的所有任务和来源.稍后实施逻辑计划,经过审查,将转化为物理计划.此外,这里决定了数据的逻辑和物理结构,例如如何分区数据和分享字段,如日期或者其他文件.
6.2.施工
在 Rdbms 的帮助下生成物理数据库,被确定为设计过程和逻辑结构的一部分,创建所有对象,如 schema,索引,表,视图等.
6.3.填充:
这里获取数据时将数据填充到其中.所有必须的转换都在填充数据之前实现.
6.4.访问:
我们将使用填充的数据进行查询以创建报告,最终用户使用此步骤来了解使用查询的数据.
6.5.管理
这里处理各种任务,例如访问管理,系统优化及调整,管理和向数据集市添加新数据以及规划恢复场景以及处理任何故障情况.