【30秒看懂大数据】数据湖

  • 简单说

数据湖是一个存储平台,存储了企业所有所需要的数据。

  • 举例理解

我们仍然以下周备餐为例。

我在网上买了牛排,又去超市购买了一堆蔬菜和肉,然后又去菜市场采购了很多大料比如干辣椒、辣椒面、桂皮、八角、薄荷、火锅底料,然后回来的路上又遇见了邻居,邻居说家里之前屯的螺狮粉还有好几包,于是回家时候又送了我2包。

此时我有网上买的牛排、超市买的蔬菜、肉,菜市场采购的大料配料、邻居送的螺狮粉。

所以这些食物的来源很多元,然后牛排是包装的、蔬菜是散的、鸡腿是冷冻的、猪肉是切丝的、大料有散称的也有小包装的,这些食物的形态是复杂多样的。

这些食物有点多,我跑了半天也有点累,所以我将这些所有的食物全部放进了厨房的储物柜中等待我休息好了在处理。

在这个例子中

1、  我的临时储物柜就是一个我食物的“数据湖”

2、  我的食物来源渠道都各不相同=数据湖的数据来源非常丰富多元

3、  我采购的食物各种包装形态=数据湖的数据类型不一,有成形也有不成形的 

4、  这些食物全部进储物柜=数据湖的数据非常繁多且丰富

大家可以注意到我这个数据湖存储的都是未经我处理的食物,大家把我采购的食物换成企业数据,就可以理解什么是数据湖了。

你可能感兴趣的:(生活中的数据学,大数据,大数据,数据分析,数据可视化,big,data)