结构化数据(structured),半结构化数据(semi-structured),非结构化数据(unstructured)

 
研究一下分布式架构的实现方式
 

结构化数据(structured),半结构化数据(semi-structured),非结构化数据(unstructured)  


概念
结构化数据:即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据。
半结构化数据:介于完全结构化数据(如关系型数据库、面向对象数据库中的数据)和完全无结构的数据(如声音、图像文件等)之间的数据,HTML文档就属于半结构化数据。它一般是自描述的,数据的结构和内容混在一起,没有明显的区分。
非结构化数据:不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等。

数据模型
结构化数据:二维表(关系型)
非结构化数据:树、图
非结构化数据:无

其他
结构化数据:先有结构、再有数据
半结构化数据:先有数据,再有结构
阅读(41) | 评论(2)
|      

 
研究一下分布式架构的实现方式
 
VMWare虚拟化实践

 
2013-03-06 15:14
  雪融成冰
所以数据库的分类可以分为传统的关系型数据库,和NoSQL数据库,后者可以应付非结构化数据,当然应该也可以处理结构化数据。
回复
2013-03-06 15:09
  雪融成冰
一般来讲,结构化数据只占10%以内的比例,但是就是这10%以内的数据浓缩了过去很久以来的企业各个方面的数据需求,发展也已经成熟。但是随着大数据需求处理的大态势,对于结构化以外数据的处理越来越有市场,所以处理非结构化、半结构化的数据库,会慢慢成为数据处理的主流。
回复

你可能感兴趣的:(数据仓库和数据挖掘)