Hadoop-特点+架构+HDFS详解(文件读写流程)+MapReduce详解(架构+原理)+Yarn详解(工作机制)
基本属性分布式结构:由于分布在不同主机上的进程,协同工作,一起才能构成整个应用。4V特征Volumn:体量大,单个数据体量大,数据条数也是海量。Velocity:数据快,数据时效性高,由于产生的数据基数大的原因,数据的截获,存储,操作必须要高速。Variaty:样式多,可以存储多种类型的数据,包括结构化数据,例如表格,半结构化数据,例如日志、网址,和非结构化数据,例如图片、视频等。Value:价值