拼命Girl_Hadoop笔记(一):大数据概念、Hadoop框架概述

要了解Hadoop首先我们要知道大数据的概念是什么?

1. 大数据概念

	(1)大数据是什么
	 官方理解:大数据(Big Date):指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
    自己理解:数据量大、数据种类多样、要求实时性强。也就是一种规模非常大的,在分析、管理、存储和获取等方面都超出了传统的数据库软件所具有的功能处理范围的巨大数据的调集。
    (2)特点:(4V)
	        海量的数据规模(Volume)
			数据类型多种多样(Variety)
			快速的数据流转和动态的数据体系(Velocity)
			巨大的数据价值(Value)

2.标题Hadoop框架

2.1 Hadoop是什么

Hadoop是一个开源的框架,可编写和运行分布式应用处理大规模数据,是专门为离线和大数据分析而设计的,不适合对几个记录随机读写的在线事务处理模式。
Hadoop=HDFS(文件系统,数据存储技术相关)和Mapreduce(数据处理)。Hadoop就是一个分布式计算的解决方案。

2.2 Hadoop的优势

	1)	高可靠:Hadoop底层维护多个数据副本,所以即便Hadoop某个计算元素或存储出现故障,也不会导致数据的丢失。
	2)	高扩展性:在集群间分配任务数据,可方便的扩展数以千计的节点。
	3)	高效性:在MapReduce的思想下,Hadoop是并行工作的,以加快任务处理速度‘’
	4)	高容错性:能自动将失败的任务重新分配

2.3 Hadoop组成

Hadoop1.x和hadoop2.x的区别
拼命Girl_Hadoop笔记(一):大数据概念、Hadoop框架概述_第1张图片
拼命Girl_Hadoop笔记(一):大数据概念、Hadoop框架概述_第2张图片
Yarn架构
拼命Girl_Hadoop笔记(一):大数据概念、Hadoop框架概述_第3张图片
MapReduce架构概述:
拼命Girl_Hadoop笔记(一):大数据概念、Hadoop框架概述_第4张图片

你可能感兴趣的:(hadoop,Hadoop,概述,大数据)