Hadoop 是什么?

什么是 Hadoop?

其实 Hadoop 就是一个开源框架,可支持数据密集型[分布式]的应用程序,Hadoop的框架最核心的设计就是:HDFS(Hadoop Distributed File System,Hadoop的分布式文件系统) 和 MapReduce(是 Google 提出的一个软件架构 ,用于大规模数据集(大于1TB )的并行运算。)

HDFS 为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。

Hadoop 具体能干什么?

狭义:Hadoop 擅长(海量离线)日志分析。

广义:在线的实时分析、海量的数据存储、(比如视频监控系统,交通摄像头,拍摄视频存在HDFS)

能解决什么问题?

1)海量数据的存储(HDFS)
2)海量数据的分析(MapReduce)
3)资源管理调度(YARN)

你可能感兴趣的:(Hadoop 是什么?)