2021-03-07

HDFS =====> 解决存储问题
· MapReduce =====> 解决计算问题
· Yarn =====> 资源协调者
· Zookeeper =====> 分布式应用程序协调服务
· Flume =====> 日志收集系统
· Hive =====> 基于Hadoop的数仓工具
· HBase =====> 分布式、面向列的开源数据库
· Sqoop =====> 数据传递工具
· Scala =====> 多范式编程语言、面向对象和函数式编程的特性

· Spark =====> 目前企业常用的批处理离线/实时计算引擎

· Flink =====> 目前最火的流处理框架、既支持流处理、也支持批处理

· Elasticsearch =====> 大数据分布式弹性搜索引擎

· Python语言:编写一些脚本时会用到。

· 离线/实时项目

你可能感兴趣的:(2021-03-07)