【基础知识】大数据概述

关键词—分布式

化整为零,再化零为整

大数据的定义

传统数据库处理起来困难的数据集。

发展历程

【基础知识】大数据概述_第1张图片

中国开源生态图谱2023

【基础知识】大数据概述_第2张图片

参考内容

中国开源生态图谱 2023.pdf

技术组件说明

数据集成

sqoop、dataX、flume

数据存储

hdfs、kafka

数据处理

mapreduce、hive、impala、spark、flink

数据分析

hbase、mysql、greenplum(postgreSQL)、clickhouse

应用场景

数据分析——决策
大数据是一种解决方案,但不一定是最高效的方案。

你可能感兴趣的:(大数据)