【大数据】大数据初识

1. 什么是大数据
大数据是指无法在一定时间里用常规软件工具对其内容进行抓取、管理和处理的数据集合

2. 大数据特征
4V特征:
Volume(大数据量):90%的数据是过去两年产生的
Velocity(速度快):数据增长速度快,时效性高
Variety(多样性):数据种类和来源多样化----结构化数据、半结构化数据、非结构化数据
Value(价值密度低):需挖掘获取数据价值
固有特征:
时效性
不可变性
3.hadoop三大核心
分布式文件系统HDFS ---------解决大数据存储
分布式计算框架MapReduce ----------解决大数据计算
分布式资源管理系统YARN
4.为什么使用Hadoop?
高扩展性,可伸缩
高可靠性-----------------多副本机制,容错高
低成本
无共享架构
灵活,可储存任意类型数据
开源,社区活泼

你可能感兴趣的:(【大数据】大数据初识)