大数据学习笔记—大数据概论

大数据概论

  • 一、 大数据的概念
  • 二、大数据的特点(4V)
  • 三、 大数据的应用场景
  • 四、大数据的发展前景
  • 五、大数据部门的业务流程/组织结构

一、 大数据的概念

大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产
主要解决海量数据的存储和海量数据的分析计算问题。

二、大数据的特点(4V)

  1. 大量(Volume)
    数据量大
    截至目前,人类生产的所有印刷材料的数据量约200PB,而历史上人类总共说过的话的数据量大约是5EB。当前,典型个人计算机硬盘的容量为TB量级,而一些大企业的数据量已经接近EB量级。
  2. 高速(Velocity)
    数据产生的速度快
    这是大数据区分与传统数据挖掘的最显著特征,根据IDC的“数字宇宙”的报告,预计到2020年,全球数据使用量将达到35.2ZB。在如此海量的数据面前,处理数据的效率就是企业的生命。
  3. 多样(Variety)
    数据多种多样
    数据类型的多样性也让数据分为结构化和非结构化数据。相对与以往便于存储的以数据库/文本为主的结构化数据,非结构化数据越来越多,包括网络日志、音频、视频、图片地理位置信息等。多类型的数据对数据的处理能力提出了更高的要求。
  4. 低价值密度(Value)
    数据价值密度低
    价值密度的高低与数据总量的大小成反比。如何对有价值数据“提纯”成为目前大数据背景下待解决的难题。

三、 大数据的应用场景

  1. 物流仓储:大数据分析系统助力商家精细化运营、提升销量、节约成本。
  2. 零售:分析用户消费习惯,为用户购买提供方便,从而提升商品销量。
  3. 旅游:深度结合大数据能力与旅游行业需求,共建旅游产业智慧管理、智慧服务和智慧营销。
  4. 推荐:给用户推荐可能喜欢的商品。
  5. 保险:海量数据挖掘及风险预测,助力保险行业精准营销,提升精细化定价能力。
  6. 金融:多维度体现用户特征,帮助金融机构推荐优质客户,防范欺诈风险。
  7. 房产:大数据全面助力房地产行业,打造精准投策与营销,选出更合适的地,建造更合适的楼,卖给更合适的人。
  8. 人工智能

四、大数据的发展前景

  1. 党的十八大提出 “实施国家大数据战略” ,国务院印发《促进大数据发展行动纲要》,大数据技术和应用处于创新突破期,国内市场需求处于爆发期,我国大数据产业面临重要的发展机遇。
  2. 党的十九大提出 “推动互联网、大数据、人工智能和实体经济深度融合”
  3. 国际数据公司IDC预测,到2020年,企业基于大数据计算分析平台的支出将突破5000亿美元。目前我国大数据人才约46万,人才缺口达150万。
  4. 2017年,北京大学、中国人民大学、北京邮电大学等25所高校成功申请开设大数据课程。
  5. 大数据属于高新技术,大牛少,升职竞争小。
  6. 大数据开发工程师的平均薪水已达到15k-40k,且目前还保持着强劲发展势头。

注:数据来源2018年-2019年

五、大数据部门的业务流程/组织结构

  1. 业务流程图
    在这里插入图片描述
  2. 组织结构图
    大数据学习笔记—大数据概论_第1张图片

你可能感兴趣的:(大数据)