大数据的定义与特点

什么是大数据:

定义1 (Kusnetzky, Dan. What is "Big Data")
    所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理成人类所能解读的信息。

定义2 (维克托·迈尔舍恩伯格、肯尼斯·库克耶. "大数据时代")
    不用随机分析法(抽样调查)这样的捷径,而采用所有数据的方法。

定义3 ("大数据"(Big Data)研究机构Gartner)
    "大数据"是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率的信息资产。



大数据特点:
  • 多样性,复杂性(Variety):
    • 大数据种类繁多,在编码方式、数据格式和应用特征等各个方面都存在差异,因此也常常说大数据有一个重要特点,叫做多源异构(来自多个信息源,构造方式多种多样)
  • 速度(Velocity):
    • 速度快,数据持续到达,只在特定的时间和空间内数据才有意义
    • 须考虑能不能在扫描数据一次以内,甚至在log n复杂性以内解决问题
  • 数据量(Volume):
    • “大”
    • 由于数据量大必须考虑并行处理、必须考虑能不能想办法缩减其数据量、必须考虑能不能设计有效的存储结构存储这些数据
  • 基于高度分析的新价值(Value):

大数据的应用:
  • 预测
  • 推荐
  • 商业情报分析
  • 科学研究

你可能感兴趣的:(大数据)