处理大数据的四个步骤

处理大数据的四个步骤:
  • 收集:原始数据种类多样,格式、位置、存储、时效性等迥异。数据收集从异构数据源中收集数据并转换成相应的格式方便处理。
  • 存储:收集好的数据需要根据成本、格式、查询、业务逻辑等需求,存放在合适的存储中,方便进一步的分析。
  • 变形:原始数据需要变形与增强之后才适合分析,比如网页日志中把IP地址替换成省市、传感器数据的纠错、用户行为统计等。
  • 分析:通过整理好的数据分析what happened、why it happened、what is happening和what will happen,帮助企业决策。


图:大数据处理的工作流

你可能感兴趣的:(处理大数据的四个步骤)