Spark:实时数据微批处理(2.Spark Core:核心)

文章目录

  • 1.RDD 概述
    • 1.1 什么是 RDD?
    • 1.2 RDD 的 5 个主要属性(property)
    • 1.3 理解 RDD
      • 1.3.1 RDD 特点
  • 2.RDD 编程
    • 2.1 RDD 编程模型
    • 2.2 RDD 的创建
  • 3 RDD 的转换(transformation)
    • 3.1 Value 类型
      • map和mapPartitions
      • mapPartitionsWithIndex(func)
      • flatMap(func)
      • glom
      • groupBy
      • filter(func)

你可能感兴趣的:(bigdata,spark)