雾岛与鲸

使用Spark操作Hudi

开发环境:
hadoop 2.7.6
hive 2.3.7
spark 2.4.5

1、pom文件

  <repositories>
    <repository>
      <id>maven-aliid>
      <url>http://maven.aliyun.com/nexus/content/groups/public//url>
      <releases>
        <enabled>trueenabled>
      releases>
      <snapshots>
        <enabled>trueenabled>
        <updatePolicy>alwaysupdatePolicy>
        <checksumPolicy>failchecksumPolicy>
      snapshots>
    repository>
  repositories>

  <dependencies>
    <dependency>
      <groupId>org.apache.hudigroupId>
      <artifactId>hudi-clientartifactId>
      <version>0.5.3version>
    dependency>

    <dependency>
      <groupId>org.apache.hudigroupId>
      <artifactId>hudi-hiveartifactId>
      <version>0.5.3version>
    dependency>

    <dependency>
      <groupId>org.apache.hudigroupId>
      <artifactId>hudi-spark-bundle_2.11artifactId>
      <version>0.5.3version>
    dependency>

    <dependency>
      <groupId>org.apache.hudigroupId>
      <artifactId>hudi-commonartifactId>
      <version>0.5.3version>
    dependency>

    <dependency>
      <groupId>org.apache.hudigroupId>
      <artifactId>hudi-hadoop-mr-bundleartifactId>
      <version>0.5.3version>
    dependency>

    
    <dependency>
      <groupId>org.apache.sparkgroupId>
      <artifactId>spark-core_2.11artifactId>
      <version>2.4.5version>
    dependency>
    <dependency>
      <groupId>org.apache.sparkgroupId>
      <artifactId>spark-sql_2.11artifactId>
      <version>2.4.5version>
    dependency>
    <dependency>
      <groupId>org.apache.sparkgroupId>
      <artifactId>spark-hive_2.11artifactId>
      <version>2.4.5version>
    dependency>
    <dependency>
      <groupId>org.apache.sparkgroupId>
      <artifactId>spark-avro_2.11artifactId>
      <version>2.4.5version>
    dependency>
    <dependency>
      <groupId>org.apache.hadoopgroupId>
      <artifactId>hadoop-clientartifactId>
      <version>2.7.2version>
    dependency>
    <dependency>
      <groupId>com.alibabagroupId>
      <artifactId>fastjsonartifactId>
      <version>1.2.47version>
    dependency>
    <dependency>
      <groupId>org.apache.sparkgroupId>
      <artifactId>spark-hive_2.11artifactId>
      <version>2.4.5version>
    dependency>
    <dependency>
      <groupId>org.spark-project.hivegroupId>
      <artifactId>hive-jdbcartifactId>
      <version>1.2.1.spark2version>
    dependency>

  dependencies>

2、模拟数据工具类

import java.io.{BufferedWriter, File, FileWriter}
import scala.util.Random

case class DwsMember(uid: Int,
                     ad_id: Int,
                     var fullname: String,
                     iconurl: String,
                     dt: String,
                     dn: String
                    )

object GenDataUtils {

  def main(args: Array[String]): Unit = {

    val writeFile = new File("text.txt")
    val writer = new BufferedWriter(new FileWriter(writeFile))

    for(i <- 1 to 10){

      val dwsMember = DwsMember(i, Random.nextInt(i),
        s"spark_hudi_${Random.nextInt(5)}",
        s"www.baidu_${randomString(10)}.com",
        "2021-03-04",        // 后面这两个属于分区
        s"dept_${Random.nextInt(10)}"
      )
      println(GsonUtil.toJson(dwsMember))
      writer.write(GsonUtil.toJson(dwsMember)+"\n")
    }

    writer.close()

  }

  /**
   * 生成随机字符串
   * @param len 长度
   * @return
   */
  def randomString(len: Int): String = {
    val rand = new scala.util.Random(System.nanoTime)
    val sb = new StringBuilder(len)
    val ab = "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz"
    for (i <- 0 until len) {
      sb.append(ab(rand.nextInt(ab.length)))
    }
    sb.toString
  }
}

3、配置文件

将集群配置文件复制到resources文件夹下，使本地环境可以访问hadoop集群

4、Hudi写Hdfs

import com.google.gson.Gson
import com.zyh.bean.DwsMember
import org.apache.hudi.DataSourceReadOptions
import org.apache.spark.sql.{SaveMode, SparkSession}


object HoodieDataSourceExample {

  def main(args: Array[String]): Unit = {

    val sparkSession = SparkSession
      .builder()
      .appName("dwd_member_import")
      .master("local[*]")
      .config("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
      .enableHiveSupport()
      .getOrCreate()


    val ssc = sparkSession.sparkContext
    ssc.hadoopConfiguration.set("fs.defaultFS", "hdfs://localhost:8020")
    ssc.hadoopConfiguration.set("dfs.nameservices", "localhost")

    // insertData(sparkSession)
    // queryData(sparkSession)
    // updateData(sparkSession)
    // incrementalQuery(sparkSession)
    // pointInTimeQuery(sparkSession)
  }


  /**
   * 读取hdfs日志文件通过hudi写入hdfs
   * @param sparkSession
   */
  def insertData(sparkSession: SparkSession) = {

    import org.apache.spark.sql.functions._
    import sparkSession.implicits._

    val commitTime = System.currentTimeMillis().toString //生成提交时间
    val df = sparkSession.read.text("/user/test/ods/member.log")
      .mapPartitions(partitions => {
        val gson = new Gson
        partitions.map(item => {
          gson.fromJson(item.getString(0), classOf[DwsMember])
        })
      })

    val result = df.withColumn("ts", lit(commitTime)) //添加ts 时间戳列
      .withColumn("uuid", col("uid"))       //添加uuid 列 如果数据中uuid相同hudi会进行去重
      .withColumn("hudipartition", concat_ws("/", col("dt"), col("dn"))) //增加hudi分区列

    result.write.format("org.apache.hudi")
      //      .options(org.apache.hudi.QuickstartUtils.getQuickstartWriteConfigs)
      .option("hoodie.insert.shuffle.parallelism", 12)
      .option("hoodie.upsert.shuffle.parallelism", 12)
      .option("PRECOMBINE_FIELD_OPT_KEY", "ts")  //指定提交时间列
      .option("RECORDKEY_FIELD_OPT_KEY", "uuid") //指定uuid唯一标示列
      .option("hoodie.table.name", "testTable")
      //      .option(DataSourceWriteOptions.DEFAULT_PARTITIONPATH_FIELD_OPT_VAL, "dt") //  发现api方式不起作用 分区列
      .option("hoodie.datasource.write.partitionpath.field", "hudipartition") //分区列
      .mode(SaveMode.Overwrite)
      .save("/user/zyh/hudi")
  }

查看hdfs目录 /user/zyh/hudi :

5、查询hdfs上的hudi数据

/**
   * 查询hdfs上的hudi数据
   * @param sparkSession
   */
  def queryData(sparkSession: SparkSession) = {
    val df = sparkSession.read.format("org.apache.hudi")
      .load("/user/zyh/hudi/*/*")

    // 执行sql, 需要启动hive
    df.createOrReplaceTempView("hudi_trips_snapshot")
    sparkSession.sql(
      """
        |select * from hudi_trips_snapshot
        |where uuid <= 10
        |""".stripMargin).show()
    // df.show()
  }

查询结果:

+-------------------+--------------------+------------------+----------------------+--------------------+---+-----+------------+--------------------+----------+--------+-------------+----+-------------------+
|_hoodie_commit_time|_hoodie_commit_seqno|_hoodie_record_key|_hoodie_partition_path|   _hoodie_file_name|uid|ad_id|    fullname|             iconurl|        dt|      dn|           ts|uuid|      hudipartition|
+-------------------+--------------------+------------------+----------------------+--------------------+---+-----+------------+--------------------+----------+--------+-------------+----+-------------------+
|     20220307112306|  20220307112306_0_1|                 9|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  9|    7|spark_hudi_1|www.baidu_NobsixQ...|2021-03-04|dept_555|1646623382412|   9|2021-03-04/dept_555|
|     20220307112306|  20220307112306_0_2|                 4|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  4|    1|spark_hudi_0|www.baidu_poUl3kG...|2021-03-04|dept_555|1646623382412|   4|2021-03-04/dept_555|
|     20220307112306|  20220307112306_0_3|                 6|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  6|    5|spark_hudi_3|www.baidu_EToGOeF...|2021-03-04|dept_555|1646623382412|   6|2021-03-04/dept_555|
|     20220307112306|  20220307112306_0_4|                 1|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  1|    0|spark_hudi_3|www.baidu_jVe5qFR...|2021-03-04|dept_555|1646623382412|   1|2021-03-04/dept_555|
|     20220307112306|  20220307112306_0_5|                 8|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  8|    6|spark_hudi_3|www.baidu_3QIQkmT...|2021-03-04|dept_555|1646623382412|   8|2021-03-04/dept_555|
|     20220307112306|  20220307112306_0_6|                 3|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  3|    0|spark_hudi_1|www.baidu_y8Iy34C...|2021-03-04|dept_555|1646623382412|   3|2021-03-04/dept_555|
|     20220307112306|  20220307112306_0_7|                 5|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  5|    3|spark_hudi_0|www.baidu_805Kokn...|2021-03-04|dept_555|1646623382412|   5|2021-03-04/dept_555|
|     20220307112306|  20220307112306_0_8|                10|   2021-03-04/dept_555|c62c0c00-3690-4e6...| 10|    9|spark_hudi_3|www.baidu_JLTvL1M...|2021-03-04|dept_555|1646623382412|  10|2021-03-04/dept_555|
|     20220307112306|  20220307112306_0_9|                 7|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  7|    5|spark_hudi_1|www.baidu_qmvx6sB...|2021-03-04|dept_555|1646623382412|   7|2021-03-04/dept_555|
|     20220307112306| 20220307112306_0_10|                 2|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  2|    1|spark_hudi_2|www.baidu_n1tM4fJ...|2021-03-04|dept_555|1646623382412|   2|2021-03-04/dept_555|
+-------------------+--------------------+------------------+----------------------+--------------------+---+-----+------------+--------------------+----------+--------+-------------+----+-------------------+

6、修改hdfs上的hudi数据

另外生成10条数据，上传hdfs

def updateData(sparkSession: SparkSession) = {
    import org.apache.spark.sql.functions._
    import sparkSession.implicits._
    val commitTime = System.currentTimeMillis().toString //生成提交时间
    val df = sparkSession.read.text("/user/test/ods/member2.log")
      .mapPartitions(partitions => {
        val gson = new Gson
        partitions.map(item => {
          gson.fromJson(item.getString(0), classOf[DwsMember])
        })
      })
    val result = df.withColumn("ts", lit(commitTime)) //添加ts 时间戳列
      .withColumn("uuid", col("uid")) //添加uuid 列 如果数据中uuid相同hudi会进行去重
      .withColumn("hudipartition", concat_ws("/", col("dt"), col("dn"))) //增加hudi分区列

    result.write.format("org.apache.hudi")
      //      .options(org.apache.hudi.QuickstartUtils.getQuickstartWriteConfigs)
      .option("hoodie.insert.shuffle.parallelism", 12)
      .option("hoodie.upsert.shuffle.parallelism", 12)
      .option("PRECOMBINE_FIELD_OPT_KEY", "ts")  //指定提交时间列
      .option("RECORDKEY_FIELD_OPT_KEY", "uuid") //指定uuid唯一标示列
      .option("hoodie.table.name", "testTable")
      //      .option(DataSourceWriteOptions.DEFAULT_PARTITIONPATH_FIELD_OPT_VAL, "dt") //  发现api方式不起作用 分区列
      .option("hoodie.datasource.write.partitionpath.field", "hudipartition") //分区列
      .mode(SaveMode.Append)
      .save("/user/zyh/hudi")
  }

虽然代码操作和新增一样只是修改了插入模式为append, 但是hudi会根据 uuid 判断进行更新数据，操作完毕后，生成一份最新的修改后的数据，同时hdfs 路径上写入一份数据。

查询数据, 表中提交时间发生了变化:

+-------------------+--------------------+------------------+----------------------+--------------------+---+-----+------------+--------------------+----------+--------+-------------+----+-------------------+
|_hoodie_commit_time|_hoodie_commit_seqno|_hoodie_record_key|_hoodie_partition_path|   _hoodie_file_name|uid|ad_id|    fullname|             iconurl|        dt|      dn|           ts|uuid|      hudipartition|
+-------------------+--------------------+------------------+----------------------+--------------------+---+-----+------------+--------------------+----------+--------+-------------+----+-------------------+
|     20220307112631|  20220307112631_0_1|                 9|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  9|    8|spark_hudi_4|www.baidu_SRovjgs...|2021-03-04|dept_555|1646623586500|   9|2021-03-04/dept_555|
|     20220307112631|  20220307112631_0_2|                 4|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  4|    0|spark_hudi_1|www.baidu_jiSM0oC...|2021-03-04|dept_555|1646623586500|   4|2021-03-04/dept_555|
|     20220307112631|  20220307112631_0_3|                 6|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  6|    2|spark_hudi_1|www.baidu_O3S0YnZ...|2021-03-04|dept_555|1646623586500|   6|2021-03-04/dept_555|
|     20220307112631|  20220307112631_0_4|                 1|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  1|    0|spark_hudi_1|www.baidu_MqF7avB...|2021-03-04|dept_555|1646623586500|   1|2021-03-04/dept_555|
|     20220307112631|  20220307112631_0_5|                 8|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  8|    4|spark_hudi_4|www.baidu_HU0td3F...|2021-03-04|dept_555|1646623586500|   8|2021-03-04/dept_555|
|     20220307112631|  20220307112631_0_6|                 3|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  3|    1|spark_hudi_2|www.baidu_f8neGOp...|2021-03-04|dept_555|1646623586500|   3|2021-03-04/dept_555|
|     20220307112631|  20220307112631_0_7|                 5|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  5|    2|spark_hudi_1|www.baidu_BOYBqAQ...|2021-03-04|dept_555|1646623586500|   5|2021-03-04/dept_555|
|     20220307112631|  20220307112631_0_8|                10|   2021-03-04/dept_555|c62c0c00-3690-4e6...| 10|    6|spark_hudi_0|www.baidu_17CF5VH...|2021-03-04|dept_555|1646623586500|  10|2021-03-04/dept_555|
|     20220307112631|  20220307112631_0_9|                 7|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  7|    2|spark_hudi_2|www.baidu_f1Da431...|2021-03-04|dept_555|1646623586500|   7|2021-03-04/dept_555|
|     20220307112631| 20220307112631_0_10|                 2|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  2|    1|spark_hudi_1|www.baidu_4hZECat...|2021-03-04|dept_555|1646623586500|   2|2021-03-04/dept_555|
+-------------------+--------------------+------------------+----------------------+--------------------+---+-----+------------+--------------------+----------+--------+-------------+----+-------------------+

注: 只有同一个分区的uuid，数据才会被更新

7、增量查询

def incrementalQuery(sparkSession: SparkSession) = {
    val beginTime = 20220307104004L
    val df = sparkSession.read.format("org.apache.hudi")
      .option(DataSourceReadOptions.QUERY_TYPE_OPT_KEY, DataSourceReadOptions.QUERY_TYPE_INCREMENTAL_OPT_VAL) //指定模式为增量查询
      .option(DataSourceReadOptions.BEGIN_INSTANTTIME_OPT_KEY, beginTime) //设置开始查询的时间戳  不需要设置结束时间戳
      .load("/user/zyh/hudi")
    df.show()
    println(df.count())
  }

根据 _hoodie_commit_time 时间进行查询，查询增量修改数据，注意参数 beginTime 是和 _hoodie_commit_time 对比，而不是和ts对比。如果 beginTime 比 _hoodie_commit_time 大，就会过滤掉全部数据。

查询结果:

+-------------------+--------------------+------------------+----------------------+--------------------+---+-----+------------+--------------------+----------+--------+-------------+----+-------------------+
|_hoodie_commit_time|_hoodie_commit_seqno|_hoodie_record_key|_hoodie_partition_path|   _hoodie_file_name|uid|ad_id|    fullname|             iconurl|        dt|      dn|           ts|uuid|      hudipartition|
+-------------------+--------------------+------------------+----------------------+--------------------+---+-----+------------+--------------------+----------+--------+-------------+----+-------------------+
|     20220307112631|  20220307112631_0_1|                 9|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  9|    8|spark_hudi_4|www.baidu_SRovjgs...|2021-03-04|dept_555|1646623586500|   9|2021-03-04/dept_555|
|     20220307112631|  20220307112631_0_2|                 4|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  4|    0|spark_hudi_1|www.baidu_jiSM0oC...|2021-03-04|dept_555|1646623586500|   4|2021-03-04/dept_555|
|     20220307112631|  20220307112631_0_3|                 6|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  6|    2|spark_hudi_1|www.baidu_O3S0YnZ...|2021-03-04|dept_555|1646623586500|   6|2021-03-04/dept_555|
|     20220307112631|  20220307112631_0_4|                 1|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  1|    0|spark_hudi_1|www.baidu_MqF7avB...|2021-03-04|dept_555|1646623586500|   1|2021-03-04/dept_555|
|     20220307112631|  20220307112631_0_5|                 8|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  8|    4|spark_hudi_4|www.baidu_HU0td3F...|2021-03-04|dept_555|1646623586500|   8|2021-03-04/dept_555|
|     20220307112631|  20220307112631_0_6|                 3|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  3|    1|spark_hudi_2|www.baidu_f8neGOp...|2021-03-04|dept_555|1646623586500|   3|2021-03-04/dept_555|
|     20220307112631|  20220307112631_0_7|                 5|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  5|    2|spark_hudi_1|www.baidu_BOYBqAQ...|2021-03-04|dept_555|1646623586500|   5|2021-03-04/dept_555|
|     20220307112631|  20220307112631_0_8|                10|   2021-03-04/dept_555|c62c0c00-3690-4e6...| 10|    6|spark_hudi_0|www.baidu_17CF5VH...|2021-03-04|dept_555|1646623586500|  10|2021-03-04/dept_555|
|     20220307112631|  20220307112631_0_9|                 7|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  7|    2|spark_hudi_2|www.baidu_f1Da431...|2021-03-04|dept_555|1646623586500|   7|2021-03-04/dept_555|
|     20220307112631| 20220307112631_0_10|                 2|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  2|    1|spark_hudi_1|www.baidu_4hZECat...|2021-03-04|dept_555|1646623586500|   2|2021-03-04/dept_555|
+-------------------+--------------------+------------------+----------------------+--------------------+---+-----+------------+--------------------+----------+--------+-------------+----+-------------------+

10

8、指定特定时间查询

def pointInTimeQuery(sparkSession: SparkSession) = {
    val beginTime = 20220307103005L
    val endTime = 20220307112731L
    val df = sparkSession.read.format("org.apache.hudi")
      .option(DataSourceReadOptions.QUERY_TYPE_OPT_KEY, DataSourceReadOptions.QUERY_TYPE_INCREMENTAL_OPT_VAL) //指定模式为增量查询
      .option(DataSourceReadOptions.BEGIN_INSTANTTIME_OPT_KEY, beginTime) //设置开始查询的时间戳
      .option(DataSourceReadOptions.END_INSTANTTIME_OPT_KEY, endTime)
      .load("/user/zyh/hudi")

    df.show()
    println(df.count())
  }

查询结果:

+-------------------+--------------------+------------------+----------------------+--------------------+---+-----+------------+--------------------+----------+--------+-------------+----+-------------------+
|_hoodie_commit_time|_hoodie_commit_seqno|_hoodie_record_key|_hoodie_partition_path|   _hoodie_file_name|uid|ad_id|    fullname|             iconurl|        dt|      dn|           ts|uuid|      hudipartition|
+-------------------+--------------------+------------------+----------------------+--------------------+---+-----+------------+--------------------+----------+--------+-------------+----+-------------------+
|     20220307112631|  20220307112631_0_1|                 9|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  9|    8|spark_hudi_4|www.baidu_SRovjgs...|2021-03-04|dept_555|1646623586500|   9|2021-03-04/dept_555|
|     20220307112631|  20220307112631_0_2|                 4|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  4|    0|spark_hudi_1|www.baidu_jiSM0oC...|2021-03-04|dept_555|1646623586500|   4|2021-03-04/dept_555|
|     20220307112631|  20220307112631_0_3|                 6|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  6|    2|spark_hudi_1|www.baidu_O3S0YnZ...|2021-03-04|dept_555|1646623586500|   6|2021-03-04/dept_555|
|     20220307112631|  20220307112631_0_4|                 1|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  1|    0|spark_hudi_1|www.baidu_MqF7avB...|2021-03-04|dept_555|1646623586500|   1|2021-03-04/dept_555|
|     20220307112631|  20220307112631_0_5|                 8|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  8|    4|spark_hudi_4|www.baidu_HU0td3F...|2021-03-04|dept_555|1646623586500|   8|2021-03-04/dept_555|
|     20220307112631|  20220307112631_0_6|                 3|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  3|    1|spark_hudi_2|www.baidu_f8neGOp...|2021-03-04|dept_555|1646623586500|   3|2021-03-04/dept_555|
|     20220307112631|  20220307112631_0_7|                 5|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  5|    2|spark_hudi_1|www.baidu_BOYBqAQ...|2021-03-04|dept_555|1646623586500|   5|2021-03-04/dept_555|
|     20220307112631|  20220307112631_0_8|                10|   2021-03-04/dept_555|c62c0c00-3690-4e6...| 10|    6|spark_hudi_0|www.baidu_17CF5VH...|2021-03-04|dept_555|1646623586500|  10|2021-03-04/dept_555|
|     20220307112631|  20220307112631_0_9|                 7|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  7|    2|spark_hudi_2|www.baidu_f1Da431...|2021-03-04|dept_555|1646623586500|   7|2021-03-04/dept_555|
|     20220307112631| 20220307112631_0_10|                 2|   2021-03-04/dept_555|c62c0c00-3690-4e6...|  2|    1|spark_hudi_1|www.baidu_4hZECat...|2021-03-04|dept_555|1646623586500|   2|2021-03-04/dept_555|
+-------------------+--------------------+------------------+----------------------+--------------------+---+-----+------------+--------------------+----------+--------+-------------+----+-------------------+

10

opencv入门(6) TrackBar调整图片和键盘响应千殃sama opencv 学习笔记
文章目录1创建trackbar2使用userdata传入函数3键盘响应1创建trackbar1.trackbar名称2.创建在哪个窗口上3.拖动trackbar改变的值4.trackBar的最大值5.trackbar改变时的回调函数6.带入回调函数的数据，可以不用带,是一个void指针createTrackbar(“Valuebar”,“亮度调整”,&lightness,max_value,on_
php数据导出pdf文件 Z单单 pdf
一.导出pdf文件，首先要安装相关的类库文件，我用的是dompdf类库。1.安装类库文件：composerrequiredompdf/dompdf2.引入类库文件到你的控制器中，创建方法：publicfunctiongeneratePdf(){//你需要打印的查询内容$data=['name'=>'烦烦烦','content'=>'哈哈哈计划经济','img'=>'https:://www.tup
kafka问题解决笔记 Leo_Hu666 kafka 笔记分布式
1.ERRORShutdownbrokerbecausealllogdirsin/tmp/kafka-logshavefailed(kafka.log.LogManager)修改：/data3/kafka_2.12-3.9.1/config/server.propertieslog.dirs=/tmp/kafka-logs-new
Python爬虫设置代理IP 菜鸟驿站2020 python
配置代理ipfrombs4importBeautifulSoupimportrequestsimportrandom#从ip代理网站获取ip列表defget_ip_list(url,headers):web_data=requests.get(url,headers=headers)soup=BeautifulSoup(web_data.text,'lxml')ips=soup.find_all(
golang实现从request请求返回的response中提取网站图标的faviconMMH3, faviconMD5, faviconPath, faviconData, faviconURL
golang实现从request请求返回的response中提取网站图标的faviconMMH3,faviconMD5,faviconPath,faviconData,faviconURL，其中faviconData类型为[]byte，其余为string类型。在Go中提取网站的favicon（网站图标）并计算其MMH3和MD5哈希值，同时获取路径、原始数据和URL，可以通过以下步骤实现：packa
08_Excel 导入 - 用户信息批量导入耀耀_很无聊【后端开发】Java 碎碎念 excel java 开发语言
08_Excel导入-用户信息批量导入1.VO类java复制编辑@Data@AllArgsConstructor@NoArgsConstructorpublicclassUserInfoBatch4ExcelReq{@ExcelProperty(value="用户姓名")@Schema(description="用户姓名")privateStringuserName;@ExcelProperty(
Android Jetpack架构组件(四)之LiveData xiangzhihong8 深入Android应用开发
一、LiveData简介LiveData是Jetpack架构组件Lifecycle库的一部分，是一个可感知生命周期的可观察容器类(Observable)。与常规的可观察类不同，LiveData具有生命周期感知能力，这意味着它具有感知应用组件（如Activity、Fragment或Service）的生命周期的能力，并且LiveData仅更新处于活跃生命周期状态的应用组件观察者。因此，LiveData
掌握Android Jetpack，优化移动开发体验移动开发前沿移动端开发宝典 android jetpack android ai
掌握AndroidJetpack，优化移动开发体验关键词：AndroidJetpack、组件化开发、ViewModel、LiveData、Room、Navigation、Compose摘要：本文深入探讨AndroidJetpack组件库的核心架构和使用方法，通过系统化的讲解和实战演示，帮助开发者理解如何利用Jetpack系列组件提升开发效率、构建健壮的Android应用。文章将从基础概念入手，逐步
MVI+Compose架构实战 Android洋芋 MVI JetpackCompose Kotlin Flow 状态管理声明式UI
简介本文将深入探讨为什么LiveData不适合在JetpackCompose中使用，并通过完整代码示例展示MVI+Compose架构的实现。从Android架构演进历史到Composable函数的重组机制，从单向数据流原理到StateFlow的线程安全特性，全面解析这一技术趋势背后的深层原因。一、为什么LiveData不适合在JetpackCompose中使用？LiveData与Compose的单
树莓派实验——人脸识别 Rounie opencv python 计算机视觉
importnumpyasnp#导入numpy科学计算库importcv2#导入OpenCV函数库#装载人脸识别特征文件face_cascade=cv2.CascadeClassifier('/usr/local/lib/python3.5/dist-packages/cv2/data/haarcascade_frontalface_alt.xml')cap=cv2.VideoCapture(0)
数据中心双活架构解决方案
数据中心双活架构解决方案数据中心双活架构（Active-ActiveDataCenter）旨在实现业务高可用、负载均衡和灾难自动切换。以下是完整的解决方案，涵盖架构设计、关键技术、实施步骤及最佳实践。1.双活架构设计1.1基本架构模型同城双活（MetroActive-Active）两个数据中心距离≤100km（低延迟，通常100km（延迟较高，通常>10ms）采用异步数据复制（如Kafka+CDC
[第一章 web入门]SQL注入-2 weixin_40546436 渗透测试
1通过updatexml取数据从页面发现有一个提示如果加上?tips=1的话，通过burpsuite发包可以通过updatexml来查看回显，可以通过这个取到数据下面是通过updatexml来注入，这时4步中用到语句name=admin’andupdatexml(1,concat(0x7e,(select(database())),0x7e),1)#&pass=bbname=admin’andup
Spark从入门到熟悉（篇三）小新学习屋数据分析 spark 大数据分布式
本文介绍Spark的DataFrame、SparkSQL，并进行SparkSQL实战，加强对编程的理解，实现快速入手知识脉络包含如下7部分内容：RDD和DataFrame、SparkSQL的对比创建DataFrameDataFrame保存成文件DataFrame的API交互DataFrame的SQL交互SparkSQL实战参考资料RDD和DataFrame、SparkSQL的对比RDD对比Data
使用GPU进行机器学习训练时，如果GPU-Util计算核心满载工作但是显存占用较少，应该如何优化？十子木机器学习深度学习人工智能
是否需要优化？如果任务运行正常：无需干预（GPU设计本就是优先榨干计算性能）。如果出现卡顿或效率低下：增大batch_size：提升显存占用，减少数据搬运次数（但需避免OOM）。启用混合精度：torch.cuda.amp可减少显存占用并加速计算。检查CPU到GPU的数据流：避免频繁的小数据拷贝（如DataLoader的num_workers设置）。
变幻莫测：CoreData 中 Transformable 类型面面俱到（八）大熊猫侯佩 Apple开发入门 CoreData Transformable Data SwiftData 类型转换 Codable Swift
概述各位似秃似不秃小码农们都知道，在苹果众多开发平台中CoreData无疑是那个最简洁、拥有“官方认证”且最具兼容性的数据库框架。使用它可以让我们非常方便的搭建出App所需要的持久存储体系。不过，大家是否知道在CoreData中还存在一个Transformable类型，它到底是个啥？应用场景有哪些？在最新的SwiftData中有没有对应物？对于开发者又有哪些“见雀张罗”的撸码陷阱和最佳实践呢？在本
Android 中函数实现多个返回值的几种方式
在编程中，函数通常只能返回一个值。但通过使用对象封装、Pair、Triple、数组、列表或Bundle方式，可以轻松地返回多个值。1、对象封装方式创建数据类来封装需要返回的多个值。dataclassResult(valcode:Int,valmessage:String)fungetMultiValues():Result{returnResult(1,"success")}//调用方式valre
ZYNQ MPSOC PL端DDR4读写--介绍（1） LEEE@FPGA FPGA高速接口开发 fpga开发 DDR4
1DDR4介绍DDR4SDRAM（Double-Data-RateFourthGenerationSynchronousDynamicRandomAccessMemory，简称为DDR4SDRAM），是一种高速动态随机存取存储器，它属于SDRAM家族的存储器产品，提供了相较于DDR3SDRAM更高的运行性能与更低的电压，并被广泛的应用于计算机的运行缓存。DDR4主要特点1)更高频率与带宽起步频率为
大数据集群架构hadoop集群、Hbase集群、zookeeper、kafka、spark、flink、doris、dataeas(二) 争取不加班！ hadoop hbase zookeeper 大数据运维
zookeeper单节点部署wget-chttps://dlcdn.apache.org/zookeeper/zookeeper-3.8.4/apache-zookeeper-3.8.4-bin.tar.gz下载地址tarxfapache-zookeeper-3.8.4-bin.tar.gz-C/data/&&mv/data/apache-zookeeper-3.8.4-bin//data/zoo
大模型学习（Datawhale_Happy-LLM）笔记7: Encoder-Decoder PLM lxltom 学习笔记 language model 自然语言处理神经网络人工智能深度学习
大模型学习（Datawhale_Happy-LLM）笔记7:Encoder-DecoderPLM1.Encoder-Decoder架构概述1.1架构基础Encoder-DecoderPLM是基于原始Transformer架构的完整实现，它同时保留了编码器（Encoder）和解码器（Decoder）两个核心组件。这种设计使得模型能够兼具文本理解和生成的双重能力，特别适合处理序列到序列（Seq2Seq
《UNIX环境高级编程》笔记第三章——文件IO（2) day_day_hard_up Linux系统编程笔记 linux c语言 unix
1.简介本文是上一篇笔记文件IO（1）的续写，接下来继续补充一些文件IO特性以及介绍剩下的一些函数。文件IO的读写效率与调用时传入的buf大小有关，也与打开的文件描述标志有关（O_SYNC和O_DSYNC），影响效率IO效率的相关函数有sync、fsync和fdatasync。理解dup、dup2和fcntl函数的预前知识:（1）每个进在进程表中都有一个记录项，记录项包含一张打开的文件描述符表，每
mongodb 基本概念重生之我是一名程序员 mongodb
mongodb基本概念基于mongo:4.4.2databasedatabase数据库tablecollection数据库表/集合rowdocument数据记录行/文档columnfield数据字段/域indexindex索引tablejoins表连接,MongoDB不支持primarykeyprimarykey主键,MongoDB自动将_id字段设置为主键MongoDB数据类型数据类型描述Str
数据结构之顺序表 Capricorn_man 数据结构
一、创建头文件typedefintSLDataType;//动态存储typedefstructSeqList{SLDataType*a;//动态开辟的数组intsize;//有效数据的数量intcapacity;//空间大小}SL;二、初始化顺序表voidSLInit(SL*psl){assert(psl);psl->a=NULL;psl->size=0;psl->capacity=0;}三、销毁
【分析学】从有限开覆盖定理出发 -- 实数系完备性 BlackPercy 分析学数学高等数学
目录有限开覆盖定理实数系完备性定理确界定理单调有界定理闭区间套定理聚点定理柯西收敛定理有限开覆盖定理开覆盖定义：设{Ui}i∈I\{U_i\}_{i\inI}{Ui}i∈I是一个开覆盖，即[a,b]⊆⋃i∈IUi[a,b]\subseteq\bigcup_{i\inI}U_i[a,b]⊆⋃i∈IUi,称⋃i∈IUi\bigcup_{i\inI}U_i⋃i∈IUi为闭区间[a,b][a,b][a,b
FFmpeg中TS与MP4格式的extradata差异详解码流怪侠音视频基础 ffmpeg MP4 TS 音视频 extradata 视频编解码实时音视频
在视频处理中，extradata是存储解码器初始化参数的核心元数据，直接影响视频能否正确解码。本文深入解析TS和MP4格式中extradata的结构差异、存储逻辑及FFmpeg处理方案。一、extradata的核心作用extradata是解码必需的参数集合，包含：H.264：SPS（序列参数集）、PPS（图像参数集）H.265：VPS（视频参数集）、SPS、PPS音频：采样率、声道数等配置其核心功
使用 `pytest` 框架时，可以通过极限封装将 YAML 文件的读取、解析小赖同学啊 python pytest 服务器运维
在使用pytest框架时，可以通过极限封装将YAML文件的读取、解析和测试用例的通用逻辑封装成共享的方法或fixture，从而减少重复代码。以下是详细的实现步骤和示例。1.封装YAML文件读取和解析将YAML文件的读取和解析逻辑封装到一个工具函数中，供所有测试用例调用。示例YAML文件#test_data.yamltest_cases:-name:TestCase1input:5e
nanoGPT复现——prepare拆解（自己构建词表 VS tiktoken） 2301_80365274 python 开发语言
在nanoGPT的data文件夹有两个很相似的文件夹结构：shakespeare和shakespeare-char，这两种都是对shakespeare数据集的处理，但是shakespeare使用的是tiktoken对文字进行编码，另一个则是使用自己构建的词表一、shakespeare-char（自己构建词表）数据获取data_path=os.path.join(os.path.dirname(__
PgSQL内核代码阅读|查询的两种实现方式
PgSQL内核代码阅读|查询的两种实现方式PgSQL查询用户表时，针对带有WHERE条件的顺序扫描查询，他会从存储加载数据，然后一条一条的从页中读取数据，并将其返回给SeqScan算子。在SeqScan算子中处理WHERE过滤，即ExecQual函数处理过滤表达式。对于系统表还有另一种查询方式，即使不经过索引，也可以通过ScanKeyInit将过滤条件值带入ScanKeyData中，从而在存储层就
MATLAB代码实现了一个完整的ARIMA时间序列分析与预测流程神经网络697344 算法深度学习 MATLAB matlab 信息可视化开发语言
%%1.数据准备years=(2010:2024)';data=[11894,12277,12777,13262,13902,14524,15037,15961,16724,...17767,19064,20056,20978,21676,22023]';%创建时间序列对象ts=timeseries(data,years,'Name','65岁以上人口');ts.TimeInfo.Units='y
基于springboot+mysql+jpa+html实现商品销售信息系统五星资源 spring boot mysql java
基于springboot+mysql+jpa+html实现商品销售信息系统一、系统介绍1、系统主要功能：2.涉及技术框架：3.本项目所用环境：二、功能展示三、其它系统四、获取源码一、系统介绍1、系统主要功能：订单管理模块商品管理模块品牌管理模块分类管理模块客户管理模块供应商管理模块2.涉及技术框架：web框架：SpringBoot数据库框架：SpingDataJPA数据库：MySql项目构建工具：
Excel 数据合并助手SheetDataMerge智能识别同类数据，销售报表处理提升效率小龙软件库电脑开源软件 windows
各位Excel小能手们！今天给大家介绍个超厉害的玩意儿——SheetDataMerge，这可是专注Excel数据处理的实用工具！它就像个数据小管家，核心功能就是智能合并工作表里的同类数据。软件下载地址安装包它有多牛呢？能自动识别表格里关键字段相同的行或者列，对数值型数据进行求和、求平均值这些数学运算，对文本型数据还能智能拼接。举个例子，处理销售数据的时候，如果好多行记录里“产品编号”和“日期”字段
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen

使用Spark操作Hudi

1、pom文件

2、模拟数据工具类

3、配置文件

4、Hudi写Hdfs

5、查询hdfs上的hudi数据

6、修改hdfs上的hudi数据

7、增量查询

8、指定特定时间查询

你可能感兴趣的:(#,hudi,spark,big,data,scala)