sxjlinux

Spark SQL自定义函数UDF、UDAF聚合函数以及开窗函数的使用

一、UDF的使用

1、Spark SQL自定义函数就是可以通过scala写一个类，然后在SparkSession上注册一个函数并对应这个类，然后在SQL语句中就可以使用该函数了，首先定义UDF函数，那么创建一个SqlUdf类，并且继承UDF1或UDF2等等，UDF后边的数字表示了当调用函数时会传入进来有几个参数，最后一个R则表示返回的数据类型，如下图所示：

2、这里选择继承UDF2，如下代码所示：

package com.udf

import org.apache.spark.sql.api.java.UDF2

class SqlUDF extends UDF2[String,Integer,String] {
  override def call(t1: String, t2: Integer): String = {
    t1+"_udf_test_"+t2
  }
}

3、然后在SparkSession生成的对象上通过sparkSession.udf.register进行注册，如下代码所示：

    val conf=new SparkConf().setAppName("AppUdf").setMaster("local")
    val sparkSession=SparkSession.builder().config(conf).getOrCreate()
    //指定函数名为：splicing_t1_t2 此函数名只有通过udf.register注册过之后才能够被使用，第二个参数是继承与UDF的类
    //第三个参数是返回类型
    sparkSession.udf.register("splicing_t1_t2",new SqlUDF,DataTypes.StringType)

4、生成模拟数据，并注册一个临时表，如下代码所示：

var rows=Seq[Row]()
    val random=new Random()
    for(i <- 0 until 10){
      val name="name"+i
      val age=random.nextInt(30)%15+15
      val row=Row(name,age)
      rows +:=row
    }
    val rowsRDD=sparkSession.sparkContext.parallelize(rows)
    val schema=DataTypes.createStructType(Array[StructField](
      DataTypes.createStructField("name",DataTypes.StringType,true),
      DataTypes.createStructField("age",DataTypes.IntegerType,true))
    )

    val df=sparkSession.createDataFrame(rowsRDD,schema)
    df.createOrReplaceTempView("person")
    df.show()

输出结果如下图所示：

5、在sql语句中使用自定义函数splicing_t1_t2，然后将函数的返回结果定义一个别名name_age，如下代码所示：

val sql="SELECT name,age,splicing_t1_t2(name,age) name_age FROM person"
sparkSession.sql(sql).show()

输出结果如下：

6、由此可以看到在自定义的UDF类中，想如何操作都可以了，完整代码如下；

package com.udf

import org.apache.spark.SparkConf
import org.apache.spark.sql.{Row, SparkSession}
import org.apache.spark.sql.types.{DataTypes, StructField}

import scala.util.Random

object AppUdf {
  def main(args:Array[String]):Unit={
    val conf=new SparkConf().setAppName("AppUdf").setMaster("local")
    val sparkSession=SparkSession.builder().config(conf).getOrCreate()
    //指定函数名为：splicing_t1_t2 此函数名只有通过udf.register注册过之后才能够被使用，第二个参数是继承与UDF的类
    //第三个参数是返回类型
    sparkSession.udf.register("splicing_t1_t2",new SqlUDF,DataTypes.StringType)

    var rows=Seq[Row]()
    val random=new Random()
    for(i <- 0 until 10){
      val name="name"+i
      val age=random.nextInt(30)%15+15
      val row=Row(name,age)
      rows +:=row
    }
    val rowsRDD=sparkSession.sparkContext.parallelize(rows)
    val schema=DataTypes.createStructType(Array[StructField](
      DataTypes.createStructField("name",DataTypes.StringType,true),
      DataTypes.createStructField("age",DataTypes.IntegerType,true))
    )

    val df=sparkSession.createDataFrame(rowsRDD,schema)
    df.createOrReplaceTempView("person")

    val sql="SELECT name,age,splicing_t1_t2(name,age) name_age FROM person"
    sparkSession.sql(sql).show()

    sparkSession.close()
  }
}

二、无类型的用户自定于聚合函数：UserDefinedAggregateFunction

1、它是一个接口，需要实现的方法有：

class AvgAge extends UserDefinedAggregateFunction {
  //设置输入数据的类型，指定输入数据的字段与类型，它与在生成表时创建字段时的方法相同
  override def inputSchema: StructType = ???
  //指定缓冲数据的字段与类型
  override def bufferSchema: StructType = ???
  //指定数据的返回类型
  override def dataType: DataType = ???
  //指定是否是确定性，对输入数据进行一致性检验，是一个布尔值，当为true时，表示对于同样的输入会得到同样的输出
  override def deterministic: Boolean = ???
  //initialize用户初始化缓存数据
  override def initialize(buffer: MutableAggregationBuffer): Unit = ???
  //当有新的输入数据时，update就会更新缓存变量
  override def update(buffer: MutableAggregationBuffer, input: Row): Unit = ???
  //将更新的缓存变量进行合并，有可能每个缓存变量的值都不在一个节点上，最终是要将所有节点的值进行合并才行
  override def merge(buffer1: MutableAggregationBuffer, buffer2: Row): Unit = ???
  //一个计算方法，用于计算我们的最终结果
  override def evaluate(buffer: Row): Any = ???
}

这是一个计算平均年龄的自定义聚合函数，实现代码如下所示：

package com.udf

import java.math.BigDecimal

import org.apache.spark.sql.Row
import org.apache.spark.sql.expressions.{MutableAggregationBuffer, UserDefinedAggregateFunction}
import org.apache.spark.sql.types.{DataType, DataTypes, StructField, StructType}

/**
 * 用于计算平均年龄的聚合函数
 */
class AvgAge extends UserDefinedAggregateFunction {
  /**
   * 设置输入数据的类型，指定输入数据的字段与类型，它与在生成表时创建字段时的方法相同
   * 比如计算平均年龄，输入的是age这一列的数据，注意此处的age名称可以随意命名
   * @return
   */
  override def inputSchema: StructType = DataTypes.createStructType(Array[StructField](DataTypes.createStructField("age",DataTypes.IntegerType,true)))

  /**
   * 指定缓冲数据的字段与类型，相当于中间变量
   * 由于要计算平均值，首先要计算出总和与个数才能计算平均值，因此需要进来一个值就要累加并计数才能计算出平均值
   * 所以要定义两个变量作为累加和以及计数的变量
   * @return
   */
  override def bufferSchema: StructType = DataTypes.createStructType(Array[StructField](
    DataTypes.createStructField("sum",DataTypes.DoubleType,true),
    DataTypes.createStructField("count",DataTypes.IntegerType,true)
  ))
  //指定数据的返回类型,由于平均值是double类型，因此定义DoubleType
  override def dataType: DataType = DataTypes.DoubleType
  /**
   * 设置该函数是否为幂等函数
   * 幂等函数:即只要输入的数据相同，结果一定相同
   * true表示是幂等函数，false表示不是
   * @return
   */
  override def deterministic: Boolean = true

  /**
   * initialize用于初始化缓存变量的值，也就是初始化bufferSchema函数中定义的两个变量的值sum,count
   * 其中buffer(0)就表示sum值，buffer(1)就表示count的值，如果还有第3个，则使用buffer(3)表示
   * @param buffer
   */
  override def initialize(buffer: MutableAggregationBuffer): Unit = {
    buffer.update(0,0.0) //或使用buffer(0)=0.0
    buffer.update(1,0) //或使用buffer(1)=0
  }

  /**
   * 当有一行数据进来时就会调用update一次，有多少行就会调用多少次，input就表示在调用自定义函数中有多少个参数，最终会将
   * 这些参数生成一个Row对象，在使用时可以通过input.getString或inpu.getLong等方式获得对应的值
   * 缓冲中的变量sum,count使用buffer(0)或buffer.getDouble(0)的方式获取到
   * @param buffer
   * @param input
   */
  override def update(buffer: MutableAggregationBuffer, input: Row): Unit = {
    val sum=buffer.getDouble(0)
    val count=buffer.getInt(1)
    buffer.update(0,sum+input.getInt(0).toDouble)
    buffer.update(1,count+1)
  }

  /**
   * 将更新的缓存变量进行合并，有可能每个缓存变量的值都不在一个节点上，最终是要将所有节点的值进行合并才行
   * 其中buffer1是本节点上的缓存变量，而buffer2是从其他节点上过来的缓存变量然后转换为一个Row对象,然后将buffer2
   * 中的数据合并到buffer1中去即可
   * @param buffer1
   * @param buffer2
   */
  override def merge(buffer1: MutableAggregationBuffer, buffer2: Row): Unit = {
    val sum1=buffer1.getDouble(0)
    val count1=buffer1.getInt(1)
    val sum2=buffer2.getDouble(0)
    val count2=buffer2.getInt(1)
    buffer1.update(0,sum1+sum2)
    buffer1.update(1,count1+count2)
  }

  /**
   * 一个计算方法，用于计算我们的最终结果,也就相当于返回值
   * @param buffer
   * @return
   */
  override def evaluate(buffer: Row): Any = {
    val bd = new BigDecimal(buffer.getDouble(0)/buffer.getInt(1).toDouble)
    bd.setScale(2, BigDecimal.ROUND_HALF_UP).doubleValue//保留两位小数
  }
}

2、注册该类，并指定到一个自定义函数中，如下图所示：

3、在表中加一列字段id，通过GROUP BY进行分组计算，如

4、在sql语句中使用group_age_avg，如下图所示：

输出结果如下图所示：

5、完整代码如下：

package com.udf

import org.apache.spark.SparkConf
import org.apache.spark.sql.{Row, SparkSession}
import org.apache.spark.sql.types.{DataTypes, StructField}

import scala.util.Random

object AppUdf {
  def main(args:Array[String]):Unit={
    val conf=new SparkConf().setAppName("AppUdf").setMaster("local")
    val sparkSession=SparkSession.builder().config(conf).getOrCreate()
    //指定函数名为：splicing_t1_t2 此函数名只有通过udf.register注册过之后才能够被使用，第二个参数是继承与UDF的类
    //第三个参数是返回类型
    sparkSession.udf.register("splicing_t1_t2",new SqlUDF,DataTypes.StringType)
    //UDAF不用设置返回类型，因此使用两个参数即可
    sparkSession.udf.register("group_age_avg",new AvgAge)
    var rows=Seq[Row]()
    val random=new Random()
    for(i <- 0 until 10){
      val name="name"+i
      val age=random.nextInt(30)%15+15
      val row=Row(random.nextInt(2),name,age)
      rows +:=row
    }
    val rowsRDD=sparkSession.sparkContext.parallelize(rows)
    val schema=DataTypes.createStructType(Array[StructField](
      DataTypes.createStructField("id",DataTypes.IntegerType,true),
      DataTypes.createStructField("name",DataTypes.StringType,true),
      DataTypes.createStructField("age",DataTypes.IntegerType,true))
    )

    val df=sparkSession.createDataFrame(rowsRDD,schema)
    df.createOrReplaceTempView("person")
    df.show()

    val sql="SELECT id, group_age_avg(age) avg_age FROM person GROUP BY id"
    sparkSession.sql(sql).show()

    sparkSession.close()
  }
}

三、类型安全的用户自定于聚合函数：Aggregator

1、它是一个接口，需要继承与Aggregator，而Aggregator有3个参数，分别是IN,BUF,OUT,IN表示输入的值是什么，可以是一个自定类对象包含多个值，也可以是单个值，BUF就是需要用来缓存值使用的，如果需要缓存多个值也需要定义一个对象，而返回值也可以是一个对象返回多个值，需要实现的方法有：

package com.udf

import org.apache.spark.sql.Encoder
import org.apache.spark.sql.expressions.Aggregator

case class DataBuf(var sum:Double,var count:Int)
object AvgAgeAggregator extends Aggregator[Int,DataBuf,Double]{
  /**
   * 相当于UserDefinedAggregateFunction中的initialize函数，用于初始化DataBuf对象的值，此DataBuf是自定义类型的
   * @return
   */
  override def zero: DataBuf = ???

  /**
   * reduce函数相当于UserDefinedAggregateFunction中的update函数，当有新的数据a时，更新中间数据b
   * @param b
   * @param a
   * @return
   */
  override def reduce(b: DataBuf, a: Int): DataBuf = ???

  /**
   * merge函数相当于UserDefinedAggregateFunction中的merge函数，对两个值进行 合并，
   * 因为有可能每个缓存变量的值都不在一个节点上，最终是要将所有节点的值进行合并才行，将b2中的值合并到b1中
   * @param b1
   * @param b2
   * @return
   */
  override def merge(b1: DataBuf, b2: DataBuf): DataBuf = ???

  /**
   * finish相当于UserDefinedAggregateFunction中的evaluate，是一个计算方法，用于计算我们的最终结果,也就相当于返回值
   * 返回值可以是一个对象
   * @param reduction
   * @return
   */
  override def finish(reduction: DataBuf): Double = ???

  /**
   *  缓冲数据编码方式
   * @return
   */
  override def bufferEncoder: Encoder[DataBuf] = ???

  /**
   *  最终数据输出编码方式
   * @return
   */
  override def outputEncoder: Encoder[Double] = ???
}

2、具体实现如下代码所示：

package com.udf

import java.math.BigDecimal

import org.apache.spark.sql.{Encoder, Encoders}
import org.apache.spark.sql.expressions.Aggregator
case class DataBuf(var sum:Double,var count:Int)
object AvgAgeAggregator extends Aggregator[Int,DataBuf,Double]{

  /**
   * 相当于UserDefinedAggregateFunction中的initialize函数，用于初始化DataBuf对象的值，此DataBuf是自定义类型的
   * @return
   */
  override def zero: DataBuf = DataBuf(0.0,0)

  /**
   * reduce函数相当于UserDefinedAggregateFunction中的update函数，当有新的数据a时，更新中间数据b
   * @param b
   * @param a
   * @return
   */
  override def reduce(b: DataBuf, a: Int): DataBuf = {
    b.count+=1
    b.sum+=a.toDouble
    b
  }

  /**
   * merge函数相当于UserDefinedAggregateFunction中的merge函数，对两个值进行 合并，
   * 因为有可能每个缓存变量的值都不在一个节点上，最终是要将所有节点的值进行合并才行，将b2中的值合并到b1中
   * @param b1
   * @param b2
   * @return
   */
  override def merge(b1: DataBuf, b2: DataBuf): DataBuf = {
    b1.sum+=b2.sum
    b1.count+=b2.count
    b1
  }

  /**
   * finish相当于UserDefinedAggregateFunction中的evaluate，是一个计算方法，用于计算我们的最终结果,也就相当于返回值
   * 返回值可以是一个对象
   * @param reduction
   * @return
   */
  override def finish(reduction: DataBuf): Double = {
    val bd = new BigDecimal(reduction.sum/reduction.count.toDouble)
    bd.setScale(2, BigDecimal.ROUND_HALF_UP).doubleValue//保留两位小数
  }

  /**
   *  缓冲数据编码方式,如果Encoder中指定的类型时对象，则设置为product，如果是具体的类型，则需设置为具体的类型
   * @return
   */
  override def bufferEncoder: Encoder[DataBuf] = Encoders.product

  /**
   *  最终数据输出编码方式，如果Encoder中指定的类型，则设置为具体的类型，比如Double则设置为scalaDouble
   * @return
   */
  override def outputEncoder: Encoder[Double] = Encoders.scalaDouble
}

3、而使用此聚合函数就不能通过注册函数来使用了，需要通过Dataset对象的select来使用，如下图所示：

执行结果如下图所示：

因此无类型的用户自定于聚合函数：UserDefinedAggregateFunction和类型安全的用户自定于聚合函数：Aggregator之间的区别是

（1）UserDefinedAggregateFunction不能够带类型而Aggregator是可以带类型的。

（2）使用方法不同UserDefinedAggregateFunction通过注册可以在DataFram的sql语句中使用，而Aggregator必须是在Dataset上使用。

四、开窗函数的使用

1、在Spark 1.5.x版本以后，在Spark SQL和DataFrame中引入了开窗函数,其中比较常用的开窗函数就是row_number该函数的作用是根据表中字段进行分组，然后根据表中的字段排序；其实就是根据其排序顺序，给组中的每条记录添加一个序号；且每组的序号都是从1开始，可利用它的这个特性进行分组取top-n。它是放在select子句中的，其格式为：

ROW_NUMBER() OVER (PARTITION BY area ORDER BY click_count DESC) rank

首先可以，在SELECT查询时，使用row_number()函数，其次row_number()函数后面先跟上OVER关键字，然后括号中，是PARTITION BY，也就是说根据哪个字段进行分组，其次是可以用ORDER BY进行组内排序，然后row_number()就可以给每个组内的行，一个组内行号，然后rank就是每一组的行号

2、使用方法的sql语句为：

SELECT id,name,age,row_number() OVER (PARTITION BY id ORDER BY age) rank FROM person ORDER BY id desc,rank desc

意思是在sql语句中加一个rank字段，该字段记录了以id为分组，在组内按照age升序排序，并记录行号，最后先按照id降序排序，如果id相同则按照rank降序排序

3、代码如下：

package com.udf

import org.apache.spark.SparkConf
import org.apache.spark.sql.{Row, SparkSession}
import org.apache.spark.sql.types.{DataTypes, StructField}

import scala.util.Random

object AppUdf {
  def main(args:Array[String]):Unit={
    val conf=new SparkConf().setAppName("AppUdf").setMaster("local")
    val sparkSession=SparkSession.builder().config(conf).getOrCreate()
    //指定函数名为：splicing_t1_t2 此函数名只有通过udf.register注册过之后才能够被使用，第二个参数是继承与UDF的类
    //第三个参数是返回类型
    sparkSession.udf.register("splicing_t1_t2",new SqlUDF,DataTypes.StringType)
    //UDAF不用设置返回类型，因此使用两个参数即可
    sparkSession.udf.register("group_age_avg",new AvgAge)
    var rows=Seq[Row]()
    val random=new Random()
    for(i <- 0 until 10){
      val name="name"+i
      val age=random.nextInt(30)%15+15
      val row=Row(random.nextInt(2),name,age)
      rows +:=row
    }
    val rowsRDD=sparkSession.sparkContext.parallelize(rows)
    val schema=DataTypes.createStructType(Array[StructField](
      DataTypes.createStructField("id",DataTypes.IntegerType,true),
      DataTypes.createStructField("name",DataTypes.StringType,true),
      DataTypes.createStructField("age",DataTypes.IntegerType,true))
    )

    val df=sparkSession.createDataFrame(rowsRDD,schema)
    df.createOrReplaceTempView("person")
    df.show()

    val sql="SELECT id,name,age,row_number() OVER (PARTITION BY id ORDER BY age) rank FROM person ORDER BY id desc,rank desc"
    sparkSession.sql(sql).show()
    sparkSession.close()
  }
}

输出结果如下：

关于vue+element ui 中的导航菜单问题空心闲人前端程序员
关于vue+elementui中的导航菜单问题最近公司要开发一个vue项目，自己搭框架的时候用到了element，目标是实现一个顶部菜单以及侧边菜单栏。直接上代码。importcommonHeaderfrom"@/components/header"importleftContentfrom"@/components/leftContent"exportdefault{name:'layout',
利用AI与MySQL提升工业物联网健康监测的智慧水平——构建预测性维护的新纪元墨夶数据库学习资料1 人工智能 mysql 物联网
在工业4.0和智能制造的大背景下，如何确保生产设备的高效稳定运行成为企业竞争力的核心要素之一。传统的事后维修方式已经难以满足现代制造业的需求，而基于人工智能（AI）的预测性维护系统则为这一挑战提供了全新的解决方案。今天，我们将深入探讨如何结合AI技术和MySQL数据库，打造一个智能、高效的工业物联网（IIoT）健康监测平台，助力企业在激烈的市场竞争中脱颖而出。一、为什么选择AI+MySQL？1.A
MySQL中基于机器学习的自适应缓存热点识别优化策略——开启数据库性能新纪元墨夶数据库学习资料1 数据库 mysql 机器学习
在数据驱动的世界里，数据库的性能直接影响到整个应用系统的响应速度和用户体验。随着业务量的增长和技术的发展，传统的缓存机制逐渐暴露出局限性。如何更智能地识别并利用热点数据进行缓存优化，成为提升数据库性能的关键所在。今天，我们将深入探讨一种创新的方法——基于机器学习的自适应缓存热点识别优化策略，并分享其在MySQL中的具体实现方案。为什么选择机器学习？‍传统上，开发者们依赖于手动配置或预设规则来决定哪
数据安全新纪元——多方安全计算与MySQL结合的隐私预算管理深度解析墨夶数据库学习资料1 安全 mysql android
在当今数字化时代，数据已成为企业最宝贵的资产之一。然而，随着数据泄露事件频发，如何确保数据的安全性和隐私性成为了亟待解决的问题。传统的加密技术虽然能在一定程度上保护静态数据，但在动态数据分析过程中却显得力不从心。为了解决这一难题，隐私计算作为一种新兴的技术应运而生，它允许在不解密原始数据的前提下进行有效的计算和分析。本文将深入探讨如何利用多方安全计算（MPC）与关系型数据库MySQL相结合的方式实
构建 Python 插件架构：打造灵活可扩展的模块化应用全栈探索者chen python python 架构开发语言学习机器学习程序人生插件
构建Python插件架构：打造灵活可扩展的模块化应用前言在现代软件开发中，单一的代码库往往难以满足不断变化的业务需求和多样化的扩展场景。如何设计一个应用，使其既能保持核心功能的稳定，又能轻松集成第三方功能、模块或定制化扩展？答案就是——插件架构。通过插件架构，你可以让应用具备极高的灵活性，支持动态加载、无缝扩展以及解耦维护。本文将深入探讨如何在Python中设计和构建一个插件架构。从核心概念、模块
股神系列：蒋菲的量化投资中，如何利用大数据优化模型？她的数据来源有哪些？云策量化量化交易量化软件量化炒股量化炒股 QMT 量化交易入门教程 PTrade 股票投资 deepseek
推荐阅读：《程序化炒股：如何申请官方交易接口权限？个人账户可以申请吗？》标题：股神系列：蒋菲的量化投资中，如何利用大数据优化模型？她的数据来源有哪些？正文：在金融投资的世界里，量化投资以其科学、系统和客观的特点，成为了众多投资者追求的“圣杯”。而在量化投资领域，蒋菲以其独特的大数据量化投资模型而闻名。本文将深入探讨蒋菲如何利用大数据优化其量化投资模型，以及她的数据来源有哪些。一、量化投资模型的优化
基于 C++ 类的程序设计模式与应用研究饼干帅成渣 c++开发语言
摘要C++语言凭借其强大的功能在软件开发领域占据重要地位，类作为C++面向对象编程的核心，承载着数据封装、代码复用等关键使命。本文深入剖析C++类的基础概念、核心特性及其在实际编程中的应用。通过详细阐述类的定义、成员构成、访问控制以及封装、继承、多态等特性，结合具体代码示例展示其在构建软件架构中的作用。同时，探讨C++类在应用中面临的常见问题及解决方案，为开发者高效运用C++类进行程序设计提供有力
Hamcrest的介绍以及在项目中的实际应用噔噔噔噔@ 软件测试基础及工具分享软件测试面试题专栏数据库 Hamcrest 单元测试前端其他
Hamcrest是一个用于编写声明式、可读性强的匹配器（Matcher）的框架，通常与JUnit等测试框架结合使用，用于验证测试结果。它提供了丰富的匹配器库，可以帮助开发者编写更清晰、更灵活的测试断言。Hamcrest的核心特点声明式语法：Hamcrest的匹配器语法更接近自然语言，易于阅读和理解。可组合性：匹配器可以组合使用，构建复杂的断言逻辑。丰富的匹配器库：提供了大量内置匹配器，支持对象、集
chatgpt赋能python：Python怎么倒序列表 aijinglingchat ChatGpt python chatgpt 人工智能计算机
Python怎么倒序列表列表是Python中最常用的数据结构之一，但在实际使用时，有时需要将列表进行倒序排列。Python提供了多种方法来实现这个需求，本文将简要介绍这些方法以及它们的使用场景。方法1：使用reverse()函数使用列表的reverse()方法是Python中最简单直接的方法来倒序列表。该方法会将原列表倒置。lst=[1,2,3,4,5]lst.reverse()print(lst
Linux 常用命令 - last 【显示历史登录用户列表】 WKJay_ Linux 常用命令 linux 服务器
简介last命令源自英文单词“last”，意为“最后”。该命令用于显示系统中用户的登录和注销记录，以及系统的重启和关机记录。它通过读取/var/log/wtmp文件来获取这些信息，wtmp文件记录了所有用户的登录和注销活动。使用方式last[options][username...][tty...]lastb[options][username...][tty...]常用选项-a,--hostla
密码学，算法在人工智能的实战利用 china—hbaby 人工智能密码学
在人工智能（AI）的快速发展中，数据安全和隐私保护成为了核心议题。密码学，作为保护信息安全的基石，其在AI领域的应用显得尤为重要。本文将探讨密码学在AI中的利用，并提供一些代码示例来展示其实际应用。密码学的概述即常用加密方式密码学（Cryptography）是数学和计算机科学的一个分支，它涉及保护信息的安全性和隐私性。密码学的主要目标是确保信息在传输过程中不被未授权的第三方读取或篡改，以及确保信息
ts之变量声明以及语法细节，ts小白初学ing 菥菥爱嘻嘻小白学习ts typescript 前端
TypeScript用js编写的项目虽然开发很快，但是维护是成本很高，而且js不报错啊啊啊啊啊！！！以js为基础进行扩展的给变量赋予了类型语法、实战(ts+vue3)TypeScript是JavaScript的一个超集，支持ECMAScript6标准（ES6教程）。TypeScript由微软开发的自由和开源的编程语言，在JavaScript的基础上增加了静态类型检查的超集。TypeScript设计
做代理仓建议使用海外仓系统吗？易境通海外仓系统大数据
日益繁荣的跨境电商市场吸引了许多货代企业想要参与其中，却苦于没有经验、缺乏充裕资金和人力资源。而代理仓模式为企业提供了低成本、高灵活性的解决方案，能够有效降低门槛，快速响应市场需求。无需大量的资金、资源、人力投入，即可快速入局海外仓市场。此时，使用一个拥有代理功能的海外仓系统，可以有效简化代理账号和价格设置、客户信息管理，以及财务对账等多个环节流程，大大降低企业的操作难度，帮助企业全面提升管理效率
量子化学仿真软件：Quantum Espresso_（7）.ph.x模块使用 kkchenjj 分子动力学2 分子动力学仿真模拟性能优化模拟仿真
ph.x模块使用1.ph.x模块概述ph.x是QuantumEspresso软件套件中的一个重要模块，用于计算材料的声子谱和相关的物理性质，如热导率、热膨胀系数等。声子是晶格振动的量子化模式，对理解材料的热力学性质、电输运性质以及光学性质至关重要。ph.x模块基于密度泛函微扰理论（DensityFunctionalPerturbationTheory,DFPT）进行计算，能够高效地处理周期性固体系
docker创建的mysql没有配置文件_使用docker安装mysql, redis, kafka等各类服务 Gyrolt
前言大致说来,docker的作用如下绝大部分应用，开发者都可以通过dockerbuild创建镜像，通过dockerpush上传镜像，用户通过dockerpull下载镜像，用dockerrun运行应用。用户不需要再去关心如何搭建环境，如何安装，如何解决不同发行版的库冲突——而且通常不会需要消耗更多的硬件资源，不会明显降低性能。也就是实现了标准化、集装箱如果想要简单使用,可以看答主的这一片文章:番茄番
【Unity网络同步框架 - Nakama研究(二)】归海_一刀 unity 网络游戏引擎
Unity网络同步框架-Nakama研究(二)虽说官方文档和网站以及论坛建立的不错，而且还有中文翻译且质量也不错，但是总会遇到一些词不达意，说了但是依旧没懂的部分，甚至问AI也问不出什么东西，所以需要有一些比较明显的博客来记录实战部分服务端搭建使用官方推荐的Docker进行安装在将Docker软件下载到Windows环境后，请确保已安装node-js、typescript、lua和Go等环境（后续
qt读书笔记 mmmcu2004 QT qt 读书 translation 工作 action
QWidget::setToolTip()用于为Widget设置相应的tip文本。同样，QAction::setToolTip()为Action设置相应的tip文本；若没有显式的为Action设置tip文本,Action会自动的使用actiontext。setStatusTip()，该函数为Widget和Action添加statustip。QWidget::setWhatsThis()QWhats
Cursor44.11 无限续杯攻略：持续畅享 AI 编程利器不会算法的小灰人工智能编辑器 vscode AI编程经验分享
一、引言在当今数字化快速发展的时代，高效的编程工具对于开发者来说如同珍宝。Cursor作为一款基于VSCode二次开发的强大AI编程编辑器，凭借其内置的多种AI大模型，如GPT-4、GPT-4o、Claude-3.5以及近期热门的DeepSeek满血版R1，为开发者提供了前所未有的编程体验。它能够快速生成代码、精准修复错误、智能优化逻辑等，极大地提升了编程效率。然而，新用户注册Cursor虽可获得
C# 技术使用笔记：Asp.Net Core MVC 中控制器 Controllers 中返回数据使用详解 caifox菜狐狸 C#技术使用笔记 c#笔记 asp.net core ViewResult JsonResult Redirect 控制器
本文将深入探讨ASP.NETCoreMVC控制器中返回数据的多种方式，从基础的ViewResult到灵活的IActionResult，再到强大的ActionResult，我们将逐一剖析它们的使用场景、优缺点以及最佳实践。通过丰富的代码示例和详细的解释，帮助读者全面掌握控制器返回数据的技巧，从而提升开发效率，构建更加健壮和高效的Web应用程序。无论你是初学者还是有一定经验的开发者，本文都将为你提供有
语音识别学习系列（13）：语音识别中的情感识别与表达 DoYangTan 语音识别学习人工智能
语音识别学习系列（13）：语音识别中的情感识别与表达前言在语音识别领域，仅仅将语音准确转换为文字内容已不能满足日益多样化的人机交互需求。人们在交流过程中往往蕴含着丰富的情感信息，语音识别若能对情感进行识别与表达，将会使交互变得更加自然、智能且贴合人性化需求。本期我们就围绕语音识别中的情感识别与表达这一重要主题展开深入探讨，了解其背后的原理、方法以及实际应用价值。一、语音情感识别的基本原理与常用方法
uniapp Deepsleep. uni-app
uni-app是一个使用Vue.js开发所有前端应用的框架，可以编译到iOS、Android、H5、以及各种小程序等多个平台。以下是uni-app页面生命周期的详细介绍，包括一些简单的示例：初始化阶段onLoad(options)触发时机：页面加载时触发，且只触发一次。参数：options是一个包含页面路径参数的对象。示例：从上一个页面传递参数到当前页面。onLoad(options){conso
Python 用户账户(创建用户账户) 钢铁男儿 Python 从入门到精通 python sqlite 数据库
Web应用程序的核心是让任何用户都能够注册账户并能够使用它，不管用户身处何方。在本章中，你将创建一些表单，让用户能够添加主题和条目，以及编辑既有的条目。你还将学习Django如何防范对基于表单的网页发起的常见攻击，这让你无需花太多时间考虑确保应用程序安全的问题。然后，我们将实现一个用户身份验证系统。你将创建一个注册页面，供用户创建账户，并让有些页面只能供已登录的用户访问。接下来，我们将修改一些视图
What's new in dubbo-go v3.3.0
我们dubbogo社区很高兴地宣布发布最新版本v3.3.0！这一版本带来了多个Bug修复、新特性以及代码优化，显著提升了dubbogo的稳定性与功能性。版本亮点在本次更新中，我们对多个核心组件进行了改进，以解决服务发现、注册中心相关的问题，并优化内存管理，减少内存泄漏。此外，我们增强了底层通信库的错误处理能力，并提升了系统的整体稳定性，为Go开发者提供更强大、更可靠的微服务开发体验。本次更新的主要
如何使用SQL进行多表联合查询(SQLⅰte举例) C++ 老炮儿的技术栈 c++sql 算法学习笔记
使用C++和SQLite进行多表联合查询的示例代码。假设有两个表：students表和scores表，students表包含学生的基本信息，scores表包含学生的成绩信息，通过学生的id进行关联查询。#include#include#include//回调函数，用于处理查询结果staticintcallback(void*NotUsed,intargc,char**argv,char**azCo
java:实现设置窗体背景颜色为淡蓝色（附带源码） Katie。 Java 实战项目 java 信息可视化开发语言
一、项目简介在桌面应用开发中，窗体背景颜色作为界面设计的重要组成部分，不仅影响整体美观，还能传递特定的情感和品牌信息。本项目旨在使用JavaSwing简单实现将窗体背景颜色设置为淡蓝色效果。该示例展示了如何创建一个基本的JFrame，并通过调用其内容面板的setBackground()方法，设置背景颜色为淡蓝色（RGB值173,216,230）。通过本项目，初学者可以了解Swing基本组件的使用方
Orange 单体架构 - 快速启动 mmd0308 Orange 开源项目架构开源
1后端服务1.1基础设施组件说明版本MySQLMySQL数据库服务5.7/8+JavaJava17redis-stackRedis向量数据库最新版本Node安装Node22.11.0+1.2orange-dependencies-parent项目Maven依赖版本管理1.2.1项目克隆GitHubgitclonehttps://github.com/hengzq/orange-dependenci
【STM32】智能避障红外小车 Alioooooooon 嵌入式 stm32 单片机嵌入式硬件
文章目录直流电机`motor.c/motor.h`红外对管红外循迹利用脉冲宽度调制技术（PWM）控制电机转速避障`red.c/red.h`编译环境：keil5SourceInsightSTM32F103X原理图：直流电机直流电机的原理：通电就会转，反向通电就会反转两极的电势差决定转速电机驱动模块以及接线参考图示代码实现：motor.c/motor.h#ifndef__MOTOR_H__#defin
深夜惊魂：当监控告警“撒谎”时，SRE 如何逆风翻盘？ YAMLMaster kubernetes 运维开发 devops 容器云原生
Yorkshire,England引言我们这一篇也是含金量十足，如果面试官让你说个你处理过的比较有意思的案例，可以跟他讲讲，让他也见见世面。好吧，我们直接开始，最后有相关的群，有兴趣可以加入。开始一、故障场景深度还原时间：2025年1月3日02:00（GMT+8）环境：•数据库集群：MySQL8.0.35，通过KubeBlocks部署（3节点，跨AZ）•监控架构：•Prometheus-Opera
Linux------Redis(软件安装，Linux下和Windows下)，NoSQL（简单了解） .墨迹. Linux redis 大数据 java
文章目录NoSql1.历史1.单机MySql2.Memcached(缓存)+MySql+垂直拆分(读写分离)3.分库分表+水平拆分+MySql集群4.如今最近的年代5.为什么要使用NoSQL2.什么是NoSQL1.NOSQL2.特点3.3v+3高3.NoSQL的四大分类1.kv键值对：2.文档型数据库（bson和json一样）：3.列存储数据库：4.图关系型数据库Redis1.初始redis1.简
Python 单例模式的 5 种实现方式：深入解析与最佳实践做测试的小薄测试高阶 python 单例模式自动化测试测试框架
单例模式（SingletonPattern）是一种经典的设计模式，其核心思想是确保一个类在整个程序运行期间只有一个实例，并提供一个全局访问点。这种模式在许多场景中非常有用，例如全局配置管理、日志记录器、数据库连接池等。然而，Python的灵活性使得实现单例模式有多种方式，每种方法都有其特点和适用场景。本文将详细介绍Python中实现单例模式的5种常见方法，并深入分析它们的优缺点以及适用场景，帮助您
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc

Spark SQL自定义函数UDF、UDAF聚合函数以及开窗函数的使用

你可能感兴趣的:(Spark SQL自定义函数UDF、UDAF聚合函数以及开窗函数的使用)