段智华

Spark 2.2.1 SQL UDAF用户自定义函数案例

UDAF：User Defined Aggregation Function，用户自定义的聚合函数，函数本身作用于数据集合，能够在聚合操作的基础上进行自定义操作。例如：UDF会被SparkSQL中的Catalyst封装成为Expression，最终会通过eval方法来计算输入的数据Row。UDAF有大量的Aggregation之类的操作，对数据进行分组，对批量的数据集合进行操作。

一个UDAF维护一个聚合缓冲区来存储每组输入数据的中间结果。它为每个输入行更新此缓冲区，一旦处理完了所有输入行，基于该聚合缓冲区的值，返回结果。

3.5.1 基于类型自定义聚合函数UDAF的Dataset 操作案例

本节基于类型自定义聚合函数 UDAF 的 Dataset 操作案例在 IntelliJ IDEA Community Edition 2017.3.2 x64 本地开发环境测试。

使用Maven工程方式新建工程，导入Spark 2.2.1及相关的Jar包，需在Pom.xml文件中增加相关的依赖：

Pom.xml文件依赖：

 

    4.0.0


    spark221BookExample
    spark221BookExample
    1.0-SNAPSHOT


    
        2.11.8
        2.2.1
        2.8.2
        1.2.14
        9.2.5.v20141112
        2.17
        1.8
    


    
        
            scala-tools.org
            Scala-Tools Maven2 Repository
            http://scala-tools.org/repo-releases
        
    


    
        
            scala-tools.org
            Scala-Tools Maven2 Repository
            http://scala-tools.org/repo-releases
        
    
    
        
        
            javax.ws.rs
            javax.ws.rs-api
            2.0
        


        
            org.scala-lang
            scala-library
            ${scala.version}
        
        
            org.scala-lang
            scala-compiler
            ${scala.version}
        
        
            org.scala-lang
            scala-reflect
            ${scala.version}
        


        
            org.scala-lang
            scalap
            ${scala.version}
        


        
            junit
            junit
            4.4
            test
        
        
            org.specs
            specs
            1.2.5
            test
        
        
            org.apache.spark
            spark-core_2.11
            ${spark.version}
        
        
            org.apache.spark
            spark-launcher_2.11
            ${spark.version}
        
        
            org.apache.spark
            spark-network-shuffle_2.11
            ${spark.version}
        
        
            org.apache.spark
            spark-sql_2.11
            ${spark.version}
        
        
            org.apache.spark
            spark-hive_2.11
            ${spark.version}
        
        
            org.apache.spark
            spark-catalyst_2.11
            ${spark.version}
        
        
            org.apache.spark
            spark-streaming-flume-assembly_2.11
            ${spark.version}
        
        
            org.apache.spark
            spark-streaming-flume_2.11
            ${spark.version}
        
        
            org.apache.spark
            spark-streaming_2.11
            ${spark.version}
        
        
            com.google.guava
            guava
            14.0.1
        
        
            org.apache.spark
            spark-graphx_2.11
            ${spark.version}
        
        
            org.scalanlp
            breeze_2.11
            0.11.2
            compile
            
                
                    junit
                    junit
                
                
                    commons-math3
                    org.apache.commons
                
            
        
        
            org.apache.commons
            commons-math3
            3.4.1
            compile
        
        
            org.apache.spark
            spark-mllib_2.11
            ${spark.version}
        






        
            org.apache.spark
            spark-mllib-local_2.11
            ${spark.version}
            test-jar
            test
        
        
            org.apache.spark
            spark-repl_2.11
            ${spark.version}
        
        
            org.apache.hadoop
            hadoop-client
            2.6.0
        
        
            org.apache.spark
            spark-streaming-kafka-0-8_2.10
            ${spark.version}
        
        
            org.apache.spark
            spark-streaming-flume_2.11
            ${spark.version}
        
        
            mysql
            mysql-connector-java
            5.1.6
        
        
            org.apache.hive
            hive-jdbc
            1.2.1
        
        
            org.apache.httpcomponents
            httpclient
            4.4.1
        
        
            org.apache.httpcomponents
            httpcore
            4.4.1
        


        
        
            org.apache.hadoop
            hadoop-common
            2.6.0
        


        
            org.apache.hadoop
            hadoop-client
            2.6.0
        


        
        
            org.apache.hadoop
            hadoop-hdfs
            2.6.0
        
        
            redis.clients
            jedis
            ${jedis.version}
        
        
            org.json
            json
            20090211
        
        
            com.fasterxml.jackson.core
            jackson-core
            2.6.3
        
        
            com.fasterxml.jackson.core
            jackson-databind
            2.6.3
        
        
            com.fasterxml.jackson.core
            jackson-annotations
            2.6.3
        
        
            com.alibaba
            fastjson
            1.1.41
        
        
            fastutil
            fastutil
            5.0.9
        
        
            org.eclipse.jetty
            jetty-server
            ${jetty.version}
        


        
            org.eclipse.jetty
            jetty-servlet
            ${jetty.version}
        


        
            org.eclipse.jetty
            jetty-util
            ${jetty.version}
        


        
            org.glassfish.jersey.core
            jersey-server
            ${container.version}
        
        
            org.glassfish.jersey.containers
            jersey-container-servlet-core
            ${container.version}
        
        
            org.glassfish.jersey.containers
            jersey-container-jetty-http
            ${container.version}
        
        
            org.apache.hadoop
            hadoop-mapreduce-client-core
            2.6.0
        


        
            org.antlr
            antlr4-runtime
            4.5.3
        
        
            org.apache.thrift
            libthrift
            0.9.3
        


    


    
        
            
                maven-assembly-plugin
                
                    dist
                    true
                    
                        jar-with-dependencies
                    
                
                
                    
                        make-assembly
                        package
                        
                            single
                        
                    
                
            


            
                maven-compiler-plugin
                
                    1.7
                    1.7
                
            


            
                net.alchim31.maven
                scala-maven-plugin
                3.2.2
                
                    
                        scala-compile-first
                        process-resources
                        
                            compile
                        
                    
                
                
                    ${scala.version}
                    incremental
                    true
                    
                        -unchecked
                        -deprecation
                        -feature
                    
                    
                        -Xms1024m
                        -Xmx1024m
                    
                    
                        -source
                        ${java.version}
                        -target
                        ${java.version}
                        -Xlint:all,-serial,-path
                    
                
            


            
                org.antlr
                antlr4-maven-plugin
                4.3
                
                    
                        antlr
                        
                            antlr4
                        
                        none
                    
                
                
                    src/test/java
                    true
                    true

本案例UserDefinedTypedAggregation.scala实现UDAF，通过MyAverage继承至基类Aggregator并实现以下六个方法：

重载实现方法zero：此聚合函数的零值，需满足任何b + zero = b的属性。MyAverage类zero方法初始化caseclass Average类的成员变量薪酬求和及职员人员次数为零值。
重载实现方法reduce：组合两个值构建一个新值。从性能考虑，函数可以修改“缓冲区”，可以返回Buffer而不是构建一个新对象。MyAverage类reduce方法读入每个Employee职员信息，将职员信息的薪酬进行累加，职员人员次数计数为1进行累加。
重载实现方法merge：合并两个中间值。本案例将第一个Average类的薪酬加上第二个Average类的薪酬；将第一个Average类的职员人次加上第二个Average类的职员人次。
重载实现方法finish：转换汇聚合并以后的输出。本案例将累加的薪酬总额除以职员人员总数，计算求出平均工资值。
重载实现方法bufferEncoder：指定中间值类型的编码器。本案例的中间值类型是case class Average。
重载实现方法outputEncoder：指定最终输出值类型的编码器。本案例的最终值平均工资的类型是Double类型。

本案例实现的功能是读入职员的薪酬信息文件，计算出职员的平均工资。

1) 数据源文件data/sql/employees.json，数据格式包括姓名、工资。

内容如下。

1.         {"name":"Michael","salary":3000}

2.         {"name":"Andy","salary":4500}

3.         {"name":"Justin","salary":3500}

4.         {"name":"Berta","salary":4000}

2) 定义职员Employee的case class类，其成员变量分别为姓名、薪酬等信

息。

3) 定义平均值Average的case class类，其成员变量分别为薪酬求和、职员

人次等信息。

4) 定义object对象 MyAverage 继承至Aggregator[Employee,Average,

Double]。Employee是聚合函数的输入类型，Average是聚合函数中间值进行汇聚的类型，Double是最终结果的输出类型。MyAverage重载实现Aggregator类的6个方法。

5) 构建建SparkSession，导入Spark的隐式转换类spark.implicits._，用于将

一个DataFrame隐式转换为一个DataSet。

6) 使用spark.read.json方法读入职员薪酬信息employees.json，转换为

Employee类型的DataSet。

7) 通过MyAverage.toColumn.name方法设置列名为average_salary，

averageSalary的类型为TypedColumn[Employee, Double]。

8) 通过ds.select(averageSalary)，调用averageSalary列计算平均工资值。查询

平均工资。

9) result.show()打印出最终的平均工资结果。

UserDefinedTypedAggregation.scala的源代码：

5.         packageorg.apache.spark.examples.sql

6.          

7.         // $exampleon:typed_custom_aggregation$

8.         importorg.apache.spark.sql.expressions.Aggregator

9.         import org.apache.spark.sql.Encoder

10.      importorg.apache.spark.sql.Encoders

11.      importorg.apache.spark.sql.SparkSession

12.      // $exampleoff:typed_custom_aggregation$

13.       

14.      objectUserDefinedTypedAggregation {

15.       

16.        // $example on:typed_custom_aggregation$

17.        case class Employee(name: String, salary:Long)

18.        case class Average(var sum: Long, var count:Long)

19.       

20.        object MyAverage extends Aggregator[Employee,Average, Double] {

21.          // A zero value for this aggregation.Should satisfy the property that any b + zero = b

22.          def zero: Average = Average(0L, 0L)

23.          // Combine two values to produce a newvalue. For performance, the function may modify `buffer`

24.          // and return it instead of constructing anew object

25.          def reduce(buffer: Average, employee:Employee): Average = {

26.            buffer.sum += employee.salary

27.            buffer.count += 1

28.            buffer

29.          }

30.          // Merge two intermediate values

31.          def merge(b1: Average, b2: Average):Average = {

32.            b1.sum += b2.sum

33.            b1.count += b2.count

34.            b1

35.          }

36.          // Transform the output of the reduction

37.          def finish(reduction: Average): Double =reduction.sum.toDouble / reduction.count

38.          // Specifies the Encoder for theintermediate value type

39.          def bufferEncoder: Encoder[Average] =Encoders.product

40.          // Specifies the Encoder for the final outputvalue type

41.          def outputEncoder: Encoder[Double] =Encoders.scalaDouble

42.        }

43.        // $example off:typed_custom_aggregation$

44.       

45.        def main(args: Array[String]): Unit = {

46.          val spark = SparkSession

47.            .builder()

48.            .appName("Spark SQL user-defined Datasetsaggregation example")

49.            .getOrCreate()

50.       

51.          import spark.implicits._

52.       

53.          // $example on:typed_custom_aggregation$

54.          val ds =spark.read.json("examples/src/main/resources/employees.json").as[Employee]

55.          ds.show()

56.          // +-------+------+

57.          //|   name|salary|

58.          // +-------+------+

59.          // |Michael|  3000|

60.          // |  Andy|  4500|

61.          // | Justin|  3500|

62.          // | Berta|  4000|

63.          // +-------+------+

64.       

65.          // Convert the function to a `TypedColumn`and give it a name

66.          val averageSalary = MyAverage.toColumn.name("average_salary")

67.          val result = ds.select(averageSalary)

68.          result.show()

69.          // +--------------+

70.          // |average_salary|

71.          // +--------------+

72.          // |       3750.0|

73.          // +--------------+

74.          // $example off:typed_custom_aggregation$

75.       

76.          spark.stop()

77.        }

78.       

79.      }

在IDEA中运行UserDefinedTypedAggregation.scala，结果如下：

Using Spark'sdefault log4j profile: org/apache/spark/log4j-defaults.properties

18/02/21 14:08:10INFO SparkContext: Running Spark version 2.2.1

……

18/02/21 14:08:41INFO DAGScheduler: Job 1 finished: show atUserDefinedTypedAggregation.scala:73, took 0.770808 s

+-------+------+

|   name|salary|

+-------+------+

|Michael|  3000|

|   Andy| 4500|

| Justin|  3500|

|  Berta| 4000|

+-------+------+

…….

18/02/21 14:08:45INFO DAGScheduler: Job 2 finished: show at UserDefinedTypedAggregation.scala:86,took 1.504912 s

+--------------+

|average_salary|

+--------------+

|        3750.0|

+--------------+

3.5.2 基于无类型的自定义聚合函数UDAF案例。

本节基于无类型的自定义聚合函数UDAF案例，MyAverageUDAF继承了基类UserDefinedAggregateFunction并实现以下八个方法：

重载实现方法inputSchema：返回StructType字段（输入列，长整型类型），作为MyAverage函数的输入参数；
重载实现方法BufferSchema：返回StructType字段（薪酬求和，长整型类型），（职工人次，长整型类型），作为MyAverage函数的中间结果的值。
重载实现方法dataType：dataType表示MyAverage函数返回值的类型是浮点类型；
重载实现方法deterministic：设置true，在给定输入值的前提下，MyAverage生成一组相同的结果。
重载实现方法initialize：初始化缓冲区的第0个元素薪酬求和的值为0，初始化缓冲区第1个元素职工人次的值为0，用于初始化聚集缓冲区（MutableAggregationBuffer）的值。
重载实现方法update：将读入每行input的第0个元素的值（即工资金额）加上buffer第0个元素值（薪酬求和进行更新）；每次的员工次数计数为1，buffer第1个元素值员工人次数加上1进行更新。
重载实现方法merge：merge用于合并两个聚集缓冲区，将第0个缓冲区的薪酬求和值加上第1个缓冲区的薪酬求和值，将第1个缓冲区的职工人次数加上第1个缓冲区的职工人次数，并将结果存储到MutableAggregationBuffer；
l重载实现方法evaluate：MyAverage函数的最终计算结果为buffer的第0个元素（即工资薪酬求和）除以buffer的第1个元素（即职工人次总数）。计算出平均工资。

本案例实现的功能也是读入职员的薪酬信息文件，计算出职员的平均工资。但不同于UserDefinedTypedAggregation.scala基于类型自定义聚合函数UDAF的Dataset 操作案例，本案例通过spark.read.json读入employees.json文件以后，没有通过as[Employee]方法转换为DataSet，因此不具备DataSet的强类型。

1) 创建SparkSession。

2) 通过spark.udf.register注册名称为myAverage的自定义UDAF函数MyAverage。

3) 通过spark.read.json读入职工工资信息表employees.json。

4) 调用createOrReplaceTempView方法注册为临时表employees。并查询显示临时表的数据。

5) 通过spark.sql语句调用myAverage(salary)自定义函数，计算平均工资。 result.show()打印最终结果。

UserDefinedUntypedAggregation.scala源代码：

   package sparksql

2.          

3.         // $exampleon:untyped_custom_aggregation$

4.         importorg.apache.spark.sql.expressions.{MutableAggregationBuffer,UserDefinedAggregateFunction}

5.         importorg.apache.spark.sql.types._

6.         importorg.apache.spark.sql.{Row, SparkSession}

7.         // $exampleoff:untyped_custom_aggregation$

8.          

9.         objectUserDefinedUntypedAggregation {

10.       

11.        // $example on:untyped_custom_aggregation$

12.        object MyAverage extendsUserDefinedAggregateFunction {

13.          // Data types of input arguments of thisaggregate function

14.          def inputSchema: StructType =StructType(StructField("inputColumn", LongType) :: Nil)

15.       

16.          // Data types of values in the aggregationbuffer

17.          def bufferSchema: StructType = {

18.            StructType(StructField("sum",LongType) :: StructField("count", LongType) :: Nil)

19.          }

20.       

21.          // The data type of the returned value

22.          def dataType: DataType = DoubleType

23.       

24.          // Whether this function always returns thesame output on the identical input

25.          def deterministic: Boolean = true

26.       

27.          // Initializes the given aggregationbuffer. The buffer itself is a `Row` that in addition to

28.          // standard methods like retrieving a valueat an index (e.g., get(), getBoolean()), provides

29.          // the opportunity to update its values.Note that arrays and maps inside the buffer are still

30.          // immutable.

31.          def initialize(buffer:MutableAggregationBuffer): Unit = {

32.            buffer(0) = 0L

33.            buffer(1) = 0L

34.          }

35.       

36.          // Updates the given aggregation buffer`buffer` with new input data from `input`

37.          def update(buffer:MutableAggregationBuffer, input: Row): Unit = {

38.            if (!input.isNullAt(0)) {

39.              buffer(0) = buffer.getLong(0) +input.getLong(0)

40.              buffer(1) = buffer.getLong(1) + 1

41.            }

42.          }

43.       

44.          // Merges two aggregation buffers andstores the updated buffer values back to `buffer1`

45.          def merge(buffer1:MutableAggregationBuffer, buffer2: Row): Unit = {

46.            buffer1(0) = buffer1.getLong(0) +buffer2.getLong(0)

47.            buffer1(1) = buffer1.getLong(1) +buffer2.getLong(1)

48.          }

49.       

50.          // Calculates the final result

51.          def evaluate(buffer: Row): Double =buffer.getLong(0).toDouble / buffer.getLong(1)

52.        }

53.       

54.        // $example off:untyped_custom_aggregation$

55.       

56.        def main(args: Array[String]): Unit = {

57.          val spark = SparkSession

58.            .builder()

59.            .master("local")

60.            .appName("Spark SQL user-definedDataFrames aggregation example")

61.            .getOrCreate()

62.       

63.          // $example on:untyped_custom_aggregation$

64.          // Register the function to access it

65.          spark.udf.register("myAverage",MyAverage)

66.       

67.          val df =spark.read.json("data/sql/employees.json")

68.          df.createOrReplaceTempView("employees")

69.          df.show()

70.          // +-------+------+

71.          // |  name|salary|

72.          // +-------+------+

73.          // |Michael|  3000|

74.          // |  Andy|  4500|

75.          // | Justin|  3500|

76.          // | Berta|  4000|

77.          // +-------+------+

78.       

79.          val result = spark.sql("SELECTmyAverage(salary) as average_salary FROM employees")

80.          result.show()

81.          // +--------------+

82.          // |average_salary|

83.          // +--------------+

84.          // |       3750.0|

85.          // +--------------+

86.          // $example off:untyped_custom_aggregation$

87.       

88.          spark.stop()

89.        }

90.       

91.      }

在IDEA中运行UserDefinedUntypedAggregation.scala，结果如下：

Using Spark'sdefault log4j profile: org/apache/spark/log4j-defaults.properties

18/02/21 17:09:21INFO SparkContext: Running Spark version 2.2.1

……

18/02/21 17:09:41INFO DAGScheduler: Job 1 finished: show atUserDefinedUntypedAggregation.scala:85, took 0.138434 s

+-------+------+

|   name|salary|

+-------+------+

|Michael|  3000|

|   Andy| 4500|

| Justin|  3500|

|  Berta| 4000|

+-------+------+

……

18/02/21 17:09:43INFO DAGScheduler: Job 2 finished: show atUserDefinedUntypedAggregation.scala:96, took 0.693570 s

+--------------+

|average_salary|

+--------------+

|        3750.0|

+--------------+

2018年新春报喜！热烈祝贺王家林大咖大数据经典传奇著作《SPARK大数据商业实战三部曲》畅销书籍清华大学出版社发行上市!

本书基于Spark 2.2.0最新版本（2017年7月11日发布），以Spark商业案例实战和Spark在生产环境下几乎所有类型的性能调优为核心，以Spark内核解密为基石，分为上篇、中篇、下篇，对企业生产环境下的Spark商业案例与性能调优抽丝剥茧地进行剖析。上篇基于Spark源码，从一个动手实战案例入手，循序渐进地全面解析了Spark 2.2新特性及Spark内核源码；中篇选取Spark开发中最具有代表的经典学习案例，深入浅出地介绍，在案例中综合应用Spark的大数据技术；下篇性能调优内容基本完全覆盖了Spark在生产环境下的所有调优技术。

本书适合所有Spark学习者和从业人员使用。对于有分布式计算框架应用经验的人员，本书也可以作为Spark高手修炼的参考书籍。同时，本书也特别适合作为高等院校的大数据教材使用。

当当网、京东、淘宝、亚马逊等网店已可购买！欢迎大家购买学习！

当当网址： http://product.dangdang.com/25230552.html

android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
每日一题——第八十九题互联网打工人no1 C语言程序设计每日一练 c语言
题目：在字符串中找到提取数字，并统计一共找到多少整数，a123xxyu23&8889，那么找到的整数为123，23，8889//思想：#include#include#includeintmain(){charstr[]="a123xxyu23&8889";intcount=0;intnum=0;//用于临时存放当前正在构建的整数。boolinNum=false;//用于标记当前是否正在读取一个整
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
每日一题——第八十一题互联网打工人no1 C语言程序设计每日一练 c语言
打印如下图案:#includeintmain(){inti,j;charch='A';for(i=1;i<5;i++,ch++){for(j=0;j<5-i;j++){printf("");//控制空格输出}for(j=1;j<2*i;j++)//条件j<2*i{printf("%c",ch);//控制字符输出}printf("\n");}return0;}
每日一题——第八十二题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将一个控制台输入的字符串中的所有元音字母复制到另一字符串中#include#include#include#include#defineMAX_INPUT1024boolisVowel(charp);intmain(){charinput[MAX_INPUT];charoutput[MAX_INPUT];printf("请输入一串字符串：\n");fgets(input,sizeof(inp
每日一题——第八十三题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将输入的整形数字输出,输出1990，输出"1990"#include#defineMAX_INPUT1024intmain(){intarrr_num[MAX_INPUT];intnum,i=0;printf("请输入一个数字：");scanf_s("%d",&num);while(num!=0){arrr_num[i++]=num%10;num/=10;}printf("\"");for(
WPF中的ComboBox控件几种数据绑定的方式互联网打工人no1 wpf c#
一、用字典给ItemsSource赋值（此绑定用的地方很多，建议熟练掌握）在XMAL中：在CS文件中privatevoidBindData(){DictionarydicItem=newDictionary();dicItem.add(1,"北京");dicItem.add(2,"上海");dicItem.add(3,"广州");cmb_list.ItemsSource=dicItem;cmb_l
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
利用LangChain的StackExchange组件实现智能问答系统 nseejrukjhad langchain microsoft 数据库 python
利用LangChain的StackExchange组件实现智能问答系统引言在当今的软件开发世界中，StackOverflow已经成为程序员解决问题的首选平台之一。而LangChain作为一个强大的AI应用开发框架，提供了StackExchange组件，使我们能够轻松地将StackOverflow的海量知识库集成到我们的应用中。本文将详细介绍如何使用LangChain的StackExchange组件
如何部分格式化提示模板:LangChain中的高级技巧 nseejrukjhad langchain java 服务器 python
标题:如何部分格式化提示模板:LangChain中的高级技巧内容:如何部分格式化提示模板:LangChain中的高级技巧引言在使用大型语言模型(LLM)时,提示工程是一个关键环节。LangChain提供了强大的提示模板功能,让我们能更灵活地构建和管理提示。本文将介绍LangChain中一个高级特性-部分格式化提示模板,这个技巧可以让你的提示管理更加高效和灵活。什么是部分格式化提示模板?部分格式化提
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
Kafka 消息丢失如何处理？架构文摘JGWZ 学习
今天给大家分享一个在面试中经常遇到的问题：Kafka消息丢失该如何处理？这个问题啊，看似简单，其实里面藏着很多“套路”。来，咱们先讲一个面试的“真实”案例。面试官问：“Kafka消息丢失如何处理？”小明一听，反问：“你是怎么发现消息丢失了？”面试官顿时一愣，沉默了片刻后，可能有点不耐烦，说道：“这个你不用管，反正现在发现消息丢失了，你就说如何处理。”小明一头雾水：“问题是都不知道怎么丢的，处理起来
走向以教育叙事为载体的教育叙事研究 666小飞鱼
今天我读了吴松超老师的《给教师的68条建写作建议》中的第23条《如何通过教育叙事走向研究》，吴老师在文中与我们分享了一个德育案例，这是一个反面的案例，意在告知我们在处理问题时，不能就考虑的点太窄，思考要全面。走向教育叙事研究，教师要有敏锐的“感知力”，这个感知力来自于背后专业知识的支撑，思维能力以及广阔的视野和见识等。所以对于同一件事处理方法不同，这个就是教师背后“敏锐力”的不同造成的，也就是说是
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
每日一题——第八十八题互联网打工人no1 C语言程序设计每日一练 c语言
题目：输入一个9位的无符号整数，判断其是否有重复数字#include#include#includeintmain(){charnum_str[10];printf("请输入一个9位数的无符号数：");scanf_s("%9d",&num_str);if(strlen(num_str)!=9){printf("输入的不是一个9位无符号整数，请重新输入");}else{if(hasDuplicate
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri

Spark 2.2.1 SQL UDAF用户自定义函数案例