好记性＋烂笔头

sparkmlib调用

sparkmlib4_time

创建数据、模型、预测表
1、数据存入mysql
2、读取数据、模型预测
3、模型保存
4、mysql 数据加载、模型预测保存
？mysql模型加载，预测保存
？hdfs数据读入、存储

cd /opt/module/spark-standalone
sbin/start-all.sh
bin/spark-shell

创建数据、模型、预测表

SHOW DATABASES;
USE mydb;
SHOW TABLES;


CREATE TABLE flowers8 (
  id INT NOT NULL AUTO_INCREMENT PRIMARY KEY,
  sepal_length FLOAT,
  sepal_width FLOAT,
  petal_length FLOAT,
  petal_width FLOAT,
  species VARCHAR(255),
  created_at TIMESTAMP NOT NULL DEFAULT CURRENT_TIMESTAMP
);


CREATE TABLE models8 (
    id INT NOT NULL AUTO_INCREMENT,
    name VARCHAR(50) NOT NULL,
    content BLOB NOT NULL,
    PRIMARY KEY (id),
    created_at TIMESTAMP NOT NULL DEFAULT CURRENT_TIMESTAMP
);


CREATE TABLE predicted_flowers8 (
    id INT NOT NULL AUTO_INCREMENT,
    indexedFeatures VARCHAR(255),
    label VARCHAR(255),
    rawPrediction VARCHAR(255),
    probability VARCHAR(255),
    prediction DOUBLE,
    PRIMARY KEY (id),
    created_at TIMESTAMP NOT NULL DEFAULT CURRENT_TIMESTAMP
);

1、数据存入mysql


import org.apache.spark.sql.functions._
import org.apache.spark.sql.types._
import java.sql.{Connection, DriverManager, PreparedStatement}
import org.apache.spark.sql.SparkSession
import java.util.Properties

val url = "jdbc:mysql://hadoop102:3306/mydb"
val table = "flowers8"
val user = "root"
val password = "000000"

val props = new Properties()
props.put("user", user)
props.put("password", password)

val spark = SparkSession.builder().appName("insert-data").config("spark.master", "local").getOrCreate()
val cleanedData = spark.read.text("file:///opt/module/spark-standalone/data/iris.data.txt").filter(row => row.getAs[String]("value").trim != "").map(row => row.getAs[String]("value").split(",")).map(cols => (cols(0).toDouble, cols(1).toDouble, cols(2).toDouble, cols(3).toDouble, cols(4))).toDF("sepal_length", "sepal_width", "petal_length", "petal_width", "species")

cleanedData.write.mode("append").jdbc(url, table, props)
spark.stop()

2、读取数据、模型预测

import org.apache.spark.ml.linalg.{Vector,Vectors}
import org.apache.spark.ml.feature.{IndexToString,StringIndexer,VectorIndexer}
import org.apache.spark.ml.classification.LogisticRegression
import org.apache.spark.ml.{Pipeline,PipelineModel}
import org.apache.spark.sql.Row
import org.apache.spark.ml.classification.LogisticRegressionModel
import org.apache.spark.ml.evaluation.MulticlassClassificationEvaluator
import org.apache.spark.ml.linalg.Vectors
import java.util.Properties
case class Iris(features:org.apache.spark.ml.linalg.Vector,label:String)
val url = "jdbc:mysql://hadoop102:3306/mydb"
val user = "root"
val password = "000000"
val table = "flowers8"
val props = new Properties()
props.put("user", user)
props.put("password", password)
val irisDF = spark.read.jdbc(url, table, props) // 从MySQL数据库读取数据

val data = irisDF.map { row =>
  Iris(
    Vectors.dense(row.getAs[Double]("sepal_length"), row.getAs[Double]("sepal_width"),
                 row.getAs[Double]("petal_length"), row.getAs[Double]("petal_width")),
    row.getAs[String]("species")
  )
}
val labelIndexer=new StringIndexer().setInputCol("label").setOutputCol("indexedLabel").fit(data)
val featureIndexer=new VectorIndexer().setInputCol("features").setOutputCol("indexedFeatures").fit(data)
val lr=new LogisticRegression().setLabelCol("indexedLabel").setFeaturesCol("indexedFeatures").setMaxIter(100).setRegParam(0.3).setElasticNetParam(0.8)
val labelConverter = new IndexToString().setInputCol("prediction").setOutputCol("predictedLabel").setLabels(labelIndexer.labels)
val lrPipeline = new Pipeline().setStages(Array(labelIndexer,featureIndexer,lr,labelConverter))
val Array(trainingData,testData)=data.randomSplit(Array(0.7,0.3))
val lrPipelineModel = lrPipeline.fit(trainingData)
val lrPredictions=lrPipelineModel.transform(testData)
lrPredictions.
select("predictedLabel","label","features","probability").collect().
foreach{case Row(predictedLabel:String,label:String,features:Vector,prob:Vector)=>println(s"($label,$features) -->prob=$prob,predicted Label=$predictedLabel")}
val evaluator = new MulticlassClassificationEvaluator().
setLabelCol("indexedLabel").setPredictionCol("prediction")
val lrAccuracy = evaluator.evaluate(lrPredictions)
val lrModel = lrPipelineModel.stages(2).asInstanceOf[LogisticRegressionModel]
println("Coefficients: \n "+ lrModel.coefficientMatrix++ "\nIntercept:"+lrModel.interceptVector+"\n numClasses: "+lrModel.numClasses+"\n numFeatures: "+lrModel.numFeatures)


//本地保存模型
lrModel.save("/opt/module/spark-standalone/data/lrModel9")
val localModel = LogisticRegressionModel.load("/opt/module/spark-standalone/data/lrModel9")
val predictions1 = localModel.transform(testData.withColumnRenamed("features", "indexedFeatures"))
predictions1 .show()

3、模型保存

import java.io.ByteArrayOutputStream
import java.io.ObjectOutputStream
import java.sql.{Connection, DriverManager, PreparedStatement}
import org.apache.spark.ml.linalg.{Vector,Vectors}
import org.apache.spark.ml.feature.{IndexToString,StringIndexer,VectorIndexer}
import org.apache.spark.ml.classification.LogisticRegression
import org.apache.spark.ml.{Pipeline,PipelineModel}
import org.apache.spark.sql.Row
import org.apache.spark.ml.classification.LogisticRegressionModel
import org.apache.spark.ml.evaluation.MulticlassClassificationEvaluator
import org.apache.spark.ml.linalg.Vectors
val model = LogisticRegressionModel.load("/opt/module/spark-standalone/data/lrModel9")
val bos = new ByteArrayOutputStream()
val oos = new ObjectOutputStream(bos)
oos.writeObject(model)
oos.flush()
val bytes = bos.toByteArray()
val conn: Connection = DriverManager.getConnection("jdbc:mysql://hadoop102:3306/mydb", "root", "000000")
val stmt: PreparedStatement = conn.prepareStatement("INSERT INTO models8 (name, content) VALUES (?, ?)")
stmt.setString(1, "my_model")
stmt.setBytes(2, bytes)
stmt.executeUpdate()

4、mysql 数据加载、模型预测保存

//mysql 加载数据
import org.apache.spark.ml.linalg.{Vector,Vectors}
import org.apache.spark.ml.feature.{IndexToString,StringIndexer,VectorIndexer}
import org.apache.spark.ml.classification.LogisticRegression
import org.apache.spark.ml.{Pipeline,PipelineModel}
import org.apache.spark.sql.Row
import org.apache.spark.ml.classification.LogisticRegressionModel
import org.apache.spark.ml.evaluation.MulticlassClassificationEvaluator
import org.apache.spark.ml.linalg.Vectors
import java.util.Properties
case class Iris(features:org.apache.spark.ml.linalg.Vector,label:String)
val url = "jdbc:mysql://hadoop102:3306/mydb"
val user = "root"
val password = "000000"
val table = "flowers5"
val props = new Properties()
props.put("user", user)
props.put("password", password)
val irisDF = spark.read.jdbc(url, table, props) // 从MySQL数据库读取数据
irisDF
val data = irisDF.map { row =>
   Iris(
     Vectors.dense(row.getAs[Double]("sepal_length"), row.getAs[Double]("sepal_width"),
                  row.getAs[Double]("petal_length"), row.getAs[Double]("petal_width")),
     row.getAs[String]("species")
   )
 }
data
val labelIndexer=new StringIndexer().setInputCol("label").setOutputCol("indexedLabel").fit(data)
val featureIndexer=new VectorIndexer().setInputCol("features").setOutputCol("indexedFeatures").fit(data)
val lr=new LogisticRegression().setLabelCol("indexedLabel").setFeaturesCol("indexedFeatures").setMaxIter(100).setRegParam(0.3).setElasticNetParam(0.8)
val labelConverter = new IndexToString().setInputCol("prediction").setOutputCol("predictedLabel").setLabels(labelIndexer.labels)
val lrPipeline = new Pipeline().setStages(Array(labelIndexer,featureIndexer,lr,labelConverter))
val Array(trainingData,testData)=data.randomSplit(Array(0.7,0.3))
val lrPipelineModel = lrPipeline.fit(trainingData)
val lrPredictions=lrPipelineModel.transform(testData)
lrPredictions.
 select("predictedLabel","label","features","probability").collect().
 foreach{case Row(predictedLabel:String,label:String,features:Vector,prob:Vector)=>println(s"($label,$features) -->prob=$prob,predicted Label=$predictedLabel")}
val evaluator = new MulticlassClassificationEvaluator().
 setLabelCol("indexedLabel").setPredictionCol("prediction")
val lrAccuracy = evaluator.evaluate(lrPredictions)
val lrModel = lrPipelineModel.stages(2).asInstanceOf[LogisticRegressionModel]
println("Coefficients: \n "+ lrModel.coefficientMatrix++ "\nIntercept:"+lrModel.interceptVector+"\n numClasses: "+lrModel.numClasses+"\n numFeatures: "+lrModel.numFeatures)                                                                          
val localModel = LogisticRegressionModel.load("/opt/module/spark-standalone/data/lrModel8")
val predictions1 = localModel.transform(testData.withColumnRenamed("features", "indexedFeatures"))
predictions1 .show()


//mysql预测保存
import java.util.Properties
// 配置 MySQL 连接参数
val url = "jdbc:mysql://hadoop102:3306/mydb"
val table = "predicted_flowers8"
val user = "root"
val password = "000000"
val props = new Properties()
props.put("user", user)
props.put("password", password)
// 将预测结果写入 MySQL 表
predictions1.select("indexedFeatures", "label", "rawPrediction", "probability", "prediction").foreach { row =>
  val indexedFeatures = row.getAs[org.apache.spark.ml.linalg.Vector]("indexedFeatures")
  val label = row.getAs[String]("label")
  val rawPrediction = row.getAs[org.apache.spark.ml.linalg.Vector]("rawPrediction")
  val probability = row.getAs[org.apache.spark.ml.linalg.Vector]("probability")
  val prediction = row.getAs[Double]("prediction")
  // 将数据插入 MySQL 表中
  val conn = java.sql.DriverManager.getConnection(url, user, password)
  try {
    val stmt = conn.createStatement()
    val sql = s"""INSERT INTO $table
         |(indexedFeatures, label, rawPrediction, probability, prediction)
         |VALUES ('${indexedFeatures.toArray.mkString(",")}', '$label', '${rawPrediction.toArray.mkString(",")}', '${probability.toArray.mkString(",")}', $prediction)
         |""".stripMargin
    stmt.executeUpdate(sql)
  } finally {
    conn.close()
  }
  // 返回 Unit
  ()
}

？mysql模型加载，预测保存

//mysql 加载数据
import org.apache.spark.ml.linalg.{Vector,Vectors}
import org.apache.spark.ml.feature.{IndexToString,StringIndexer,VectorIndexer}
import org.apache.spark.ml.classification.LogisticRegression
import org.apache.spark.ml.{Pipeline,PipelineModel}
import org.apache.spark.sql.Row
import org.apache.spark.ml.classification.LogisticRegressionModel
import org.apache.spark.ml.evaluation.MulticlassClassificationEvaluator
import org.apache.spark.ml.linalg.Vectors
import java.util.Properties
case class Iris(features:org.apache.spark.ml.linalg.Vector,label:String)
val url = "jdbc:mysql://hadoop102:3306/mydb"
val user = "root"
val password = "000000"
val table = "flowers5"
val props = new Properties()
props.put("user", user)
props.put("password", password)
val irisDF = spark.read.jdbc(url, table, props) // 从MySQL数据库读取数据
irisDF
val data = irisDF.map { row =>
   Iris(
     Vectors.dense(row.getAs[Double]("sepal_length"), row.getAs[Double]("sepal_width"),
                  row.getAs[Double]("petal_length"), row.getAs[Double]("petal_width")),
     row.getAs[String]("species")
   )
 }
data
val labelIndexer=new StringIndexer().setInputCol("label").setOutputCol("indexedLabel").fit(data)
val featureIndexer=new VectorIndexer().setInputCol("features").setOutputCol("indexedFeatures").fit(data)
val lr=new LogisticRegression().setLabelCol("indexedLabel").setFeaturesCol("indexedFeatures").setMaxIter(100).setRegParam(0.3).setElasticNetParam(0.8)
val labelConverter = new IndexToString().setInputCol("prediction").setOutputCol("predictedLabel").setLabels(labelIndexer.labels)
val lrPipeline = new Pipeline().setStages(Array(labelIndexer,featureIndexer,lr,labelConverter))
val Array(trainingData,testData)=data.randomSplit(Array(0.7,0.3))
val lrPipelineModel = lrPipeline.fit(trainingData)
val lrPredictions=lrPipelineModel.transform(testData)
lrPredictions.
 select("predictedLabel","label","features","probability").collect().
 foreach{case Row(predictedLabel:String,label:String,features:Vector,prob:Vector)=>println(s"($label,$features) -->prob=$prob,predicted Label=$predictedLabel")}
val evaluator = new MulticlassClassificationEvaluator().
 setLabelCol("indexedLabel").setPredictionCol("prediction")
val lrAccuracy = evaluator.evaluate(lrPredictions)
val lrModel = lrPipelineModel.stages(2).asInstanceOf[LogisticRegressionModel]
println("Coefficients: \n "+ lrModel.coefficientMatrix++ "\nIntercept:"+lrModel.interceptVector+"\n numClasses: "+lrModel.numClasses+"\n numFeatures: "+lrModel.numFeatures)                                                                          


// 加载mysql模型
import java.io.ByteArrayInputStream
import java.io.ObjectInputStream
import java.sql.{Connection, DriverManager, PreparedStatement, ResultSet}
val conn: Connection = DriverManager.getConnection("jdbc:mysql://hadoop102:3306/mydb", "root", "000000")
val query: String = "SELECT content FROM models3 WHERE name = 'my_model'"
val stmt = conn.prepareStatement(query)
val rs: ResultSet = stmt.executeQuery(query)
var loadedLRModel: LogisticRegressionModel = null
if (rs.next()) {
  val bytes: Array[Byte] = rs.getBytes("content")
  val bis = new ByteArrayInputStream(bytes)
  val ois = new ObjectInputStream(bis)
  loadedLRModel = ois.readObject().asInstanceOf[LogisticRegressionModel]
}
rs.close()
stmt.close()
conn.close()

val predictions1 = loadedLRModel.transform(testData.withColumnRenamed("features", "indexedFeatures"))
predictions1 .show()




//mysql预测保存
import java.util.Properties
val url = "jdbc:mysql://hadoop102:3306/mydb"
val table = "predicted_flowers6"
val user = "root"
val password = "000000"
val props = new Properties()
props.put("user", user)
props.put("password", password)
predictions1.select("indexedFeatures", "label", "rawPrediction", "probability", "prediction").foreach { row =>
  val indexedFeatures = row.getAs[org.apache.spark.ml.linalg.Vector]("indexedFeatures")
  val label = row.getAs[String]("label")
  val rawPrediction = row.getAs[org.apache.spark.ml.linalg.Vector]("rawPrediction")
  val probability = row.getAs[org.apache.spark.ml.linalg.Vector]("probability")
  val prediction = row.getAs[Double]("prediction")
  val conn = java.sql.DriverManager.getConnection(url, user, password)
  try {
    val stmt = conn.createStatement()
    val sql = s"""INSERT INTO $table
         |(indexedFeatures, label, rawPrediction, probability, prediction)
         |VALUES ('${indexedFeatures.toArray.mkString(",")}', '$label', '${rawPrediction.toArray.mkString(",")}', '${probability.toArray.mkString(",")}', $prediction)
         |""".stripMargin
    stmt.executeUpdate(sql)
  } finally {
    conn.close()
  }
  ()
}

？hdfs数据读入、存储

import org.apache.spark.ml.linalg.{Vector,Vectors}
import org.apache.spark.ml.feature.{IndexToString,StringIndexer,VectorIndexer}
import org.apache.spark.ml.classification.LogisticRegression
import org.apache.spark.ml.{Pipeline,PipelineModel}
import org.apache.spark.sql.Row
import org.apache.spark.ml.classification.LogisticRegressionModel
import org.apache.spark.ml.evaluation.MulticlassClassificationEvaluator
import org.apache.spark.ml.linalg.Vectors
case class Iris(features:org.apache.spark.ml.linalg.Vector,label:String)
val irisDF = sc.textFile("hdfs://hadoop102:9870/pdwcs/iris.data.txt")

val data = irisDF.map { line =>
  val parts = line.split(",")
  Iris(
    Vectors.dense(parts(0).toDouble, parts(1).toDouble, parts(2).toDouble, parts(3).toDouble),
    parts(4)
  )
}
val df= data.toDF()
df.show()

Java Lambda 表达式详解及其用法 —— 含集合操作示例情书 java
JavaLambda表达式详解及其用法——含集合操作示例Lambda表达式自Java8引入以来，大大简化了代码的书写，特别是在集合操作和流处理（StreamAPI）方面。本文将详细介绍Lambda表达式的概念、使用方法及其在集合中的应用，并结合示例说明如何使用Lambda表达式进行集合的转换和处理。1.什么是Lambda表达式？Lambda表达式是一种可以把函数作为参数的简洁表达方式，主要用于替代
2025年计算机专业毕业设计选题推荐速存小晓程序设计课程设计 java spring boot 毕业设计
2025最新计算机专业毕业设计选题推荐博主介绍CSDN特邀作者、博客专家、CSDN新星计划导师Java领域优质创作者，荣获“博客之星”称号掘金、华为云、阿里云、InfoQ等平台优质作者专注于Java技术及学生毕业项目实战指导高校教师/讲师，擅长同行交流合作文末获取源码联系方式主要内容SpringBoot、Vue、SSM框架应用HLMT（假设为某特定技术或框架）、Jsp、PHP、Node.js、Py
Java中的注解 @valid @RequestBody @ApiOperation @Builder@NoArgsConstructor@AllArgsConstructor@Data xt_ java java 开发语言
1、@valid在Java中，特别是在Spring框架中，@Valid是一个常用的注解，用于在方法参数上执行BeanValidation。BeanValidation是JavaEE的一部分，它提供了一组用于验证JavaBean属性的注解。当你使用@Valid注解时，Spring会检查标注了该注解的对象的属性，以确保它们满足指定的验证规则。这里有一个简单的例子：首先，定义一个简单的实体类，并使用Be
[2940]基于JAVA的货架销售智慧管理系统的设计与实现阿鑫学长【毕设工场】 java 开发语言毕业设计课程设计
毕业设计（论文）开题报告表姓名学院专业班级题目基于JAVA的货架销售智慧管理系统的设计与实现指导老师（一）选题的背景和意义随着信息技术的快速发展，越来越多的企业开始关注信息化管理。而零售行业作为与人们生活息息相关的重要领域，其管理系统的智能化和自动化程度直接影响着企业的运营效率和服务质量。基于Java的货架销售智慧管理系统的设计与实现正是针对这一需求，旨在为企业提供一个高效、便捷、智能的管理系统。
Python语法总结彧侠脚本处理 Python
Python作为一种解释型的脚本语言，无论从自动化运维、大数据处理还是人工智能都得到了广泛的应用，而且它好理解、易学习、上手快的特点也使它成为了当下最火热的开发语言之一。下面就对Python语言中的各种语法做一个总结，以备后用数据类型一、整数二、浮点数三、字符串四、布尔值五、空值print语句注释什么是变量比如：定义字符串raw字符串与多行字符串Unicode字符串字符串还有一个编码问题。整数和浮
DFS,回溯实现全排列未来的JAVA高级开发工程师算法 Java java 算法
packagecom.cjh.dfs;importjava.util.ArrayList;importjava.util.List;importjava.util.Scanner;publicclassDFS1{staticList>list=newArrayListt=newArrayListt){if(t.size()==n){list.add(newArrayList<>(t));retur
java8特性 - lambda表达式菜菜-plus java java-ee
java8特性-Lambda一、Lambda表达式函数式接口Lambda表达式使用的前提，就是接口必须是一个函数式接口。定义如果在接口中，只有一个抽象方法，那么这个接口就是函数式接口。格式使用注解来检查当前接口是否是一个函数式接口@FunctionalInterface如果不是函数式接口，则编译报错。作用主要用于函数式编程（即使用lambda表达式编程）。@FunctionalInterfacei
JavaScript系列（32）-- WebAssembly集成详解陳沉辰陈 JavaScript javascript wasm udp
JavaScriptWebAssembly集成详解今天，让我们深入了解JavaScript与WebAssembly的集成，这是一项能够显著提升Web应用性能的关键技术。WebAssembly基础概念小知识：WebAssembly（简称Wasm）是一种低级的类汇编语言，它具有紧凑的二进制格式，能够以接近原生的速度运行。它被设计为可以和JavaScript一起协同工作，为Web应用提供高性能计算能力。
【Java】详细讲解数据类型与运算符 Yui_ Java java 开发语言
大家好，我是Yui_如果文章知识点有错误的地方，请指正！和大家一起学习，一起进步如有不懂，可以随时向我提问，我会全力讲解~如果感觉博主的文章还不错的话，希望大家关注、点赞、收藏三连支持一下博主哦~！你们的支持是我创作的动力！我相信现在的努力的艰辛，都是为以后的美好最好的见证！人的心态决定姿态！欢迎讨论：如有疑问或见解，欢迎在评论区留言互动。点赞、收藏与分享：如觉得这篇文章对您有帮助，请点赞、收藏并
详解Java之lambda 新绿MEHO JAVA Java JAVA
目录lambda引入语法函数式接口lambda表达式的使用语法精简：代码示例：变量捕获局部变量捕获成员变量捕获lambda在集合中的使用lambda的优缺点lambda引入Lambda表达式是JavaSE8中一个重要的新特性。lambda表达式允许你通过表达式来代替功能接口。lambda表达式就和方法一样,它提供了一个正常的参数列表和一个使用这些参数的主体(body,可以是一个表达式或一个代码块)
华为OD机试E卷 --英文输入法--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript c语言 python
文章目录题目描述输入描述输出描述用例JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述主管期望你来实现英文输入法单词联想功能。需求如下：•依据用户输入的单词前缀，从已输入的英文语句中联想出用户想输入的单词，按字典序输出联想到的单词序列，•如果联想不到，请输出用户输入的单词前缀。注意：英文单词联想时，区分大小写缩略形式如”don’t”，判定为两个单词，”don”和”t”
《Java核心技术卷II》HTTP客户端阿立聊全栈《Java核心技术II》Java Java核心II 服务器
HTTP客户端URLConnection是HTTP称为Web普通适用协议之前设计的，提供大量协议支持，但笨重。HttpClient提供了更便捷的API和HTTP/2的支持。HttpClient类HttpClient对象可以发出请求并接收响应，调用方法获取客户端：HttpClientclient=HttpClient.newHttpClient();需要配置客户端，如下构建器API:HttpClie
Ubuntu11.04 64位搭建android开发环境 zgjxwl Android Android Ubuntu11.04 64
1、安装Ubuntu11.0464位版本名称：ubuntu-11.04-desktop-amd64.iso下载地址：http://kuai.xunlei.com/d/TfV8AwK-CQC7xDtSf6e具体Ubuntu的安装不详细说了，大家可以自行google通过VmWare安装。2、安装jdk1.7下载地址：http://www.oracle.com/technetwork/java/java
搭建单机伪分布式Hadoop+spark+scala 啥也不会0-0 分布式 hadoop spark
目录一、准备环境包：二、创建centos7虚拟机并配置ip三、链接Xshell并上环境包四、安装JDK1.解压jdk2.设置JAVA环境变量3.执行source使设置生效：4.检查JAVA是否可用。五、免密登陆1.创建ssh秘钥，输入如下命令，生成公私密钥2.将master公钥id_dsa复制到master进行公钥认证，实现本机免密登陆，测试完exit退出六、安装Hadoop软件1.解压hadoo
CDP中的Hive3之Apache Hive3特性对许 #Hive #Spark hive cdp
CDP中的Hive3之ApacheHive3特性1、ApacheHive3特性2、Hive不支持的接口和功能3、HiveonTez简介4、ApacheHive3架构概述CDP中采用的是ApacheHive3版本，相比Hive1/2，该版本在事务和安全性等方面有重大改进，了解这些版本之间的主要差异对于SQL用户至关重要，包括使用ApacheSpark和ApacheImpala的用户1、ApacheH
Hadoop 与 Spark：大数据处理的比较王子良. 大数据经验分享 hadoop spark 大数据
欢迎来到我的博客！非常高兴能在这里与您相遇。在这里，您不仅能获得有趣的技术分享，还能感受到轻松愉快的氛围。无论您是编程新手，还是资深开发者，都能在这里找到属于您的知识宝藏，学习和成长。博客内容包括：Java核心技术与微服务：涵盖Java基础、JVM、并发编程、Redis、Kafka、Spring等，帮助您全面掌握企业级开发技术。大数据技术：涵盖Hadoop（HDFS）、Hive、Spark、Fli
JDK新特性飘飘渺渺渺红尘 Java Web Service java 开发语言
目录Java81、Interface2、Lambda2.1、替代匿名内部类RunnerableComparatorListener2.2、集合遍历3、Stream3.1、流类型3.2、常用方法4、Date-Time4.1、java.time主要类4.2、格式化4.3、字符串转日期4.4、日期计算4.5、获取指定日期4.6、时区小结Java91、G1成为默认垃圾回收器Java101、G1并行Full
string.join()方法 BLUE_SEVEN
JavaStringjoin()join()方法返回使用指定分隔符拼接一个字符串。在join()方法中，为每个元素添加了分隔符。如果为null元素，则添加“null”。从JDK1.8开始，Java字符串才包含join()方法。Java字符串中有两种join()方法。1语法publicstaticStringjoin(CharSequencedelimiter,CharSequence...elem
【Java】Lambda表达式玛卡~巴卡 Java基础 java 开发语言 Lambda
文章目录一、Lambda表达式1.1相关背景1.2函数式编程1.3匿名内部类和Lambda表达式二、Lambda表达式的使用2.1基本语法2.2使用案例三、变量捕获3.1匿名内部类的变量捕获3.2Lambda表达式的变量捕获四、Lambda表达式在集合中的使用4.1Collection接口4.2List接口4.3Map接口五、Lambda表达式的优缺点一、Lambda表达式1.1相关背景Lambd
虚拟机VMware Workstation Pro安装集群+hadoop+spark+scala 落枫兮 hadoop spark scala
参考资料：参考视频教程链接：大数据实验虚拟机安装Hadoop和Spark_哔哩哔哩_bilibiliup主：孤独时代的硕硕namenode安装选择镜像、路径、磁盘（最好不要c盘）、内存和处理器编辑名称与位置可点击此处自定义硬盘进行设置。选择语言、时区、软件、位置和网络
stream流的使用小韩学长yyds java
1.什么是Stream流?Stream（流）是一个来自数据源的元素队列并支持聚合操作元素是特定类型的对象，形成一个队列。Java中的Stream并不会存储元素，而是按需计算。数据源流的来源。可以是集合，数组，I/Ochannel，产生器generator等。聚合操作类似SQL语句一样的操作，比如filter,map,reduce,find,match,sorted等。和以前的Collection操
税务门户网站系统：数据分析与税务政策传播 liuxin33445566 安全 java 开发语言数据库前端
2.1SSM框架介绍本课题程序开发使用到的框架技术，英文名称缩写是SSM，在JavaWeb开发中使用的流行框架有SSH、SSM、SpringMVC等，作为一个课题程序采用SSH框架也可以，SSM框架也可以，SpringMVC也可以。SSH框架是属于重量级别的框架，配置繁琐，不够灵活，修改程序需要修改好多个文件，并且运行起来也占用内存较高，CPU使用率相对也高，SpringMVC是Spring开发的
大数据手写面试题Scala语言实现大全（持续更新）大模型大数据攻城狮大数据数据结构算法面试题面试宝典
在大数据领域，Scala语言因其强大的函数式编程特性和对并发处理的良好支持而成为了开发者们的热门选择。有些面试官，为了考验面试者的基本功，需要让手写一些面试题，以数据结构和算法类的居多。本文将为您提供一些常见的Scala手写面试题及参考答案，帮助您在面试或工作中更好地运用Scala。目录1.冒泡排序2.二分查找3.快速排序4.归并排序5.手写Spark-WordCount6.手写Spark程序求平
Zookeeper启动指定JDK版本费曼乐园 Zookeeper zookeeper
1.从官网下载jdk21版本。JavaDownloads|Oracle2.将下载的jdk-21_linux-x64_bin.tar.gz文件上传的主机/usr/java目录下面。3.在/usr/java目录下面解压文件。tar-zxvfjdk-21_linux-x64_bin.tar.gz4.修改zookeeper的bin目录下面的zkEnv.sh脚本，在关于获取JAVA_HOME的脚本行前面添加
Java中的String.join方法详解 UtdPatch java python 开发语言
String.join方法是Java中的一个实用工具方法，用于将一组字符串连接成一个新的字符串。它提供了一种简洁而灵活的方式来处理字符串连接的需求。在本文中，我们将详细介绍String.join方法的功能、用法和示例代码。功能简介String.join方法的功能是将一组字符串连接成一个新的字符串，通过指定一个分隔符将它们分隔开。它接受两个参数：分隔符和一个可迭代的CharSequence（如字符串
feign调用跳过HTTPS的SSL证书校验配置详解秋分的秋刀鱼 Java 网络编程 ssl https 网络 java
一、问题抛出如果不配置跳过SSL证书校验，当Feign客户端尝试连接到一个使用自签名证书的服务器时，可能会抛出类似以下的异常：javax.net.ssl.SSLHandshakeException:sun.security.validator.ValidatorException:PKIXpathbuildingfailed:sun.security.provider.certpath.SunCe
java String.join()方法详解飞滕人生TYF java java
JavaString.join()方法详解String.join()是Java提供的一个实用方法，用于将多个字符串按照指定的分隔符连接成一个字符串。这一方法是Java8中引入的，极大地简化了字符串拼接的操作。1.方法定义publicstaticStringjoin(CharSequencedelimiter,CharSequence...elements)publicstaticStringjoi
com.mongodb.MongoSocketOpenException: Exception opening socket错误解决方法且听风吟， JAVA mongodb java 数据库
详细错误信息：com.mongodb.MongoSocketOpenException:Exceptionopeningsocketatcom.mongodb.connection.SocketStream.open(SocketStream.java:63)~[mongodb-driver-core-3.4.2.jar:na]atcom.mongodb.connection.InternalSt
elementui树状菜单tree_Java + Element-UI 实现简单的树形菜单 weixin_39682301
一、简单入门级树形菜单实现(纯后台逻辑)1、简介(1)开发环境IDEA+JDK1.8+mysql1.8SpringBoot2.2.6+mybatis-plus此处仅后台开发(返回json数据)，前台页面展示后续会讲解。(2)数据表如下，仅供参考，可以添加修改时间、创建时间、逻辑删除等字段。DROPDATABASEIFEXISTStest;CREATEDATABASEtest;USEtest;/*用
Elasticsearch 8.17.1 JAVA工具类熟透的蜗牛牛X的开源框架 elasticsearch
一、ElasticSearchUtilspackagecom.wssnail.elasticsearch.util;importco.elastic.clients.elasticsearch.ElasticsearchClient;importco.elastic.clients.elasticsearch._types.FieldValue;importco.elastic.clients.e
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS

sparkmlib调用

sparkmlib4_time

创建数据、模型、预测表

1、数据存入mysql

2、读取数据、模型预测

3、模型保存

4、mysql 数据加载、模型预测保存

？mysql模型加载，预测保存

？hdfs数据读入、存储

你可能感兴趣的:(#,Spark,大数据,spark,java)