落叶飘雪2014

Spark系列之Spark启动与基础使用

title: Spark系列

第三章 Spark启动与基础使用

3.1 Spark Shell

3.1.1 Spark Shell启动

spark-shell

$SPARK_HOME/bin/spark-shell \
--master spark://hadoop10:7077 \
--executor-memory 512M \
--total-executor-cores 2

注意上面的 cores 参数，若是 0，那么以后这个 spark shell 中运行的代码是不能执行成功的。千万注意。必要要把 cpu cores 和 memory 设置合理。

1、executor memory不能超过虚拟机的内存
2、cpu cores不要超过spark集群能够提供的总cpu cores，否则会使用全部。最好不要使用全部。否则其他程序由于没有cpu core可用，就不能正常运行

参数说明：

--master spark://hadoop10:7077 指定Master的地址
--executor-memory 2G 指定每个worker可用内存为2G
--total-executor-cores 2 指定整个集群使用的cpu核数为2个

注意：

如果启动spark shell时没有指定master地址，但是也可以正常启动spark shell和执行spark shell中的程序，其实是启动了spark的local模式，该模式仅在本机启动一个Driver进程，没有与集群建立联系。

Spark-2.x开始/Spark3.x

Spark Shell 中已经默认将 SparkContext 类初始化为对象 sc
Spark Shell 中已经默认将 SparkSession 类初始化为对象 spark
用户代码如果需要用到，则直接应用 sc，spark 即可

Spark-1.x

Spark Shell 中已经默认将 SparkContext 类初始化为对象 sc
Spark Shell 中已经默认将 SQLContext 类初始化为对象 sqlContext
用户代码如果需要用到，则直接应用sc，sqlContext即可

3.1.2 编写WordCount

在提交WordCount程序之前，先在HDFS集群中的准备一个文件用于做单词统计：

words.txt内容如下：

hello huangbo
hello xuzheng
hello wangbaoqiang

把该文件上传到HDFS文件系统中：

hadoop fs -mkdir -p /spark/wc/input
hadoop fs -put words.txt /spark/wc/input

在 Spark Shell 中提交 WordCount 程序：

sc.textFile("hdfs://hadoop10/spark/wc/input/words.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).saveAsTextFile("hdfs://hadoop10/spark/wc/output")

查询验证结果：

hadoop fs -ls hdfs://hadoop10/spark/wc/output
hadoop fs -cat hdfs://hadoop10/spark/wc/output/*

说明：

sc
.textFile("hdfs://hadoop10/spark/wc/input/words.txt")
.flatMap(_.split(""))
.map((_,1))
.reduceByKey(_+_)
.saveAsTextFile("hdfs://hadoop10/spark/wc/output")

1、sc
	是SparkContext对象，该对象时提交spark程序的入口
2、textFile("hdfs://hadoop10/spark/wc/input/words.txt")是从HDFS中读取数据
	底层是通过InputFormat去读取（因为数据在HDFS，从HDFS读取数据的规范就是InputFormat）
	RDD[String] (文件中的一行，就是RDD中的一条数据。)
3、flatMap(_.split(" "))
	先map，再压平，切割压平
	Array(Array("hello", "a"), Array("hello", "b")) =》 Array("hello", "a","hello", "b")
4、map((_,1))
	将单词和1构成元组(word,1)
5、reduceByKey(_+_)
	按照key进行reduce，并将value累加
6、saveAsTextFile("hdfs://hadoop10/spark/wc/output")
	将结果写入到HDFS对应输出目录中

3.2 Spark Submit

利用Spark自带的例子程序执行一个求PI（蒙特卡洛算法）的程序：

[root@hadoop10 bin]# ./spark-submit \
--class org.apache.spark.examples.SparkPi \
--master spark://hadoop10:7077 \
--executor-memory 512m \
--total-executor-cores 2 \
/software/spark/examples/jars/spark-examples_2.12-3.1.2.jar \
100

运行结果：

理解：

执行通过/software/spark/bin/spark-shell来运行。
如果不设置master那么默认运行在本机节点；
如果设置 --master spark://hadoop10:7077,那么运行在Spark Standalone模式集群。

参数说明：

--class 指定 jar 包的主类

--master 指定jar包提交的模式
详解如下：
1、local
	本地模式，本地运行，可以调试（local 1个线程、local[*]不限线程、local[N] N个线程，理想情况下，N设置为你机器的CPU核数）
2、spark
	提交到Spark Standalone集群，有Master和Worker进程
3、mesos
	将jar包提交到mesos集群，运行在mesos资源管理器框架之上，由mesos负责资源管理，Spark负责任务调度和计算
4、YARN
	将jar包提交到yarn集群，运行在yarn资源管理器框架之上，由yarn负责资源管理，Spark负责任务调度和计算
5、cloud
	比如AWS的EC2，使用这个模式能很方便的访问Amazon的S3，Spark支持多种分布式存储系统，比如HDFS和S3

--deploy-mode 指定jar的运行方式（默认是 client 模式）
详解如下：
1、client 模式
	在提交端生成的JVM会一直等待所有计算过程全部完成才退出，它有两个功能，一个是提交，一个是监控jar包运行（测试环境下使用）
2、cluster 模式
	在提交端生成的JVM在提交jar包后会退出，它只有一个提交功能，然后在某一个 worker上会生成一个Driver的JVM，该JVM执行监控jar包运行的功能，等待所有代码运行完毕退出（生产环境下使用 ）

application.jar 指定你的jar包的地址
arguments       传递给main()方法的参数

3.2.1 Spark Submit多种运行模式

1、提交任务到本地运行

/software/spark/bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master local[4] \
--driver-memory 512m \
--executor-memory 512m \
--total-executor-cores 1 \
/software/spark/examples/jars/spark-examples_2.12-3.1.2.jar \
10

2、提交任务到Spark集群运行

/software/spark/bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master spark://hadoop10:7077 \
--driver-memory 512m \
--executor-memory 512m \
--total-executor-cores 1 \
/software/spark/examples/jars/spark-examples_2.12-3.1.2.jar \
10

3、提交Yarn集群，使用Yarn-Client模式

/software/spark/bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master yarn \
--deploy-mode client \
--driver-memory 512m \
--executor-memory 512m \
--total-executor-cores 1 \
/software/spark/examples/jars/spark-examples_2.12-3.1.2.jar \
10

3.3 修改Spark日志级别

3.3.1 临时修改

val sparkContext:SparkContext = new SparkContext(conf)
sparkContext.setLogLevel("WARN")

3.3.2 永久修改

可以通过修改Spark配置文件来Spark日志级别

以下是详细步骤的：

第一步：先进入conf目录
[root@hadoop10 conf]$ cd /software/spark/conf

第二步：准备log4j.properties
[root@hadoop10 conf]$ cp log4j.properties.template log4j.properties

第三步：配置日志级别：
把INFO改成你想要的级别：主要有ERROR, WARN, INFO, DEBUG几种

3.4 Spark的WordCount案例

3.4.0 spark-shell中的WordCount

[root@hadoop10 bin]# cd /software/spark/bin/
[root@hadoop10 bin]# pwd
/software/spark/bin
[root@hadoop10 bin]# spark-shell 
2021-11-09 16:57:03,855 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
Setting default log level to "WARN".
To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel).
Spark context Web UI available at http://hadoop10:4040
Spark context available as 'sc' (master = local[*], app id = local-1636448230277).
Spark session available as 'spark'.
Welcome to
      ____              __
     / __/__  ___ _____/ /__
    _\ \/ _ \/ _ `/ __/  '_/
   /___/ .__/\_,_/_/ /_/\_\   version 3.1.2
      /_/
         
Using Scala version 2.12.10 (Java HotSpot(TM) 64-Bit Server VM, Java 1.8.0_202)
Type in expressions to have them evaluated.
Type :help for more information.

scala> sc.textFile("file:///home/data/wordcount.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).foreach(println)
(hadoop,1)                                                          (0 + 2) / 2]
(hbase,1)
(hello,3)
(world,1)
                                                                                
scala>

3.4.1 Java7版本WordCount

package com.aa.sparkjava.core.wordcount;

import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaPairRDD;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.function.FlatMapFunction;
import org.apache.spark.api.java.function.Function2;
import org.apache.spark.api.java.function.PairFunction;
import org.apache.spark.api.java.function.VoidFunction;
import scala.Tuple2;

import java.util.Arrays;
import java.util.Iterator;

/**
 * @Author AA
 * @Date 2021/11/25 16:46
 * @Project bigdatapre
 * @Package com.aa.sparkjava.core.wordcount
 * WordCountJava java7版本的编写
 */
public class WordCountJava7 {
    public static void main(String[] args){

        //一、参数判断
        if(args.length!=2){
            System.out.println("Usage:JavaWordCount7: Please enter the necessary parameters:");
            System.exit(1);
        }

        //二、编程入口
        SparkConf conf = new SparkConf();
        conf.setMaster("local");
        conf.setAppName(WordCountJava7.class.getSimpleName());
        JavaSparkContext jsc = new JavaSparkContext(conf); 

        //三、读取数据，设置输入路径。
        JavaRDD<String> lineRDD = jsc.textFile(args[0]);

        //四、进行逻辑处理，切割压平
        JavaRDD<String> jrdd1 = lineRDD.flatMap(new FlatMapFunction<String, String>() {
            @Override
            public Iterator<String> call(String line) throws Exception {
                return Arrays.asList(line.split(" ")).iterator();
            }
        });

        //五、将四中的单词结果和1组合成元组
        JavaPairRDD<String, Integer> javaPairRDD = jrdd1.mapToPair(new PairFunction<String, String, Integer>() {
            @Override
            public Tuple2<String, Integer> call(String s) throws Exception {
                return new Tuple2<String, Integer>(s, 1);
            }
        });

        //六、 分组聚合  reduceByKey()  (a,b)=>a+b   前两个参数是输入参数类型，第三个参数：返回值的类型
        JavaPairRDD<String, Integer> result = javaPairRDD.reduceByKey(new Function2<Integer, Integer, Integer>() {
            @Override
            public Integer call(Integer v1, Integer v2) throws Exception {
                return v1 + v2;
            }
        });

        //七、保存结果或者打印输出
        //打印输出
        result.foreach(new VoidFunction<Tuple2<String, Integer>>() {
            @Override
            public void call(Tuple2<String, Integer> tuple) throws Exception {
                System.out.println(tuple);
                //System.out.println(tuple._1 + " " + tuple._2);
            }
        });
        //保存结果
        //result.saveAsTextFile(args[1]);
        //八、释放资源
        jsc.close();
    }
}

3.4.2 Java8 Lambda表达式版本WordCount

package com.aa.sparkjava.core.wordcount;

import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaPairRDD;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import scala.Tuple2;

import java.util.Arrays;

/**
 * @Author AA
 * @Date 2021/11/26 11:53
 * @Project bigdatapre
 * @Package com.aa.sparkjava.core.wordcount
 * WordCountJava java8版本  使用lambda表达式
 */
public class WordCountJava8 {
    public static void main(String[] args){

        if(args.length != 2){
            System.out.println("Please enter the necessary parameters:Usage Java8 Lambda WordCount");
            System.exit(1);
        }

        SparkConf conf = new SparkConf();
        conf.setMaster("local");
        conf.setAppName(WordCountJava8.class.getSimpleName());
        JavaSparkContext jsc = new JavaSparkContext(conf);
        //1、读取数据
        JavaRDD<String> jrdd = jsc.textFile(args[0]);
        //2、切割压平
        JavaRDD<String> jrdd2 = jrdd.flatMap(t -> Arrays.asList(t.split(" ")).iterator());
        //3、和1组合 
        JavaPairRDD<String, Integer> jprdd = jrdd2.mapToPair(t -> new Tuple2<String, Integer>(t, 1));
        //4、分组聚合
        JavaPairRDD<String, Integer> res = jprdd.reduceByKey((a, b) -> a + b);
        //5、保存输出
        res.saveAsTextFile(args[1]);
        //6、释放资源
        jsc.close();

    }
}

3.4.3 Scala版本WordCount

package com.aa.sparkscala.core.wordcount

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

/**
 * @Author AA
 * @Date 2021/11/26 15:08
 * @Project bigdatapre
 * @Package com.aa.sparkscala.core.wordcount
 * Spark WordCount  Scala版本  使用老的API SparkContext
 */
object WordCountScala {
  def main(args: Array[String]): Unit = {
    //1、创建一个SparkConf对象，并设置程序的名称
    val conf = new SparkConf().setAppName("WordCount").setMaster("local")

    //2、创建一个SparkContext对象
    val sparkContext: SparkContext = new SparkContext(conf)

    //3、读取HDFS上的文件构建一个RDD
    val fileRDD: RDD[String] = sparkContext.textFile("D:\\input\\test1.txt")

    //4、构建一个单词RDD
    val wordAndOneRDD: RDD[(String, Int)] = fileRDD.flatMap(_.split(" ")).map((_, 1))

    //5、进行单词的聚合
    val resultRDD: RDD[(String, Int)] = wordAndOneRDD.reduceByKey(_ + _)

    //6、保存结果
    resultRDD.saveAsTextFile("D:\\output\\wordcountscala1")

    //7、关闭sc
    sparkContext.stop()
  }
}

3.4.4 补充API依赖

        <dependency>
            <groupId>org.scala-lang</groupId>
            <artifactId>scala-library</artifactId>
            <version>2.12.14</version>
        </dependency>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-core_2.12</artifactId>
            <version>3.1.2</version>
        </dependency>

声明：
文章中代码及相关语句为自己根据相应理解编写，文章中出现的相关图片为自己实践中的截图和相关技术对应的图片，若有相关异议，请联系删除。感谢。转载请注明出处，感谢。

By luoyepiaoxue2014

B站： https://space.bilibili.com/1523287361 点击打开链接
微博地址： http://weibo.com/luoyepiaoxue2014 点击打开链接

机器学习-三大SOTA Boosting算法总结和调优小新学习屋机器学习机器学习 boosting 集成学习决策树人工智能
参考书籍：《机器学习公式推导和代码实现》书籍页码：P197～205简介除了深度学习适用的文本、图像、语音、视频等非结构化数据，对于训练样本较少的结构化数据，Boosting算法仍是第一选择。XGBoost、LightGBM、CatBoost是目前经典的SOTABoosting算法算法对比维度XGBoostLightGBMCatBoos说明算法的继承性是对GBDT的改进是对XGBoost的改进是对X
大模型微调到底有没有技术含量？ DeepSeek-大模型系统教程人工智能语言模型 ai 大模型大模型微调程序员 AI大模型
今天给大家带来知乎好友@ybq的一篇回答-大模型微调到底有没有技术含量，或者说技术含量到底有多大？老生常谈的一句话吧：有没有技术含量取决于这个工作你怎么做，尤其是llm方向，上手门槛相比传统NLP变得更低了。我举一些例子吧，针对大模型微调的几个重要环节，我列举的每一种做法大概率都能完成最终目标，甚至说训出来的模型效果都没什么差别。但对个人能力成长的帮助就大不相同了。数据工作做法1:继承实验室或者同
Spark从入门到熟悉（篇二）
本文介绍Spark的RDD编程，并进行实战演练，加强对编程的理解，实现快速入手知识脉络包含如下8部分内容：创建RDD常用Action操作常用Transformation操作针对PairRDD的常用操作缓存操作共享变量分区操作编程实战创建RDD实现方式有如下两种方式实现：textFile加载本地或者集群文件系统中的数据用parallelize方法将Driver中的数据结构并行化成RDD示例"""te
微信小店分销系统深度解析：功能、架构与开发实践！ vx:hedian166 微信架构小程序
一、微信小店分销系统概述微信小店分销系统是基于微信生态构建的一套完整电商解决方案，它允许商家在微信内快速搭建自己的分销网络。与传统的电商平台不同，微信分销系统充分利用了微信的社交属性，通过多级分销模式实现商品的快速传播和销售。核心特点：社交裂变属性：利用微信好友关系链实现商品传播轻量化运营：无需复杂配置即可快速上线闭环交易：从浏览到支付全流程在微信内完成数据分析：提供完整的用户行为和交易数据追踪二
按月设置索引名的完整指南：Elasticsearch日期索引实践少林码僧 elasticsearch jenkins 大数据
按月设置索引名的完整指南：Elasticsearch日期索引实践在时序数据场景中，按月设置索引名（如logs-2024-01）是优化查询效率、降低管理成本的关键策略。以下是三种实现方案及详细步骤：方案一：索引模板+日期数学表达式（推荐）原理：利用ES内置的日期数学表达式动态生成索引名，无需额外工具操作步骤：创建索引模板PUT_index_template/monthly_logs{"index_p
基于vue框架的党建系统j9hzh（程序+源码+数据库+调试部署+开发环境）系统界面在最后面。
系统程序文件列表项目功能：组织管理员,成员,通知公告,组织信息,组织成员,入党材料,会议信息,活动签到,消息通知,学习视频开题报告内容基于Vue框架的党建系统开题报告一、研究背景随着信息技术的飞速发展，党建工作作为党的建设的重要组成部分，正面临着新的机遇与挑战。传统的党建管理方式往往依赖于纸质文档和人工操作，不仅效率低下，而且难以保证信息的准确性和时效性。因此，构建一套高效、便捷、安全的党建系统已
基于vue框架的超市订单管理系统16uob（程序+源码+数据库+调试部署+开发环境）系统界面在最后面。小光学长数据库
系统程序文件列表项目功能：员工,商品分类,商品信息,供货商,入库订单,销售订单,货架信息,盈利信息开题报告内容基于Vue框架的超市订单管理系统开题报告一、研究背景与意义随着信息技术的飞速发展和电子商务的普及，传统超市管理模式正面临前所未有的挑战与机遇。传统的手工记录与管理方式已难以满足现代超市对高效、精准、实时管理的需求。超市订单管理系统作为超市运营的核心部分，其信息化、智能化水平直接影响到超市的
Elasticsearch索引模板：自动化索引管理搜索引擎技术搜索引擎实战 elasticsearch 自动化 jenkins ai
Elasticsearch索引模板：自动化索引管理关键词：Elasticsearch、索引模板、自动化管理、索引映射、索引设置、生命周期管理、数据建模摘要：本文深入解析Elasticsearch索引模板的核心原理与实践方法，通过系统化的步骤演示如何利用索引模板实现索引的自动化创建与统一管理。内容涵盖模板结构设计、映射与设置配置、动态字段处理、优先级策略、实战案例及最佳实践，帮助读者掌握高效管理大规
调试 WebView 接口时间戳签名问题：一次精细化排查和修复过程
为了保证数据安全，很多接口会对请求进行签名校验，常见方式是前端生成时间戳+key，再做哈希作为签名参数提交到后端。如果设备系统时间不准、页面生成时间戳延迟，或者跨时区出现时间混乱，都会导致签名验证失败。在移动端WebView里，这类问题更加隐蔽：用户看到页面正常，但接口频繁返回签名错误或token失效，引发“偶现性”白屏、按钮无效等问题。我们可以通过使用WebDebugX来进行远程网页调试，可以在
高考计算机专业选择万能小贤哥 python 人工智能机器学习高考
高考计算机专业选择：从认知到决策的全面指南在数字经济蓬勃发展的今天，计算机专业已成为高考志愿填报的热门之选。但计算机领域分支众多，专业名称相近却差异显著，如何结合自身特点做出合适选择，需要理性分析与规划。一、计算机类专业的“家族图谱”计算机类专业并非单一学科，而是包含多个细分方向，不同专业培养目标和侧重领域各有不同：-计算机科学与技术：这是计算机领域的“基础款”，涵盖计算机原理、编程语言、算法、操
FFmpeg 视频编码灬Sunnnnn FFmpeg 实战项目-视频播放器 ffmpeg 音视频
1.简介编码视频数据，如下图所示，将原始的YUV数据编码为H.264或者H.265。使用FFmpeg进行视频编码的流程通常包括以下几个步骤：注册编解码器：通过av_register_all()函数注册FFmpeg所有编解码器，这是使用任何编解码器的前提条件。初始化输出上下文：使用avformat_alloc_output_context2()函数来初始化输出码流的AVFormatContext，这
ffmpeg 视频编码流程及主要API melonbo FFMPEG ffmpeg 音视频
一、编码流程初始化组件配置编码器参数打开编码器处理输入帧编码循环写入输出数据收尾释放资源二、核心步骤与API详解1.初始化与参数配置注册组件（旧版本需手动注册，新版本自动处理）avformat_network_init();//网络相关初始化（可选）查找编码器AVCodec*codec=avcodec_find_encoder(AV_CODEC_ID_H264);//支持H.264/HEVC等创建
spring boot中使用easyexcel简单实现导出功能
导入依赖com.alibabaeasyexcel3.1.1建立excel表格所需数据类（载入excel表的数据）ExcelProperty可定义列名，位置等属性@Data@ExcelIgnoreUnannotatedpublicclassOrderListResp{/***用户id*/@ApiModelProperty("用户id")//value代表列名，index为表格列序号，此代表列名为用户
计算机编译原理ppt,编译原理课件.ppt 知知与终生计算机编译原理ppt
文档介绍：高级语言汇编语言SOURCEPROGRAMAssemblePROGRAM?翻译程序?TRANSLATER为什么要学****编译原理程序设计语言是计算机软件专业的重要核心学****编程的历程:C语言--汇编语言--数据结构Monday,July03,2017编译原理为什么要学****编译原理必修主干课程,操作系统和编译系统构成程序设计者与计算机之间的基本界面。通过学****该课程,掌握编译
java使用easypoi导出动态列excel
简介asypoi功能如同名字easy,主打的功能就是让一个没见接触过poi的人员就可以方便的写出Excel导出,Excel模板导出,Excel导入,Word模板导出,通过简单的注解和模板语言(熟悉的表达式语法),完成以前复杂的写法。一、场景描述客户要求导出一张结算报表，报表的列头是选择结算的日期区间，也就是需要根据日期分组，然后计算这个日期下的结算金额和笔数，最后再计算合计。针对这个场景，我整理了
理解WebGL中的顶点着色器和片元着色器程序猿全栈の董（董翔） webgl 着色器
WebGL是一种基于OpenGLES的JavaScriptAPI，它允许我们在网页上直接渲染3D图形而无需任何插件。WebGL的核心是着色器编程，它主要包含两种着色器：顶点着色器(VertexShader)和片元着色器(FragmentShader)。顶点着色器负责处理每个顶点的位置，它决定了顶点在屏幕上的最终位置。而片元着色器则负责计算每个像素的颜色值。这两个着色器共同工作，构成了WebGL渲染
Python数据结构之 Big O ぃ曦晔° 数据结构算法 Big O 复杂度
学习课程：【Udemy高分付费课程】Python数据结构与算法-终极Python编码面试和计算机科学训练营在Python中，BigO表示法用于描述算法的时间复杂度，即算法运行时间与输入大小之间的关系；或空间复杂度，即算法运行时所占用的内存。在处理时间复杂度和空间复杂度是有3个希腊字母：Ω--最佳速度θ--平均速度O--最坏情况我们在讨论BigO时，总是在谈论最坏情况（WorstCase）Pytho
Python 数据结构之队列（Queue）
Python中的队列（Queue）概述队列是一种遵循先进先出（FIFO,FirstInFirstOut）原则的线性数据结构，这意味着最早进入队列的元素将最先被移除。常用于任务调度、缓冲区管理等场景。Python提供了多种实现队列的方式，包括内置模块和第三方库。Python中queue的主要类型Python的queue模块提供了几种常用的队列类型，每种类型都有其独特的特性和应用场景。1.QueueQ
供应链管理：计划相关岗位及其岗位职责快雪时晴-初晴融雪供应链管理供应链管理计划计划岗位
一、计划相关岗位及其岗位职责岗位名称岗位职责需求计划员(DemandPlanner)-完成独立需求计划的编制。-完成需求数据和需求计划的分析。-达成关于需求计划的共识。-与需求计划制订、达成共识、变更的利益相关方进行有关需求信息、计划的沟通。综合生产计划员(ProductionPlanner)-完成综合生产计划的编制。-与综合生产计划制订、达成共识、变更的利益相关方进行需求信息、计划的沟通。-将战
构建企业级提示词管理平台 AI人工智能与大数据 ChatGPT java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
构建企业级提示词管理平台关键词：提示词管理平台、企业级、数据处理、用户交互、系统架构设计摘要：本文将详细探讨如何构建企业级提示词管理平台。我们将从问题背景出发，逐步深入分析核心概念、算法原理、系统设计与项目实战，提供一套完整的解决方案。1.背景介绍1.1问题背景在现代企业中，提示词作为一种重要的信息传递工具，广泛应用于客户服务、市场营销和内部沟通等多个领域。然而，随着数据量的爆炸式增长和业务场景的
Kafka生态整合深度解析：构建现代化数据架构的核心枢纽
Kafka生态整合深度解析：构建现代化数据架构的核心枢纽导语：在当今数据驱动的时代，ApacheKafka已经成为企业级数据架构的核心组件。本文将深入探讨Kafka与主流技术栈的整合方案，帮助架构师和开发者构建高效、可扩展的现代化数据处理平台。文章目录Kafka生态整合深度解析：构建现代化数据架构的核心枢纽一、Kafka与流处理引擎的深度集成1.1Kafka+ApacheSpark：批流一体化处理
出个5桩120KW的整体建设方案可以吗？配多大的箱式变压器、对应补贴要求、实施流程等吧 - 慧知开源充电桩平台文慧的科技江湖更新日志 -(慧哥)慧知充电桩平台大数据人工智能架构开源直流充电桩 ocpp 云快充协议
出个5桩120KW的整体建设方案可以吗？配多大的箱式变压器、对应补贴要求、实施流程等吧，位置在广东广州-慧知开源充电桩平台，结合广州最新政策与行业数据，财务建设方案：⚡一、核心设备充电桩采购方案价格校正：市场价：120kW直流桩主流价格为4万～4.5万元/台（国产一线品牌，含基础功能）按您要求的3万元/台：属行业最低价，需警惕以下风险：可能为简化功能机型（如无功率动态分配、通信模块简化）故障率较高
设置时区GMT和UTC 思静鱼 Linux&运维安装时区
GMT（格林尼治标准时间）和UTC（协调世界时）都表示“世界时间标准”，它们经常互换使用，但严格来说，它们并不完全相同。下面是它们的详细对比：1.概念上的区别项目GMT（GreenwichMeanTime）UTC（CoordinatedUniversalTime）起源来自英国，基于地球自转（天文时间）国际标准时间，基于原子钟（原子时间）定义方式天文测量法，基于格林尼治天文台子午线原子钟计算的国际协
为什么选择YashanDB作为您的数据存储解决方案？数据库
在现代数据库管理中，如何在保持快速查询响应并确保数据一致性的基础上，有效管理海量数据，成为许多企业面临的挑战。优化查询性能、加速数据处理流程、确保高可用性和数据安全是数据库技术的关键需求。YashanDB作为一种新兴的数据库解决方案，以其灵活的架构和强大的性能优化能力，逐渐被视为满足这一需求的理想选择。领先的体系架构YashanDB的体系架构灵活且高效，支持单机部署、共享集群部署以及分布式集群部署
为什么YashanDB数据库是数据驱动企业的选择？数据库
在数据驱动的企业环境中，数据库作为信息管理的核心组件，其性能和特性直接影响企业的数据处理效率和应用响应速度。因此，选择合适的数据库技术，对于实现高效的数据存储与处理至关重要。特别是如何优化查询速度、确保数据的一致性和高可用性，是企业决策的重要考量。本文将详细分析YashanDB数据库的技术特点及其优势，帮助企业理解选择YashanDB的原因。YashanDB的体系架构与部署形态YashanDB支持
企业如何使用YashanDB实现数据资产最大化？数据库
在当今数字化时代，企业面临着海量数据的管理与利用挑战，如何优化数据查询速度以提升业务响应效率成为关键问题。查询速度直接影响数据驱动决策的时效性和准确性，进而关系到企业竞争力的提升。本文将基于先进数据库技术，探讨企业如何利用YashanDB的核心架构、存储引擎与优化机制，最大化数据资产的价值。YashanDB的部署架构与灵活应用YashanDB支持三种部署形态：单机部署、分布式集群部署及共享集群部署
企业如何根据业务需求调整YashanDB数据库配置数据库
在企业中，数据库的性能直接影响到应用的运行效率和用户体验。尤其是随着业务需求的变化，如何根据不同的业务需求及时调整YashanDB的数据库配置便显得尤为重要。本文将探讨YashanDB数据库配置的优化方向，阐明其必要性，并提供具体的可操作性建议。部署架构选择YashanDB支持多种部署形态，包括单机（主备）部署、分布式集群部署和共享集群部署。根据企业的具体需求，可以选择不同的部署架构。单机部署适用
学习java基础：java开发常用技术 molihuaya 学习java java开发技术
基础部分1.线程和进程的区别线程三个基本状态：就绪、执行、阻塞线程五个基本操作：创建、就绪、运行、阻塞、终止进程四种形式：主从式、会话式、消息或邮箱机制、共享存储区方式进程是具有一定功能的程序关于某次数据集合上的一次运行活动，是系统进行资源分配和调度的一个独立单位。一个进程包含多个线程。线程是进程的一个实体，是CPU调度和分配的基本单元。2.JSP四大域对象和九大内置对象四大域对象：PageCon
[探索Tavily Search API：为AI代理提供实时准确搜索的利器]
探索TavilySearchAPI：为AI代理提供实时准确搜索的利器引言在现代AI应用程序中，实时和准确的数据获取对AI代理（如大型语言模型）是至关重要的。TavilySearchAPI是一种专为AI代理设计的搜索引擎，提供实时、准确和事实性的搜索结果。本篇文章将详细介绍TavilySearchAPI的功能、集成方法与使用示例。主要内容TavilySearchAPI概述TavilySearchAP
航天器基频：概念、影响因素、应用与计算方法
航天器基频：概念、影响因素、应用与计算方法1.引言在航天器结构设计中，基频（FundamentalFrequency）是一个至关重要的动力学参数，它直接影响航天器在发射、在轨运行及变轨过程中的振动特性。基频过低可能导致航天器与运载火箭或外部激励发生共振，引发结构失效。因此，准确计算和控制航天器的基频是航天工程中的核心任务之一。本文将从基本概念、影响因素、应用领域和计算方法四个方面详细介绍航天器的基
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end