屡傻不改

【Spark Streaming】（二）Spark Streaming - 实时数据采集

导入 spark 和 spark-streaming 依赖包

<dependency>
  <groupId>org.apache.spark</groupId>
  <artifactId>spark-core_2.11</artifactId>
  <version>2.4.5</version>
</dependency>
<dependency>
  <groupId>org.apache.spark</groupId>
  <artifactId>spark-streaming_2.11</artifactId>
  <version>2.4.5</version>
</dependency>

案例一：SparkStreaming接受socket数据，实现单词计数WordCount

spark版本

从本机的7777端口源源不断地收到以换行符分隔的文本数据流，并计算单词个数

package cn.kgc.kb09.Spark
import org.apache.spark.streaming.{Seconds, StreamingContext}
import org.apache.spark.SparkConf
import org.apache.spark.streaming.dstream.ReceiverInputDStream

object SparkStreamDemo1 {
  def main(args: Array[String]): Unit = {
    val conf = new SparkConf().setAppName("SparkStreamDemo1").setMaster("local[*]")

    // 采集周期，指定的3秒为每次采集的时间间隔
    val streamingContext = new StreamingContext(conf,Seconds(3))

    // 指定采集的方法
    val socketLineStream: ReceiverInputDStream[String] =
      streamingContext.socketTextStream("192.168.247.201",7777)

    // 将采集来的信息进行处理，统计数据（wordcount）
    val wordStream = socketLineStream.flatMap(line => line.split("\\s+"))
    val mapStream = wordStream.map(x => (x,1))
    val wordcountStream = mapStream.reduceByKey(_+_)

    // 打印
    wordcountStream.print()

    // 启动采集器
    streamingContext.start()
    streamingContext.awaitTermination()
  }
}

这时候在Linux中输入的内容会在控制台打印wordcount单词统计：
根据指定的采集周期，每次采集的时间间隔3秒。spark streaming的本质是微批处理。

Spark Streaming拥有两类数据源

（1）基本源（Basic sources）：这些源在StreamingContext API中直接可用。例如文件系统、套接字连接、Akka的actor等。
（2）高级源（Advanced sources）：这些源包括Kafka,Flume,Kinesis,Twitter等等。

基本数据源输入源码：
SparkStream 对于外部的数据输入源，一共有下面几种：

（1）用户自定义的数据源：receiverStream
（2）根据TCP协议的数据源： socketTextStream、socketStream
（3）网络数据源：rawSocketStream
（4）hadoop文件系统输入源：fileStream、textFileStream、binaryRecordsStream
（5）其他输入源（队列形式的RDD）：queueStream

Java版本

package cn.kgc.kb09.Spark;

import org.apache.spark.SparkConf;
import org.apache.spark.api.java.function.FlatMapFunction;
import org.apache.spark.api.java.function.Function2;
import org.apache.spark.api.java.function.PairFunction;
import org.apache.spark.streaming.Durations;
import org.apache.spark.streaming.api.java.JavaDStream;
import org.apache.spark.streaming.api.java.JavaPairDStream;
import org.apache.spark.streaming.api.java.JavaReceiverInputDStream;
import org.apache.spark.streaming.api.java.JavaStreamingContext;
import scala.Tuple2;
import java.util.Arrays;
import java.util.Iterator;

/**
* @Qianchun
* @Date 2020/12/18
* @Description
*/
public class SparkStreamJavaDemo1 {
    public static void main(String[] args) throws InterruptedException {
        // 第一步：配置SparkConf
        SparkConf conf = new SparkConf().setMaster("local[*]").setAppName("SparkStreamJavaDemo1");

        // 第二步：创建SparkStreamingContext
        JavaStreamingContext jsc = new JavaStreamingContext(conf, Durations.seconds(3));

        /**
         * 第三步：创建Spark Streaming 输入数据来源 input Stream
         * 1、数据输入来源可以基于 File，HDFS，Flume，Kafka，Socket等
         * 2.在这里我们制定数据来源于网络 Socket端口，Spark Streaming链接上改端口并在运行的时候一直监听该端口的数据（当然该端口服务首先必须存在），
         *  并且在后续会根据业务需要不断的有数据产生（当然对于Spark Streaming 引用程序的运行而言，有无数据其处理流程都是一样的）
         * 3.如果经常在每隔 5 秒钟没有数据的话不断的启动空的 Job 其实是会造成调度资源的浪费，因为彬没有数据需要发生计算；
         * 真实的企业级生产环境的代码在具体提交 Job 前会判断是否有数据，如果没有的话，不再提交 Job；
         */
        JavaReceiverInputDStream<String> lines = jsc.socketTextStream("192.168.247.201", 7777);

        /**第四步：接下来就是对于 Rdd编程一样基于 DStream进行编程
         * 原因是DStream是RDD产生的模板（或者说类）， 在 Saprk Stream发生计算前，其实质是把每个 Batch的DStream的操作翻译成为 Rdd 的操作！！！
         */
        JavaDStream<String> flatmap = lines.flatMap(new FlatMapFunction<String, String>() {
            @Override
            public Iterator<String> call(String s) throws Exception {
                String[] split = s.split("\\s+");
                return Arrays.asList(split).iterator();
            }
        });

        JavaPairDStream<String, Integer> mapToPair = flatmap.mapToPair(new PairFunction<String, String, Integer>() {
            @Override
            public Tuple2<String, Integer> call(String s) throws Exception {
                return new Tuple2<String, Integer>(s, 1);
            }
        });

        JavaPairDStream<String, Integer> reduceByKey = mapToPair.reduceByKey(new Function2<Integer, Integer, Integer>() {
            @Override
            public Integer call(Integer v1, Integer v2) throws Exception {
                return v1 + v2;
            }
        });

        /**
         * 此处print并不会直接触发 job 的执行，因为现在的一切都是在 Spark Streaming 框架的控制之下的，对于 Spark Streaming 而言具体是否触发真正的 job 运行
         * 是基设置的  Duration 时间间隔触发
         * 一定要注意的是 Spark Streaming应用程序要想执行具体的Job，对DStream就必须有 output Stream操作
         * output Stream有很多类型的函数触发，类print，saveAsTextFile，saveAsHadoopFile等，最为重要的一个方法是 foreachRDD,因为Spark Streaming处理的结果一般都会放在 Redis，DB，
         * DashBoard等上面，foreachRDD主要就是用来完成这些功能的，而且可以随意的自定义具体数据到底放在那里
         */
        reduceByKey.print();

        /**
         * Spark Streaming 执行引擎也就是Driver开始运行，Driver启动的时候是位于一条新的线程中的，当然其内部有消息接收应用程序本身或者 Executor 中的消息；
         */
        jsc.start();
        jsc.awaitTermination();
    }
}

运行代码，在虚拟机上输入nc -lk 7777 代表向7777号端口输入数据，来进行测试，会计算出每三秒中每个词出现的次数

案例二：自定义采集器Receiver（自定义数据源）

还是以wordcount为例，自定义Receiver实现一下

声明一个receiver类，通常需要继承原有的基类，在这里需要继承自Receiver，该基类有两个方法需要重写分别是：

1、 onstart() 接收器开始运行时触发方法，在该方法内需要启动一个线程，用来接收数据。
2、onstop() 接收器结束运行时触发的方法，在该方法内需要确保停止接收数据。
当然在接收数据流过程中也可能会发生终止接收数据的情况，这时候onstart内可以通过isStoped()来判断，是否应该停止接收数据

数据存储：
一旦接收完数据，则必须要进行数据的存储，并交由SparkStreaming 来处理，Spark以store(data)方法来支持此流程。由于数据格式的不同，当然store方法必须要支持各种类型的数据存储。store方法是以一次存储一条记录或者一次性收集全部的序列化对象。

代码实现：
采集端口内输入内容，接收到“end”停止

package cn.kgc.kb09.Spark
import java.io.{BufferedReader, InputStreamReader}
import org.apache.spark.SparkConf
import org.apache.spark.storage.StorageLevel
import org.apache.spark.streaming.receiver.Receiver
import org.apache.spark.streaming.{Seconds, StreamingContext}

// 自定义采集器
// 1）继承Receiver
// 2）重写方法 onStart(), onStop()
class MyReceiver(host:String, port:Int) extends Receiver [String](StorageLevel.MEMORY_ONLY) {

  // 接收socket数据
  var socket: java.net.Socket = null

  def receive: Unit = {
    socket = new java.net.Socket(host, port)
    // 通过BufferedReader ，将输入流转换为字符串
    val reader = new BufferedReader(
      new InputStreamReader(socket.getInputStream, "UTF-8")
    )
    var line: String = null

    // 将采集的数存储到采集器的内部进行转换
    while ((line=reader.readLine()) != null) {
      if (line.equals("end")) {
        return
      } else {
        this.store(line)
      }
    }
  }

  override def onStart(): Unit = {
    new Thread(new Runnable {
      override def run(): Unit = {
        receive
      }
    }).start()
  }

  override def onStop(): Unit = {
    if (socket != null) {
      socket.close()
      socket = null
    }
  }
}


object MyReceiverStream {
  def main(args: Array[String]): Unit = {
    // spark的配置对象
    val conf = new SparkConf().setMaster("local[*]").setAppName("myReceiverStream")

    // 实时分析的环境对象
    // 采集周期：以指定的时间为周期采集实时数据
    val streamingContext = new StreamingContext(conf, Seconds(5))

    // 在这里转换成自定义的采集器
    val receiverStream =
      streamingContext.receiverStream(new MyReceiver("192.168.247.201", 7777))

    // 将采集的数据进行分割
    val lineStream = receiverStream.flatMap(line => line.split("\\s+"))

    // 将数据进行结构的转变进行统计分析
    val mapStream = lineStream.map((_, 1))

    // 将转换结构后的数据进行聚合处理
    val sumStream = mapStream.reduceByKey(_ + _)

    // 将结果打印
    sumStream.print()

    // 启动采集器
    streamingContext.start()
    // Driver等待采集器的执行
    streamingContext.awaitTermination()
  }
}

运行代码，启动nc

nc-lk 7777

案例三：Spark Streaming处理文件系统数据（local/hdfs）

textFileStream路径如果是hdfs的路径你直接hdfs dfs -put到你的监测路径就可以
如果是本地目录如E:\\qianchun\\Kafka\\kafkaStream\\in\\test，你不能直接在目录里创建文件或移动文件到这个目录，必须用流的形式写入到这个目录形成文件才能被监测到。可在其它地方创建一个文件然后另存到此本地目录下可以完成此项测试。

package cn.kgc.kb09.Spark
import org.apache.spark.SparkConf
import org.apache.spark.streaming.{Seconds, StreamingContext}

object SparkStreamFileDataSourceDemo2 {
  def main(args: Array[String]): Unit = {
    val conf = new SparkConf().setMaster("local[2]").setAppName("FileDataSource")

    // 创建StreamingContext对象
    val streamingContext = new StreamingContext(conf,Seconds(5))

    // 文件为HDFS文件 
//    val fileDStream: DStream[String] = streamingContext.textFileStream("hdfs://hadoopwei:9000/kb09file")
    // 文件为本地Windows文件
    val inputDir = "E:\\qianchun\\Kafka\\kafkaStream\\in\\test"

    // 对StreamingContext对象调用 .textFileStream()方法生成一个文件流类型的InputStream
    val fileDStream = streamingContext.textFileStream(inputDir)

    // 编写流计算过程
    val wordStream = fileDStream.flatMap(line => line.split("\\s+"))
    val mapStream = wordStream.map((_,1))
    val sumStream = mapStream.reduceByKey(_+_)

    // 打印结果
    sumStream.print()

    // 启动流计算
    streamingContext.start()
    streamingContext.awaitTermination()
  }
}

案例四：Spark Streaming读取Kafka数据

（1）版本选型

ReceiverAPI：需要一个专门的 Executor 去接收数据，然后发送给其他的 Executor 做计算。存在的问题，接收数据的 Executor 和计算的 Executor 速度会有所不同，特别在接收数据的 Executor速度大于计算的 Executor 速度，会导致计算数据的节点内存溢出。早期版本中提供此方式，当前版本不适用。
DirectAPI：是由计算的 Executor 来主动消费 Kafka 的数据，速度由自身控制。

（2）Kafka 0-10 Direct模式

需求：通过 SparkStreaming 从 Kafka 读取数据，并将读取过来的数据做简单计算，最终打印到控制台。

导入spark-streaming-kafka依赖包

<dependency>
  <groupId>org.apache.spark</groupId>
  <artifactId>spark-streaming-kafka-0-10_2.11</artifactId>
  <version>2.4.5</version>
</dependency>

出现报错，因为有一个依赖版本过高：
Caused by: com.fasterxml.jackson.databind.JsonMappingException: Incompatible Jackson version: 2.9.6
需要添加依赖：

<!-- 版本降维 -->
<dependency> 
    <groupId>com.fasterxml.jackson.core</groupId> 
    <artifactId>jackson-databind</artifactId> 
    <version>2.6.6</version> 
</dependency>

代码部分

package cn.kgc.kb09.Spark

import org.apache.kafka.clients.consumer.{ConsumerConfig, ConsumerRecord}
import org.apache.spark.SparkConf
import org.apache.spark.streaming.dstream.{DStream, InputDStream}
import org.apache.spark.streaming.kafka010.{ConsumerStrategies, KafkaUtils, LocationStrategies}
import org.apache.spark.streaming.{Seconds, StreamingContext}

object SparkStreamKafkaSource {
  def main(args: Array[String]): Unit = {
    // 创建SparkConf
    val conf = new SparkConf().setMaster("local[2]").setAppName("KafkaDemo")
    // 创建StreamingContext
    val streamingContext = new StreamingContext(conf,Seconds(5))

    // 设置checkpoint目录
    streamingContext.checkpoint("checkpoint")

    // 配置Kafka相关参数
    val kafkaParams: Map[String, String] = Map(
      // kafka集群有几台机器就写几台
      (ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG -> "192.168.247.201:9092"),
      // 因为是消费topic，所以需要K-V反序列化
      (ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG -> "org.apache.kafka.common.serialization.StringDeserializer"),
      (ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG -> "org.apache.kafka.common.serialization.StringDeserializer"),
      // 定义消费者组别
      (ConsumerConfig.GROUP_ID_CONFIG, "kafkaGroup1")
    )

    // 通过 KafkaUtils.createDirectStream接受kafka数据，这里采用是kafka低级api偏移量不受zk管理
    val kafkaStream: InputDStream[ConsumerRecord[String, String]] =
      KafkaUtils.createDirectStream(
        streamingContext,  //不再是直接从streamingContext点出来的基本源，而是作为参数生成InputDStream
        LocationStrategies.PreferConsistent,
        ConsumerStrategies.Subscribe(Set("sparkKafkaDemo"), kafkaParams)  //sparkKafkaDemo是生产者的topic
      )

    // 对获取的数据进行处理
    val wordStream = kafkaStream.flatMap(v => v.value().toString.split("\\s+"))

    val mapStream = wordStream.map((_,1))


    // 无状态
//    val sumStream = mapStream.reduceByKey(_+_)
//    sumStream.print()


    // 有状态  hello,2   再输入hello，则返回(2,1)
    // 前提条件：需要设置checkpoint
    val stateSumStream: DStream[(String, Int)] = mapStream.updateStateByKey {
      case (seq, buffer) => {
        println(seq, seq.sum, buffer.getOrElse(0))
        val sum = buffer.getOrElse(0) + seq.sum
        Option(sum)
      }
    }

    // 打印结果
    stateSumStream.print()

    // 启动流计算
    streamingContext.start()
    streamingContext.awaitTermination()
  }
}

通过 KafkaUtils.createDirectStream接受kafka数据，这里采用是kafka低级api偏移量不受zk管理

LocationStrategies:本地策略。为提升性能,可指定Kafka Topic Partition的消费者所在的Executor。
LocationStrategies.PreferConsistent:一致性策略。一般情况下用这个策略就OK。将分区尽可能分配给所有可用Executor。
LocationStrategies.PreferBrokers:特殊情况,如果Executor和Kafka Broker在同一主机,则可使用此策略。
LocationStrategies.PreferFixed:特殊情况,当Kafka Topic Partition负荷倾斜,可用此策略,手动指定Executor来消费特定的Partition.
ConsumerStrategies:消费策略。
ConsumerStrategies.Subscribe/SubscribePattern:可订阅一类Topic,且当新Topic加入时，会自动订阅。一般情况下，用这个就OK。
ConsumerStrategies.Assign:可指定要消费的Topic-Partition,以及从指定Offset开始消费。

特点：

1、不需要使用单独的Receiver线程从Kafka获取数据
2、使用Kafka简单消费者API,不需要ZooKeeper参与，直接从Kafka Broker获取数据。
3、执行过程:Spark Streaming Batch Job触发时，Driver端确定要读取的Topic-Partition的OffsetRange，然后由Executor并行从Kafka各Partition读取数据并计算。
4、为保证整个应用EOS， Offset管理一般需要借助外部存储实现。如Mysql、HBase等。
5、由于不需要WAL，且Spark Streaming会创建和Kafka Topic Partition一样多的RDD Partition,且一一对应，这样,就可以并行读取，大大提高了性能。
6、Spark Streaming应用启动后，自己通过内部currentOffsets变量跟踪Offset，避免了基于Receiver的方式中Spark Streaming和Zookeeper中的Offset不一致问题。

参考文献：
https://www.cnblogs.com/redhat0019/p/10817597.html
https://blog.csdn.net/timicai/article/details/111485113
https://blog.csdn.net/wangpei1949/article/details/89419691
https://www.cnblogs.com/upupfeng/p/12325201.html

聊一聊 IM 要如何提升用户体验？后端java
IM系列imdoc实时通讯文档仓库聊一聊IM是什么？聊一聊IM即时通讯系统聊一聊IM要如何设计？聊一聊IM要如何设计功能模块？聊一聊IM要如何进行架构设计？聊一聊IM要如何进行技术选型？聊一聊IM要如何保证安全性？聊一聊IM要如何保证扩展性？聊一聊IM要如何实现运维与监控？聊一聊IM要如何提升用户体验？聊一聊IM要如何进行测试与部署？聊一聊IM要如何编写文档+技术支持？聊一聊IM要如何打造差异化？
聊一聊 IM 要如何提升用户体验？后端java
IM系列imdoc实时通讯文档仓库聊一聊IM是什么？聊一聊IM即时通讯系统聊一聊IM要如何设计？聊一聊IM要如何设计功能模块？聊一聊IM要如何进行架构设计？聊一聊IM要如何进行技术选型？聊一聊IM要如何保证安全性？聊一聊IM要如何保证扩展性？聊一聊IM要如何实现运维与监控？聊一聊IM要如何提升用户体验？聊一聊IM要如何进行测试与部署？聊一聊IM要如何编写文档+技术支持？聊一聊IM要如何打造差异化？
DeepSeek在地铁应急响应与处理中的具体实现方案，包括技术架构、功能实现和代码示例：人工智能专属驿站架构计算机视觉
以下是关于DeepSeek在地铁应急响应与处理中的具体实现方案，包括技术架构、功能实现和代码示例：1.事件检测与预警技术实现：视频监控与传感器数据融合：利用地铁站内的视频监控系统和传感器（如烟雾传感器、压力传感器）实时采集数据。通过深度学习算法（如目标检测和行为识别）对视频流进行分析，结合传感器数据，快速识别突发事件。自动警报触发：一旦检测到异常事件（如火灾、拥挤踩踏），系统立即通过预设的警报机制
探秘Java动态追踪技术：如何在不停服的情况下调试和优化你的应用程序墨夶 Java学习资料1 java 单元测试
在现代软件开发的世界里，快速迭代和持续交付成为了常态。然而，在生产环境中遇到问题时，传统的调试方法往往显得力不从心——重启服务可能会带来不可接受的服务中断风险。这时，Java动态追踪技术就展现出了它的价值。它允许开发者在不影响现有业务的前提下，实时地对正在运行的应用程序进行监控、诊断甚至修改。本文将深入探讨这一强大的工具集，并通过实际案例展示其应用。一、什么是Java动态追踪？简单来说，Java动
昆仑通态-数据显示创益无界工业控制分享数据库
我遇到一个问题，在上位机界面给设备设参数时，某一个参数的值大于一个常数时给不下去，我检查了数据类型没有问题，我在显示界面打开参数的属性设置面板，最大值设置没有问题。后发现在实时数据库对数据范围也做了限制昆仑通态有两个数据库：分别是设备窗口的数据库和实时数据库。设备窗口的数据库可以添加多个设备分别存储数据，对数据类型、数据长度等自由定义；实时数据库存储所有的数据，确保数据共享。设备窗口的数据库数据存
介绍下你们电商搜索的整体Java技术架构？ java1234_小锋 java java
大家好，我是锋哥。今天分享关于【介绍下你们电商搜索的整体Java技术架构？】面试题。希望对大家有帮助；介绍下你们电商搜索的整体Java技术架构？1000道互联网大厂Java工程师精选面试题-Java资源分享网在电商平台的搜索系统中，Java技术架构通常是构建高性能、可扩展、稳定搜索引擎的核心。一个典型的电商搜索系统通常会涉及以下几个关键部分：数据采集、索引建立、搜索查询处理、缓存和分布式处理等。下
互联网医院系统源码详解：陪诊问诊APP开发的技术路径万岳科技程序员小金软件开发教学 APP开发教学医疗陪诊APP APP开发软件开发陪诊问诊APP开发智慧医疗平台开发开源软件
开发一个功能完善的陪诊问诊APP，不仅需要考虑用户需求，还需要依托坚实的技术架构。本篇文章，笔者将详细介绍互联网医院系统源码，并探讨陪诊问诊APP的开发技术路径。一、互联网医院系统源码概述互联网医院系统源码，通常是指可以支持医院在线就诊、远程问诊、在线开方、药品配送等功能的系统源码。这类系统的核心是能够在平台上实现医生与患者之间的实时互动，且可以满足多种医疗服务需求。对于陪诊问诊APP来说，系统的
AI数据分析与商业智能：DeepSeek助力企业决策，轻松实现高效赚钱！知1而N 人工智能创业创新新媒体运营数据分析媒体运维
导语：在当今数据驱动的商业环境中，企业需要快速获取和分析数据，以做出明智的决策，提升运营效率和市场竞争力。然而，传统的数据分析方法往往耗时耗力，难以满足企业对实时数据分析的需求。今天，我将分享一种全新的赚钱方式，开展数据分析与商业智能服务，帮助企业提升决策效率，实现高效盈利！一、什么是DeepSeek数据分析与商业智能服务？DeepSeek不仅可以生成高质量的内容，还具备强大的数据分析和商业智能能
Airflow和PySPARK实现带多组参数和标签的Amazon Redshift数据仓库批量数据导出程序 weixin_30777913 python spark 云计算
设计一个基于多个带标签SQL模板作为配置文件和多组参数的PySPARK代码程序，实现根据不同的输入参数，用Airflow进行调度，自动批量地将AmazonRedshift数据仓库的数据导出为Parquet、CSV和Excel文件到S3上，标签和多个参数（以“_”分割）为组成导出数据文件名，文件已经存在则覆盖原始文件。PySpark程序需要异常处理，输出带时间戳和每个运行批次和每个导出文件作业运行状
HarmonyNext实战案例：构建一个智能健康监测应用前端
在本文中，我们将通过一个完整的实战案例，深入探讨如何在HarmonyNext平台上使用ArkTS构建一个智能健康监测应用。该应用将实现以下功能：实时监测用户的心率、步数和睡眠质量，并将数据可视化展示。本文假设读者已经具备一定的编程基础，尤其是对TypeScript或JavaScript有一定的了解，并且熟悉HarmonyNext的基本开发环境。项目概述智能健康监测应用的核心功能包括：心率监测：通过
FLASH与RAM AARON_MJT STM32 单片机 javascript 嵌入式硬件
STM32内的FLASH与RAMFLASH1、什么是FLASH?FLASH的作用是什么?2、NandFlash&NorFlashRAM1、什么是RAM?RAM的作用?内存分区1、四区分配2、单片机的程序存储3、STM32有两部分内存空间4、为什么会有RAM1和RAM2？5、怎样将变量存储在CMM内存中？6、将实时操作系统的数据存放在CCM单片机的flash和RAM,相当于电脑的硬盘和内存条FLAS
Amazon CodeWhisperer 体验分享 AI时代已来！ python aws vscode
AmazonCodeWhisperer是亚马逊开发的智能编程助手可以根据注释和现有代码实时生成从代码片段到全函数的代码建议，可以扫描代码来检测难以发现的漏洞，获取代码建议来立即修复这些漏洞。整体体验比较流畅，但是操作文档和实际操作有些不符，另外代码生成方面，有些地方也不和人意，比如生成速度、生成代码量等等。下面详细介绍下体验过程中遇到的问题。一、AWStoolkit安装及账号注册工具搜索是比较快的
BMS项目-面试及答疑整理孤芳剑影 BMS电池管理系统单片机嵌入式硬件
1.SOC计算用的什么原理实现的？bms目前计算SOC使用的安时积分+开路电压首先得对电池有一个抽象得概念，把电池比作游泳池，电量比作游泳池里面的水，电流比作流入和流出得水流，那么充电也就是往游泳池里面灌入水流安时积分：对水流进行一个实时监测，比如1S一次监测，那么每次1S测的水流量叠加就能将电量的时刻动态变化的电量给计算出来，当叠加的频率足够快那么电量计算得就越精准开路电压：可以认为是游泳池对出
Linux 下使用mtr命令来进行网络诊断 linux
简介mtr（MyTraceroute）命令是一个结合了ping和traceroute功能的网络诊断工具。它提供网络路径的实时分析并帮助诊断连接问题安装Debian/Ubuntusudoaptinstallmtr-yRHEL/CentOSsudoyuminstallmtr-yFedorasudodnfinstallmtr-y示例用法基础用法mtr示例这会持续追踪数据包到google.com的路由，并
财神动销-店铺销量飙升-批量下单-一键改价 fyds0824 intellij-idea
图片；好运文章；安逸技术支持；fyds0824复制上方即可添加核心动销功能商品批量拉取与流量分析财神动销支持从拼多多平台批量拉取商品信息，包括商品名称、价格、库存、图片等关键数据，极大地提升了数据同步的效率。此外，它还能实时监控商品流量，帮助商家精准分析商品的市场表现，为后续的营销策略提供数据支持。智能排序与随机SKU财神动销允许商家根据销量、价格、评价等多个维度对商品列表进行排序，优化商品展示效
8. 【.NET 8 实战--孢子记账--从单体到微服务--转向微服务】--微服务基础工具与技术--Ocelot 网关--负载均衡喵叔哟 .NET 8 .net 微服务负载均衡
负载均衡在Ocelot中作为API网关的核心功能，通过智能调度流量保障微服务架构的高效与稳定。Ocelot内置多种算法动态分配请求，例如轮询策略按顺序分发流量，最小连接数策略优先选择负载较低的实例，而基于Cookie的会话粘滞策略则能维持特定用户请求与后端服务的绑定状态，适用于需要会话一致性的场景。同时，Ocelot与服务发现工具深度集成，实时感知服务实例的上下线状态，自动剔除故障节点并调整路由策
JDK活化石复活：setStream()抢救指南，看完想给Applet开追悼会筱涵哥 Java基础入门 java
一、时空错乱现场：当我试图用Applet传2024年的数据1.1来自侏罗纪的SOS"把这个2003年的数据采集Applet改造成能对接新系统！"——看着要传输的JSON数据，我仿佛听到硬盘在哀嚎："臣妾做不到啊！"1.2现代程序员的降维打击//试图传输JSON数据时try{InputStreamjsonStream=newByteArrayInputStream("{\"data\":1}".ge
设计模式之适配器模式 Forget the Dream 设计模式设计模式适配器模式 c++java
引言狂风呼啸，一场强台风正以迅猛之势逼近你所在的城市，带来极大的威胁。而祸不单行，市中心的一座大楼突发火灾，情况万分危急。应急指挥中心里气氛凝重，领导紧盯着屏幕，一边是GIS系统中由气象部门实时更新的降雨量、风速数据以及精准的地图信息，这些数据对于掌握台风的动态和影响范围至关重要；另一边则是CAD系统中结构工程师精心标注的建筑承重参数，这是评估大楼及周边建筑安全状况的关键依据。领导需要在极短时间内
大模型在白血病诊疗全流程风险预测与方案制定中的应用研究 LCG元围术期危险因子预测模型研究人工智能
目录一、绪论1.1研究背景与意义1.2国内外研究现状1.3研究目的与内容二、大模型技术与白血病相关知识2.1大模型技术原理与特点2.2白血病的病理生理与诊疗现状三、术前风险预测与手术方案制定3.1术前数据收集与预处理3.2大模型预测术前风险3.3根据预测制定手术方案四、术中风险预测与麻醉方案优化4.1术中实时数据监测与采集4.2大模型动态风险预测4.3基于预测调整麻醉方案五、术后风险预测与护理方案
大模型在心力衰竭预测及临床方案制定中的应用研究报告 LCG元围术期危险因子预测模型研究人工智能
目录一、引言1.1研究背景与意义1.2研究目的1.3研究方法与创新点二、大模型技术与心力衰竭概述2.1大模型技术原理与发展2.2心力衰竭的病理机制与现状三、大模型在心力衰竭术前风险预测中的应用3.1数据收集与预处理3.2预测模型的构建与训练3.3模型评估与验证3.4基于预测结果的手术方案制定四、大模型在心力衰竭术中风险预测中的应用4.1术中数据监测与获取4.2风险预测模型的实时更新与应用4.3针对
入门Apache Spark：基础知识和架构解析 juer_0001 java spark
介绍ApacheSparkSpark的历史和背景ApacheSpark是一种快速、通用、可扩展的大数据处理引擎，最初由加州大学伯克利分校的AMPLab开发，于2010年首次推出。它最初设计用于支持分布式计算框架MapReduce的交互式查询，但逐渐发展成为一种更通用的数据处理引擎，能够处理数据流、批处理和机器学习等工作负载。Spark的特点和优势Spark是一种快速、通用、可扩展的大数据处理框架，
Spark核心算子对比：`reduceByKey`与`groupByKey`源码级解析及生产调优指南数据大包哥大数据 spark 分布式
Spark核心算子对比：reduceByKey与groupByKey源码级解析及生产调优指南1.核心机制对比在Spark中，reduceByKey和groupByKey都是对键值对RDD（RDD[(K,V)]）进行聚合操作的高阶算子，但两者的底层实现和性能表现截然不同。特性reduceByKeygroupByKeyShuffle前预聚合✅启用（mapSideCombine=true）❌禁用（map
使用 PM2 部署和管理 Node.js 应用 JJCTO袁龙 Node.js node.js
使用PM2部署和管理Node.js应用在现代Web开发中，Node.js已经成为了后端开发的主流选择之一。无论是构建RESTfulAPI，还是实时通讯应用，Node.js都能以优异的性能和丰富的生态体系满足我们的需求。然而，当应用越来越复杂，如何高效地部署和管理Node.js应用就显得尤为重要。在这篇博文中，我们将探讨如何使用PM2来部署和管理Node.js应用，同时提供一些示例代码以便更好地理解
NVIDIA jetson查看资源占用情况，打印/保存资源使用情况日志低配加班人 jetson 日志工具测试工具
1.jtopjtop这个一般都有安装，只能实时查看安装方式为sudo-Hpipinstalljetson-stats运行就是直接jtop即可2.tegrastats这个是jetson自带的工具，可以保存日志到文件，用于测试资源占用有无异常比较好用，如果资源有异常，但是不知道具体现象，可以打开日志功能，再打开异常程序，放在一边跑就行。tegrastats在目录/usr/bin/下使用tegrasta
流媒体服务Nginx + RTMP 模块、Wowza Streaming Engine、Red5、SRS（Simple Real-time Server对比纠结哥_Shrek nginx 运维
Nginx+RTMP模块、WowzaStreamingEngine、Red5和SRS（SimpleReal-timeServer）都是流媒体服务器，能够提供视频推流、拉流和直播分发等功能。每种流媒体服务器在性能、功能、配置和使用场景上都有不同的特点。下面是它们的对比：1.Nginx+RTMP模块简介：Nginx是一款高性能的Web服务器，RTMP模块是Nginx的一个插件，专门用于处理实时流媒体传
架构师面试（七）：评论消息棕生架构师面试架构师面试评论消息信箱模型方案电话模型方案 BP机模型方案
问题在抖音客户端实时获取评论消息业务中，从用户体验和实现成本考虑，下面最优方案是哪一个？A.客户端发送心跳时拉取评论消息；B.服务端收到评论消息后，直接推送评论消息数据到当前客户端；C.客户端定时拉取评论消息；D.服务端收到评论消息后，推送通知到当前客户端，触发客户端立即拉取评论消息。解析A选项和C选项，都属于定时拉取方案，属于信箱模型，实时性低，不过实现简单（心跳方案实现更简单）；B选项，服务端
c#实现modbus rtu定时采集数据 A_nanda c#Modbus RTU
以下是使用C#实现ModbusRTU定时采集数据的完整代码示例，包含定时任务、数据采集和异常处理：csharp复制usingSystem;usingSystem.IO.Ports;usingSystem.Timers;publicclassModbusRtuCollector:IDisposable{privatereadonlySerialPort_serialPort;privatereado
Flink架构体系：深入解析Apache Flink的架构与工作原理雨中徜徉的思绪漫溢 flink 架构 apache 大数据
Flink架构体系：深入解析ApacheFlink的架构与工作原理ApacheFlink是一种高性能、分布式、流式处理引擎，被广泛应用于大数据处理和实时分析场景。本文将深入解析Flink的架构体系和工作原理，包括核心组件和数据流处理过程，并提供相应的示例代码。Flink架构概述ApacheFlink的架构基于流式处理模型，它通过将数据流划分为有向无环图（DAG）的形式，将大规模的数据处理任务划分为
浅谈流媒体协议以及视频编解码纠结哥_Shrek 视频编解码
流媒体协议介绍流媒体协议用于传输视频、音频等多媒体数据，确保数据流畅地传输到用户设备。常见的流媒体协议包括RTMP、HLS、DASH、WebRTC等，每种协议具有不同的特点和适用场景。1.RTMP(Real-TimeMessagingProtocol)定义：由Adobe提出的实时消息传输协议，最初用于Flash播放器的流媒体播放。特点：低延迟，适合实时直播。支持推流和拉流，常用于直播推流（主播端推
StreamPark发布：Flink迎来首个Apache版本 MfvShell flink apache 大数据 Flink
近日，流处理计算平台StreamPark重磅发布了其首个Apache版本，为用户带来了更强大的功能和性能优化。这一版本的发布标志着StreamPark与ApacheFlink的融合迈出了重要的一步，为用户提供了更好的流处理体验。ApacheFlink是一个开源的流处理框架，具有强大的扩展性和容错性，被广泛应用于实时数据处理和分析场景。而StreamPark则是基于ApacheFlink构建的流处理
Js函数返回值 _wy_ js return
一、返回控制与函数结果，语法为：return 表达式;作用: 结束函数执行，返回调用函数，而且把表达式的值作为函数的结果二、返回控制语法为：return;作用: 结束函数执行，返回调用函数，而且把undefined作为函数的结果在大多数情况下,为事件处理函数返回false,可以防止默认的事件行为.例如,默认情况下点击一个<a>元素,页面会跳转到该元素href属性
MySQL 的 char 与 varchar bylijinnan mysql
今天发现，create table 时，MySQL 4.1有时会把 char 自动转换成 varchar 测试举例： CREATE TABLE `varcharLessThan4` ( `lastName` varchar(3) ) ; mysql> desc varcharLessThan4; +----------+---------+------+-
Quartz——TriggerListener和JobListener eksliang TriggerListener JobListener quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208624 一.概述 listener是一个监听器对象，用于监听scheduler中发生的事件，然后执行相应的操作；你可能已经猜到了，TriggerListeners接受与trigger相关的事件，JobListeners接受与jobs相关的事件。二.JobListener监听器 j
oracle层次查询 18289753290 oracle；层次查询；树查询
.oracle层次查询(connect by) oracle的emp表中包含了一列mgr指出谁是雇员的经理，由于经理也是雇员，所以经理的信息也存储在emp表中。这样emp表就是一个自引用表，表中的mgr列是一个自引用列，它指向emp表中的empno列，mgr表示一个员工的管理者， select empno,mgr,ename,sal from e
通过反射把map中的属性赋值到实体类bean对象中酷的飞上天空 javaee 泛型类型转换
使用过struts2后感觉最方便的就是这个框架能自动把表单的参数赋值到action里面的对象中但现在主要使用Spring框架的MVC，虽然也有@ModelAttribute可以使用但是明显感觉不方便。好吧，那就自己再造一个轮子吧。原理都知道，就是利用反射进行字段的赋值，下面贴代码主要类如下： import java.lang.reflect.Field; imp
SAP HANA数据存储：传统硬盘的瓶颈问题蓝儿唯美 HANA
SAPHANA平台有各种各样的应用场景，这也意味着客户的实施方法有许多种选择，关键是如何挑选最适合他们需求的实施方案。在《Implementing SAP HANA》这本书中，介绍了SAP平台在现实场景中的运作原理，并给出了实施建议和成功案例供参考。本系列文章节选自《Implementing SAP HANA》，介绍了行存储和列存储的各自特点，以及SAP HANA的数据存储方式如何提升空间压
Java Socket 多线程实现文件传输随便小屋 java socket
高级操作系统作业，让用Socket实现文件传输，有些代码也是在网上找的，写的不好，如果大家能用就用上。客户端类： package edu.logic.client; import java.io.BufferedInputStream; import java.io.Buffered
java初学者路径 aijuans java
学习Java有没有什么捷径?要想学好Java，首先要知道Java的大致分类。自从Sun推出Java以来，就力图使之无所不包，所以Java发展到现在，按应用来分主要分为三大块：J2SE,J2ME和J2EE,这也就是Sun ONE(Open Net Environment)体系。J2SE就是Java2的标准版，主要用于桌面应用软件的编程；J2ME主要应用于嵌入是系统开发，如手机和PDA的编程；J2EE
APP推广 aoyouzi APP 推广
一，免费篇 1，APP推荐类网站自主推荐最美应用、酷安网、DEMO8、木蚂蚁发现频道等,如果产品独特新颖，还能获取最美应用的评测推荐。PS：推荐简单。只要产品有趣好玩，用户会自主分享传播。例如足迹APP在最美应用推荐一次，几天用户暴增将服务器击垮。 2，各大应用商店首发合作老实盯着排期，多给应用市场官方负责人献殷勤。 3，论坛贴吧推广百度知道，百度贴吧，猫扑论坛，天涯社区，豆瓣（
JSP转发与重定向百合不是茶 jsp servlet Java Web jsp转发
在servlet和jsp中我们经常需要请求,这时就需要用到转发和重定向; 转发包括;forward和include 例子;forwrad转发; 将请求装法给reg.html页面关键代码; req.getRequestDispatcher("reg.html
web.xml之jsp-config bijian1013 java web.xml servlet jsp-config
1.作用：主要用于设定JSP页面的相关配置。 2.常见定义： <jsp-config> <taglib> <taglib-uri>URI(定义TLD文件的URI,JSP页面的tablib命令可以经由此URI获取到TLD文件)</tablib-uri> <taglib-location> TLD文件所在的位置
JSF2.2 ViewScoped Using CDI sunjing CDI JSF 2.2 ViewScoped
JSF 2.0 introduced annotation @ViewScoped; A bean annotated with this scope maintained its state as long as the user stays on the same view(reloads or navigation - no intervening views). One problem w
【分布式数据一致性二】Zookeeper数据读写一致性 bit1129 zookeeper
很多文档说Zookeeper是强一致性保证，事实不然。关于一致性模型请参考http://bit1129.iteye.com/blog/2155336 Zookeeper的数据同步协议 Zookeeper采用称为Quorum Based Protocol的数据同步协议。假如Zookeeper集群有N台Zookeeper服务器(N通常取奇数，3台能够满足数据可靠性同时
Java开发笔记白糖_ java开发
1、Map<key,value>的remove方法只能识别相同类型的key值 Map<Integer,String> map = new HashMap<Integer,String>(); map.put(1,"a"); map.put(2,"b"); map.put(3,"c"
图片黑色阴影 bozch 图片
.event{ padding:0; width:460px; min-width: 460px; border:0px solid #e4e4e4; height: 350px; min-heig
编程之美-饮料供货-动态规划 bylijinnan 动态规划
import java.util.Arrays; import java.util.Random; public class BeverageSupply { /** * 编程之美饮料供货 * 设Opt（V’，i）表示从i到n-1种饮料中，总容量为V’的方案中，满意度之和的最大值。 * 那么递归式就应该是：Opt（V’，i）=max{ k * Hi+Op
ajax大参数（大数据）提交性能分析 chenbowen00 Web Ajax 框架浏览器 prototype
近期在项目中发现如下一个问题项目中有个提交现场事件的功能，该功能主要是在web客户端保存现场数据（主要有截屏，终端日志等信息）然后提交到服务器上方便我们分析定位问题。客户在使用该功能的过程中反应点击提交后反应很慢，大概要等10到20秒的时间浏览器才能操作，期间页面不响应事件。根据客户描述分析了下的代码流程，很简单，主要通过OCX控件截屏，在将前端的日志等文件使用OCX控件打包，在将之转换为
[宇宙与天文]在太空采矿,在太空建造 comsci
我们在太空进行工业活动...但是不太可能把太空工业产品又运回到地面上进行加工,而一般是在哪里开采,就在哪里加工,太空的微重力环境,可能会使我们的工业产品的制造尺度非常巨大.... 地球上制造的最大工业机器是超级油轮和航空母舰,再大些就会遇到困难了,但是在空间船坞中,制造的最大工业机器,可能就没
ORACLE中CONSTRAINT的四对属性 daizj oracle CONSTRAINT
ORACLE中CONSTRAINT的四对属性 summary:在data migrate时,某些表的约束总是困扰着我们,让我们的migratet举步维艰,如何利用约束本身的属性来处理这些问题呢?本文详细介绍了约束的四对属性: Deferrable/not deferrable, Deferred/immediate, enalbe/disable, validate/novalidate,以及如
Gradle入门教程 dengkane gradle
一、寻找gradle的历程一开始的时候，我们只有一个工程，所有要用到的jar包都放到工程目录下面，时间长了，工程越来越大，使用到的jar包也越来越多，难以理解jar之间的依赖关系。再后来我们把旧的工程拆分到不同的工程里，靠ide来管理工程之间的依赖关系，各工程下的jar包依赖是杂乱的。一段时间后，我们发现用ide来管理项程很不方便，比如不方便脱离ide自动构建，于是我们写自己的ant脚本。再后
C语言简单循环示例 dcj3sjt126com c
# include <stdio.h> int main(void) { int i; int count = 0; int sum = 0; float avg; for (i=1; i<=100; i++) { if (i%2==0) { count++; sum += i; } } avg
presentModalViewController 的动画效果 dcj3sjt126com controller
系统自带(四种效果)： presentModalViewController模态的动画效果设置： [cpp] view plain copy UIViewController *detailViewController = [[UIViewController al
java 二分查找 shuizhaosi888 二分查找 java二分查找
需求：在排好顺序的一串数字中，找到数字T 一般解法：从左到右扫描数据，其运行花费线性时间O(N)。然而这个算法并没有用到该表已经排序的事实。 /** * * @param array * 顺序数组 * @param t * 要查找对象 * @return */ public stati
Spring Security（07）——缓存UserDetails 234390216 ehcache 缓存 Spring Security
Spring Security提供了一个实现了可以缓存UserDetails的UserDetailsService实现类，CachingUserDetailsService。该类的构造接收一个用于真正加载UserDetails的UserDetailsService实现类。当需要加载UserDetails时，其首先会从缓存中获取，如果缓存中没
Dozer 深层次复制 jayluns VO maven po
最近在做项目上遇到了一些小问题，因为架构在做设计的时候web前段展示用到了vo层，而在后台进行与数据库层操作的时候用到的是Po层。这样在业务层返回vo到控制层，每一次都需要从po-->转化到vo层，用到BeanUtils.copyProperties(source, target)只能复制简单的属性，因为实体类都配置了hibernate那些关联关系，所以它满足不了现在的需求，但后发现还有个很
CSS规范整理（摘自懒人图库） a409435341 html UI css 浏览器
刚没事闲着在网上瞎逛，找了一篇CSS规范整理，粗略看了一下后还蛮有一定的道理，并自问是否有这样的规范，这也是初入前端开发的人一个很好的规范吧。一、文件规范 1、文件均归档至约定的目录中。具体要求通过豆瓣的CSS规范进行讲解：所有的CSS分为两大类：通用类和业务类。通用的CSS文件，放在如下目录中：基本样式库 /css/core
C++动态链接库创建与使用你不认识的休道人 C++dll
一、创建动态链接库 1.新建工程test中选择”MFC [dll]”dll类型选择第二项"Regular DLL With MFC shared linked"，完成 2.在test.h中添加 extern “C” 返回类型 _declspec(dllexport)函数名(参数列表); 3.在test.cpp中最后写 extern “C” 返回类型 _decls
Android代码混淆之ProGuard rensanning ProGuard
Android应用的Java代码，通过反编译apk文件（dex2jar、apktool）很容易得到源代码，所以在release版本的apk中一定要混淆一下一些关键的Java源码。 ProGuard是一个开源的Java代码混淆器（obfuscation）。ADT r8开始它被默认集成到了Android SDK中。官网： http://proguard.sourceforge.net/
程序员在编程中遇到的奇葩弱智问题 tomcat_oracle jquery 编程 ide
　　现在收集一下：　　排名不分先后，按照发言顺序来的。 1、Jquery插件一个通用函数一直报错，尤其是很明显是存在的函数，很有可能就是你没有引入jquery。。。或者版本不对 2、调试半天没变化：不在同一个文件中调试。这个很可怕，我们很多时候会备份好几个项目，改完发现改错了。有个群友说的好：在汤匙
解决maven-dependency-plugin (goals "copy-dependencies","unpack") is not supported xp9802 dependency
解决办法：在plugins之前添加如下pluginManagement，二者前后顺序如下： [html] view plain copy <build> <pluginManagement