冰点.

Apache Storm入门介绍之三分钟看懂Apache Storm

文章目录

0.前言
1. 什么是 Apache Storm？
- 1.1. Nimbus
- 1.2. Zookeeper
- 1.3. Supervisor
- 1.4. Worker
- 1.5 集群模式下各组件职责
2. 核心概念
- 2.1基本架构和任务模型
- 2.2 工作流程
3. 源码地址
- 3.1. 代码结构
- 3.1. 核心模块介绍
4. Storm入门实例
- 0.创建java工程并引入依赖
- 1. 创建一个 `Spout `类，用于生成随机的社交媒体帖子数据，并将其发送到拓扑中的下一个组件（Bolt）：
- 2. 创建一个 Bolt 类，用于处理帖子数据，并计算每个帖子的情感倾向：
- 3. 创建一个拓扑类，用于连接 Spout 和 Bolt，并设置拓扑的并发度：
- 4.情感分析方法 analyzeSentiment
5. Apache Storm 与 Hadoop
6. Apache Storm 的用例
- 使用的公司
7. Apache Storm 的优点
- 通俗的讲
8. 参考文档

0.前言

我们大家想想目前与大数据相关的著名的开源组件有哪些呢？比如说最早期的批处理框架 Hadoop？流计算平台 Storm，火了一阵子的 Spark？异或其他领域数仓的 Hive，KV 存储的 HBase？这些都是非常著名的开源项目、我大概整理了一个图可供大家参考。而本章我们着重了解一下大数据领域的分布式实时数据处理老大哥Storm。虽然近年来 Apache Flink 成为了分布式实时数据处理领域的重要技术，并且在某些方面甚至超越了 Apache Storm。Flink 提供了更加高级的流处理和批处理功能，具有更好的性能和易用性。但是 Storm 仍然是一个非常有价值的技术，并且在各公司已经有了很深的技术沉淀和最佳实践，还支持着公司和客户的核心业务。Storm 具有更加灵活的编程模型和更加丰富的 API，可以满足各种实时数据处理的需求。Storm 也拥有一个庞大的社区和生态系统，支持各种数据源和数据处理工具的集成和扩展。因此，在选择实时数据处理技术时，应该根据具体需求进行综合评估，选择最适合自己的技术。本次我们分三个章节着重讲解一下。

1. 什么是 Apache Storm？

Apache Storm 是一个分布式实时计算系统，可以处理大规模实时数据流。它是一个开源项目，最初由 Twitter 开发并贡献给 Apache 软件基金会。Storm 提供了一个易于使用的编程模型，支持高效、可靠、可扩展的数据处理流程，广泛应用于实时数据分析、实时推荐、实时监控等领域。

从图中我们梳理出以下的关系

Nimbus 通过与 Zookeeper 的交互，管理 Storm 集群中的所有组件，包括 Supervisor 和 Worker。

Zookeeper 维护着 Storm 集群的状态和元数据，包括 Topology 的元数据、Worker 的状态、Supervisor 的信息等。

Supervisor 负责管理 Worker 进程，监控和维护 Worker 的状态和资源使用情况。

Worker 运行在 Supervisor 中，处理 Tuple 并将处理后的数据发送给下游的 Bolt 或者输出到外部存储系统。

1.1. Nimbus

Nimbus 是 Storm 的主节点，负责 Topology 的分配和调度。Nimbus 接收到 Topology 的提交请求后，会对 Topology 进行编译、打包和分发，然后将任务分配给集群中的 Supervisor 和 Worker。Nimbus 还负责监控和管理整个 Storm 集群的运行状态，例如监控 Worker 的状态、处理故障和异常、维护 Topology 的元数据等。

1.2. Zookeeper

Zookeeper 是 Storm 集群的分布式协调服务，负责管理集群中各个组件的状态和配置信息。Nimbus、Supervisor 和 Worker 都会将自己的状态和元数据注册到 Zookeeper 中，以便其他组件可以发现和访问它们。Zookeeper 还提供了分布式锁、协调和通知机制，能够保证 Storm 集群的高可用性和一致性。

1.3. Supervisor

Supervisor 是 Storm 集群中的工作节点，负责运行和管理 Worker 进程。每个 Supervisor 可以运行多个 Worker 进程，每个 Worker 进程运行一个或多个 Task。Supervisor 还负责监控 Worker 进程的状态和资源使用情况，例如 CPU、内存、磁盘等。

1.4. Worker

Worker 是 Storm 集群中的实际工作进程，负责具体的数据处理和传递工作。Worker 运行在 Supervisor 中，可以运行多个 Task。每个 Worker 负责处理一部分数据流，通过处理 Tuple 来实现实时数据处理和转换。Worker 还会将处理后的数据发送给下游的 Bolt 或者输出到外部存储系统。

1.5 集群模式下各组件职责

2. 核心概念

Apache Storm 是一个分布式实时计算系统，具有以下核心概念：

组件	描述
Topology	Storm 中的最高级别的抽象概念，表示一个实时数据处理流程。Topology 由 Spout 和 Bolt 组成，可以看作是一个有向无环图（DAG），其中 Spout 是数据源，Bolt 是数据处理节点。
Spout	流的来源，也叫做源节点，。一般来说，Storm 接受来自原始数据源的输入数据，如 Twitter Streaming API、Apache Kafka 队列、Kestrel 队列等。否则，您可以编写 spout 从数据源读取数据。“ISpout”是实现spout的核心接口，具体接口有IRichSpout、BaseRichSpout、KafkaSpout等。负责从数据源中读取实时数据流，并将数据流发送给下游的 Bolt 节点。Spout 可以从文件、数据库、消息队列、网络等不同的数据源中读取数据，并通过可靠的方式将数据发送给 Bolt 节点。
Bolt	Bolts 是逻辑处理单元。Spout 将数据传递给 bolts 和 bolts 进程并产生一个新的输出流。Bolts 可以执行过滤、聚合、连接、与数据源和数据库交互的操作。Bolt 接收数据并发送到一个或多个 Bolt。“IBolt”是实现bolt的核心接口。一些常用的接口有 IRichBolt、IBasicBolt 等Topology 中的处理节点，负责对数据流进行实时处理和转换。Bolt 可以对数据流进行过滤、聚合、计算、转换等各种操作，并通过可靠的方式将处理后的数据发送给下游的 Bolt 节点或者输出到外部存储系统。
Stream	数据流的抽象概念，表示一组有序的数据记录。Stream 可以包含多个字段，每个字段可以是不同的数据类型。Stream 是 Topology 中 Spout 和 Bolt 之间的通信载体，可以传递实时数据流和元数据信息。
Tuple	Storm 中的基本数据单元，表示一个有序的字段组成的数据记录。Tuple 可以看作是 Stream 中的一个数据元素，每个 Tuple 由多个字段组成，字段可以是不同的数据类型。Tuple 是 Storm 中数据处理和传递的基本单位。
Task	Bolt 或者 Spout 在集群中的实例，负责具体的数据处理和传递工作。Topology 中的每个 Bolt 或者 Spout 都会被分配若干个 Task，每个 Task 负责处理一部分数据流。
Worker	Storm 集群中的一个进程，负责启动和运行一个或多个 Task。每个 Worker 可以运行在独立的机器上，也可以运行在同一台机器上的不同进程中。

来自官网

2.1基本架构和任务模型

根据下图，我们来理解一下Storm 核心组件的作用和关系。

2.2 工作流程

3. 源码地址

源码地址 https://github.com/apache/storm

3.1. 代码结构

3.1. 核心模块介绍

目录	描述
storm-buildtools	构建和测试 Storm 项目的工具和脚本
storm-checkstyle	代码风格检查的 Checkstyle 配置文件和规则
storm-client	与 Storm 集群通信的客户端 API
storm-clojure-test	用于测试 Clojure 代码的测试工具和框架
storm-clojure	Storm 中使用的 Clojure 代码
storm-core	Storm 的核心功能和算法的实现代码
storm-dist	构建分发包的相关文件和配置
storm-multilang	与非JVM语言通信的多语言支持
storm-server	启动和管理 Storm 服务器的代码
storm-shaded-deps	Storm 所需的各种第三方依赖的 shaded 版本
storm-submit-tools	提交和管理 Storm 拓扑的工具和脚本
storm-webapp	Storm 的 Web UI 的代码和资源文件

4. Storm入门实例

说了那么多概念，我们来搞个代码来感受一下。我们假设有这样的一个场景，就比如CSDN的博文评价或者论坛帖子分析，核心场景是分析CSDN平台上用户对不同话题的情感倾向。
我们用java来实现.在控制台上，可以看到每个帖子及其情感倾向的输出结果。这只是一个简单的情感分析示例，并且仅基于词语的出现与否进行判断。在实际应用中，情感分析通常会使用更复杂的算法和语言模型来进行更精确的情感判断。请大家不要上纲上线。

0.创建java工程并引入依赖

添加Storm的依赖。

  <dependency>
    <groupId>org.apache.stormgroupId>
    <artifactId>storm-coreartifactId>
    <version>2.2.0version>
  dependency>

1. 创建一个 `Spout` 类，用于生成随机的社交媒体帖子数据，并将其发送到拓扑中的下一个组件（Bolt）：

public class SocialMediaSpout extends BaseRichSpout {
  private SpoutOutputCollector collector;
  
  @Override
  public void open(Map<String, Object> conf, TopologyContext context, SpoutOutputCollector collector) {
    this.collector = collector;
  }
  
  @Override
  public void nextTuple() {
    // 生成随机的社交媒体帖子数据
    String post = generateRandomPost();
    
    // 发送数据到下一个组件
    collector.emit(new Values(post));
  }
  
  private String generateRandomPost() {
    // 实现随机生成帖子的逻辑
    // 返回生成的帖子内容
  }
  
  @Override
  public void declareOutputFields(OutputFieldsDeclarer declarer) {
    declarer.declare(new Fields("post"));
  }
}

2. 创建一个 Bolt 类，用于处理帖子数据，并计算每个帖子的情感倾向：

public class SentimentAnalysisBolt extends BaseRichBolt {
  private OutputCollector collector;
  
  @Override
  public void prepare(Map<String, Object> conf, TopologyContext context, OutputCollector collector) {
    this.collector = collector;
  }
  
  @Override
  public void execute(Tuple tuple) {
    // 获取帖子数据
    String post = tuple.getStringByField("post");
    
    // 进行情感分析，计算情感倾向
    double sentiment = analyzeSentiment(post);
    
    // 发送情感倾向数据到下一个组件
    collector.emit(new Values(post, sentiment));
    
    // 确认处理成功
    collector.ack(tuple);
  }
  
  private double analyzeSentiment(String post) {
    // 实现情感分析的逻辑
    // 返回计算得到的情感倾向值
  }
  
  @Override
  public void declareOutputFields(OutputFieldsDeclarer declarer) {
    declarer.declare(new Fields("post", "sentiment"));
  }
}

3. 创建一个拓扑类，用于连接 Spout 和 Bolt，并设置拓扑的并发度：

public class SentimentAnalysisTopology {
  public static void main(String[] args) throws Exception {
    // 创建拓扑
    TopologyBuilder builder = new TopologyBuilder();
    
    // 设置 Spout 和 Bolt
    builder.setSpout("socialMediaSpout", new SocialMediaSpout(), 2);
    builder.setBolt("sentimentAnalysisBolt", new SentimentAnalysisBolt(), 4).shuffleGrouping("socialMediaSpout");
    
    // 创建配置
    Config config = new Config();
    config.setDebug(true);
    
    // 提交拓扑到 Storm 集群
    StormSubmitter.submitTopology("sentiment-analysis-topology", config, builder.createTopology());
  }
}

4.情感分析方法 analyzeSentiment

它接受一个字符串作为输入，并返回一个表示情感极性的整数值。具体实现如下：
首先定义了一个积极词汇数组和一个消极词汇数组，然后遍历输入文本中的每个单词。使用 Arrays.asList 方法将数组转换为 List，并使用 contains 方法检查单词是否在列表中。如果单词在积极词汇列表中，情感分数加1；如果单词在消极词汇列表中，情感分数减1。最后返回情感分数作为结果。

public class SentimentAnalyzer {
    public static int analyzeSentiment(String text) {
        String[] positiveWords = {"开心", "真棒", "支持", "优秀", "好文", "厉害"};
        String[] negativeWords = {"三连", "互粉", "垃圾", "差" ,"废话"};
        
        int sentimentScore = 0;
        
        String[] words = text.split(" ");
        for (String word : words) {
            if (Arrays.asList(positiveWords).contains(word)) {
                sentimentScore += 1;
            } else if (Arrays.asList(negativeWords).contains(word)) {
                sentimentScore -= 1;
            }
        }
        
        return sentimentScore;
    }
}

5. Apache Storm 与 Hadoop

Apache Storm 和 Hadoop 都是大数据处理领域的重要技术。但是，它们的设计目标和应用场景有所不同。Hadoop 是一个批处理系统，主要用于离线数据处理，例如批量的 MapReduce 任务和数据仓库。而 Storm 是一个实时计算系统，主要用于处理实时数据流，例如实时的流处理、实时的事件处理和实时的机器学习。

Storm	Hadoop
实时流处理	批量处理
无状态	有状态的
具有基于 ZooKeeper 协调的主/从架构。主节点称为nimbus和从节点称为supervisors.	具有/不具有基于 ZooKeeper 的协调的主从架构。主节点是job tracker从节点是task tracker.
Storm 流式处理可以在集群上每秒访问数万条消息。	Hadoop 分布式文件系统 (HDFS) 使用 MapReduce 框架来处理需要数分钟或数小时的大量数据。
Storm Topology会一直运行，直到用户关闭或出现不可恢复的意外故障。	MapReduce 作业按顺序执行并最终完成。
两者都是分布式和容错的
如果 nimbus / supervisor 死了，重新启动会使其从停止的地方继续，因此不会受到任何影响。	如果 JobTracker 死了，所有正在运行的作业都将丢失。

6. Apache Storm 的用例

Apache Storm 可以用于处理各种实时数据流，包括社交媒体数据、物联网数据、金融数据、移动应用数据等。以下是一些常见的用例：

实时数据分析和决策：Storm 可以对海量实时数据进行分析和决策，例如实时交易监控、实时风控分析、实时广告投放等。
实时推荐和个性化服务：Storm 可以根据用户的实时行为和偏好，提供个性化的推荐和服务，例如实时新闻推荐、实时电影推荐等。
实时监控和预警：Storm 可以对实时数据流进行监控和预警，例如实时网络监控、实时系统监控等。
实时机器学习和模型训练：Storm 可以在实时数据流中更新机器学习模型和进行模型训练，例如实时预测和实时识别。

使用的公司

Twitter− Twitter 在其“发布者分析产品”系列中使用 Apache Storm。“发布者分析产品”处理 Twitter 平台中的每条推文和点击。Apache Storm 与 Twitter 基础架构深度集成。

NaviSite− NaviSite 正在将 Storm 用于事件日志监控/审计系统。系统中产生的每一条日志都会经过Storm。Storm 将根据配置的正则表达式集检查消息，如果匹配，则该特定消息将保存到数据库中。

Wego− Wego 是位于新加坡的旅游元搜索引擎。旅行相关数据来自世界各地不同时间的许多来源。Storm 帮助 Wego 搜索实时数据，解决并发问题并为最终用户找到最佳匹配。
来自网络

7. Apache Storm 的优点

Apache Storm 具有以下好处：

实时性：Storm 可以处理实时数据流，并实现毫秒级的响应时间。
可靠性：Storm 提供了可靠的消息传递机制和故障恢复机制，能够保证数据处理的高可靠性。
可扩展性：Storm 可以通过水平扩展来支持大规模的数据处理流程，能够便捷地扩展节点数和集群规模。
易用性：Storm 提供了易于使用的编程模型和丰富的 API，能够简化开发和部署的过程。
生态系统：Storm 有一个庞大的开源生态系统，支持各种数据源和数据处理工具的集成和扩展。

通俗的讲

Storm 是开源的、强大的和用户友好的。它可以在小公司和大公司中使用。
Storm 容错、灵活、可靠，并且支持任何编程语言。
允许实时流处理。
Storm 的速度快得令人难以置信，因为它具有强大的数据处理能力。
Storm 通过线性添加资源，即使在负载增加的情况下也能保持性能。它具有高度可扩展性。
Storm 在几秒或几分钟内执行数据刷新和端到端交付响应，具体取决于问题。它的延迟非常低。
Storm 拥有运营智能。
即使集群中的任何连接节点死亡或消息丢失，Storm 也提供有保证的数据处理。

8. 参考文档

Apache Storm 官方文档：https://storm.apache.org/releases/2.4.0/index.html
Storm 启动指南：https://storm.apache.org/releases/2.2.0/Running-topologies-on-a-production-cluster.html
Storm Topology 设计指南：https://storm.apache.org/releases/2.2.0/Understanding-the-parallelism-of-a-Storm-topology.html
Storm 插件和外部集成：https://storm.apache.org/releases/2.2.0/External-Integrations.html
Storm API 文档：https://storm.apache.org/releases/2.2.0/javadocs/index.html
Storm 教程和示例：https://storm.apache.org/releases/2.2.0/Tutorials.html
Storm 与其他大数据工具的集成指南：https://storm.apache.org/releases/2.2.0/Third-party-integrations.html

前端性能优化之SSR优化 xiangzhihong8 前端前端
我们常说的SSR是指Server-SideRendering，即服务端渲染，属于首屏直出渲染的一种方案。SSR也是前端性能优化中最常用的技术方案了，能有效地缩短页面的可见时间，给用户带来很好的体验。SSR渲染方案一般来说，我们页面加载会分为好几个步骤：请求域名，服务器返回HTML资源。浏览器加载HTML片段，识别到有CSS/JavaScript资源时，获取资源并加载。现在大多数前端页面都是单页面应
JAVA泛型 TraceChen JAVA java
JAVA泛型Java泛型（generic）是在JDK1.5版本引用的一种新的特性，泛型提供编译时安全检查机制，该机制允许程序员在编译时检查非安全的类型。一、泛型本质泛型本质是数据化类型，即先给类型指定一个参数，然后使用时再指定参数具体的值，那么这个类型可以在使用时候决定，这种参数类型可以用在类、接口、方法中，分别被称为泛型类、泛型接口、泛型方法。 Listlist=newArrayListl
鸿蒙NEXT开发之开屏广告实现怀男孩 harmonyos harmonyos 华为
1.广告请求服务的实现首先，你需要创建一个广告请求服务来处理广告的加载和展示。你已经在代码中实现了requestAd函数，接下来需要处理广告加载、显示、点击等事件。可以考虑以下结构：1.1创建广告加载函数import{advertising,identifier}from'@kit.AdsKit';import{hilog}from'@kit.PerformanceAnalysisKit';imp
JDK8 Stream 数据流效率分析，Java开发你需要了解的那些事气质大叔程序员后端面试 java
此外还有一系列特化流，如IntStream，LongStream，DoubleStream等），Java8引入的的Stream主要用于取代部分Collection的操作，每个流代表一个值序列，流提供一系列常用的聚集操作，可以便捷的在它上面进行各种运算。集合类库也提供了便捷的方式使我们可以以操作流的方式使用集合、数组以及其它数据结构；作为阅读福利，小编也整理了一些Java学习笔记（包含面试真题+脑图
基础篇：ArkTS基础语法介绍言程序plus 鸿蒙Next开发 javascript arkts 鸿蒙
前言：目前流行的编程语言TypeScript是在JavaScript基础上通过添加类型定义扩展而来的，而ArkTS则是TypeScript的进一步扩展。TypeScript深受开发者的喜爱，因为它提供了一种更结构化的JavaScript编码方法。ArkTS旨在保持TypeScript的大部分语法，为现有的TypeScript开发者实现无缝过渡，让移动开发者快速上手ArkTS。ArkTS比typeS
SAP之顾问篇 FF.5电子银行对账单 SAP圣父 SAP
直接上干货一.配置财务会计→银行会计核算→业务往来→支付交易→电子银行对账单→进行电子银行对账单的全局设置1.创建科目符号例:ZS012.对科目符号分配科目给ZS01设置总账科目3.创建过账规则码例:Z0014.定义过账规则给Z001设置借贷方过账代码，借贷方科目5.创建业务类型例:ZT016.对过账规则分配外部事务类型给ZT01设置外部交易码(※2)，设置过账规则:Z0017.对事务类型分配银行
尚硅谷电商数仓6.0，hive on spark,spark启动不了新时代赚钱战士 hive spark hadoop
在datagrip执行分区插入语句时报错[42000][40000]Errorwhilecompilingstatement:FAILED:SemanticExceptionFailedtogetasparksession:org.apache.hadoop.hive.ql.metadata.HiveException:FailedtocreateSparkclientforSparksessio
【万字总结】前端全方位性能优化指南（四）——虚拟DOM批处理、文档碎片池、重排规避庸俗今天不摸鱼 Web性能优化合集前端性能优化
前言在浏览器宇宙中，DOM操作如同「时空裂缝」——一次不当的节点更新可能引发连锁重排，吞噬整条渲染流水线的性能。本章直面这一核心矛盾，以原子级操作合并、节点记忆重组、排版禁忌破解为三重武器，重构DOM更新的物理法则。通过虚拟DOM的批处理引擎将千次操作坍缩为单次提交，借助文档碎片池实现90%节点的跨时空复用，再以transform替代top等20项反重排铁律，我们将彻底终结「JavaScript线
Java泛型 lgily-1225 日常积累 java 开发语言后端
Java泛型是Java5引入的一项重要特性，旨在增强类型安全、减少代码冗余，并支持更灵活的代码设计。以下是对泛型的详细介绍及使用指南：一、泛型核心概念泛型允许在类、接口、方法中使用类型参数（如），使得代码可以处理多种数据类型，而无需重复编写逻辑。解决的问题类型安全：避免运行时ClassCastException。消除强制类型转换：编译器自动处理类型转换。代码复用：同一逻辑可处理不同类型的数据。二、
实现高德地图自定义点标记跳动，点标记随缩放大小显示和隐藏时光请留微笑 javascript 前端 vue.js
高德地图的自定义标记（Marker）添加一个循环动画效果，比如让图标上下跳动，你可以利用CSS动画或JavaScript动画库（如GSAP）。使用GSAP来创建动画，下面我将展示两种GSAP和CSS类来为Marker的内容添加循环动画。方法一：通过CSS动画实现图标上下跳动首先自定义点标记，在点标记显示内容content中自定义一个图标，这里我用的是element中的图标，给标签一个类名，如i-i
云原生边缘计算：分布式智能的时代黎明桂月二二云原生边缘计算分布式
引言：从集中式算力到万物智联的范式裂变AT&T边缘节点部署超5000个，特斯拉自动驾驶系统每节点200TOPS算力。国家电网通过边缘计算实现毫秒级电网故障隔离，菜鸟物流分拣效率提升400%。IDC预测2027年边缘基础设施支出将达亿，宝马汽车工厂设备预测性维护准确率达9亿运维成本。一、边缘计算范式进化论1.1算力拓扑结构演变世代大型主机中心化云计算分布式雾计算去中心化边缘计算泛在化神经形态计算体计
oracle基础知识之表的集合运算数字天下 oracle 数据库
一个查询就是一个集合：查询的结果集一条记录就是一个元素。集合运算是用来把两个或多个查询的结果集做并、交、查的集合运算，包含集合运算的查询称为复合查询。*Select基本语法如下：SELECTcolumn_1,column_2,…FROMtable_nameWHEREsearch_conditionORDERBYcolumn_1,column_2;2.常用集合运算方式的应用（1）联合运算：联合运算实
Java IDEA中Gutter Icons图标的含义路宇 java笔记 java intellij-idea 开发语言 gutter-icons 图标 Java开发工具
前些天发现了一个蛮有意思的人工智能学习网站,8个字形容一下"通俗易懂，风趣幽默"，感觉非常有意思,忍不住分享一下给大家。点击跳转到教程前言：很多人刚开始用IDEA来学习编程，会发现下面这些图标。但是我们有时候并不知道它的含义和设置显示与隐藏，下面给大家讲解一下装订线图标位于左侧编辑器中。它们调用一些基本操作以及其他特定于框架和技术的功能。设置步骤File->Setting进到idea的设置页面。接
常用的pdf技术有哪些？--笔记我不是彭于晏灬 pdf 笔记
常用的pdf技术有哪些？1.iTextPDF：iText是著名的开放项目，是用于生成PDF文档的一个java类库。通过iText不仅可以生成PDF或rtf的文档，而且可以将XML、Html文件转化为PDF文件。Openoffice：openoffice是开源软件且能在windows和linux平台下运行，可以灵活的将word或者Excel转化为PDF文档。JasperReport：是一个强大、灵活
【科大讯飞笔试题汇总】2024-04-21-科大讯飞春招笔试题-三语言题解(CPP/Python/Java) 春秋招笔试突围最新互联网春秋招试题合集 python java 开发语言春招笔试互联网大厂笔试题
大家好这里是KK爱Coding，一枚热爱算法的程序员✨本系列打算持续跟新科大讯飞近期的春秋招笔试题汇总～ACM银牌|多次AK大厂笔试｜编程一对一辅导感谢大家的订阅➕和喜欢KK这边最近正在收集近一年互联网各厂的笔试题汇总，如果有需要的小伙伴可以关注后私信一下KK领取，会在飞书进行同步的跟新，5月1日之前限时免费领取哦，后续会由ACM银牌团队持续维护~。文章目录01.硬币最少组合问题问题描述输入格式输
vite中使用Web Worker 脚本
MDN对WebWorker的说明WebWorker为Web内容在后台线程中运行脚本提供了一种简单的方法。线程可以执行任务而不干扰用户界面。此外，它们可以使用XMLHttpRequest（尽管responseXML和channel属性总是为空）或fetch（没有这些限制）执行I/O。一旦创建，一个worker可以将消息发送到创建它的JavaScript代码，通过将消息发布到该代码指定的事件处理器（反
【java】注解 6<7 java 开发语言
注解什么是注解Annotation（注解）是从JDK5.0开始引入的新技术。Annotation的作用：不是程序本身必需的，但是可以对程序做出解释。可以被其他程序（比如编译器等）读取。Annotation的格式：注解是以“@注释名”在代码中存在的，还可以添加一些参数值，例如：@SuppressWarnings(value=“unchecked”)。Annotation在哪里可以使用?可以附加在pa
【java】反射 6<7 java python 开发语言
反射反射机制可以读取注解。反射的概念在Java中，通常情况下，我们在编译时就知道要使用的类和方法。但反射机制打破了这种常规，它允许程序在运行时动态地分析类、调用方法、操作字段等。也就是说，在运行时，程序可以根据需要来决定要使用哪个类、调用哪个方法、访问哪个字段，而不是在编译时就确定下来。反射的核心类Java反射机制主要涉及以下几个核心类：1、Class类Class类是反射机制的基础，它代表一个类或
深度解析Java中的代码分支策略规划：掌握GitFlow与GitHub Flow的艺术墨夶 Java学习资料2 java github 开发语言
在这个技术日新月异的时代，每一个开发者都在寻找提高效率、减少错误并优化团队协作的方法。而当涉及到代码管理时，选择正确的分支策略至关重要。今天，我们将深入探讨如何在Java项目中应用两种流行的分支策略——GitFlow和GitHubFlow，并通过详尽的示例代码来展示它们的实际运用。1.分支管理策略概览分支管理策略不仅帮助团队成员之间进行有效的沟通，还确保了代码库的健康状态。无论是小型创业公司还是大
Elasticsearch 介绍：分布式搜索与分析引擎吱屋猪_ elasticsearch
在如今大数据时代，企业和开发者面临着前所未有的数据量和实时性要求。为了能够高效地处理、存储和查询这些数据，Elasticsearch作为一种强大的分布式搜索引擎，已经成为了很多组织和开发者的首选解决方案。1.什么是Elasticsearch？Elasticsearch是一个开源的、基于ApacheLucene构建的全文搜索引擎。它提供了高效的搜索功能，并且非常适合处理大量数据，尤其是在需要快速搜索
【VSCode】VSCode常用插件 Ctrl Z. vscode ide 编辑器
Chinese(Simplified)(简体中文)LanguagePackforVisualStudioCode：简体中文支持插件HTML/CSS/JavaScriptSnippets：支持HTML/CSS/JavaScript快速匹配输入HTMLSnippets：这个插件提供了一系列HTML代码片段，通过简单的缩写就可以快速生成常用的HTML结构。例如，输入!并按下Tab键，就可以快速生成一个完
K8S学习之基础四十：配置altermanager发送告警到钉钉群云上艺旅 K8S学习 kubernetes 学习钉钉 prometheus 云原生容器
配置altermanager发送告警到钉钉群创建钉钉群，设置机器人助手(必须是管理员才能设置)，获取webhookwebhook：https://oapi.dingtalk.com/robot/send?access_token=25bed933a52d69f192347b5be4b2193bc0b257a6d9ae68d81619e3ae3d93f7c6#创建cm，配置钉钉群信息vialertm
java 实现数据库备份李逍遙️ mysql 数据库 java mysql
importcom.guangyi.project.model.system.DataBaseInFo;importjava.io.BufferedReader;importjava.io.File;importjava.io.FileOutputStream;importjava.io.IOException;importjava.io.InputStream;importjava.io.Inp
linux 安装jdk1.8 李逍遙️ linux 运维服务器
通过终端，使用wget命令下载JDK：wgethttps://download.java.net/openjdk/jdk8u41/ri/openjdk-8u41-b04-linux-x64-14_jan_2020.tar.gz解压下载的文件。你可以使用tar命令解压：tar-xzfopenjdk-8u41-b04-linux-x64-14_jan_2020.tar.gz将解压后的JDK移动到/op
实现一个完整的计算器（Java）李逍遙️
直接上代码importjava.awt.BorderLayout;importjava.awt.Color;importjava.awt.GridLayout;importjava.awt.event.ActionEvent;importjava.awt.event.ActionListener;importjavax.swing.JButton;importjavax.swing.JFrame;
java word转pdf三种方法（附有需要的jar）李逍遙️ word转pdf java
一.jacob1.jar下载jacob.jar和jacob-1.17-x64.dll下载提取码：01212.在jdk/bin目录下引入.dll文件（64位：jacob-1.17-x64.dll32位：jacob-1.17-x86.dll）3.转换代码importcom.jacob.activeX.ActiveXComponent;importcom.jacob.com.Dispatch;impor
LangChain入门：使用Python和通义千问打造免费的Qwen大模型聊天机器人南七小僧人工智能网站开发 AI技术产品经理服务器数据库 windows
前言LangChain是一个用于开发由大型语言模型（LargeLanguageModels，简称LLMs）驱动的应用程序的框架。它提供了一个灵活的框架，使得开发者可以构建具有上下文感知能力和推理能力的应用程序，这些应用程序可以利用公司的数据和APIs。这个框架由几个部分组成。LangChain库：Python和JavaScript库。包含了各种组件的接口和集成，一个基本的运行时，用于将这些组件组合
泛型擦除和TypeToken liudachu java
泛型可以让代码更加通用，但同时也可能会导致一些类型信息在运行时丢失，这就是所谓的类型擦除。Guava的TypeToken帮咱们巧妙地解决了这个问题。第1章：泛型编程的挑战先来说说泛型。在Java中，泛型是一种在编译时进行类型检查的机制。它让咱们能在类、接口、方法中使用类型参数，比如List或者Map。这样的好处是代码更安全，更易读，同时还能重用。但是，泛型也有个大问题——类型擦除。听起来有点高深，
数仓建模—Data Warebase AI 时代数据平台应当的样子不二人生数仓建模人工智能数据仓库数仓建模
DataWarebaseAI时代数据平台应当的样子引言：在这个AI技术飞速发展的时代，我们有能力更深入地发掘数据潜在的价值，而数据处理不应当成为阻碍。云原生分布式DataWarebase将开启处理数据的新范式，它让数据的使用返璞归真，不论是存储还是查询，一个系统满足业务全方位数据需求。打破复杂数据架构的束缚，大大降低数据的使用门槛，释放数据潜能，让数据涌现智能。背景近二十年大数据发展史2002年我
2025美团最新面试题—Java程序减少GC的设计程序员共鸣 java jvm 开发语言
1.对象复用与池化线程局部变量：通过ThreadLocal缓存线程私有对象，避免竞争。可变对象：优先使用可修改对象（如StringBuilder代替String拼接）。2.减少对象创建避免隐式装箱：使用基本类型（int而非Integer）。优化循环：避免在循环内创建临时对象。静态不可变对象：将常量声明为staticfinal（如配置参数）。3.数据结构优化预分配容量：初始化集合时指定合理大小（如A
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少