低调的小哥哥

Maxwell数据库数据采集-大数据week12-DAY1-Maxwell

文章目录

前言
Maxwell 数据库数据实时采集
- 1、Maxwell 简介
- 2、Mysql Binlog介绍
- - 2.1 Binlog 简介
  - 2.2 Binlog 的日志格式
- 3、Mysql 实时数据同步方案对比
- 4、开启Mysql的Binlog
- 5、Maxwell安装部署
- 6、kafka介绍和使用
- - 6.1 Kafka简介
  - 6.2 Kafka特性
  - 6.3 Kafka集群架构
  - 6.4 Kafka集群安装部署
  - 6.5 kafka集群启动和停止
  - 6.6 kafka命令行的管理使用
- 7、Maxwell实时采集mysql表数据到kafka
总结

前言

Maxwell 数据库数据实时采集

1、Maxwell 简介

Maxwell 是一个能实时读取 MySQL 二进制日志文件binlog，并生成 Json格式的消息，作为生产者发送给 Kafka，Kinesis、RabbitMQ、Redis、Google Cloud Pub/Sub、文件或其它平台的应用程序。它的常见应用场景有ETL、维护缓存、收集表级别的dml指标、增量到搜索引擎、数据分区迁移、切库binlog回滚方案等。
- 官网(http://maxwells-daemon.io)
- GitHub(https://github.com/zendesk/maxwell)
Maxwell主要提供了下列功能
- 1. 支持SELECT * FROM table的方式进行全量数据初始化。
- 1. 支持在主库发生failover后，自动恢复binlog位置，实现断点续传。
- 1. 可以对数据进行分区，解决数据倾斜问题，发送到Kafka的数据支持库、表、列等级别的数据分区。
- 1. 工作方式是伪装为slave接收binlog events，然后根据schema信息拼装，可以接受ddl、xid、row等event。

2、Mysql Binlog介绍

2.1 Binlog 简介

MySQL中一般有以下几种日志

日志类型	写入日志的信息
错误日志	记录在启动，运行或停止mysqld时遇到的问题
通用查询日志	记录建立的客户端连接和执行的语句
二进制日志 binlog	记录更改数据的语句
中继日志	从服务器复制主服务器接收的数据更改
慢查询日志	记录所有执行时间超过 `long_query_time` 秒的所有查询或不使用索引的查询
DDL日志（元数据日志）	元数据操作由DDL语句执行

在默认情况下，系统仅仅打开错误日志，关闭了其他所有日志，以达到尽可能减少IO损耗提高系统性能的目的，但是在一般稍微重要一点的实际应用场景中，都至少需要打开二进制日志，因为这是MySQL很多存储引擎进行增量备份的基础，也是MySQL实现复制的基本条件
接下来主要介绍二进制日志 binlog。
- MySQL 的二进制日志 binlog 可以说是 MySQL 最重要的日志，它记录了所有的 DDL 和 DML 语句（除了数据查询语句select、show等），以事件形式记录，还包含语句所执行的消耗的时间，MySQL的二进制日志是事务安全型的。binlog 的主要目的是复制和恢复。
Binlog日志的两个最重要的使用场景
- MySQL主从复制
  - MySQL Replication在Master端开启binlog，Master把它的二进制日志传递给slaves来达到master-slave数据一致的目的。
- 数据恢复
  - 通过使用 mysqlbinlog工具来使恢复数据。

2.2 Binlog 的日志格式

记录在二进制日志中的事件的格式取决于二进制记录格式。支持三种格式类型：
- Statement：基于SQL语句的复制（statement-based replication, SBR）
- Row：基于行的复制（row-based replication, RBR）
- Mixed：混合模式复制（mixed-based replication, MBR）
Statement
- 每一条会修改数据的sql都会记录在binlog中。
- 优点
  - 不需要记录每一行的变化，减少了binlog日志量，节约了IO, 提高了性能。
- 缺点
  - 在进行数据同步的过程中有可能出现数据不一致。
  - 比如 update tt set create_date=now()，如果用binlog日志进行恢复，由于执行时间不同可能产生的数据就不同。
Row
- 它不记录sql语句上下文相关信息，仅保存哪条记录被修改。
- 优点
  - 保持数据的绝对一致性。因为不管sql是什么，引用了什么函数，它只记录执行后的效果。
- 缺点
  - 每行数据的修改都会记录，最明显的就是update语句，导致更新多少条数据就会产生多少事件，占用较大空间。
Mixed
- 从5.1.8版本开始，MySQL提供了Mixed格式，实际上就是Statement与Row的结合。
- 在Mixed模式下，一般的复制使用Statement模式保存binlog，对于Statement模式无法复制的操作使用Row模式保存binlog， MySQL会根据执行的SQL语句选择日志保存方式（因为statement只有sql，没有数据，无法获取原始的变更日志，所以一般建议为Row模式)。
- 优点
  - 节省空间，同时兼顾了一定的一致性。
- 缺点
  - 还有些极个别情况依旧会造成不一致，另外statement和mixed对于需要对binlog的监控的情况都不方便。

3、Mysql 实时数据同步方案对比

mysql 数据实时同步可以通过解析mysql的 binlog 的方式来实现，解析binlog可以有多种方式，可以通过canal，或者maxwell等各种方式实现。以下是各种抽取方式的对比介绍。

其中canal由 Java开发，分为服务端和客户端，拥有众多的衍生应用，性能稳定，功能强大；canal 需要自己编写客户端来消费canal解析到的数据。
Maxwell相对于canal的优势是使用简单，Maxwell比Canal更加轻量级，它直接将数据变更输出为json字符串，不需要再编写客户端。对于缺乏基础建设，短时间内需要快速迭代的项目和公司比较合适。
另外Maxwell 有一个亮点功能，就是Canal只能抓取最新数据，对已存在的历史数据没有办法处理。而Maxwell有一个bootstrap功能，可以直接引导出完整的历史数据用于初始化，非常好用。

4、开启Mysql的Binlog

1、服务器当中安装mysql（省略）
- 注意：mysql的版本尽量不要太低，也不要太高，最好使用5.6及以上版本。

2、添加mysql普通用户maxwell

为mysql添加一个普通用户maxwell，因为maxwell这个软件默认用户使用的是maxwell这个用户。
进入mysql客户端，然后执行以下命令，进行授权
```
mysql -uroot -p123456
```

执行sql语句

--校验级别最低，只校验密码长度
mysql> set global validate_password_policy=LOW;
mysql> set global validate_password_length=6;

--创建maxwell库（启动时候会自动创建，不需手动创建）和用户
mysql> CREATE USER 'maxwell'@'%' IDENTIFIED BY '123456';
mysql> GRANT ALL ON maxwell.* TO 'maxwell'@'%';
mysql> GRANT SELECT, REPLICATION CLIENT, REPLICATION SLAVE on *.* to 'maxwell'@'%'; 
--刷新权限
mysql> flush privileges;

3、修改配置文件 /etc/my.cnf

执行命令 sudo vim /etc/my.cnf, 添加或修改以下三行配置

#binlog日志名称前缀
log-bin= /var/lib/mysql/mysql-bin

#binlog日志格式
binlog-format=ROW

#唯一标识，这个值的区间是：1到(2^32)-1
server_id=1

4、重启mysql服务
- 执行如下命令
```
sudo service mysqld restart
```
5、验证binlog是否配置成功
- 进入mysql客户端，并执行以下命令进行验证
```
mysql -uroot -p123456
mysql> show variables like '%log_bin%';
```

6、查看binlog日志文件生成
- 进入 /var/lib/mysql 目录，查看binlog日志文件.

5、Maxwell安装部署

1、下载对应版本的安装包
- 地址：https://github.com/zendesk/maxwell/releases/download/v1.21.1/maxwell-1.21.1.tar.gz
- 安装包名称：maxwell-1.21.1.tar.gz
2、上传服务器

3、解压安装包到指定目录

 tar -zxvf maxwell-1.21.1.tar.gz -C /kkb/install/

4、修改maxwell配置文件

进入到安装目录 /kkb/install/maxwell-1.21.1 进行如下操作

cd /kkb/install/maxwell-1.21.1 
cp config.properties.example config.properties
vim config.properties

配置文件config.properties 内容如下：

# choose where to produce data to
producer=kafka
# list of kafka brokers
kafka.bootstrap.servers=node01:9092,node02:9092,node03:9092
# mysql login info
host=node03
port=3306
user=maxwell
password=123456
# kafka topic to write to
kafka_topic=maxwell

注意：一定要保证使用maxwell 用户和 123456 密码能够连接上mysql数据库。

6、kafka介绍和使用

6.1 Kafka简介

Kafka是最初由Linkedin公司开发，它是一个分布式、可分区、多副本，基于zookeeper协调的分布式日志系统；常见可以用于web/nginx日志、访问日志，消息服务等等。Linkedin于2010年贡献给了Apache基金会并成为顶级开源项目。主要应用场景是：日志收集系统和消息系统。

Kafka是一个分布式消息队列。具有高性能、持久化、多副本备份、横向扩展能力。生产者往队列里写消息，消费者从队列里取消息进行业务逻辑。Kafka就是一种发布-订阅模式。将消息保存在磁盘中，以顺序读写方式访问磁盘，避免随机读写导致性能瓶颈。

消息（Message）
- 是指在应用之间传送的数据，消息可以非常简单，比如只包含文本字符串，也可以更复杂，可能包含嵌入对象。
消息队列（Message Queue）
- 一种应用间的通信方式，消息发送后可以立即返回，通过消息系统来确保信息的可靠传递，消息发布者只管把消息发布到MQ中而不管谁来取，消息使用者只管从MQ中取消息而不管谁发布的，这样发布者和使用者都不用知道对方的存在。

6.2 Kafka特性

高吞吐、低延迟

kafka 最大的特点就是收发消息非常快，kafka 每秒可以处理几十万条消息，它的最低延迟只有几毫秒。

高伸缩性

 每个主题(topic) 包含多个分区(partition)，主题中的分区可以分布在不同的主机(broker)中。

持久性、可靠性

Kafka 能够允许数据的持久化存储，消息被持久化到磁盘，并支持数据备份防止数据丢失。

容错性

 允许集群中的节点失败，某个节点宕机，Kafka 集群能够正常工作。

高并发

支持数千个客户端同时读写。

6.3 Kafka集群架构

producer

 消息生产者，发布消息到Kafka集群的终端或服务。

broker

Kafka集群中包含的服务器，一个borker就表示kafka集群中的一个节点。

topic

每条发布到Kafka集群的消息属于的类别，即Kafka是面向 topic 的。更通俗的说Topic就像一个消息队列，生产者可以向其写入消息，消费者可以从中读取消息，一个Topic支持多个生产者或消费者同时订阅它，所以其扩展性很好。

partition

每个 topic 包含一个或多个partition。Kafka分配的单位是partition。

replica

partition的副本，保障 partition 的高可用。

consumer

从Kafka集群中消费消息的终端或服务。

consumer group

每个 consumer 都属于一个 consumer group，每条消息只能被 consumer group 中的一个 Consumer 消费，但可以被多个 consumer group 消费。

leader

每个partition有多个副本，其中有且仅有一个作为Leader，Leader是当前负责数据的读写的partition。 producer 和 consumer 只跟 leader 交互。

follower

Follower跟随Leader，所有写请求都通过Leader路由，数据变更会广播给所有Follower，Follower与Leader保持数据同步。如果Leader失效，则从Follower中选举出一个新的Leader。

controller

	知道大家有没有思考过一个问题，就是Kafka集群中某个broker宕机之后，是谁负责感知到他的宕机，以及负责进行Leader Partition的选举？如果你在Kafka集群里新加入了一些机器，此时谁来负责把集群里的数据进行负载均衡的迁移？包括你的Kafka集群的各种元数据，比如说每台机器上有哪些partition，谁是leader，谁是follower，是谁来管理的？如果你要删除一个topic，那么背后的各种partition如何删除，是谁来控制？还有就是比如Kafka集群扩容加入一个新的broker，是谁负责监听这个broker的加入？如果某个broker崩溃了，是谁负责监听这个broker崩溃？这里就需要一个Kafka集群的总控组件，Controller。他负责管理整个Kafka集群范围内的各种东西。

zookeeper

(1)	Kafka 通过 zookeeper 来存储集群的meta元数据信息。
(2)一旦controller所在broker宕机了，此时临时节点消失，集群里其他broker会一直监听这个临时节点，发现临时节点消失了，就争抢再次创建临时节点，保证有一台新的broker会成为controller角色。

offset

偏移量

消费者在对应分区上已经消费的消息数（位置），offset保存的地方跟kafka版本有一定的关系。
kafka0.8 版本之前offset保存在zookeeper上。
kafka0.8 版本之后offset保存在kafka集群上。
	它是把消费者消费topic的位置通过kafka集群内部有一个默认的topic，
	名称叫 __consumer_offsets，它默认有50个分区。

6.4 Kafka集群安装部署

1、下载安装包（http://kafka.apache.org）
- https://archive.apache.org/dist/kafka/1.1.0/kafka_2.11-1.1.0.tgz
```
kafka_2.11-1.1.0.tgz
```
2、规划安装目录
```
/kkb/install
```

3、上传安装包到服务器中

通过FTP工具上传安装包到node01服务器上

4、解压安装包到指定规划目录

tar -zxvf kafka_2.11-1.1.0.tgz -C /kkb/install

5、重命名解压目录
```
mv kafka_2.11-1.1.0 kafka
```

6、修改配置文件

在node01上修改

进入到kafka安装目录下有一个config目录

vi server.properties

#指定kafka对应的broker id ，唯一
broker.id=0
#指定数据存放的目录
log.dirs=/kkb/install/kafka/kafka-logs
#指定zk地址
zookeeper.connect=node01:2181,node02:2181,node03:2181
#指定是否可以删除topic ,默认是false 表示不可以删除
delete.topic.enable=true
#指定broker主机名
host.name=node01

配置kafka环境变量

sudo vi /etc/profile

export KAFKA_HOME=/kkb/install/kafka
export PATH=$PATH:$KAFKA_HOME/bin

6、分发kafka安装目录到其他节点

scp -r kafka node02:/kkb/install
scp -r kafka node03:/kkb/install
scp /etc/profile node02:/etc
scp /etc/profile node03:/etc

7、修改node02和node03上的配置

node02

vi server.properties

#指定kafka对应的broker id ，唯一
broker.id=1
#指定数据存放的目录
log.dirs=/kkb/install/kafka/kafka-logs
#指定zk地址
zookeeper.connect=node01:2181,node02:2181,node03:2181
#指定是否可以删除topic ,默认是false 表示不可以删除
delete.topic.enable=true
#指定broker主机名
host.name=node02

node03

vi server.properties

#指定kafka对应的broker id ，唯一
broker.id=2
#指定数据存放的目录
log.dirs=/kkb/install/kafka/kafka-logs
#指定zk地址
zookeeper.connect=node01:2181,node02:2181,node03:2181
#指定是否可以删除topic ,默认是false 表示不可以删除
delete.topic.enable=true
#指定broker主机名
host.name=node03

8、让每台节点的kafka环境变量生效
- 在每台服务器执行命令
```
source /etc/profile
```

6.5 kafka集群启动和停止

1、启动kafka集群

先启动zookeeper集群，然后在所有节点如下执行脚本

nohup kafka-server-start.sh /kkb/install/kafka/config/server.properties >/dev/null 2>&1 &

2、停止kafka集群
- 所有节点执行关闭kafka脚本
```
kafka-server-stop.sh
```

6.6 kafka命令行的管理使用

1、创建topic

使用 kafka-topics.sh脚本

kafka-topics.sh --create --partitions 3 --replication-factor 2 --topic test --zookeeper node01:2181,node02:2181,node03:2181

2、查询所有的topic

使用 kafka-topics.sh脚本

kafka-topics.sh --list --zookeeper node01:2181,node02:2181,node03:2181

3、查看topic的描述信息

使用 kafka-topics.sh脚本

kafka-topics.sh --describe --topic test --zookeeper node01:2181,node02:2181,node03:2181

4、删除topic

使用 kafka-topics.sh脚本

kafka-topics.sh --delete --topic test --zookeeper node01:2181,node02:2181,node03:2181

5、模拟生产者写入数据到topic中

使用 kafka-console-producer.sh 脚本

kafka-console-producer.sh --broker-list node01:9092,node02:9092,node03:9092 --topic test

6、模拟消费者拉取topic中的数据

使用 kafka-console-consumer.sh 脚本

kafka-console-consumer.sh --zookeeper node01:2181,node02:2181,node03:2181 --topic test --from-beginning

或者

kafka-console-consumer.sh --bootstrap-server node01:9092,node02:9092,node03:9092 --topic test --from-beginning

7、Maxwell实时采集mysql表数据到kafka

1、启动kafka集群和zookeeper集群

启动zookeeper集群

#每台节点执行脚本
nohup zkServer.sh start >/dev/null  2>&1 &

启动kafka集群

nohup /kkb/install/kafka/bin/kafka-server-start.sh /kkb/install/kafka/co
nfig/server.properties > /dev/null 2>&1 &

2、创建topic

kafka-topics.sh --create --topic maxwell --partitions 3 --replication-factor 2 --zookeeper node01:2181,node02:2181,node03:2181

3、启动maxwell服务

/kkb/install/maxwell-1.21.1/bin/maxwell

4、插入数据并进行测试

向mysql表中插入一条数据，并开启kafka的消费者，查看kafka是否能够接收到数据。

向mysql当中创建数据库和数据库表并插入数据

CREATE DATABASE /*!32312 IF NOT EXISTS*/`test_db` /*!40100 DEFAULT CHARACTER SET utf8 */;

USE `test_db`;

/*Table structure for table `user` */

DROP TABLE IF EXISTS `user`;

CREATE TABLE `user` (
  `id` varchar(10) NOT NULL,
  `name` varchar(10) DEFAULT NULL,
  `age` int(11) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

/*Data for the table `user` */
#插入数据
insert  into `user`(`id`,`name`,`age`) values  ('1','xiaokai',20);
#修改数据
update `user` set age= 30 where id='1';
#删除数据
delete from `user` where id='1';

5、启动kafka的自带控制台消费者

测试maxwell主题是否有数据进入

kafka-console-consumer.sh --topic maxwell --bootstrap-server node01:9092,node02:9092,node03:9092 --from-beginning

观察输出结果

{"database":"test_db","table":"user","type":"insert","ts":1621244407,"xid":985,"commit":true,"data":{"id":"1","name":"xiaokai","age":20}}

{"database":"test_db","table":"user","type":"update","ts":1621244413,"xid":999,"commit":true,"data":{"id":"1","name":"xiaokai","age":30},"old":{"age":20}}

{"database":"test_db","table":"user","type":"delete","ts":1621244419,"xid":1013,"commit":true,"data":{"id":"1","name":"xiaokai","age":30}}

json数据字段说明
- database
  - 数据库名称
- table
  - 表名称
- type
  - 操作类型
  - 包括 insert/update/delete 等
- ts
  - 操作时间戳
- xid
  - 事务id
- commit
  - 同一个xid代表同一个事务，事务的最后一条语句会有commit
- data
  - 最新的数据，修改后的数据
- old
  - 旧数据，修改前的数据

总结

你可能感兴趣的:(Java大数据)

final 到底有啥用？99% 的开发者可能只知道一半！软件求生 #工作建议运维数据库 java 架构微服务
小伙伴们，你有过这样的经历吗？早晨喝了一杯奶茶，兴致勃勃地去面试，面试官却冷不丁地问了一句：“final在Java中有什么作用？”我的天哪！我当时脑子一片空白，只能挤出一句：“用来修饰变量吧。”看着面试官点了点头，但眉头却微微一皱，我就知道，完了……不怕！今天咱们就从头到尾，搞清楚final的所有用途，让你下次遇到这个问题，自信到能现场开课！什么是final？简单来说，final是Java中的一个
如何处理selenium Webdriver中的文本框？知识的宝藏 Selenium基础篇 selenium 前端 python
文本框或字段在整个网页中广泛使用，本文将介绍如何在Java中使用SeleniumWebdriver处理文本框。可以有各种文本字段，我们将尝试包括其中的大多数，并执行各种操作，如清除和输入文本。我们将使用我们的Selenium游乐场网站-testkru，与各种文本框进行交互。您也可以使用同一个网站来执行任何所需的操作。下面是文本框的屏幕截图;我们将使用其中的一些来执行文本框上的各种操作。我们来看看下
selenium clear（）方法清除文本框内容 Change is good selenium python 测试工具
在使用Selenium进行Web自动化测试时，清除文本框内容是一个常见的需求。这可以通过多种方式实现，取决于你使用的是哪种编程语言（如Python、Java等）以及你的具体需求。以下是一些常见的方法：1.使用clear()方法clear()方法是Selenium提供的一个非常直接的方法来清除文本框的内容。这个方法会删除文本框中的所有内容，并将其设置为空字符串。python：fromselenium
【附源码】Java计算机毕业设计小说阅读网站（程序+LW+部署）一念计算机毕设源码程序 java 课程设计 mysql
项目运行环境配置：Jdk1.8+Tomcat7.0+Mysql+HBuilderX（Webstorm也行）+Eclispe（IntelliJIDEA,Eclispe,MyEclispe,Sts都支持）。项目技术：java+mybatis+Maven等等组成，B/S模式+Maven管理等等。环境需要1.运行环境：最好是javajdk1.8，我们在这个平台上运行的。其他版本理论上也可以。2.IDE环境
python 分布式集群_Python搭建Spark分布式集群环境小国阁下 python 分布式集群
前言ApacheSpark是一个新兴的大数据处理通用引擎，提供了分布式的内存抽象。Spark最大的特点就是快，可比HadoopMapReduce的处理速度快100倍。本文没有使用一台电脑上构建多个虚拟机的方法来模拟集群，而是使用三台电脑来搭建一个小型分布式集群环境安装。本教程采用Spark2.0以上版本(比如Spark2.0.2、Spark2.1.0等)搭建集群，同样适用于搭建Spark1.6.2
高级java每日一道面试题-2025年01月24日-框架篇[SpringBoot篇]-如何理解 Spring Boot 中的 Starters(启动器) ? java我跟你拼了 java每日一道面试题 java spring boot 简化依赖管理自动配置加快开发速度自动管理依赖项简化外部化配置
如果有遗漏,评论区告诉我进行补充面试官:如何理解SpringBoot中的Starters(启动器)?我回答:一、Starters的定义与作用1.定义Starters是SpringBoot中的一组预定义依赖关系，这些依赖被封装在一个单一的包中。它们简化了Maven或Gradle配置文件中的依赖项声明，并自动配置和管理相关依赖项。2.作用简化依赖管理：通过引入一个starter，可以自动引入所有必要的
华为OD机试D卷 --矩阵匹配--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od 矩阵 python javascript java c++c语言
文章目录题目描述输入描述输出描述用例题目解析java源码js源码python源码c源码c++源码题目描述从一个N*M（N≤M）的矩阵中选出N个数，任意两个数字不能在同一行或同一列，求选出来的N个数中第K大的数字的最小值是多少。输入描述输入矩阵要求：1≤K≤N≤M≤150输入格式：NMKN*M矩阵输出描述N*M的矩阵中可以选出M!/N!种组合数组，每个组合数组种第K大的数中的最小值。无需考虑重复数字
python对接rocketmq i_nekohuang python rocketmq
背景有对接java系统监听其相关资源同步新增的需求，该java系统使用了rocketmq。前置说明1、目前Python客户端仅支持Linux和macOS操作系统，暂不支持Windows系统2、rocketmq-client-python基于rocketmq-client-cpp进行包装，因此需要先编译出librocketmq.so3、文档中相关源码包和依赖包版本和github中README.md有
go语言中的defer，panic和recover code_feien golang
go语言中的panic和recover基本概念deferpanicrecover使用场景基本概念defer介绍：defer主要用来注册多个延迟调用，这些调用以先进后出的顺序在函数返回前被执行。有点类似于java中的finaly语句。defer常用于保证一些资源最终能够得到回收和释放。使用：defer函数的实参在注册的时候通过值拷贝传递进去。例如下面的代码，实参a的值在defer注册的时候通过值拷贝
Java——String类常见方法_string[] a 判断长度 2501_90223240 java 开发语言
字符串数组本质因为String属于引用类型，所以str内存储的并不是字符串内容本身。我们进入String源码可以看到str数组内部存储的是对象的地址，字符串内容其实是存在**字符数组value[]**中的：调试起来看：这是它的简化内存布局图：字符串长度求字符串长度返回值：字符串或数组长度Stringstr1="hello";System.out.println(str1.length());判断字
Spring Boot与MongoDB集成指南行动π技术博客 spring boot mongodb 后端
1.引言在当今快速发展的软件开发领域，选择合适的技术栈对于构建高效、可扩展的应用程序至关重要。随着微服务架构和云原生应用的兴起，开发人员需要更灵活、更快速的解决方案来满足不断变化的业务需求。SpringBoot和MongoDB的结合正是这一需求的完美答案。1.1为什么选择SpringBoot和MongoDB？SpringBoot是一个开源的Java框架，它基于Spring框架，提供了快速开发和简化
814. 二叉树剪枝（JavaScript）进击的桐人 leetcode 中等题 medium javascript LeetCode JavaScript Binary Tree Pruning
给定二叉树根结点root，此外树的每个结点的值要么是0，要么是1。返回移除了所有不包含1的子树的原二叉树。(节点X的子树为X本身，以及所有X的后代。)示例1:输入:[1,null,0,0,1]输出:[1,null,0,null,1]解释:只有红色节点满足条件“所有不包含1的子树”。右图为返回的答案。示例2:输入:[1,0,1,0,0,0,1]输出:[1,null,1,null,1]示例3:输入:[
java ffmpeg(Windows/Linux)截取视频做封面 Mr.菜园子 JAVA ffmpeg java ffmpeg java ffmpeg windows(Linux)
一、Windows版本1、下载前往FFmpeg官网http://ffmpeg.org/download.html下载Windows版本FFmpeg（我下载ffmpeg-4.0-win64-shared）2、解压下载后解压到本地（我的解压目录D:\wedive_file\ffmpeg）二、Linux版本1、下载前往FFmpeg官网http://ffmpeg.org/download.html下载Li
Java 15中的密封类：探索与实践 t0_54manong java 开发语言个人开发
在Java15中，密封类（SealedClasses）作为一个新的预览特性被引入，它为类和接口的继承与实现提供了一种更为精细的控制方式。本文将通过实例详细探讨密封类的使用方法、与final类的区别，以及其适用场景。一、什么是密封类？密封类允许类或接口控制哪些类可以实现或继承它。这与传统的final类不同，final类完全禁止继承，而密封类则提供了一种更灵活的方式，允许开发者显式指定哪些类可以继承它
Spring Cloud和SpringBoot版本对应关系？思维导图代码示例（java 架构) 用心去追梦 java spring cloud spring boot
SpringCloud和SpringBoot的版本之间存在一定的对应关系，因为SpringCloud依赖于SpringBoot提供的基础功能。通常情况下，每个主要版本的SpringCloud都是与特定版本范围的SpringBoot兼容的。以下是截至2024年12月的最新版本信息和一个简化的关系图。SpringCloud和SpringBoot版本对应关系简化的关系图SpringEcosystemVe
数仓ETL测试星月情缘02 etl 数据仓库
提取，转换和加载有助于组织使数据在不同的数据系统中可访问，有意义且可用。ETL工具是用于提取，转换和加载数据的软件。在当今数据驱动的世界中，无论大小如何，都会从各种组织，机器和小工具中生成大量数据。在传统的编程方式中，ETL都提取并进行一些转换操作，然后将转换后的数据加载到目标数据库文件等。为此，需要用任何编程语言编写代码，如Java，C#，C++等。为了避免更多编码和使用库，将通过拖放组件来减少
RESTful API：概念、实际场景应用及在 Java 和 C# 中的实现太阳 restful java c#
RESTfulAPI：概念、实际场景应用及在Java和C#中的实现一、什么是RESTfulAPI**RESTfulAPI（RepresentationalStateTransferAPI）**即符合REST（RepresentationalStateTransfer，表述性状态转移）架构风格的应用程序编程接口。它是一种基于HTTP协议的软件架构风格，用于设计网络应用程序。（一）主要特点资源导向：将
python中cv是什么_python里面cv是什么意思 weixin_39639568 python中cv是什么
OpenCV(OpenSourceComputerVisionLibrary)开放源代码计算机视觉库，主要算法涉及图像处理、计算机视觉和机器学习相关方法。OpenCV其实就是一堆C和C++语言的源代码文件，这些源代码文件中实现了许多常用的计算机视觉算法。OpenCV由一系列C函数和C++类构成，它有C，C++，Python和java接口，当前SDK(SoftwareDevelopmentKit软件
基于Python+Spark的气象天气分析大屏可视化系统设计与实现毕设源码 sj52abcd python spark 课程设计毕业设计
博主介绍：✌专注于VUE,小程序，安卓，Java,python,物联网专业，有17年开发经验，长年从事毕业指导，项目实战✌选取一个适合的毕业设计题目很重要。✌关注✌私信我✌具体的问题，我会尽力帮助你。研究的背景:随着我国气象事业的发展，气象数据的实时分析和可视化成为越来越重要的任务。然而，目前气象数据的分析与展示手段仍然较为传统，缺乏交互性，不能满足现代气象业务的需求。因此，研究一种基于Pytho
【硬刚大数据】2021年从零到大数据专家之Hbase八股文王知无(import_bigdata)
欢迎关注博客主页：https://blog.csdn.net/u013411339欢迎点赞、收藏、留言，欢迎留言交流！本文由【王知无】原创，首发于CSDN博客！本文首发CSDN论坛，未经过官方和本人允许，严禁转载！本文是对《【硬刚大数据之学习路线篇】2021年从零到大数据专家的学习指南(全面升级版)》的面试部分补充。硬刚大数据系列文章链接：2021年从零到大数据专家的学习指南(全面升级版)
史上最强！Spring Boot 3.3 高效批量插入万级数据的多种方案 m0_74825074 面试学习路线阿里巴巴 spring boot 后端 java
SpringBoot3.3多种方式实现高效批量插入万级数据，史上最强！在大数据处理场景下，如何高效地将大量数据插入数据库是一个重要课题。本文基于SpringBoot3.3及MyBatis-Plus，介绍几种高效的批量插入数据的方法，包括：使用JDBC批处理使用自定义SQL批处理单条插入（for循环）拼接SQL语句插入MyBatis-Plus的saveBatch方法循环插入+开启批处理模式每种方式都
Java框架介绍:Quartz从入门到进阶(图) hdy007 Java quartz 框架 java 作业存储 struts
你曾经需要应用执行一个任务吗？这个任务每天或每周星期二晚上11：30，或许仅仅每个月的最后一天执行。一个自动执行而无须干预的任务在执行过程中如果发生一个严重错误，应用能够知到其执行失败并尝试重新执行吗？你和你的团队是用java编程吗？如果这些问题中任何一个你回答是，那么你应该使用Quartz调度器。旁注：Matrix目前就大量使用到了Quartz。比如，排名统计功能的实现，在Jmatrix里通过Q
PHP代码免费加密平台：保护你的代码安全网友阿贵 PHP php
PHP代码免费加密平台：保护你的代码安全引言在开发过程中，保护源代码的安全性是非常重要的。PHP作为一种广泛使用的服务器端脚本语言，其代码的安全性尤为重要。为了帮助开发者更好地保护自己的代码，我们推出了PHP代码免费加密平台（php.javait.cn）。本文将详细介绍该平台的功能和使用方法。平台简介1.平台功能PHP代码免费加密平台提供了以下主要功能：PHP混淆加密：无需安装组件运行，兼容主流P
Selenium 浏览器操作与使用技巧——详细解析（Java版） Future_yzx selenium java 测试工具
目录一、浏览器及窗口操作二、键盘与鼠标操作三、勾选复选框四、多层框架/窗口定位五、操作下拉框六、上传文件操作七、处理弹窗与alert八、处理动态元素九、使用Selenium进行网站监控前言Selenium是一款非常强大的Web自动化测试工具，能够帮助开发者与测试人员进行浏览器的自动化操作。通过Selenium，您不仅可以进行传统的自动化测试，还可以实现网站监控、动态元素处理、用户交互等高级功能。本
Quartz 架构和单体应用介绍小马不敲代码 SpringBoot 架构定时任务
一、摘要Quartz架构介绍SpringBootQuartz应用整合二、关于QuartzQuartz是OpenSymphony开源组织在Jobscheduling领域开源的一个作业调度框架项目，完全由Java编写，主要是为了实现在Java应用程序中进行作业调度并提供了简单却强大的机制！Quartz不仅可以单独使用，还可以与J2EE与J2SE应用程序相结合使用！同时，Quartz允许程序开发人员根据
多租户架构未提供足够的租户安全培训和教育图幻未来网络安全
多租户架构下租户安全培训与教育的需求分析与解决方案引言随着云计算和大数据技术的飞速发展，多租户架构已成为企业数字化转型的重要基石。多租户架构允许一个应用程序实例为多个租户提供服务，从而降低了企业的运营成本。然而，这种架构也带来了一系列的安全挑战。为了解决这些问题，企业需要加强对租户的安全培训和教育，确保租户了解如何在使用多租户架构时保护自己的数据和应用程序。本文将探讨多租户架构下的租户安全培训和教
3步搞定：java分布式WebSocket与消息队列的奇妙邂逅？墨瑾轩一起学学Java【一】分布式 websocket 网络协议 java
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣嘿，亲爱的开发者们！今天我们要聊的是那个让分布式系统心跳加速的热门话题——如何用消息队列轻松实现分布式WebSocket。别急，我会一步步带你走进这个奇妙的世界，让你轻松掌握这门技艺。准备好了吗？让我们开始这场技术盛宴吧！引言在这个信息爆炸的时代，WebSoc
JAVA开源免费项目基于Vue和SpringBoot的医院后台管理系统（附源码）胡晗靓 java vue.js spring boot 开源前端开发语言
本文项目编号T170，文末自助获取源码\color{red}{T170，文末自助获取源码}T170，文末自助获取源码目录一、系统介绍二、数据库设计三、配套教程3.1启动教程3.2讲解视频3.3二次开发教程四、功能截图五、文案资料5.1选题背景5.2国内外研究现状六、核心代码6.1查询数据6.2新增数据6.3删除数据一、系统介绍在管理员功能模块确定下来的基础上，对管理员各个功能进行设计，确定管理员功
一文了解大数据概论程序员
一.大数据概论1.1大数据概念大数据（bigdata）：指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。主要解决，海量数据的存储和海量数据的分析计算问题。按顺序给出数据存储单位：bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。1Byte=8bit
Photoshop脚本编程简介清枫草塘 UI设计 photoshop 脚本编程
自动化对每个设计师的工作来说是很有用的。它可以在重复的任务上节省宝贵的时间，还能够帮我们更快捷、更容易的解决一系列问题。你可以使用photoshop的动作来使工作流程自动化，这是很流行的，大多数人都知道并且已经在使用的方法。今天，我们将介绍给你一种高级的自动化技巧：脚本语言。所有的这一切仅仅需要你有一点点关于JavaScript的基本知识，这对于我们中的一些网页设计师往往都是具备的。我很多年前就知
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb