seaskyccl

Elasticsearch（ELK）集群环境部署

一、概述

ELK 是一个由三个开源软件工具组成的数据处理和可视化平台，包括 Elasticsearch、Logstash 和 Kibana。这些工具都是由 Elastic 公司创建和维护的。

Elasticsearch 是一个分布式的搜索和分析引擎，可以将大量数据存储在一个或多个节点上，支持实时搜索、分析和聚合，提供高性能的全文搜索、复杂查询和分析能力。
Logstash 是一个数据采集和处理工具，可以将来自各种数据源的日志数据收集、转换、过滤和存储到 Elasticsearch 中，从而实现对数据的集中管理和分析。
Kibana 是一个数据可视化和分析平台，可以使用其可视化界面来创建仪表盘、图表、地图和警报，对 Elasticsearch 中的数据进行交互式分析和可视化展示。

ELK 平台结合了这三个工具的功能，提供了一个完整的解决方案，能够满足各种数据处理和分析的需求。ELK 平台被广泛应用于日志分析、安全监控、业务分析等领域。

二、准备

1）机器环境准备

　　我们准备3台机器，并都装好JDK且设置好hostname。

192.168.182.132node-1192.168.182.133node-2192.168.182.134node-3

2）创建elsearch用户

（Linux 下不要使用 root 用户运行 Elasticsearch, 否则会报异常 can not run elasticsearch as root）

# 创建用户组

groupadd elsearch

# 创建用户，-p : 登录密码

useradd elsearch -g elsearch -p elsearch

三、elasticsearch 部署

1）下载并安装

官网下载：https://www.elastic.co/cn/downloads/elasticsearch

# 下载

wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.4.2-linux-x86_64.tar.gz

# 解压

tar zxvf elasticsearch-7.4.2-linux-x86_64.tar.gz && cd elasticsearch-7.4.2/

# 切换用户组:所有者，跟上面创建的用户相对应

chown -R elsearch:elsearch .

2）修改配置文件以支持集群

1.注意修改network.host为各节点IP地址

2.注意修改discovery.zen.ping.unicast.hosts列表

备份：

cp -a config/elasticsearch.yml config/elasticsearch.yml.bak

配置：

cat <>/etc/elasticsearch/elasticsearch.yml

## 集群名称

cluster.name: my-cs-cluster

## 节点名称（每个节点名称不能相同）

node.name: 'node-1'

## 允许 JVM 锁住内存，禁止操作系统交换出去

# bootstrap.memory_lock: true

## 是否有资格成为主节点

## 通过 node.master 可以配置该节点是否有资格成为主节点，如果配置为 true，则主机有资格成为主节点

## 注意这里是有资格成为主节点，不是一定会成为主节点

node.master: true

## 是否是数据节点

## 当 node.master 和 node.data 均为 false，则该主机会作为负载均衡节点

node.data: true

## 设置访问的地址和端口

network.host: 192.168.182.132

http.port: 9200

## 集群地址设置

## 配置之后集群的主机之间可以自动发现

discovery.zen.ping.unicast.hosts: ["192.168.182.132", "192.168.182.133", "192.168.182.134"]

# 参数设置一系列符合主节点条件的节点的主机名或 IP 地址来引导启动集群。手动指定可以成为 mater 的所有节点的 name 或者 ip，这些配置将会在第一次选举中进行计算

# cluster.initial_master_nodes: ["node-1"]

# 配置集群的主机地址，配置之后集群的主机之间可以自动发现（可选项）

# discovery.seed_hosts: ["192.168.182.132:9300","192.168.182.133:9300","192.168.182.134:9300"]

# 配置初始化集群的master节点，node.name的值

# cluster.initial_master_nodes: ["node-1"]

## 配置大多数节点（通常为主节点的节点总数/ 2 + 1）来防止“裂脑”：

discovery.zen.minimum_master_nodes: 2

## 在完全集群重启后阻止初始恢复，直到启动N个节点

gateway.recover_after_nodes: 2

# 外网访问设置

http.cors.enabled: true# 注意：*最好加上引号，要不然6.x版本肯能启动不了

http.cors.allow-origin: '*'

EOF

vim /etc/elasticsearch/elasticsearch.yml

四、启动出现的问题及解决方案

1）JDK版本过低

报错信息：

OpenJDK 64-Bit Server VM warning: Option UseConcMarkSweepGC was deprecated in version 9.0 and will likely be removed in a future release.

[2019-11-04T00:12:07,213][WARN ][o.e.b.ElasticsearchUncaughtExceptionHandler] [node-1] uncaught exception in thread [main]

org.elasticsearch.bootstrap.StartupException: java.lang.RuntimeException: can not run elasticsearch as root

at org.elasticsearch.bootstrap.Elasticsearch.init(Elasticsearch.java:163) ~[elasticsearch-7.4.2.jar:7.4.2]

at org.elasticsearch.bootstrap.Elasticsearch.execute(Elasticsearch.java:150) ~[elasticsearch-7.4.2.jar:7.4.2]

at org.elasticsearch.cli.EnvironmentAwareCommand.execute(EnvironmentAwareCommand.java:86) ~[elasticsearch-7.4.2.jar:7.4.2]

at org.elasticsearch.cli.Command.mainWithoutErrorHandling(Command.java:125) ~[elasticsearch-cli-7.4.2.jar:7.4.2]

at org.elasticsearch.cli.Command.main(Command.java:90) ~[elasticsearch-cli-7.4.2.jar:7.4.2]

at org.elasticsearch.bootstrap.Elasticsearch.main(Elasticsearch.java:115) ~[elasticsearch-7.4.2.jar:7.4.2]

at org.elasticsearch.bootstrap.Elasticsearch.main(Elasticsearch.java:92) ~[elasticsearch-7.4.2.jar:7.4.2]

Caused by: java.lang.RuntimeException: can not run elasticsearch as root

at org.elasticsearch.bootstrap.Bootstrap.initializeNatives(Bootstrap.java:105) ~[elasticsearch-7.4.2.jar:7.4.2]

at org.elasticsearch.bootstrap.Bootstrap.setup(Bootstrap.java:172) ~[elasticsearch-7.4.2.jar:7.4.2]

at org.elasticsearch.bootstrap.Bootstrap.init(Bootstrap.java:349) ~[elasticsearch-7.4.2.jar:7.4.2]

at org.elasticsearch.bootstrap.Elasticsearch.init(Elasticsearch.java:159) ~[elasticsearch-7.4.2.jar:7.4.2]

... 6 more

解决：下载安装OpenJDK11

wget https://download.java.net/java/GA/jdk11/13/GPL/openjdk-11.0.1_linux-x64_bin.tar.gz

tar -xzvf jdk-11.0.4_linux-x64_bin.tar.gz /opt/

修改ES启动脚本加上jdk11的配置：

为了方便大家参考，这里贴上完整的配置文件

#!/bin/bash

# CONTROLLING STARTUP:

# This script relies on a few environment variables to determine startup

# behavior, those variables are:

# ES_PATH_CONF -- Path to config directory

# ES_JAVA_OPTS -- External Java Opts on top of the defaults set

# Optionally, exact memory values can be set using the `ES_JAVA_OPTS`. Note that

# the Xms and Xmx lines in the JVM options file must be commented out. Example

# values are "512m", and "10g".

# ES_JAVA_OPTS="-Xms8g -Xmx8g" ./bin/elasticsearch

# 配置自己的jdk11

export JAVA_HOME=/home/elsearch/jdk-11.0.1

export PATH=$JAVA_HOME/bin:$PATH

source "`dirname "$0"`"/elasticsearch-env

if [ -z "$ES_TMPDIR" ]; then

ES_TMPDIR=`"$JAVA" -cp "$ES_CLASSPATH" org.elasticsearch.tools.launchers.TempDirectory`

ES_JVM_OPTIONS="$ES_PATH_CONF"/jvm.options

JVM_OPTIONS=`"$JAVA" -cp "$ES_CLASSPATH" org.elasticsearch.tools.launchers.JvmOptionsParser "$ES_JVM_OPTIONS"`

ES_JAVA_OPTS="${JVM_OPTIONS//\$\{ES_TMPDIR\}/$ES_TMPDIR}"

# 添加jdk判断

if [ -x "$JAVA_HOME/bin/java" ]; then

JAVA="/home/elsearch/jdk-11.0.1/bin/java"

else

JAVA=`which java`

# manual parsing to find out, if process should be detached

exec \

"$JAVA" \

$ES_JAVA_OPTS \

-Des.path.home="$ES_HOME" \

-Des.path.conf="$ES_PATH_CONF" \

-Des.distribution.flavor="$ES_DISTRIBUTION_FLAVOR" \

-Des.distribution.type="$ES_DISTRIBUTION_TYPE" \

-Des.bundled_jdk="$ES_BUNDLED_JDK" \

-cp "$ES_CLASSPATH" \

org.elasticsearch.bootstrap.Elasticsearch \

"$@"

else

exec \

"$JAVA" \

$ES_JAVA_OPTS \

-Des.path.home="$ES_HOME" \

-Des.path.conf="$ES_PATH_CONF" \

-Des.distribution.flavor="$ES_DISTRIBUTION_FLAVOR" \

-Des.distribution.type="$ES_DISTRIBUTION_TYPE" \

-Des.bundled_jdk="$ES_BUNDLED_JDK" \

-cp "$ES_CLASSPATH" \

org.elasticsearch.bootstrap.Elasticsearch \

"$@" \

<&- &

retval=$?

pid=$!

[ $retval -eq 0 ] || exit $retval

if [ ! -z "$ES_STARTUP_SLEEP_TIME" ]; then

sleep $ES_STARTUP_SLEEP_TIME

if ! ps -p $pid > /dev/null ; then

exit 1

exit 0

exit $?

2）配置过低

[1]: max file descriptors [4096] for elasticsearch process is too low, increase to at least [65535]

[2]: max virtual memory areas vm.max_map_count [65530] is too low, increase to at least [262144]

解决：

文件描述符配置
使用 root 用户
进入 /etc/security/limits.conf
添加
* hard nofile 65536
* hard nofile 65536
使用 root 用户
运行 ulimit -n 65536
临时生效
永久生效
虚拟内存配置
使用 root 用户
进入 /etc/sysctl.conf
添加或更新一行 vm.max_map_count=262144
使用 root 用户
运行 sysctl -w vm.max_map_count=262144
临时生效
永久生效
自动发现配置
单节点
进入 elasticsearch 安装目录，打开 config/elasticsearch.yml
添加或更新一行 discovery.type: single-node

3）JVM内存大小指定太大，但本机内存不够用

[root@file elasticsearch-7.1.1]# ./bin/elasticsearch

Java HotSpot(TM) 64-Bit Server VM warning: INFO: os::commit_memory(0x00000000c5330000, 986513408, 0) failed; error='Cannot allocate memory' (errno

# There is insufficient memory for the Java Runtime Environment to continue.

# Native memory allocation (mmap) failed to map 986513408 bytes for committing reserved memory.

# An error report file with more information is saved as:

# logs/hs_err_pid27766.log

解决：

# 修改jvm.options文件配置即可，从1g改成了100m

# Xms represents the initial size of total heap space

# Xmx represents the maximum size of total heap space

-Xms100m

-Xmx100m

五、安装 elasticsearch-head

1）下载安装

# 下载wget https://github.com/mobz/elasticsearch-head.git# 解压

unzip elasticsearch-head-master.zip && cd elasticsearch-head-master

# 安装

npm install grunt --save

2）修改服务器监听地址

修改elasticsearch-head下Gruntfile.js文件，默认监听在127.0.0.1下9200端口

或者修改 elasticsearch-head-master/Gruntfile.js，在connect属性中，增加hostname: ‘0.0.0.0’

1、修改连接地址

cd _site

vim app.js

this.base_uri = this.config.base_uri || this.prefs.get("app-base_uri") || "http://localhost:9200";

2、启动

#执行

grunt server

输出信息：

>> Local Npm module "grunt-contrib-jasmine" not found. Is it installed?

Running "connect:server" (connect) task

Waiting forever...

Started connect web server on http://localhost:9100

3、浏览器访问http://192.168.182.132:9100

4、elasticsearch-head 设置后台启动和关闭

进入elasticsearch-head-master目录

# vim elasticsearch-head_start.sh

#!/bin/bash

echo "START elasticsearch-head "

nohup grunt server &exit

关闭（可忽略）：

#!/bin/bash

echo "STOP elasticsearch-head "

ps -ef |grep head|awk '{print $2}'|xargs kill -9

在另外两台机子上安装ES

scp -r /home/elsearch/elasticsearch-7.4.2 [email protected]:/home/elsearch/

修改配置

# 修改节点名称

node.name: "node-2" # node-3

# 修改节点属性

node.master: false

# 修改能访问的ip地址

network.host: "192.168.182.133" # network.host: "192.168.182.134"

通过以上安装配置，ES集群就搭建起来了

最后附上配置完整说明：

cluster.name: elasticsearch

# 配置的集群名称，默认是elasticsearch，es服务会通过广播方式自动连接在同一网段下的es服务，通过多播方式进行通信，同一网段下可以有多个集群，通过集群名称这个属性来区分不同的集群。

node.name: "Franz Kafka"

# 当前配置所在机器的节点名，你不设置就默认随机指定一个name列表中名字，该name列表在es的jar包中config文件夹里name.txt文件中，其中有很多作者添加的有趣名字。

node.master: true

# 指定该节点是否有资格被选举成为node（注意这里只是设置成有资格，不代表该node一定就是master），默认是true，es是默认集群中的第一台机器为master，如果这台机挂了就会重新选举master。

node.data: true

# 指定该节点是否存储索引数据，默认为true。

index.number_of_shards: 5

# 设置默认索引分片个数，默认为5片。

index.number_of_replicas: 1

# 设置默认索引副本个数，默认为1个副本。如果采用默认设置，而你集群只配置了一台机器，那么集群的健康度为yellow，也就是所有的数据都是可用的，但是某些复制没有被分配

# （健康度可用 curl 'localhost:9200/_cat/health?v' 查看，分为绿色、黄色或红色。绿色代表一切正常，集群功能齐全，黄色意味着所有的数据都是可用的，但是某些复制没有被分配，红色则代表因为某些原因，某些数据不可用）。

path.conf: /path/to/conf

# 设置配置文件的存储路径，默认是es根目录下的config文件夹。

path.data: /path/to/data

# 设置索引数据的存储路径，默认是es根目录下的data文件夹，可以设置多个存储路径，用逗号隔开，例：

# path.data: /path/to/data1,/path/to/data2

path.work: /path/to/work

# 设置临时文件的存储路径，默认是es根目录下的work文件夹。

path.logs: /path/to/logs

# 设置日志文件的存储路径，默认是es根目录下的logs文件夹

path.plugins: /path/to/plugins

# 设置插件的存放路径，默认是es根目录下的plugins文件夹, 插件在es里面普遍使用，用来增强原系统核心功能。

bootstrap.mlockall: true

# 设置为true来锁住内存不进行swapping。因为当jvm开始swapping时es的效率会降低，所以要保证它不swap，可以把ES_MIN_MEM和ES_MAX_MEM两个环境变量设置成同一个值，并且保证机器有足够的内存分配给es。同时也要允许elasticsearch的进程可以锁住内# # 存，linux下启动es之前可以通过`ulimit -l unlimited`命令设置。

network.bind_host: 192.168.0.1

# 设置绑定的ip地址，可以是ipv4或ipv6的，默认为0.0.0.0，绑定这台机器的任何一个ip。

network.publish_host: 192.168.0.1

# 设置其它节点和该节点交互的ip地址，如果不设置它会自动判断，值必须是个真实的ip地址。

network.host: 192.168.0.1

# 这个参数是用来同时设置bind_host和publish_host上面两个参数。

transport.tcp.port: 9300

# 设置节点之间交互的tcp端口，默认是9300。

transport.tcp.compress: true

# 设置是否压缩tcp传输时的数据，默认为false，不压缩。

http.port: 9200

# 设置对外服务的http端口，默认为9200。

http.max_content_length: 100mb

# 设置内容的最大容量，默认100mb

http.enabled: false

# 是否使用http协议对外提供服务，默认为true，开启。

gateway.type: local

# gateway的类型，默认为local即为本地文件系统，可以设置为本地文件系统，分布式文件系统，hadoop的HDFS，和amazon的s3服务器等。

gateway.recover_after_nodes: 1

# 设置集群中N个节点启动时进行数据恢复，默认为1。

gateway.recover_after_time: 5m

# 设置初始化数据恢复进程的超时时间，默认是5分钟。

gateway.expected_nodes: 2

# 设置这个集群中节点的数量，默认为2，一旦这N个节点启动，就会立即进行数据恢复。

cluster.routing.allocation.node_initial_primaries_recoveries: 4

# 初始化数据恢复时，并发恢复线程的个数，默认为4。

cluster.routing.allocation.node_concurrent_recoveries: 2

# 添加删除节点或负载均衡时并发恢复线程的个数，默认为4。

indices.recovery.max_size_per_sec: 0

# 设置数据恢复时限制的带宽，如入100mb，默认为0，即无限制。

indices.recovery.concurrent_streams: 5

# 设置这个参数来限制从其它分片恢复数据时最大同时打开并发流的个数，默认为5。

discovery.zen.minimum_master_nodes: 1

# 设置这个参数来保证集群中的节点可以知道其它N个有master资格的节点。默认为1，对于大的集群来说，可以设置大一点的值（2-4）

discovery.zen.ping.timeout: 3s

# 设置集群中自动发现其它节点时ping连接超时时间，默认为3秒，对于比较差的网络环境可以高点的值来防止自动发现时出错。

discovery.zen.ping.multicast.enabled: false

# 设置是否打开多播发现节点，默认是true。

discovery.zen.ping.unicast.hosts: ["host1", "host2:port", "host3[portX-portY]"]

# 设置集群中master节点的初始列表，可以通过这些节点来自动发现新加入集群的节点。

elasticsearch7版本引入的新集群协调子系统了解一哈,新增两个如下配置项

discovery.seed_hosts

cluster.initial_master_nodes

官方文档栗子：

discovery.seed_hosts:

- 192.168.1.10:9300

- 192.168.1.11

- seeds.mydomain.com

cluster.initial_master_nodes:

- master-node-a

- master-node-b

- master-node-c

六、安装 Kibana

1）Kibana 下载

官网下载：https://www.elastic.co/cn/downloads/kibana

2）Kibana 安装

wget https://artifacts.elastic.co/downloads/kibana/kibana-7.4.2-linux-x86_64.tar.gz

tar -zxvf kibana-7.4.2-linux-x86_64.tar.gz && cd kibana-7.4.2-linux-x86_64

3）Kibana 修改配置

# vi config/kibana.yml

# 允许外部访问

server.host: "0.0.0.0"# 修改默认关联的ES地址elasticsearch.hosts: ["http://192.168.182.132:9200"]

4）Kibana 启动

# 默认不支持root启动，可以后面加参数允许root启动

./kibana --allow-root

七、logstash 部署

1）logstash 下载解压

wget https://artifacts.elastic.co/downloads/logstash/logstash-7.4.2.tar.gz

tar -zxf logstash-7.4.2.tar.gz && cd logstash-7.4.2

2）解压测试数据集

wget http://files.grouplens.org/datasets/movielens/ml-latest-small.zip

unzip ml-latest-small.zip && cd ml-latest-small

3）创建并编辑 logstash.conf 文件，添加如下内容（Ruby 语法）

input {

file {

path => "/home/elsearch/ml-latest-small/movies.csv"

start_position => "beginning"

sincedb_path => "/dev/null"

}

filter {

csv {

separator => ","

columns => ["id","content","genre"]

}

mutate {

split => { "genre" => "|" }

remove_field => ["path", "host","@timestamp","message"]

}

mutate {

split => ["content", "("]

add_field => { "title" => "%{[content][0]}"}

add_field => { "year" => "%{[content][2]}"}

}

mutate {

convert => {

"year" => "integer"

}

strip => ["title"]

remove_field => ["path", "host","@timestamp","message","content"]

}

output {

elasticsearch {

hosts => "http://192.168.182.132:9200"

index => "movies"

document_id => "%{id}"

}

stdout {}

}

4）导入数据

【注意】导入后不会自动退出，用 Ctrl-C 手动退出

./bin/logstash -f ../ml-latest-small/logstash.conf

你可能感兴趣的:(devops,elasticsearch,elk,大数据)

【DevOps】Maven 项目中常见的目录结构：集成测试代码的目录结构与单元测试的目录结构阿寻寻云原生&DevOps devops maven 集成测试
集成测试代码的目录结构通常与单元测试的目录结构类似，但它们被放置在不同的目录中，以便区分这两类测试。以下是Maven项目中常见的目录结构：1.单元测试目录结构单元测试通常放置在src/test/java目录下。这个目录专门用于存放针对应用程序单个类或方法的测试。src└──test└──java└──com└──example├──MyClassTest.java└──AnotherClassTe
《大数据时代“快刀”：Flink实时数据处理框架优势全解析》程序猿阿伟大数据 flink
在数字化浪潮中，数据呈爆发式增长，实时数据处理的重要性愈发凸显。从金融交易的实时风险监控，到电商平台的用户行为分析，各行业都急需能快速处理海量数据的工具。Flink作为一款开源的分布式流处理框架，在这一领域崭露头角，备受瞩目。一、真正实时，毫秒级响应与部分将流处理模拟为微批处理的框架不同，Flink是专为实时流处理打造的“原生”引擎。它直接处理持续不断的事件流，无需将数据攒成批次再处理，这种设计赋
园区智能化系统实现管理与服务的智能化转型与创新进阶快鲸智慧楼宇管理系统其他
内容概要园区智能化系统的出现，标志着管理与服务向智能化转型的重要一步。这一系统不仅仅是一个技术解决方案，更是一个全面提升园区运营效率与安全性的独特工具。通过集成大数据分析、物联网和人工智能，园区智能化系统能够为各类园区如工业园、产业园、物流园、写字楼与公寓等提供切实可行的解决方案。“智能化管理不仅是未来的发展趋势，更是提升竞争力的必要手段。”在资产管理方面，智能化系统能够实时监控并优化资源的配置，
CDH_6.3.2的搭建我的K8409 Flink linux 大数据分布式
一站式搭建大数据的应用1、前提条件和准备工作hostnamectlset-hostnamecdh01hostnamectlset-hostnamecdh02hostnamectlset-hostnamecdh032、修改IP和Host映射关系（所有节点）在window中也配置一下vim/etc/hosts192.168.92.201cdh01192.168.92.202cdh02192.168.9
大数据笔记之 Flink1.17 算子凡许真大数据 flink1.17 算子
文章目录前言一、Partition分区（物理分区）1.1随机分区shuffle1.2轮询分区rebalance1.3重缩放分区rescale1.4广播分区broadcast1.5全局分区global1.6keyby1.7自定义分区Custom二、transform2.1flatMap2.2filter2.3RichFunction2.4map三、Aggregate聚合3.1keyBy()3.2ma
01.双Android容器解决方案高桐@BILL 容器 Android
目录写在前面一，容器1.1容器的原理1.1.1Namespace1.1.2Cgroups（ControlGroups）1.1.3联合文件系统（UnionFileSystem）1.2容器的应用1.2.1微服务架构1.2.2持续集成和持续部署（CI/CD）1.2.3多租户环境1.2.4混合云和多云环境1.2.5大数据和机器学习1.2.6android应用场景1.3容器方案选型1.3.1Docker1.
监控易：智慧高校一体化综合运维解决方案 MXsoft618 运维信息安全物联网监控类
新冠疫情发生以来，线上线下教育模式的初探，促使学校、家长和社会对于教育信息化认识产生巨大的转变。伴随着云计算和物联网的发展，教育已经开启了一个全新的时代。自“十三五”规划中明确提出“支持各级各类学校建设智慧校园，综合利用互联网、大数据、人工智能和虚拟现实技术探索未来教育教学新模式”以来，政策春风也不断加码教育信息化进程，《教育信息化2.0行动计划》以及《智慧校园总体框架》的相继发布，全国各地都在积
学技术学英语：elasticsearch 文档ID生成算法学会了没 elasticsearch 全文检索文档生成算法
Auto-GeneratedDocumentIDsinElasticsearchWhenyouindexadocumentwithoutspecifyinganID,ElasticsearchautomaticallygeneratesauniqueIDforthatdocument.ThisIDisaBase64-encodedUUID,whichiscomposedofseveralparts
TDengine 做为 FLINK 数据源技术参考手册 TDengine （老段） tdengine flink 大数据涛思数据时序数据库数据库
ApacheFlink是一款由Apache软件基金会支持的开源分布式流批一体化处理框架，可用于流处理、批处理、复杂事件处理、实时数据仓库构建及为机器学习提供实时数据支持等诸多大数据处理场景。与此同时，Flink拥有丰富的连接器与各类工具，可对接众多不同类型的数据源实现数据的读取与写入。在数据处理的过程中，Flink还提供了一系列可靠的容错机制，有力保障任务即便遭遇意外状况，依然能稳定、持续运行。借
Hadoop HA 架构 weixin_30569033 shell 大数据
为什么要用集群?企业里面,多台机器伪分布式每一个角色都是一个进程HDFS:NNSNNDNYARN:RMNM大数据所有组件,都是主从架构master-slaveHDFS读写请求都是先到NN节点,但是,HBase读写请求不是经过master,建表和删除表是需要经过masterNN节点挂了,就不能提供对外服务(-put,-get)需要配置两个NN节点(实时的,任何时刻只有一台active对外,另外一台是
Agentic Workflow 设计模式的未来发展 AI天才研究院计算 AI大模型企业级应用开发实战大数据AI人工智能 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
引言随着信息技术的发展，企业对高效、灵活的自动化流程需求日益增加。AgenticWorkflow设计模式作为一种先进的流程管理理念，旨在通过赋予工作流程以自主性和智能化，实现工作的高效运行。本文将围绕AgenticWorkflow设计模式的核心概念、理论框架、设计模式及其未来发展趋势展开讨论。关键词AgenticWorkflow设计模式自主性合作性反馈循环迭代与增量开发敏捷方法论DevOps文化面
守护每一比特的安全——探索基于差分隐私的MySQL数据脱敏之道墨夶数据库学习资料2 安全 mysql 数据库
在当今数字化时代，随着互联网和大数据技术的发展，数据的价值愈发凸显。然而，随之而来的个人隐私泄露风险也日益增加，成为社会广泛关注的问题之一。特别是在医疗、金融等领域，如何既能充分利用海量数据资源推动行业发展，又能有效保护用户隐私不被侵犯，成为了亟待解决的重要课题。本文将深入探讨一种创新的数据安全共享方案——基于差分隐私（DifferentialPrivacy,DP）的MySQL数据库实现方法，旨在
学技术学英文：elasticsearch部署架构-容错设计学会了没 elasticsearch 架构全文检索容错
Unlessyou'rerunningElasticsearchonasinglenode,preparetodesignforfailure.Designingforfailuremeansrunningyourclusterinmultiplelocationsandbereadytoloseawholedatacenterwithoutserviceinterruption.It'snott
基于elk的springboot web日志收集存储方案 Albertliuc java springboot elk spring boot 前端
目录WEB日志分类处理方案ELK安装Elasticsearch安装Logstash安装kibana导入依赖AOP做接口日志输出日志entity类AOPAspect类logback-spring.xml配置YML配置WEB日志分类处理方案web系统的日志按照价值排序分类controller层的接口访问日志（debug日志）自定义包下的其他日志（debug日志）全局日志①全局错误日志②部分组件的deb
云原生架构体系米朵儿技术屋行业信息处理技术与政策研究专栏云原生架构 devops
云原生（Cloud-Native）的概念在国内提及的越来越多，但大部分人对云原生的认识仅限于容器、微服务、DevOps等内容，把容器、微服务、DevOps就等同于云原生，这显然是不对的。CNCF从其自身的角度定义了云原生技术：云原生技术使企业能够在现代动态环境中构建和运行可扩展的应用程序，如在公共云、私有云和混合云环境中。包括容器、服务网格、微服务、不变的基础设施和声明式API等。采用这些技术可实
AWS DevOps 入门之一 —— 使用Elastic Beanstalk 创建和部署 Web 应用程序 jack@london AWS DevOps aws web node.js devops
本节内容：配置和创建AWSElasticBeanstalk环境向AWSElasticBeanstalk部署示例Web应用程序测试示例Web应用程序前提条件：已有GitHub账户和配置Git开发环境。Folkaws-elastic-beanstalk-express-js-sample项目库到个人git存储库。下载代码，修改app.js，比如第5行中输出内容。在个人git环境创建一次代码提交记录。实
12.udp 就很对 udp 网络协议网络
12.udp**1.UDP特性****2.UDP编程框架（C/S模式）****3.UDP发送接收函数****4.UDP编程练习**1.UDP特性连接特性：无链接，通信前无需像TCP那样建立连接。可靠性：不可靠，不保证数据按序到达、不保证数据无丢失或重复。数据传输：适合传输大数据，但实际传输受网络MTU等因素限制。2.UDP编程框架（C/S模式）服务器端流程：创建套接字：调用socket()函数，参
【Elasticsearch】 Compound Queries risc123456 Elasticsearch elasticsearch 大数据搜索引擎
ElasticsearchCompoundQueriesElasticsearch的CompoundQueries是一种强大的工具，用于组合多个查询子句，以实现更复杂的搜索逻辑。这些查询子句可以是叶查询（LeafQueries）或复合查询（CompoundQueries），并且可以用于组合结果和分数、改变行为或从查询上下文切换到过滤上下文。主要的复合查询类型bool查询：用于组合多个叶查询或复合查
【Elasticsearch】 es 索引内置字段 _source 九师兄 elasticsearch 索引内置 _source
1.概述该字段属于索引的元数据，其中存储了文档原始的JSON内容，会被存储但不会被索引，用于执行fetch请求时返回原始数据。当我们不需要获得任何原始数据，只需要对数据进行排序，聚合等计算，或者写入时文档id是手动指定的，通过搜索取到文档id来进一步处理，可以将"_source"设为false来节约大量的磁盘空间。注意，禁用"_source"后会导致无法使用update，update_by_que
ElasticSearch第十六讲 ES 索引模板Index Template与Dynamic Template 程序员路同学 ElasticSearch elasticsearch java 大数据
IndexTemplateIndexTemplates可以帮助你设定Mappings和Settings，并按照一定的规则，自动匹配到新创建的索引之上。模版仅在一个索引被新创建时，才会产生作用。修改模版不会影响已创建的索引，你可以设定多个索引模版，这些设置会被“merge”在一起，你可以指定“order”的数值，控制“merging”的过程索引模板中的内容settings:指定index的配置信息,
【大数据入门核心技术-Hive】（十一）HiveSQL数据分区 forest_long 大数据技术入门到21天通关大数据 hive hadoop 数据仓库 hdfs
目录一、分区的概念二、创建分区1）静态分区1、单分区测试2、多分区测试2)动态分区3、动态分区和静态分区混合使用三、分区的其它操作1、恢复分区2、归档分区3、交换分区四、分区数据查询1、单分区数据查询2、多分区数据查询方法1：通过union方法2：通过or一、分区的概念数据分区的概念以及存在很久了，通常使用分区来水平分散压力，将数据从物理上移到和使用最频繁的用户更近的地方，以及实现其目的。hive
【Elasticsearch】索引模板 ignore_missing_component_templates risc123456 Elasticsearch elasticsearch jenkins 大数据
解释ignore_missing_component_templates配置在Elasticsearch中，ignore_missing_component_templates是一个配置选项，用于处理索引模板中引用的组件模板可能不存在的情况。当您创建一个索引模板时，可以指定一个或多个组件模板，这些组件模板将用于构建最终的索引配置。如果某个组件模板不存在，Elasticsearch通常会报错。但是，
毕设开源 python大数据旅游数据分析可视化系统(源码分享) bee_dc 毕业设计毕设大数据
文章目录0前言1课题背景2数据处理3数据可视化工具3.1django框架介绍3.2ECharts4Django使用echarts进行可视化展示（mysql数据库）4.1修改setting.py连接mysql数据库4.2导入数据4.3使用echarts可视化展示5实现效果5.1前端展示5.2后端展示6最后0前言这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到
大数据“超能力”：数据安全和隐私该如何保障？大数据在线云静思园大数据数据安全数据隐私英特尔
一人人都喜欢超级英雄。不论是超人还是钢铁侠，又或者是小蜘蛛和绿巨人，几乎每一个超级英雄漫画及电影的粉丝，都曾为其不公遭遇打抱不平：“他们明明是在用超能力做好事，拯救人类的，为什么电影里的政府和平民会这么蠢，总对他们缺乏信任，满是提防。”这就是所谓的“叶公好龙”了，因为当你身边真出现了个能把卡车当皮球一样抛来抛去的人时，你的反应恐怕也好不到哪儿去，可能也巴不得有政府出面，逼他接受《超级英雄注册法案》
再见，Elasticsearch ！码农code之路 elasticsearch 大数据搜索引擎全文检索
新一代搜索引擎，是ES的15倍，号称干翻ES！ManticoreSearch是一个使用C++开发的高性能搜索引擎，创建于2017年，其前身是SphinxSearch。ManticoreSearch充分利用了Sphinx，显着改进了它的功能，修复了数百个错误，几乎完全重写了代码并保持开源。这一切使ManticoreSearch成为一个现代，快速，轻量级和功能齐全的数据库，具有出色的全文搜索功能。Ma
软件架构设计与模式之：DevOps与运维架构 AI天才研究院架构师必知必会系列编程实践大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术文章目录1.简介概要目的2.DevOps概述什么是DevOps？DevOps的关键点DevOps的价值3.DevOps基本概念、术语及流程管理工程价值流动方法论模型职能团队能力圈景气文化工具链4.DevOps与运维架构DevOps与运维架构的区别DevOps实践与运维架构DevOps架构图DevSecOps实践DevOps的发展趋势DevOps迫切需求1.简介概要Dev
Python爬虫基础知识：从零开始的抓取艺术 egzosn python 爬虫开发语言
在大数据时代，网络数据成为宝贵的资源，而Python爬虫则是获取这些数据的重要工具。本文旨在为初学者提供一份Python爬虫的入门指南，涵盖基础知识、常用库介绍、实战案例以及注意事项，帮助你快速上手，成为一名合格的“网络矿工”。一、Python爬虫概述1.1什么是爬虫？爬虫，也称为网络爬虫或蜘蛛，是一种自动抓取互联网信息的程序。它通过模拟人类浏览网页的行为，自动地遍历和抓取网络上的数据，常用于数据
探索Oracle数据库的多租户特性：架构、优势与实践 2401_85812026 数据库 oracle 架构
在云计算和大数据时代，多租户架构成为数据库设计中的一个重要趋势。Oracle数据库的多租户选项（Multitenant）允许单个数据库实例支持多个独立数据库（称为容器数据库和可插拔数据库），每个数据库都有自己的数据、配置和资源。这种设计提高了资源利用率、简化了数据库管理，并增强了安全性。本文将深入探讨Oracle多租户选项的架构、优势以及如何在实际环境中部署和使用。1.多租户选项概述Oracle多
「大数据」Kappa架构吴维炜 AIGC架构设计师大数据架构 kappa AIGC
Kappa架构是一种处理大数据的架构，它作为Lambda架构的替代方案出现。Kappa架构的核心思想是简化数据处理流程，通过使用单一的流处理层来同时处理实时和批量数据，从而避免了Lambda架构中需要维护两套系统（批处理层和速度层）的复杂性。核心功能：单一处理层：Kappa架构使用单一的流处理层来处理所有数据，无论是实时数据还是批量数据。数据重放：通过重放历史数据，Kappa架构能够重新计算出与批
新零售社交电商系统小程序功能开发详细解析 v.15889726201 零售小程序
现在的购物方式是越来越有趣了，新零售社交电商系统是互联网、大数据、人工智能的技术和咱们熟悉的传统零售深度结合后产生的。它整合线上线下渠道及数据，带来全方位、多渠道、个性化购物体验。借助实时库存管理、智能推荐和无缝购物体验等功能，打破传统电商与实体店界限，其具备以下显著特点：一、系统主要功能分销管理独家推广代码机制：在这个新零售社交电商系统里，每个经销商都有一个只属于自己的推广代码。把这个代码分享给
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h