IT小神

秒级查询之开源分布式SQL查询引擎Presto实操-上

文章目录

概述
- 定义
- 概念
- 架构
- 优缺点
- 连接器
部署
- 集群安装
- 常用配置说明
- 资源管理安装模式
- 安装命令行界面
- 基于Tableau Web 连接器
调优
- 数据存储
- 查询SQL优化
- 无缝替换Hive表
- 建表格式的选择

概述

定义

Presto 官网地址 https://prestodb.io/

Presto 官网文档 https://prestodb.io/docs/current/

Presto GitHub源码地址 https://github.com/prestodb/presto

Presto是一个开源的分布式SQL查询引擎，特点是快速、可靠、高效，也可便捷快速的集成到湖仓一体架构中。最新版本为0.278

Presto是 Facebook 开源的 MPP (Massive Parallel Processing) SQL 引擎，数据量支持GB到PB字节;常用于大数据交互式查询场景，其支持并行查询分布在一个或多个异构数据源上的大型数据集，可实现亚秒级响应性能。Presto旨在处理数据仓库和数据分析，聚合大量数据并生成报告。也即是Presto适合于在线分析处理(OLAP)。虽然其查询性能稍逊于Impala，但是Presto功能则更加强大，支持丰富数据源包含Hive、图数据库、传统关系型数据库、Redis等。

注意：Presto不是一个通用的关系数据库；它不是MySQL、PostgreSQL或Oracle等数据库的替代品，其主要为处理联机事务处理(OLTP)而设计的。

概念

服务器类型：resource manager（资源管理器）, coordinators（协调器）、 workers（工作者）
- Resource Manager：聚合来自所有coordinators和workers的数据的服务器，并构建集群的全局视图。立即安装与分解coordinators必须需要资源管理器。集群支持多个资源管理器，每个资源管理器充当一个主资源管理器。coordinators和workers使用thrift API与资源管理器通信。
- Coordinators：负责解析语句、规划查询和管理Presto工作节点的服务器。它是Presto安装的“大脑”，也是客户端连接到的节点，以提交语句以执行。每个Presto安装必须有一个Presto coordinators和一个或多个worker工人。跟踪每个worker上的活动，并协调查询的执行。coordinators创建一个包含一系列阶段的查询逻辑模型，然后将其转换为在Presto worker集群上运行的一系列连接任务。coordinators使用REST API与worker和客户机通信。如果是仅用于开发或测试的目的，可以配置一个Presto实例来执行这两个角色。
- Workers：是Presto安装中的服务器，负责执行任务和处理数据。workers节点从连接器获取数据，并彼此交换中间数据。coordinators负责从worker获取结果，并将最终结果返回给客户机。当一个Presto工作进程启动时，它会在coordinators中将自己发布给发现服务器，这使得它可以供Presto协调器执行任务。workers使用REST API与其他workers和Presto coordinators进行通信。
数据源
- Connector ：连接器使Presto适应数据源，如Hive或关系数据库，是Presto SPI的实现，使用标准API与资源交互。Presto内置连接器有用于JMX的连接器、提供对内置系统表访问的系统连接器、Hive连接器和用于提供TPC-H基准测试数据的TPCH连接器。也支持第三方开发连接器，以便Presto可以访问各种数据源中的数据。
- Catalog：包含模式并通过连接器引用数据源。例如配置一个JMX目录，以通过JMX连接器提供对JMX信息的访问。catalog定义在存储在Presto配置目录中的属性文件中。
- Schema：是一种组织表的方法。和schema一起定义了一组可以查询的表。使用Presto访问Hive或关系数据库(如MySQL)时，模式在目标数据库中转换为相同的概念。其他类型的连接器可能选择以对底层数据源有意义的方式将表组织到模式中。
- Table：表是一组无序的行，它们被组织成具有类型的命名列。这与任何关系数据库中的情况相同。从源数据到表的映射由连接器定义。
查询执行模型：Presto执行SQL语句，并将这些语句转换为coordinators和workers的分布式集群执行的查询。
- Statement：Presto执行ansi兼容的SQL语句，该标准由子句、表达式和谓词组成。
- Query：解析一条语句时，它将其转换为一个查询，并创建一个分布式查询计划，然后将其实现为在Presto worker上运行的一系列相互连接的阶段。语句和查询之间的区别很简单。一条语句可以被认为是传递给Presto的SQL文本，而查询则是指为执行该语句而实例化的配置和组件。查询包括阶段、任务、分段、连接器以及协同工作以产生结果的其他组件和数据源。
- Stage：Presto执行查询时，通过将执行分解为阶段层次结构来执行。例如需要聚合Hive中存储的十亿行的数据，它会创建一个根阶段来聚合其他几个阶段的输出，所有这些阶段都是为了实现分布式查询计划的不同部分而设计的。组成查询的阶段层次结构类似于树。每个查询都有一个根阶段，负责聚合来自其他阶段的输出。阶段是协调器用来建模分布式查询计划，但是阶段本身并不在Presto worker上运行。
- Task：stage对分布式查询计划的特定部分建模，但stage本身并不在Presto worker上执行。任务是Presto体系结构中的工作项，因为分布式查询计划被分解为一系列阶段，然后转换为任务，然后这些任务作用于或处理分割。Presto任务有输入和输出，就像一个阶段可以由一系列任务并行执行一样，一个任务也可以与一系列驱动程序并行执行。
- Split：任务在分片上操作，分片是更大数据集的部分。分布式查询计划的最低级别的阶段通过连接器的分割检索数据，分布式查询计划较高级别的中间阶段从其他阶段检索数据。当Presto调度查询时，协调器将查询一个连接器，以获得一个表中可用的所有分割的列表。协调器跟踪哪些机器正在运行哪些任务，以及哪些任务正在处理哪些分割。
- Driver：任务包含一个或多个并行驱动程序。驱动程序作用于数据并结合操作符以产生输出，然后由一个任务聚合，然后交付给另一个阶段的另一个任务。驱动程序是操作符实例的序列，它是Presto体系结构中并行度的最低级别。驱动程序有一个输入和一个输出。
- Operator：操作符消费、转换和生成数据。例如，表扫描从连接器获取数据并生成可被其他操作符使用的数据，筛选操作符使用数据并通过对输入数据应用谓词来生成子集。
- Exchange：交换在Presto节点之间为查询的不同阶段传输数据。任务将数据生成到输出缓冲区，并使用交换客户机使用来自其他任务的数据。

架构

先从Presto CLI提交到Coordinator，也即是由客户端来提交查询请求。
Coordinator通过SQL解析生成查询计划并把任务分发给一个或多个worker去执行。
Worker负责执行具体任务和处理数据。
Catelog表示数据源，一个catelog包括connector和schema、table。
- Connector是连接适配器，用于Presto和数据源（如hive，redis）的连接，类似于JDBC。也可以自定义编程实现连接器
- Schema类似于mysql中数据库，table类似于mysql中表。
Coordinator是负责从worker获取结果并返回最终结果给client。

Presto查询请求是分Stage阶段执行，示例如下：

优缺点

优点
- Presto基于内存运算，减少了磁盘IO，因此计算更快。
- Presto 支持多数据源，且能够同时连接多个数据源进行跨数据源连表查询；比如可以从Hive查询大量APP网站访问记录然后从Mysql中关联匹配出对应的设备信息。
- 部署比Hive更简单（Hive是依赖于HDFS）。
缺点
- Presto 能够处理PB级别的海量数据分析，但Presto并不是把PB级数据都放在内存中计算的。而是根据场景，如Count、AVG等聚合hanshu ，是边读数据边计算，再清内存然后重复读数据和计算，这种耗的内存并不高。但是连表查就可能出现大量的临时数据，因此速度会变慢。

连接器

支持连接器很多，从关系数据库、NoSQL数据库、Hive等，还包括对支持目前主流三大数据湖技术Delta Lake、Hudi、Iceberg的连接器

Accumulo Connector
BigQuery Connector
Black Hole Connector
Cassandra Connector
ClickHouse connector
Delta Lake Connector
Druid Connector
Elasticsearch Connector
Hive Connector
Hive Security Configuration
Hudi connector
Iceberg Connector
JMX Connector
Kafka Connector
Kafka Connector Tutorial
Kudu Connector
Lark Sheets connector
Local File Connector
Memory Connector
MongoDB Connector
MySQL Connector
Oracle Connector
Apache Pinot Connector
PostgreSQL Connector
Prometheus Connector
Redis Connector
Redshift Connector
SQL Server Connector
System Connector
Thrift Connector
TPCDS Connector
TPCH Connector

部署

集群安装

# 创建presto的数据目录,
mkdir presto-data
# 下载最新版的presto二进制包
wget https://repo1.maven.org/maven2/com/facebook/presto/presto-server/0.278/presto-server-0.278.tar.gz
# 解压
tar -xvf presto-server-0.278.tar.gz
# 进入根目录
cd presto-server-0.278
# 创建配置目录
mkdir etc
# 创建catalog
mkdir etc/catalog

添加节点配置文件,vim etc/node.properties

# 环境的名称，集群中的所有Presto节点必须具有相同的环境名称。
node.environment=production
# 节点的id，此Presto安装的唯一标识符。这对于每个节点都必须是唯一的。这个标识符应该在重启或升级Presto时保持一致。如果在一台机器上运行多个Presto安装(即同一台机器上的多个节点)，每个安装必须有唯一的标识符。
node.id=ffffffff-ffff-ffff-ffff-fffffffffff1
# 节点数据目录的位置(文件系统路径)，Presto将在这里存储日志和其他数据。
node.data-dir=/home/commons/presto-data

添加JVM参数配置，vim etc/jvm.config

-server
-Xmx16G
-XX:+UseG1GC
-XX:G1HeapRegionSize=32M
-XX:+UseGCOverheadLimit
-XX:+ExplicitGCInvokesConcurrent
-XX:+HeapDumpOnOutOfMemoryError
-XX:+ExitOnOutOfMemoryError

如果规划为coordinator节点，添加的主配置文件，vim etc/config.properties

coordinator=true
node-scheduler.include-coordinator=false
http-server.http.port=8084
query.max-memory=50GB
query.max-memory-per-node=1GB
discovery-server.enabled=true
discovery.uri=http://hadoop1:8084

如果规划为worker节点，添加的主配置文件，vim etc/config.properties

coordinator=false
http-server.http.port=8084
query.max-memory=50GB
query.max-memory-per-node=1GB
discovery.uri=http://hadoop1:8084

配置日志级别，vim etc/log.properties

# 日志级别有四种，DEBUG, INFO, WARN and ERROR
com.facebook.presto=INFO

在etc/catalog/目录配置Presto Hive连接器,vim etc/catalog/hive.properties

connector.name=hive-hadoop2
hive.metastore.uri=thrift://hadoop2:9083
#如果hive metastore的引用文件存放在一个存在联邦的HDFS上，或者你是通过其他非标准的客户端来访问HDFS集群的，请添加以下配置信息来指向你的HDFS配置文件:
hive.config.resources=/home/commons/hadoop/etc/hadoop/core-site.xml,/home/commons/hadoop/etc/hadoop/hdfs-site.xml

# 安装目录中包含bin/launcher中的启动器脚本，Presto可以作为一个守护进程启动，运行命令如下
bin/launcher start
# 可以在前台运行，日志和其他输出被写入stdout/stderr
bin/launcher run

常用配置说明

coordinator：指定是否运维Presto实例作为一个coordinator(接收来自客户端的查询情切管理每个查询的执行过程)。
node-scheduler.include-coordinator：是否允许在coordinator服务中进行调度工作。对于大型的集群，在一个节点上的Presto server即作为coordinator又作为worke将会降低查询性能。因为如果一个服务器作为worker使用，那么大部分的资源都不会被worker占用，那么就不会有足够的资源进行关键任务调度、管理和监控查询执行。
http-server.http.port：指定HTTP server的端口。Presto 使用 HTTP进行内部和外部的所有通讯。
task.max-memory=1GB：一个单独的任务使用的最大内存 (一个查询计划的某个执行部分会在一个特定的节点上执行)。这个配置参数限制的GROUP BY语句中的Group的数目、JOIN关联中的右关联表的大小、ORDER BY语句中的行数和一个窗口函数中处理的行数。该参数应该根据并发查询的数量和查询的复杂度进行调整。如果该参数设置的太低，很多查询将不能执行；但是如果设置的太高将会导致JVM把内存耗光。
discovery-server.enabled：Presto 通过Discovery 服务来找到集群中所有的节点。为了能够找到集群中所有的节点，每一个Presto实例都会在启动的时候将自己注册到discovery服务。Presto为了简化部署，并且也不想再增加一个新的服务进程，Presto coordinator 可以运行一个内嵌在coordinator 里面的Discovery 服务。这个内嵌的Discovery 服务和Presto共享HTTP server并且使用同样的端口。
discovery.uri：Discovery server的URI。由于启用了Presto coordinator内嵌的Discovery 服务，因此这个uri就是Presto coordinator的uri。修改example.net:8080，根据你的实际环境设置该URI。注意：这个URI一定不能以“/“结尾。

资源管理安装模式

如果规模大可以部署为资源管理器、协调器池、worker池的集群模式。

一个集群至少需要1个资源管理器，可以向集群中添加更多资源管理器，每个资源管理器都充当主资源管理器。资源管理器的配置节点，vim etc/config.properties

resource-manager=true
resource-manager-enabled=true
coordinator=false
node-scheduler.include-coordinator=false
http-server.http.port=8080
thrift.server.port=8081
query.max-memory=50GB
query.max-memory-per-node=1GB
discovery-server.enabled=true
discovery.uri=http://hadoop1:8080
thrift.server.ssl.enabled=true

集群支持协调器池。每个协调器将运行集群中的查询子集。协调器的配置节点，vim etc/config.properties

coordinator=true
node-scheduler.include-coordinator=false
http-server.http.port=8080
query.max-memory=50GB
query.max-memory-per-node=1GB
discovery.uri=http://hadoop1:8080
resource-manager-enabled=true

集群支持worker池，把自己的心跳发给资源管理器。worker的配置节点，vim etc/config.properties

coordinator=false
http-server.http.port=8080
query.max-memory=50GB
query.max-memory-per-node=1GB
discovery.uri=http://hadoop1:8080
resource-manager-enabled=true

安装命令行界面

# 下载最新版本0.278
wget https://repo1.maven.org/maven2/com/facebook/presto/presto-cli/0.278/presto-cli-0.278-executable.jar
# 赋可执行权限
chmod a+x ./presto-cli-0.278-executable.jar
# 进入命令行界面
./presto-cli-0.278-executable.jar --server hadoop1:8084 --catalog hive --schema default
# 执行sql
presto:default> show schemas;
presto:default> use test;
presto:test> show tables;
presto:test> select * from emp_mid;

基于Tableau Web 连接器

Tableau的Presto web连接器允许用户从Tableau对Presto运行查询。它实现了Tableau web连接器API中的函数。

直接访问http://hadoop1:8084/tableau/presto-connector.html

调优

数据存储

合理设置分区：与Hive类似，Presto会根据元信息读取分区数据，合理的分区能减少Presto数据读取量，提升查询性能。
使用列式存储：Presto对ORC文件读取做了特定优化，因此在Hive中创建Presto使用的表时，建议采用ORC格式存储；相对于Parquet，Presto对ORC支持更好。
使用压缩：数据压缩可以减少节点间数据传输对IO带宽压力，对于即席查询需要快速解压，建议采用Snappy压缩。
预先排序：对于已经排序的数据，在查询的数据过滤阶段，ORC格式支持跳过读取不必要的数据，比如对于经常需要过滤的字段可以预先排序。

查询SQL优化

只选择使用必要的字段：由于采用列式存储，选择需要的字段可加快字段的读取、减少数据量。避免采用*读取所有字段。
过滤条件必须加上分区字段：对于有分区的表，where语句中优先使用分区字段进行过滤。acct_day是分区字段，visit_time是具体访问时间。
Group By语句优化：合理安排Group by语句中字段顺序对性能有一定提升。将Group By语句中字段按照每个字段distinct数据多少进行降序排列。
Order by时使用Limit：Order by需要扫描数据到单个worker节点进行排序，导致单个worker需要大量内存。如果是查询Top N或者Bottom N，使用limit可减少排序计算和内存压力。
使用近似聚合函数Presto有一些近似聚合函数，对于允许有少量误差的查询场景，使用这些函数对查询性能有大幅提升。比如使用approx_distinct() 函数比Count(distinct x)有大概2.3%的误差。SELECT approx_distinct(user_id) FROM access
用regexp_like代替多个like语句：Presto查询优化器没有对多个like语句进行优化，使用regexp_like对性能有较大提升。
使用Join语句时将大表放在左边：Presto中join的默认算法是broadcast join，即将join左边的表分割到多个worker，然后将join右边的表数据整个复制一份发送到每个worker进行计算。如果右边的表数据量太大，则可能会报内存溢出错误。
使用Rank函数代替row_number函数来获取TopN。

无缝替换Hive表

建立对应的orc表
先将数据灌入orc表，然后更换表名
其中原表不要删除，若线上运行一段时间后没有出现问题，则可以删除该源表。

建表格式的选择

ORC和Parquet都支持列式存储，但是ORC对Presto支持更好（Parquet对Impala支持更好）
对于列式存储而言，存储文件为二进制的，对于经常增删字段的表，建议不要使用列式存储（修改文件元数据代价大）。对比数据仓库，dwd层建议不要使用ORC，而dm层则建议使用。

本人博客网站IT小神 www.itxiaoshen.com

详细描述一下Elasticsearch索引文档的过程？ java1234_小锋 java elasticsearch 大数据搜索引擎
大家好，我是锋哥。今天分享关于【详细描述一下Elasticsearch索引文档的过程？】面试题。希望对大家有帮助；详细描述一下Elasticsearch索引文档的过程？1000道互联网大厂Java工程师精选面试题-Java资源分享网Elasticsearch是一个开源的分布式搜索和分析引擎，广泛用于处理大规模数据。其核心功能之一就是索引文档，它通过特定的流程将数据存储在索引中，并使数据可被高效搜索
Qt小例子学习53 - 使用resizeEvent调整窗口大小时调整Qlabel的图像大小虾球xz
Qt小例子学习53-使用resizeEvent调整窗口大小时调整Qlabel的图像大小testsize.h#ifndefTESTSIZE_H#defineTESTSIZE_H#includeclassQLabel;classtestsize:publicQWidget{Q_OBJECTpublic:explicittestsize(QWidget*parent=0);~testsize();pri
RocketMQ原理解析 Luxangn 后端 rocketmq
RocketMQ是阿里巴巴开源的一款分布式消息队列系统，也是一款高性能、高可用性、高可靠的消息中间件。使用RocketMQ可以轻松地构建分布式、高可用性的消息系统，并可以快速响应业务需求和处理海量数据。下面是RocketMQ的原理解析：架构模型：RocketMQ的架构模型采用分布式、主从复制、高可用性设计，包括Broker、NameServer和Producer、Consumer等模块。其中，Br
【YashanDB知识库】原生mysql驱动配置连接崖山数据库数据库
本文内容来自YashanDB官网，原文内容请见https://www.yashandb.com/newsinfo/7919231.html?templateId=171...【问题分类】功能兼容【关键字】YAS-07202、YAS\_MYERROR，不兼容【问题描述】本项目的架构是hadoop+hive+yashandb使用崖山数据库，将mysql相关的创建表语句进行初始化同步使用崖山23.3版本
HTML 迷宫游戏黑客白泽 HTML网页程序 html 游戏前端
HTML迷宫游戏相关资源文件已经打包成压缩文件，可双击index.html直接运行程序，且文章末尾已附上相关源码，以供大家学习交流，博主主页还有更多Python相关程序案例，秉着开源精神的想法，望大家喜欢，点个关注不迷路！！！1.简介：迷宫游戏一个网页操作类小游戏，操作方法也很简单，用键盘的方向键控制即可（所以手机不能玩）,如果你觉得太简单，可以随时调整迷宫的宽和高，增加迷宫的难度，刷新网页后迷宫
2025最新的陪玩小程序系统有哪些开源架构?如何完全的实现安全交付？ D矜持架构安全前端框架交友 uniapp 系统架构
一、开源架构前端框架：*Uni-app等前端框架使得开发者能够创建跨平台的应用程序，这些应用程序在不同操作系统和设备上具有一致的用户体验。这些框架提供了丰富的组件和工具，使得开发者能够快速构建出美观、易用的用户界面。*通过这些前端框架，用户可以轻松地浏览陪玩师资料、下单、支付以及进行实时通信等操作，从而提高用户满意度和忠诚度。实时通信技术：*WebSocket实时通信技术实现了用户与陪玩师之间的即
编码必看！智能代码助手帮你快速解释代码、解释函数
文心快码(BaiduComate)是基于百度文心大模型，在研发全流程全场景下为开发者提供辅助建议的智能代码助手。结合百度积累多年的编程现场大数据、外部优秀开源数据，可为开发者生成更符合实际研发场景的优秀代码，提升编码效率，释放“十倍”软件生产力。如果您对【文心快码企业版】感兴趣，希望获取更多详细信息，点击进入企业服务咨询我们会尽快安排专业人员与您取得联系！我们期待与您建立联系，为您的企业带来更高效
开源项目怎么搞钱 · 上
原文地址开源意味着给自己制造随处潜伏的竞争对手，以及花费大量时间评估和解决问题。那么为什么不建立一个封闭源代码的SaaS呢？以下是我遇到的一些开源理由：起源于工作需要很多开源项目最初都是解决公司特定问题的库。这也是Sentry的创始人DavidCramer的创始故事《Sentry：从零开始》中真实发生的。Disquswasalsoanenablertomyopensourcecontributio
一行命令为项目文件添加开源协议头 go后端开源命令行
公众号首发地址：https://mp.weixin.qq.com/s/AmOq5yaDGbAerWGOiunMyQ今天给大家介绍一款可以为项目文件添加开源协议头信息的命令行工具addlicense。如果一个现有的项目，想要开源，免不了要为项目中的文件增加开源协议头信息。虽然很多IDE都可以为新创建的文件自动增加头信息，但修改已有的文件还是要麻烦些。好在我们有addlicense工具可以使用，一行命
【Docker】Supervisor 实现单容器运行多服务进程行者Sun1989 Docker Docker 容器 Supervisor
本文内容均来自个人笔记并重新梳理，如有错误欢迎指正！如果对您有帮助，烦请点赞、关注、转发、订阅专栏！专栏订阅入口|精选文章|Kubernetes|Docker|Linux|羊毛资源|工具推荐|往期精彩文章【Docker】（全网首发）KylinV10下MySQL容器内存占用异常的解决方法【Docker】（全网首发）KylinV10下MySQL容器内存占用异常的解决方法（续）【K8s】专题十五（6）：
Ubuntu下Nginx配置ModSecurity详细思路及过程
在Nginx中配置ModSecurity提升Web应用安全性ModSecurity是一个功能强大的开源Web应用防火墙（WAF），能够有效防御各种Web攻击，如SQL注入、跨站脚本（XSS）等。在Nginx中配置ModSecurity，可以显著增强Web应用的安全性。本文将详细介绍如何在Ubuntu系统下为Nginx配置ModSecurity，涵盖从安装到测试的每一个步骤，并配以详细的解释和示意图
使用 Next 14 + NextAuth 4 + Strapi v4进行 Google 和凭据提供商身份验证的完整指南(02) javascript前端
CSS技巧与案例详解vue2与vue3技巧合集VueUse源码解读NextAuthv4介绍NextAuth是一个开源的身份验证解决方案，适用于全栈（Next）应用程序。它支持不同的登录方式，如OAuth提供商（如Google、GitHub等）、凭据（经典的邮箱+密码）以及邮箱登录（通过用户点击的"魔法链接"）。它还提供不同的数据库适配器，可以直接将登录信息存入特定的数据库（如MongoDB）或与O
Apache Answer 邀你共赴 CommunityOverCode Asia 2024
CommunityOverCodeAsia2024将于7月26日至28日在杭州举行。此次会议共设有1个主论坛和15个分论坛，来自不同领域的150余位专家导师将和大家分享Apache项目的新突破和Apache孵化器中的新创新，以及开源开发和以“TheApacheWay”领导社区驱动的项目，共同探讨Apache的运作生态、Apache软件的商业模式、开源的法律问题以及其他许多主题的内容。今年，Apac
作为前端，需要知道这些工具，解放我的重复劳动力
本文首发于微信公众号：大迁世界,我的微信：qq449245884，我会第一时间和你分享前端行业趋势，学习途径等等。更多开源作品请看GitHubhttps://github.com/qq449245884/xiaozhi，包含一线大厂面试完整考点、资料以及我的系列文章。快来免费体验ChatGptplus版本的，我们出的钱体验地址:https://chat.waixingyun.cn可以加入网站底部技
Docker里的泰拉瑞亚，来开黑！！！ docker
准备docker安装，参考之前docker中部署开源的接口管理工具doclever中的docker安装部分，本篇环境wsl2的ubuntu系统。泰拉瑞亚服务端文件，下载地址泰拉瑞亚服务端，如果链接失效，可以百度泰拉瑞亚官网找下载。构建准备一个临时文件夹，将下载的服务端文件解压后，只需要copylinux版本进来就行。$mkdirtemp#给这个文件加上执行权限$chmod+xlinux/Terra
跟我一起学 Python 数据处理（三十九）：数据库世界的探秘之旅 lilye66 python 数据库开发语言决策树随机森林数据结构线性回归
跟我一起学Python数据处理（三十九）：数据库世界的探秘之旅在数据的广袤天地中，我们始终秉持着共同学习、共同进步的理念，希望能引领大家逐步深入Python数据处理的核心领域。上一篇博客我们了解了数据存储的基础要点和案例实战，今天将聚焦于数据库这个关键部分，为大家详细剖析其奥秘。一、关系型数据库深度解析关系型数据库如MySQL和PostgreSQL，对于具有复杂关联性的数据处理十分有效。就像一个庞
开源多媒体播放器 VLC 将引入基于 AI 的实时字幕功能自不量力的A同学人工智能
开源多媒体播放器VLC将引入基于AI的实时字幕功能在CES2025上，VideoLAN展示了VLC即将推出的基于AI的实时字幕功能，以下是对行业格局可能产生的影响：对VLC自身的影响用户体验提升：该功能可自动为视频生成字幕并支持多种语言实时翻译，对于观看外语影片或有特殊需求的用户，如聋哑人士，无需再寻找合适字幕，大大提升了使用便利性和观影体验，有助于吸引更多用户使用VLC播放器，进一步巩固其在开源
Spring中的@Cacheable 注解基本知识点码农研究僧 Java spring java 后端 Cacheable
目录前言1.基本知识2.实战详解前言找工作，来万码优才：#小程序://万码优才/r6rqmzDaXpYkJZF对于Java的基本知识推荐阅读：java框架零基础从入门到精通的学习路线附开源项目面经等（超全）【Java项目】实战CRUD的功能整理（持续更新）1.基本知识@Cacheable是Spring提供的注解，用于声明一个方法的返回结果会被缓存当方法被调用时，Spring会先检查缓存中是否存在该
Spring Boot 和微服务：快速入门指南王子良. Java 经验分享 spring boot 微服务后端
欢迎来到我的博客！非常高兴能在这里与您相遇。在这里，您不仅能获得有趣的技术分享，还能感受到轻松愉快的氛围。无论您是编程新手，还是资深开发者，都能在这里找到属于您的知识宝藏，学习和成长。博客内容包括：Java核心技术与微服务：涵盖Java基础、JVM、并发编程、Redis、Kafka、Spring等，帮助您全面掌握企业级开发技术。大数据技术：涵盖Hadoop（HDFS）、Hive、Spark、Fli
浅谈云计算02 | 云计算模式的演进时光札记z 云计算云计算计算机网络云原生
云计算计算模式的演进一、云计算计算模式的起源追溯1.2个人计算机与桌面计算二、云计算计算模式的发展阶段2.1效用计算的出现2.2客户机/服务器模式2.3集群计算2.4服务计算2.5分布式计算2.6网格计算三、云计算计算模式的成熟与多元化3.1主流云计算服务模式的确立3.1.1IaaS模式的典型代表与应用场景3.1.2PaaS模式的发展与优势3.1.3SaaS模式的广泛普及3.2混合云与多云策略的出
Mysql，Redis数据一致性问题 MoLick_zxy mysql redis 数据库
引发数据不一致的原因在分布式系统中，数据不一致性通常是由于操作时序问题、系统故障、网络延迟或设计缺陷引起的。MySQL和Redis是两个独立的系统，在同时使用它们时，可能会出现数据不一致的情况。以下是一些主要原因：1.操作顺序问题如果应用程序需要同时更新MySQL和Redis，但更新顺序不同步，可能导致数据不一致。举例：先更新Redis，再更新MySQL：如果更新Redis成功但MySQL更新失败
first parameter of redis.call/redis.pcall must be a single literal string 杨过姑父 redis 数据库缓存
使用redission分布式锁的时候报错ERRbadluascriptforrediscluster,firstparameterofredis.call/redis.pcallmustbeasingleliteralstringorg.redisson.client.RedisException:ERRbadluascriptforrediscluster,firstparameterofred
ShardingSphere 实现数据脱敏 drebander 数据库 shardingSphere
在分布式数据库场景中，数据的安全性至关重要。ShardingSphere提供了一套灵活且高效的数据加密解决方案，帮助开发者在分布式环境中实现敏感数据的加密存储和安全访问，从而满足合规性和安全性需求。一、数据加密的重要性1.数据加密的作用保护隐私：防止敏感数据（如用户信息、交易记录）被窃取。满足合规：符合GDPR、CCPA等隐私保护法规的要求。防止数据泄露：即使数据库被非法访问，敏感数据也无法直接读
ZooKeeper 服务器角色? 思维导图代码示例（java 架构) 用心去追梦 java-zookeeper zookeeper 服务器
ZooKeeper是一个为分布式应用提供高效且可靠的分布式协调服务的工具。它允许开发者通过简单的接口来实现诸如配置管理、命名服务、分布式同步和组服务等常见任务。在ZooKeeper的架构中，服务器可以扮演三种角色之一：Leader（领导者）：群集中的每台服务器都会投票选出一个Leader。Leader负责处理所有的写操作请求，并将更新广播给其他服务器（Follower和Observer）。Foll
MySQL 排除指定时间内重复记录的解决方案魔法工坊 Mysql mysql 数据库
MySQL排除指定时间内重复记录的解决方案在实际的数据库操作中，我们经常需要排除时间间隔小于一定范围（例如5分钟）的重复记录。本文总结了几种实现这一需求的MySQL解决方案。表结构假设我们有一张记录数据的表event_logs，其结构如下：CREATETABLEevent_logs(idINTPRIMARYKEYAUTO_INCREMENT,event_timeDATETIMENOTNULL);-
springboot + redis多数据源 + jedis集群模式 machunlin~ java springboot redis redis spring boot java 缓存 spring cloud
最近有个项目需要redis支持多个集群，网上搜了下，发现有个开源的项目spring-boot-starter-dynamic-redis，代码写的挺好，可惜只有单机版的，于是fork了他的代码改了下，支持jedis集群模式。新代码昨天已提交给了原作者，还没看到他的回复。今天就先写个博客简单介绍下吧。支持集群版的项目地址：forkfromspring-boot-starter-dynamic-red
Redis 分布式锁动态一时爽，重构火葬场 spring后端 java 分布式 redis
当服务采用集群方式部署的时候，本地锁无法发挥作用，所以需要分布式锁来实现加锁。实现Redis主要运用setnx命令进行锁操作加锁:SETINXkeyvalue,当锁不存在的时候，成功设置锁并返回解锁:DELkey,通过删除键值对释放锁，以便其他线程可以通过SETINX来获取锁锁超时：EXPIREkeytimeout,设置超时时间，以便即使锁没有被及时释放，也可以在一定时间内自动释放，避免资源被永远
mysql 与Redis 数据强一致方案 dengjiayue mysql redis 数据库
前言mysql与Redis能实现数据的强一致?分布式实现数据的强一致的方案是什么?mysql与Redis能强一致吗?Redis的事务不适合实现强一致那怎么办?(mysql与Redis有强一致方案吗?)前言mysql与Redis一般不会使用强一致性因为不仅设计复杂并且性能差(典型的吃力不讨好类型),而是使用最终一致性如果想了解mysql与Redis数据一致性问题可以看之前这篇:https://blo
MySQL 与 Redis 数据一致性 2 dengjiayue mysql redis 数据库
1.强一致还是最终一致?2.先写MySQL还是先写Redis?case13.缓存(Redis)更新还是清除?更新策略更新策略会有数据不一致问题?数据不一致的概率与影响如果使用监听binlog更新数据还会出现数据不一致问题?binlog的消费问题使用消息队列行不行?其他方案总结:数据不一致的处理方案清除策略解决缓存击穿问题的方案分布式锁使用更新策略更新策略与清除策略的使用场景更新策略删除策略4.缓存
MySQL 与 Redis 的数据一致性问题 dengjiayue mysql redis 数据库
读数据的逻辑基本一致问题1:一致性有哪些?MySQL与Redis的数据一致性方案有哪些?先写MySQL还是先写Redis?缓存数据是更新还是清除?强一致还是最终一致?问题:如果mysql写成功了,但是Redis写(删除)失败了怎么办?重试机制的幂等问题如何解决?方案1:先更新MySQL再清除Redis方案2:双删策略方案3:监听MySQL的binlog日志删除问题:热key失效问题思路1:让热ke
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring