代码不会写

Presto-Code Generation

一、背景

1.1 场景

presto中使用了基于ASM的airlift.bytecode进行代码生成，一个主要的用途是对从数据源捞上来的数据进行表达式过滤，这是代码生成的主要应用场景，主要是为了降低进行表达式评估

中 JVM 的各种开销，如虚函数调用，分支预测，原始类型的对象装箱开销以及内存消耗。

1.2 字节码

Java编译器编译好Java文件后，产生.class文件存放在磁盘中。这种.class文件是二进制文件，内容是只有JVM虚拟机能够识别的机器码。JVM虚拟机读取字节码文件，取出二进制数据，加

载到内存中，解析.class文件内的信息，生成对应的Class对象。

class字节码文件是根据JVM虚拟机规范中规定的字节码组织规则生成的，具体的class文件可以去参考Java虚拟机规范。

基于Java的字节码规范，我们可以实现例如程序分析、生成以及转换技术手段，可以应用在以下场景：

程序分析：从简单的语法解析到完整的语义分析，也可用来发现程序中潜在的bug，检测未使用的代码，以及反向工程等。
帮助编译器生成代码，包括传统的编译器，用在分布式编程中的内嵌的编译器，以及即时编译器等。
程序转换可以用来优化程序或者对程序进行更改，或者在应用中插入调试代码或者性能监控代码，面向切面编程等。

目前对字节码进行操作的类库有很多，ASM、Javassist、airlift.bytecode等等。由于资料不全，这里暂时只针对ASM进行简单介绍，但它们的底层原理都是相同的。Spark在闭包序列化时

也使用了ASM对闭包进行前期的清理和校验操作。

1.2.1 ASM

ASM是一个Java字节码操作框架，它能够以二进制形式修改已有类或者动态生成类。ASM可以直接产生二进制class文件，也可以在类被加载入Java虚拟机之前动态改变类行为。ASM从

类文件中读入信息后，能够改变类行为、分析类信息，甚至能够根据用户要求生成新类。

在这里我们只列出了ASM的一些核心API，通过核心API的调用，可以实现分析类型西、改变类行为、生成新类等操作，具体ASM实现原理之后将具体单独讲解。

1.2.1.1 核心类

 
      类名
 
      类型
 
      说明
 
      依赖关系
 
      ClassVisitor
 
      abstract
 
      类中具体信息的访问（方法、字段、内部类等等）
 
      ClassReader
 
      解析编译过的class的字节数组，然后调用ClassVisitor实例的visitXXX方法，其中
ClassVisitor实例作为ClassReader.accept方法的参数传递进去。ClassReader可以
被看作是一个事件产生者
 
      ClassWriter
 
      是ClassVisitor的一个实现，用来以二进制方式构建编译后的类。它产生一个包含编译后的类的字节数组。
可以通过它的toByteArray方法来获得。它可以被看做是一个事件消费者
 
      实现ClassVisitor
 
      ClassAdapter
 
      也是ClassVisitor的一个实现，它将对它的方法调用委托给另一个ClassVisitor。可以被认为是一个事件过滤器

类名	类型	说明	依赖关系
ClassVisitor	abstract	类中具体信息的访问（方法、字段、内部类等等）
ClassReader		解析编译过的class的字节数组，然后调用ClassVisitor实例的visitXXX方法，其中 ClassVisitor实例作为ClassReader.accept方法的参数传递进去。ClassReader可以被看作是一个事件产生者
ClassWriter		是ClassVisitor的一个实现，用来以二进制方式构建编译后的类。它产生一个包含编译后的类的字节数组。可以通过它的toByteArray方法来获得。它可以被看做是一个事件消费者	实现ClassVisitor
ClassAdapter		也是ClassVisitor的一个实现，它将对它的方法调用委托给另一个ClassVisitor。可以被认为是一个事件过滤器

1.2.1.2 工具类

 
      类名
 
      类型
 
      说明
 
      依赖关系
 
      类名
 
      类型
 
      说明
 
      依赖关系
 
      TraceClassVisitor
 
      final
 
      跟踪代码生成，构造解析过的类的文本展示
 
      实现ClassVisitor
 
      CheckClassAdapter
 
      检查类方法调用顺序，以及参数是否合理
 
      实现ClassVisitor
 
      ASMifierClassVisitor

类名	类型	说明	依赖关系
类名	类型	说明	依赖关系
TraceClassVisitor	final	跟踪代码生成，构造解析过的类的文本展示	实现ClassVisitor
CheckClassAdapter		检查类方法调用顺序，以及参数是否合理	实现ClassVisitor
ASMifierClassVisitor

1.2.1.3 接口和组件访问类

 
      类名
 
      类型
 
      说明
 
      依赖关系
 
      MethodVisitor
 
      abstract
 
      关于方法的生成和转换
 
      由ClassVisitor中的visitMethod方法返回
 
      MethodAdapter
 
      方法的转换和修改
 
      实现MethodVisitor

类名	类型	说明	依赖关系
MethodVisitor	abstract	关于方法的生成和转换	由ClassVisitor中的visitMethod方法返回
MethodAdapter		方法的转换和修改	实现MethodVisitor

1.2.2 airlift.bytecode

airlift.bytecode是一个基于ASM的，用于生成Java字节码的Java类库。ASM提供了对字节码的底层操作，但当用户需要从无到有来构造一个类时，需要进行的操作较多，且复杂。

airlift.bytecode基于ASM，将Java类中的组成对象进行了抽象，提供了简易的字节码构建功能。

1.2.2.1 BytecodeNode

BytecodeNode是airlift.bytecode中的一个最底层的抽象接口，用来描述java操作的基础。BytecodeNode具有两个实现接口FlowControl和InstructionNode。

1.2.2.2 FlowControl

FlowControl接口对应Java中的流程控制语句，具有6个实现类。

FlowControl只定义了一个方法getComment，获取注释。

1.2.2.3 InstructionNode

InstructionNode指令节点有三个抽象实现类Constant、FieldInstruction、VariableInstruction以及6个直接实现类：Comment、InvokeInstruction、JumpInstruction、LabelNode、OpCode、TypeInstruction。具体功能都比较简单，这里就不再一一描述了。其中InvokeInstruction提供了对方法的调用操作。

Constant对应常量定义

FieldInstruction对应对field的操作，只有get和put两种实现类。

VariableInstruction对应对变量的改动操作，例如自增等等。

1.2.2.4 BytecodeBlock

BytecodeBlock也是BytecodeNode的一个实现类，但是它们的作用有很大区别。BytecodeBlock中存放了一个BytecodeNode的列表，并且提供了很多方法，这些方法是用来将独立的

BytecodeNode组合成一个带有执行顺序的代码块的。bytecode中的方法定义MethodDefinition中的body就是一个BytecodeBlock。

例如在Presto的CursorProcessorCompiler中，通过BytecodeBlock提供的链式操作可以构建一个全新的method的body。链式构建顺序即method的执行顺序。

1.2.2.5 MethodDefinition

MethodDefinition是airlift.bytecode对java方法的抽象，每个MethodDefinition具有一个BytecodeBlock，即它的内部执行逻辑，以及一些入参出参等成员，一个MethodDefinition必须和

一个ClassDefinition绑定。方法不能独立于类单独存在。method可以通过InvokeInstruction被触发执行。

1.2.2.6 ClassDefinition

ClassDefinition是airlift.bytecode对类的抽象，内容较少。

二、Presto应用

2.1 关键类解析

2.1.1 Compiler相关类

 
      类型
 
      类名
 
      功能
 
      引用类
 
      生成的方法
 
      备注
 
      配置/工具类
 
      CompilerConfig
 
      /
 
      CompilerOperations
 
      提供了简单的逻辑操作
如 and or 等函数
 
      /
 
      CompilerUtils
 
      工具类，提供了类名生成功能
和创建类的功能defineClass
 
      /
 
      字节码body生成器
（Method）
 
      BodyCompiler
 
      接口
为project和filter提供method生成
由于较复杂，单独抽出一个接口
 
      ExpressionCompiler
（BodyCompiler是一个接口）
 
      /
 
      CursorProcessorCompiler
 
      BodyCompiler的唯一实现类
 
      ExpressionCompiler
 
      project_i （多个）
process
filter
 
      完整的类生成器
（Class）
 
      AccumulatorCompiler
 
      生成累加器的字节码
也生成一些字节码块（类中的方法）

      注：调用的都是generateAccumulatorFactoryBinder方法
调用方都是SqlAggregationFunction的实现类
AbstractMinMaxAggregationFunction
AbstractMinMaxNAggregationFunction
ArbitraryAggregationFunction
ChecksumAggregationFunction
CountColumn
DecimalAverageAggregation
DecimalSumAggregation
LazyAccumulatorFactoryBinder
MapAggregationFunction
MapUnionAggregation
MultimapAggregationFunction
ArrayAggregationFunction
Histogram
AbstractMinMaxBy
AbstractMinMaxByNAggregationFunction
 
      getIntermediateType
getFinalType
getEstimatedSize
addInput
addIntermediate
evaluateIntermediate
evaluateFinal
prepareFinal

      AccumulatorFactoryBinder
是什么？？？
 
      ExpressionCompiler
 
      调用CursorProcessorCompiler
同时自己也单独定义方法
 
      LocalExecutionPlanner.visitScanFilterAndProject
 
      toString
下面为调用CursorProcessorCompiler生成的方法
project_i （多个）
process
filter
 
      InputReferenceCompiler
 
      只生成字节码body
字段应用代码块
被RowExpressionCompiler调用
对外提供visitInputReference方法
返回值为BytecodeNode

      RowExpressionCompiler
PageFunctionCompiler
 
      JoinCompiler
 
      getChannelCount
getSizeInBytes
appendTo
isPositionNull
hashPosition
hashRow
rowEqualsRow
positionEqualsRowIgnoreNulls
positionEqualsRow
positionNotDistinctFromRow
positionEqualsPositionIgnoreNulls
positionEqualsPosition
compareSortChannelPositions
isSortChannelPositionNull
 
      JoinFilterFunctionCompiler
 
      LocalExecutionPlanner.compileJoinFilterFunction
 
      toString
filter
 
      OrderingCompiler
 
      用于对比Page对象
 
      PagesIndex
 
      compareTo
 
      PageFunctionCompiler
 
      提供Page相关的操作

      ExpressionCompiler
LocalExecutionPlanner
 
      getResult
process
evaluate
isDeterministic
getInputChannels
toString
filter
 
      RowExpressionCompiler
 
      不构建类和方法，只生成ByteCode
 
      BytecodeGeneratorContext
 
      StateCompiler
 
      返回数组类，构建序列化类
 
      getSerializedType
deserialize
serialize
createSingleState
createGroupedState
getSingleStateClass
getGroupedStateClass
getEstimatedSize
ensureCapacity
getEstimatedSize

类型	类名	功能	引用类	生成的方法	备注
配置/工具类	CompilerConfig			/
CompilerOperations	提供了简单的逻辑操作如 and or 等函数		/
CompilerUtils	工具类，提供了类名生成功能和创建类的功能defineClass		/
字节码body生成器（Method）	BodyCompiler	接口为project和filter提供method生成由于较复杂，单独抽出一个接口	ExpressionCompiler （BodyCompiler是一个接口）	/
CursorProcessorCompiler	BodyCompiler的唯一实现类	ExpressionCompiler	project_i （多个） process filter
完整的类生成器（Class）	AccumulatorCompiler	生成累加器的字节码也生成一些字节码块（类中的方法）	注：调用的都是generateAccumulatorFactoryBinder方法调用方都是SqlAggregationFunction的实现类 AbstractMinMaxAggregationFunction AbstractMinMaxNAggregationFunction ArbitraryAggregationFunction ChecksumAggregationFunction CountColumn DecimalAverageAggregation DecimalSumAggregation LazyAccumulatorFactoryBinder MapAggregationFunction MapUnionAggregation MultimapAggregationFunction ArrayAggregationFunction Histogram AbstractMinMaxBy AbstractMinMaxByNAggregationFunction	getIntermediateType getFinalType getEstimatedSize addInput addIntermediate evaluateIntermediate evaluateFinal prepareFinal	AccumulatorFactoryBinder 是什么？？？
	ExpressionCompiler	调用CursorProcessorCompiler 同时自己也单独定义方法	LocalExecutionPlanner.visitScanFilterAndProject	toString 下面为调用CursorProcessorCompiler生成的方法 project_i （多个） process filter
	InputReferenceCompiler	只生成字节码body 字段应用代码块被RowExpressionCompiler调用对外提供visitInputReference方法返回值为BytecodeNode	RowExpressionCompiler PageFunctionCompiler
	JoinCompiler			getChannelCount getSizeInBytes appendTo isPositionNull hashPosition hashRow rowEqualsRow positionEqualsRowIgnoreNulls positionEqualsRow positionNotDistinctFromRow positionEqualsPositionIgnoreNulls positionEqualsPosition compareSortChannelPositions isSortChannelPositionNull
	JoinFilterFunctionCompiler		LocalExecutionPlanner.compileJoinFilterFunction	toString filter
	OrderingCompiler	用于对比Page对象	PagesIndex	compareTo
	PageFunctionCompiler	提供Page相关的操作	ExpressionCompiler LocalExecutionPlanner	getResult process evaluate isDeterministic getInputChannels toString filter
	RowExpressionCompiler	不构建类和方法，只生成ByteCode	BytecodeGeneratorContext
	StateCompiler	返回数组类，构建序列化类		getSerializedType deserialize serialize createSingleState createGroupedState getSingleStateClass getGroupedStateClass getEstimatedSize ensureCapacity getEstimatedSize

2.1.2 BytecodeGenerator

2.2 代码生成样例解析

下面，我们通过ScanFilterAndProjectOperator算子中对数据操作过程的代码生成样例来窥探代码生成流程。

首先，ScanFilterAndProjectOperator其中一个分支对数据的处理是通过CursorProcessor.process来完成。

2.2.1 CursorProcessor的执行

CursorProcessor是一个没有实现类的接口，它的实现类都是由airlift.bytecode动态构建生成的字节码。CursorProcessor是一个比较独立的代码生成结果，它只在

ScanFilterAndProjectOperator中被引用。我们以它为例来窥探代码生成的过程和执行过程。

在ScanFilterAndProjectOperator的getOutput方法中，若pageSource为空，则会转换到processColumnSource方法中。在processColumnSource方法中，会调用CursorProcessor的

process方法来对record进行处理。可以认为CursorProcessor是实际对数据的循环处理类，但由于CursorProcessor是一个没有实现类的接口，首先我们需要搞清楚它的构建过程。

ScanFilterAndProjectOperator的创建是由它的内部工厂类ScanFilterAndProjectOperatorFactory.createOperator创建的，CursorProcessor是工厂类的成员，传递给了创建出的

Operator实例，而ScanFilterAndProjectOperatorFactory是在LocalExecutionPlanner对物理计划节点进行遍历时产生的，ScanFilterAndProjectOperatorFactory即为物理执行计划的工厂类。

LocalExecutionPlanner中的内部类Visitor针对物理执行计划的节点类型实现了不同的visit方法，在遇到FilterNode或是ProjectNode（Presto后续可能会将这两个物理执行计划节点合并为

一个节点）时会调用visitScanFilterAndProject方法。

visitScanFilterAndProject方法的整体处理流程如下：

获取节点的输入类型和输出类型。其中在获取输入类型是，需要判断该节点的下级节点sourceNode，若sourceNode类型为TableScanNode，则直接从TableScanNode的输出Symbol集合中获取本节点的输入类型，否则直接从sourceNode的layout信息中获取。输出类型则不区分sourceNode的类型，统一从节点自身的outputSymbol中获取
由于compiler的入参不是Symbol而是Optional，我们需要先进行格式转换，以满足compiler的参数格式。主要是将输出Symbol转换为ProjectExpression，结合已有的FilterExpression传递给compiler。
若下级节点sourceNode类型为TableScan，且scan后的column不为空，则会同时编译生成CursorProcessor和PageProcessor，用这两个Processor来构建一个ScanFilterAndProjectOperatorFactory并封装到PhysicalOperation中返回。否则只会生成PageProcessor，并构建一个FilterAndProjectOperatorFactory封装到PhysicalOperation中返回。

在这个节点的visit函数中，Processor的构建都是在ExpressionCompiler中完成的，ExpressionCompiler提供了两个入口方法compileCursorProcessor和compilePageProcessor。

2.2.2 ExpressionCompiler编译生成CursorProcessor类

从2.2.1章节中我们了解到CursorProcessor在ScanFilterAndProjectOperator物理算子中对数据进行真正的执行，且它的初始化过程是在LocalExecutionPlanner.Visitor内部类中的

visitScanFilterAndProject方法中进行编译生成的，且编译时的入参是filter和project的Expression。实际编译动作在ExpressionCompiler类中的compileCursorProcessor和compilePageProcessor方法中进行。本章我们主要针对compileCursorProcessor方法进行解析。

首先我们来看一下ExpressionCompiler的成员变量和构造函数。ExpressionCompiler拥有一个LoadingCacheextends CursorProcessor>>的成员变量，且在构造

函数中定义了这个LoadingCache的CacheLoader。

即ExpressionCompiler在内存中对CursorProcessor进行缓存，且当有调用者试图从缓存中获取一个CacheKey对应的CursorProcessor，它会先检查是否存在，若不存在，则使用

CacheLoader中定义的Supplier根据传入的CacheKey进行初始化。且初始化的时候针对CacheKey中的内容调用了它自身的compile方法。

上文提到的，实际编译方法compileCursorProcessor中其实就调用了这个LoadingCache中的getUnchecked（即当CacheLoader没有处理抛出异常时的获取缓存数据的方法）

也就是说，当LocalExecutionPlanner试图调用ExpressionCompiler的compileCursorProcessor方法来编译一个新的CursorProcessor时，它实际调用了ExpressionCompiler的compile方

法，根据compile方法的实际调用链，CursorProcessor的构建方法实际是在compileProcessor方法中完成的。

compileProcessor的入参为已经经过类型转换的过滤表达式filter，以及投影表达式projections，一个用来构建类中方法的服务类BodyCompiler，以及一个在LoadingCache中写死的父类

CursorProcessor。注意，这里也就说明了为什么CursorProcessor在源码中是一个没有实现类的接口，但是在实际数据调用是却调用了这个接口中的方法。因为这个接口的实现类是根据查询语句动态构建出来的。

compileProcessor的构建流程在它自身中看起来比较简单，首先，它会调用airlift.bytecode中的ClassDefinition来创建一个新的类，类名使用makeClassName方法生成了一个带有时间戳

后缀的CursorPorcessor类，并定义了它的父类Object和CursorProcessor。其次，compileProcessor会调用BodyCompiler来生成这个类中的具体字节码内容，主要是类的各种方法，由于这里的方法构建逻辑较为复杂，直接抽出了一个独立的服务类BodyCompiler。BodyCompiler是一个接口，且只有一个唯一的实现类CursorProcessorCompiler。（猜测Presto是期望把所有字节码body都用BodyCompiler的实现类来实现，但实际开发中并没有达成？？？可能是其他类的方法比较简单？？？）。最后，生成了一个toString的方法，便于调试。从compileProcessor的处理流程我们可以发现，主要的代码生成集中在类中的method的生成。即CursorProcessorCompiler.generateMethods。

2.2.3 CursorProcessorCompiler编译生成CursorProcessor类中的方法

CursorProcessorCompiler专门负责为动态变异的CursorProcessor类来生成字节码body，即方法。CursorProcessorCompiler对外只提供了generateMethods方法，为了实现具体的方法，又新建了几个private 方法：

generateProcessMethod：生成"process"方法，用来处理数据
createProjectIfStatement：生成project方法中的if语句
generateMethodsForLambdaAndTry：生成lambda表达式方法
generateFilterMethod：生成"filter"方法
generateProjectMethod：生成一系列"project"方法
fieldReferenceCompiler

它的整体执行过程如下：

调用generateProcessMethod方法，生成"process"方法，用来处理数据
生成有filter前缀的过滤lambda方法
根据lamdba方法生成filter方法
遍历project表达式，生成多个project前缀方法，后缀为计数
声明构造函数

下面，我们针对每个步骤进行详细的解析

2.2.3.1 generateProcessMethod

generateProcessMethod方法的入参比较简单，只包含原始的类型一ClassDefinition和project表达式的数量，不涉及具体的表达式内容。

generateProcessMethod的步骤主要分为以下几个步骤

声明参数类型，ConnectorSession、DriverYieldSignal、RecordCursor、PageBuilder
声明方法，使用上面的参数类型，声明方法名为method，限定符为Public，返回类型为CursorProcessorOutput
在方法作用于中声明局部变量completedPositions: int和finished: boolean
变量初始化，调用MethodDefinition.putVariable方法，将completedPositions初始化为0，finished初始化为false
构建方法中的循环体WhileLoop
1. 构建第一个if语句if (pageBuilder.isFull() || yieldSignal.isSet()) return new CursorProcessorOutput(completedPositions, false);
2. 构建第二个if语句if (!cursor.advanceNextPosition()) return new CursorProcessorOutput(completedPositions, true);
3. 构建不满足前面两个if条件下的执行操作，即执行projection，调用CursorProcessorCompiler.createProjectIfStatement
执行完ProjectIfStatement后，completedPositionsVariable加1
组装method

其中，createProjectIfStatement方法中调用了还未声明，但接下来即将声明的方法filter、project_x。虽然createProjectIfStatement看起来是一个条件执行语句if，但是实际上if的

condition都为空或者恒等于true，也就是这个方法等于实际上的顺序调用。

直接调用filter方法
获取block位置
调用project方法

即，process为数据的实际执行过程，实际执行时是先对整体数据进行filter，再依次进行投影。

2.2.3.2 generateMethodsForLambdaAndTry

在定义好process方法后，调用generateMethodsForLambdaAndTry将filter中的lambda表达式提取出来，构建为一个PreGeneratedExpressions。

过程略

2.2.3.3 generateFilterMethod

generateFilterMethod方法生成了"filter"方法，它主要是依赖于RowExpressionCompiler来生成作用于行的表达式，包括and，or以及上一步生成的lambda表达式。

RowExpressionCompiler接收将cursor包装为filedReferenceCompiler作为参数，对Expression中的每个节点进行遍历，最终返回一个BytecodeNode作为方法的实际内容。

2.2.3.4 generateProjectMethod

和filter的处理方式一致，只不过filter是一个整体expression，但每个column上的函数可能不一致，例如有些列可能在做投影时加上coalesce函数，因此project需要根据column个数生成多个方法并在process方法中循环调用。

2.2.3.5 declareConstructor

构造函数中没有特殊的逻辑，只是将它父类的构造函数传递进来了。因为CursorProcessor和Object是当前构造类的父类。

三、总结

airlift.bytecode对ASM的封装比较完整，整体操作较简单。Presto的代码生成中复杂的还是Presto内部定义的一些专用对象，理解Presto的代码生成，必须先将Presto内部的一些对象功

能理解清楚才能正确理解到Presto每一步操作的用意，例如RecordCursor、PageBuilder、BlockBuilder等等。

你可能感兴趣的:(Presto)

doris：SQL 方言兼容向阳1218 大数据 doris
提示从2.1版本开始，Doris可以支持多种SQL方言，如Presto、Trino、Hive、PostgreSQL、Spark、Clickhouse等等。通过这个功能，用户可以直接使用对应的SQL方言查询Doris中的数据，方便用户将原先的业务平滑的迁移到Doris中。警告该功能目前是实验性功能，您在使用过程中如遇到任何问题，欢迎通过邮件组、GitHubIssue等方式进行反馈。部署服务下载最新版
Ranger 2.1.0集成Trino 玄慈 ranger trino cdh java cloudera 大数据
Ranger2.1.0与trino359集成一、基础环境jdk-11.0.12Maven3.6.1Git最新版二、下载ranger2.1.0源码下载之后的目录为ranger-6.3.4本文目录地址是/grid/dfs0/code/ranger-6.3.4三、修改pom.xml修改控制组件版本的pom.xmlranger-6.3.4/pom.xml一、presto的版本号改成359359二、更改组件
时间函数（Hive-Sql\Mysql\Presto）菜鸟教程*…* mysql hive sql mysql
特殊说明：1、时间函数有多种方法，比如本月第一天（T-1）：mon_firstday(sysdate(-1))或者concat(substr(sysdate(-1),1,8),‘01’)等。2、通常离线数据是T-1，故取数据时候，月至今的范围是1号至昨天，故本业会标注T-1，请知晓。3、看函数产生的效果：（1）Hive-Sql如果想看函数的效果，可以在集市输入select+函数。例如selects
centos安装mysql报错：mysql-community-client-plugins-8.0、o Presto metadata available for mysql80-community 其实她不懂 centos mysql linux
执行sudoyum-yinstallmysql-community-server命令刚开始报错mysql-community-client-plugins-8.0.40-1.el7.x86_64.rpm的公钥尚未安装失败的软件包是：mysql-community-client-plugins-8.0.40-1.el7.x86_64GPG密钥配置为：file:///etc/pki/rpm-gpg/R
关于JavaScript（你所不知道的小秘密） Taptaq 前端 javascript 前端
主流浏览器的内核IE：tridentChrome：webkit/blinkfirefox：GeckoOpera：最初是presto，现在用的是blinkSafari：webkit引入JS的方式页面内嵌标签（可在head内或body内）外部引入（常用方法）JS基本语法变量：变量声明：声明，赋值分解。单一var。（vara=100）命名规则：变量名必须以英文字母，*，$开头*变量名可以包括英文字母，，
Docker下Dubbo服务优雅上下线实现丿似锦 dubbo kubernetes dubbo qos
简介在Docker容器环境中部署基于Dubbo的服务时，实现服务的优雅上下线是至关重要的。这通常涉及到两个关键步骤：首先，确保服务能够从注册中心摘除，停止接受新的请求；其次，等待所有正在处理的请求完成后再终止容器。通过结合Kubernetes的preStopHook和Dubbo的QoS功能，可以有效地实现这一目标。环境Docker+Kubernetes+SpringBoot+Dubbo⭐实现Pre
HIVE- SPARK 流川枫_ 20210706 hdfs hive spark
日常记录备忘Hive修改字段类型之后（varchar->string）Hive可以查到数据，Presto查询报错;分区字段数据类型和表结构字段类型不一样；spark-sql分区表和非分区表兼容问题，不能关联可以建临时表把分区数据导入，用完数据将表删除；count有数据，select没数据可能是压缩格式所导致；优化合全量任务，之前是row_number()函数先插入当天增量，取出最新的数据插入全量表
大数据之-hdfs+hive+hbase+kudu+presto集群(6节点) 管哥的运维私房菜大数据 hdfs hive kudu presto hbase
几个主要软件的下载地址：prestohttps://prestosql.io/docs/current/index.htmlkudurpm包地址https://github.com/MartinWeindel/kudu-rpm/releaseshivehttp://mirror.bit.edu.cn/apache/hive/hdfshttp://archive.apache.org/dist/ha
流媒体娱乐服务平台在AWS上使用Presto作为大数据的交互式查询引擎的具体流程和代码 weixin_30777913 aws 大数据 python 音视频
一家流媒体娱乐服务平台拥有庞大的用户群体和海量的数据。为了高效处理和分析这些数据，它选择了Presto作为其在AWSEMR上的大数据查询引擎。在AWSEMR上使用Presto取得了显著的成果和收获。这些成果不仅提升了数据查询效率，降低了运维成本，还促进了业务的创新与发展。实施过程：Presto集群部署：在AWSEMR上部署了Presto集群，该集群与HiveMetastore和AmazonS3集成
Presto 时间、日期及计算相关日期三生暮雨渡瀟瀟 presto big data presto
由于工作中在数据迁移，大数据平台数据查询引擎使用Presto，和传统的数据库时间函数有区别，整理一版，供大家参考，一起学习，有错误欢迎指正。1、查询当前日期selectcurrent_date;2、查询当前时间selectcurrent_timestamp;_col0---------------------------------------2022-01-0220:45:58.551Asia/
hive表修改字段类型没有级连导致历史分区报错尘世壹俗人大数据Hive技术 hive hadoop 数据仓库
一：问题背景修改hive的分区表时有级连概念，指字段的最新状态，默认只对往后的分区数据生效，而之前的分区保留历史元数据状态。好处就是修改语句的效率很快，坏处就是如果历史分区的数据还有用，那就回发生分区元数据和表元数据的不一致报错最终导致：presto或hive任务抽取历史分区会报如下的错误Thereisamismatchbetweenthetableandpartitionschemas.Thet
2024年Presto【基础 01】简介+架构+数据源+数据模型(2)，2024年最新一线互联网公司面经总结 2401_84264536 架构
学习路线：这个方向初期比较容易入门一些，掌握一些基本技术，拿起各种现成的工具就可以开黑了。不过，要想从脚本小子变成黑客大神，这个方向越往后，需要学习和掌握的东西就会越来越多以下是网络渗透需要学习的内容：网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化资料的朋友，可以点击这里获取一个人可以走的很快，但一群人才能走的更远！不
Presto【基础 01】简介+架构+数据源+数据模型 2401_84254343 程序员架构
一个Catalog包含Schema和Connector。例如，配置JMX的Catalog，通过JXMConnector访问JXM信息。当执行一条SQL语句时，可以同时运行在多个Catalog。Presto处理table时，是通过表的完全限定（fully-qualified）名来找到Catalog。例如，一个表的权限定名是hive.test_data.test，则test是表名，test_data是
兼容 Trino Connector，扩展 Apache Doris 数据源接入能力｜Lakehouse 使用手册 vvvae1234 apache
ApacheDoris内置支持包括Hive、Iceberg、Hudi、Paimon、LakeSoul、JDBC在内的多种Catalog，并为其提供原生高性能且稳定的访问能力，以满足与数据湖的集成需求。而随着ApacheDoris用户的增加，新的数据源连接需求也随之增加。因此，从3.0版本开始，ApacheDoris引入了TrinoConnector兼容框架。Trino/Presto作为业界较早应用
2024年大数据高频面试题(下篇）猿与禅 Java架构师面试大数据面试 scala 即席查询分桶调度系统数据倾斜
文章目录Scala数据类型函数式编程闭包函数柯里化面向对象样例类对象与伴生对象特质(trait)模式匹配隐式转换即席查询KylinKylin特点Kylin工作原理核心算法Kylin总结Kylin的优点什么场景用KylinKylin的缺点Impala什么是ImpalaImpala为什么快FrontendBackendImpala总结：Presto什么是PrestoPresto的执行过程Presto总
pyhton - PyHive 凌不了云 python python hive
简介PyHive是一组PythonDB-API和SQLAlchemy接口，可用于Presto和Hive。它为Python提供了一个与Presto和Hive进行交互的平台，使得数据分析师和工程师可以更方便地进行数据处理和分析。安装在安装PyHive之前，你需要确保已经安装以下软件：PipPythonJDK（JavaDevelopmentKit）Hive或Presto在安装完成上述软件之后，你可以使用
k8s-pod 实战七（PreStop 和 PostStart 详细分析）清风 001 K8S-Pod实战 rpc 网络协议网络 k8s kubernetes 容器云原生
PreStop和PostStart详细分析PreStopHookPreStopHook是在容器终止之前执行的操作。它通常用于执行一些清理任务或完成某些操作，以确保容器能够平稳关闭。例如，在数据库应用中，你可能希望在容器终止之前完成所有正在进行的事务。PostStartHookPostStartHook是在容器启动之后立即执行的操作。它通常用于在容器启动后执行一些初始化任务。例如，你可能希望在容器启
从零到一建设数据中台 - 关键技术汇总我码玄黄数据中台数据挖掘数据分析大数据
一、数据中台关键技术汇总语言框架：Java、Maven、SpringBoot数据分布式采集：Flume、Sqoop、kettle数据分布式存储：HadoopHDFS离线批处理计算：MapReduce、Spark、Flink实时流式计算：Storm/SparkStreaming、Flink批处理消息队列：Kafka查询分析：Hbase、Hive、ClickHouse、Presto搜索引擎：Elast
谈一谈数据虚拟化的技术核心和应用架构 Aloudata Data Fabric 逻辑数据平台数据集成数据虚拟化
数据虚拟化（DataVirtualization）是对数据资源的抽象，通过屏蔽数据资源的存储位置和访问方式，能够将不同数据源、不同格式的数据资源，进行逻辑上的整合集成。这一技术方案与过去面对传统数仓的弊端，业界过去经常采取的方式Presto方案有一定相似，但存在明显差别。Presto的架构本质上是一个MPP的引擎，其架构导致绝大部分使用Presto的场景都是在ETL最末端的消费层，本身面向的是OL
spring cloud gateway k8s优雅启停 luffy_1993 kubernetes 容器云原生
通过配置readiness探针和preStophook，实现优雅启动和停止（滚动部署）1.k8s工作负载配置readinessProbe:httpGet:path:/datetimeport:8080scheme:HTTPinitialDelaySeconds:30timeoutSeconds:1periodSeconds:30successThreshold:1failureThreshold:
第 5 题：常见的浏览器内核有哪些？ Noxus丶SJ
什么是浏览器内核？浏览器内核也可以理解为排版引擎，主要由2部分组成，渲染引擎和JS引擎排版引擎主要是负责获取网页内容（HTML、XML、图像、CSS、JS）等信息进行解析、渲染网页，将网页的代码转换为看得到的页面浏览器的内核的不同对于网页的语法解释会有不同，所以渲染的效果也不相同，常见的内核有Trident、Gecko、Webkit、Presto、Blink五种Trident内核代表作品是IE，俗
presto内存配置逻辑梳理 lilyjoke 大数据 presto
presto内存配置逻辑梳理Presto分了两块内存池：GENERAL_POOL和RESERVED_POOL，而RESERVED_POOL根据业务实际情况，我会禁用，所以这块内存不做分配和考虑。GENERAL_POOL中会分两类内存：usermemory和systemmemory。systemmemory用于input/output/exchangebuffers，存放实际读写的实际数据；user
回答网友问题之十一 DIGITALMAN
问题：我用Thea渲染器presto（MC）渲染的时候总是没法渲染出有色玻璃的投影和焦散，表现出来的投影都是一片黑灰色，把渲染设置里面的几个貌似相关的设置都打开了，还是没有效果，相比之下其他几个引擎都能比较好的渲染有色玻璃的投影以及焦散效果，就是渲染速度比不上Presto（MC），怎么才能让Presto（MC）也渲染出有色玻璃的真实投影和焦散呢？回答：TheaRender渲染器在同一框架内置了三类
【大数据面试题】006介绍一下Parquet存储格式的优势 Jiweilai1 一天一道面试题大数据 spark hadoop
一步一个脚印，一天一道面试题列式存储同一列的数据是同一种数据类型，所以压缩比例可以更高。同时一般查询使用时不会使用所有列，而是只用到几列，所以查询速度会更快压缩比例高因为是列式存储，所以可以对同一类型的一段做压缩，压缩比例高支持的平台和框架多在Hadoop,Spark,Presto,Python等都支持，所以Parquet文件可以在不同系统和语言通用。这是我觉得比较实在的优势
浏览器及浏览器内核的基本介绍泡椒猪肝前端
浏览器及浏览器内核的基本介绍一、浏览器二、编译器三、HTML四、标记一、浏览器五大主流浏览器1.IE浏览器，2.Chrome浏览（谷歌浏览器），3.FirFox（火狐浏览器）4.Safari浏览器（苹果浏览器），5.Opera浏览器（欧朋浏览器）。浏览器内核IEtridentChromewebkit/blinkfirefoxGeckoOperaprestoSafariwebkit简介IE浏览器：它
整理前端面试题（上）强哥科技兴
1.常用那几种浏览器测试？有哪些内核(LayoutEngine)?(Q1)浏览器：IE，Chrome，FireFox，Safari，Opera。(Q2)内核：Trident，Gecko，Presto，Webkit。2.说下行内元素和块级元素的区别？行内块元素的兼容性使用？（IE8以下）(Q1)行内元素：会在水平方向排列，不能包含块级元素，设置width无效，height无效(可以设置line-he
presto获取上月月初和上月月末日期 sggnb presto sql
因为工作中需要，研究了一下，有问题大家一起交流获取上月月末selectCAST((date_add('day',-day_of_month(current_date),current_date))ASVARCHAR);获取上月月初selectdate_trunc('month',(date_add('day',-day_of_month(current_date),current_date)));
Thearender2渲染器学习笔记之六 DIGITALMAN
使用PRESTOMC渲染引擎，5分效果。没有调整好灯光位置，金属勺子完全爆掉了一点金属细节都没了，但你要看的是橙汁，哈哈。【前言】上一篇重点介绍了Thea的五大基本材质之一：BASIC材质及其相关属性。BASIC基础材质相当于其他渲染器的标准材质一样，主要用于模拟哑光和塑料，我们也可以用其反射和半透明模拟金属和SSS材质。这个材质效率很高，渲染速度相对较快。简单回顾就是下面这张图。点击该图，可看大
史上最全OLAP对比只会写demo的程序猿数仓 spark hadoop 数据仓库
目录1.什么是OLAP2.OLAP引擎的常见操作3.OLAP分类MOLAP的优点和缺点ROLAP的优点和缺点4.并发能力与查询延迟对比5.执行模型对比5.OLAP引擎的主要特点5.2SparkSQL、FlinkSQL5.3Clickhouse5.4Elasticsearch5.5Presto5.6Impala5.7Doris5.8Druid5.9Kylin综上所述:1.什么是OLAPOLAP（On
【Iceberg学习一】什么是Iceberg？周润发的弟弟 Iceberg 学习
ApacheIceberg是一个面向大型分析数据集的开放表格格式。Iceberg为包括Spark、Trino、PrestoDB、Flink、Hive和Impala在内的计算引擎增加了表格功能，使用一种高性能的表格格式，其工作方式就像一个SQL表一样。用户体验Iceberg避免了不愉快的意外。模式演化功能正常运作，并不会无意中恢复已删除的数据。用户无需了解分区信息也能获得快速查询。模式演化支持添加、
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR