Flink SQL 常用调优

1、建表

1.1、JDBC

connection.max-retry-timeout

可选 60s Duration 最大重试超时时间,以秒为单位且不应该小于 1 秒。

scan.partition.column

可选 (none) String 用于将输入进行分区的列名。请参阅下面的分区扫描部分了解更多详情。

scan.partition.num

可选 (none) Integer 分区数。

scan.partition.lower-bound

可选 (none) Integer 第一个分区的最小值。

scan.partition.upper-bound

可选 (none) Integer 最后一个分区的最大值。

scan.fetch-size

可选 0 Integer 每次循环读取时应该从数据库中获取的行数。如果指定的值为 '0',则该配置项会被忽略。

scan.auto-commit

可选 true Boolean 在 JDBC 驱动程序上设置 auto-commit 标志, 它决定了每个语句是否在事务中自动提交。有些 JDBC 驱动程序,特别是 Postgres,可能需要将此设置为 false 以便流化结果。

lookup.cache.max-rows

可选 (none) Integer lookup cache 的最大行数,若超过该值,则最老的行记录将会过期。 默认情况下,lookup cache 是未开启的。请参阅下面的 Lookup Cache 部分了解更多详情。

lookup.cache.ttl

可选 (none) Duration lookup cache 中每一行记录的最大存活时间,若超过该时间,则最老的行记录将会过期。 默认情况下,lookup cache 是未开启的。请参阅下面的 Lookup Cache 部分了解更多详情。

lookup.max-retries

可选 3 Integer 查询数据库失败的最大重试时间。

sink.buffer-flush.max-rows

可选 100 Integer flush 前缓存记录的最大值,可以设置为 '0' 来禁用它。

sink.buffer-flush.interval

可选 1s Duration flush 间隔时间,超过该时间后异步线程将 flush 数据。可以设置为 '0' 来禁用它。注意, 为了完全异步地处理缓存的 flush 事件,可以将 'sink.buffer-flush.max-rows' 设置为 '0' 并配置适当的 flush 时间间隔。

sink.max-retries

可选 3 Integer 写入记录到数据库失败后的最大重试次数。

sink.parallelism

可选 (none) Integer 用于定义 JDBC sink 算子的并行度。默认情况下,并行度是由框架决定:使用与上游链式算子相同的并行度。

你可能感兴趣的:(#,Flink基础,大数据,flink)