G皮T

【大数据】Flink SQL 语法篇（七）：Lookup Join、Array Expansion、Table Function

《Flink SQL 语法篇》系列，共包含以下 10 篇文章：

Flink SQL 语法篇（一）：CREATE
Flink SQL 语法篇（二）：WITH、SELECT & WHERE、SELECT DISTINCT
Flink SQL 语法篇（三）：窗口聚合（TUMBLE、HOP、SESSION、CUMULATE）
Flink SQL 语法篇（四）：Group 聚合、Over 聚合
Flink SQL 语法篇（五）：Regular Join、Interval Join
Flink SQL 语法篇（六）：Temporal Join
Flink SQL 语法篇（七）：Lookup Join、Array Expansion、Table Function
Flink SQL 语法篇（八）：集合、Order By、Limit、TopN
Flink SQL 语法篇（九）：Window TopN、Deduplication
Flink SQL 语法篇（十）：EXPLAIN、USE、LOAD、SET、SQL Hints

如果您觉得这篇文章有用 ✔️ 的话，请给博主一个一键三连吧（点赞、关注、收藏）！！！您的支持将激励博主输出更多优质内容！！！

Flink SQL 语法篇（七）：Lookup Join、Array Expansion、Table Function

1.Lookup Join（维表 Join）
2.Array Expansion（数组列转行）
3.Table Function（自定义列转行）

1.Lookup Join（维表 Join）

Lookup Join 定义（支持 Batch / Streaming）：Lookup Join 其实就是维表 Join，比如拿离线数仓来说，常常会有用户画像，设备画像等数据，而对应到实时数仓场景中，这种实时获取外部缓存的 Join 就叫做维表 Join。

应用场景：小伙伴萌会问，我们既然已经有了上面介绍的 Regular Join，Interval Join 等，为啥还需要一种 Lookup Join？因为上面说的这几种 Join 都是 流与流之间的 Join，而 Lookup Join 是流与 Redis，MySQL，HBase 这种存储介质的 Join。Lookup 的意思就是实时查找，而实时的画像数据一般都是存储在 Redis，MySQL，HBase 中，这就是 Lookup Join 的由来。

实际案例：使用曝光用户日志流（show_log）关联用户画像维表（user_profile）关联到用户的维度之后，提供给下游计算分性别，年龄段的曝光用户数使用。

曝光用户日志流（show_log）数据（数据存储在 Kafka 中）

log_id  timestamp            user_id
1       2021-11-01 00:01:03  a
2       2021-11-01 00:03:00  b
3       2021-11-01 00:05:00  c
4       2021-11-01 00:06:00  b
5       2021-11-01 00:07:00  c

用户画像维表（user_profile）数据（数据存储在 Redis 中）

user_id(主键)   age     sex
a               12-18   男
b               18-24   女
c               18-24   男

注意：Redis 中的数据结构存储是按照 Key-Value 去存储的。其中 Key 为 user_id，Value 为 age，sex 的 JSON。

具体 SQL：

CREATE TABLE show_log (
    log_id BIGINT,
    `timestamp` as cast(CURRENT_TIMESTAMP as timestamp(3)),
    user_id STRING,
    proctime AS PROCTIME()
)
WITH (
  'connector' = 'datagen',
  'rows-per-second' = '10',
  'fields.user_id.length' = '1',
  'fields.log_id.min' = '1',
  'fields.log_id.max' = '10'
);

CREATE TABLE user_profile (
    user_id STRING,
    age STRING,
    sex STRING
    ) WITH (
  'connector' = 'redis',
  'hostname' = '127.0.0.1',
  'port' = '6379',
  'format' = 'json',
  'lookup.cache.max-rows' = '500',
  'lookup.cache.ttl' = '3600',
  'lookup.max-retries' = '1'
);

CREATE TABLE sink_table (
    log_id BIGINT,
    `timestamp` TIMESTAMP(3),
    user_id STRING,
    proctime TIMESTAMP(3),
    age STRING,
    sex STRING
) WITH (
  'connector' = 'print'
);

-- lookup join 的 query 逻辑
INSERT INTO sink_table
SELECT 
    s.log_id as log_id, 
    s.`timestamp` as `timestamp`, 
    s.user_id as user_id, 
    s.proctime as proctime, 
    u.sex as sex, 
    u.age as age
FROM show_log AS s
LEFT JOIN user_profile FOR SYSTEM_TIME AS OF s.proctime AS u
ON s.user_id = u.user_id

输出数据如下：

log_id  timestamp            user_id  age     sex
1       2021-11-01 00:01:03  a        12-18   男
2       2021-11-01 00:03:00  b        18-24   女
3       2021-11-01 00:05:00  c        18-24   男
4       2021-11-01 00:06:00  b        18-24   女
5       2021-11-01 00:07:00  c        18-24   男

注意：实时的 Lookup 维表关联能使用 处理时间 去做关联。

同一条数据关联到的维度数据可能不同：实时数仓中常用的实时维表都是在不断的变化中的，当前流表数据关联完维表数据后，如果同一个 key 的维表的数据发生了变化，已关联到的维表的结果数据不会再同步更新。举个例子，维表中 user_id 为 $1$ 的数据在 $08 : 00$ 时 age 由 12-18 变为了 18-24，那么当我们的任务在 $08 : 01$ failover 之后从 $07 : 59$ 开始回溯数据时，原本应该关联到 12-18 的数据会关联到 18-24 的 age 数据。这是有可能会影响数据质量的。所以小伙伴萌在评估你们的实时任务时要考虑到这一点。
会发生实时的新建及更新的维表博主建议小伙伴萌应该建立起数据延迟的监控机制，防止出现流表数据先于维表数据到达，导致关联不到维表数据。

再说说维表常见的性能问题及优化思路。

所有的维表性能问题都可以总结为：高 QPS 下访问维表存储引擎产生的任务背压，数据产出延迟问题。

举个例子：

在没有使用维表的情况下：一条数据从输入 Flink 任务到输出 Flink 任务的时延假如为 $0.1\ ms$ ，那么并行度为 $1$ 的任务的吞吐可以达到 $1\ query\ /\ 0.1\ ms = 10000\ qps$ 。
在使用维表之后：每条数据访问维表的外部存储的时长为 $2\ ms$ ，那么一条数据从输入 Flink 任务到输出 Flink 任务的时延就会变成 $2.1\ ms$ ，那么同样并行度为 1 的任务的吞吐只能达到 $1\ query\ /\ 2.1\ ms = 476\ qps$ 。两者的吞吐量相差 $21$ 倍。

这就是为什么维表 Join 的算子会产生背压，任务产出会延迟。

那么当然，解决方案也是有很多的。抛开 Flink SQL 想一下，如果我们使用 DataStream API，甚至是在做一个后端应用，需要访问外部存储时，常用的优化方案有哪些？这里列举一下：

1️⃣ 按照 Redis 维表的 key 分桶 + local cache：通过按照 key 分桶的方式，让大多数据的维表关联的数据访问走之前访问过的 local cache 即可。这样就可以把访问外部存储 $2.1\ ms$ 处理一个 Query 变为访问内存的 $0.1\ ms$ 处理一个 Query 的时长。
2️⃣ 异步访问外存：DataStream API 有异步算子，可以利用线程池去同时多次请求维表外部存储。这样就可以把 $2.1\ ms$ 处理 $1$ 个 Query 变为 $2.1\ ms$ 处理 $10$ 个 Query。吞吐可变优化到 $10\ query\ /\ 2.1\ ms = 4761\ qps$ 。
3️⃣ 批量访问外存：除了异步访问之外，我们还可以批量访问外部存储。举一个例子：在访问 Redis 维表的 $1$ Query 占用 $2.1\ ms$ 时长中，其中可能有 $2\ ms$ 都是在网络请求上面的耗时，其中只有 $0.1\ ms$ 是 Redis Server 处理请求的时长。那么我们就可以使用 Redis 提供的 pipeline 能力，在客户端（也就是 Flink 任务 lookup join 算子中），攒一批数据，使用 pipeline 去同时访问 Redis Sever。这样就可以把 $2.1\ ms$ 处理 $1$ 个 Query 变为 $7\ ms=2\ ms + 50 * 0.1\ ms$ 处理 $50$ 个 Query。吞吐可变为 $50\ query\ /\ 7\ ms = 7143\ qps$ 。

博主认为上述优化效果中，最好用的是 1️⃣ + 3️⃣，2️⃣ 相比 3️⃣ 还是一条一条发请求，性能会差一些。

既然 DataStream 可以这样做，Flink SQL 必须必的也可以借鉴上面的这些优化方案。具体怎么操作呢？看下文骚操作

1️⃣ 按照 Redis 维表的 key 分桶 + local cache：SQL 中如果要做分桶，得先做 group by，但是如果做了 group by 的聚合，就只能在 udaf（user defined aggregation function）中做访问 Redis 处理，并且 udaf 产出的结果只能是一条，所以这种实现起来非常复杂。我们选择不做 keyby 分桶。但是我们可以直接使用 local cache 去做本地缓存，虽然【直接缓存】的效果比【先按照 key 分桶再做缓存】的效果差，但是也能一定程度上减少访问 Redis 压力。在博主实现的 Redis Connector 中，内置了 local cache 的实现。
2️⃣ 异步访问外存：目前博主实现的 Redis Connector 不支持异步访问，但是官方实现的 HBase Connector 支持这个功能，参考下面链接文章的，点开之后搜索 lookup.async。https://nightlies.apache.org/flink/flink-docs-release-1.13/docs/connectors/table/hbase/
3️⃣ 批量访问外存：这玩意官方必然没有实现啊，但是，但是，但是，经过博主周末两天的疯狂 debug，改了改源码，搞定了基于 Redis 的批量访问外存优化的功能。

2.Array Expansion（数组列转行）

应用场景（支持 Batch / Streaming）：将表中 ARRAY 类型字段（列）拍平，转为多行。

实际案例：比如某些场景下，日志是合并、攒批上报的，就可以使用这种方式将一个 Array 转为多行。

CREATE TABLE show_log_table (
    log_id BIGINT,
    show_params ARRAY<STRING>
) WITH (
  'connector' = 'datagen',
  'rows-per-second' = '1',
  'fields.log_id.min' = '1',
  'fields.log_id.max' = '10'
);

CREATE TABLE sink_table (
    log_id BIGINT,
    show_param STRING
) WITH (
  'connector' = 'print'
);

INSERT INTO sink_table
SELECT
    log_id,
    t.show_param as show_param
FROM show_log_table
-- array 炸开语法
CROSS JOIN UNNEST(show_params) AS t (show_param)

show_log_table 原始数据：

+I[7, [a, b, c]]
+I[5, [d, e, f]]

输出结果如下所示：

-- +I[7, [a, b, c]] 一行转为 3 行
+I[7, a]
+I[7, b]
+I[7, b]
-- +I[5, [d, e, f]] 一行转为 3 行
+I[5, d]
+I[5, e]
+I[5, f]

3.Table Function（自定义列转行）

应用场景（支持 Batch / Streaming）：这个其实和 Array Expansion 功能类似，但是 Table Function 本质上是个 UDTF 函数，和离线 Hive SQL 一样，我们可以自定义 UDTF 去决定列转行的逻辑。

Table Function 使用分类：

Inner Join Table Function：如果 UDTF 返回结果为空，则相当于 $1$ 行转为 $0$ 行，这行数据直接被丢弃。
Left Join Table Function：如果 UDTF 返回结果为空，折行数据不会被丢弃，只会在结果中填充 null 值。

public class TableFunctionInnerJoin_Test {

    public static void main(String[] args) throws Exception {

        FlinkEnv flinkEnv = FlinkEnvUtils.getStreamTableEnv(args);

        String sql = "CREATE FUNCTION user_profile_table_func AS 'flink.examples.sql._07.query._06_joins._06_table_function"
                + "._01_inner_join.TableFunctionInnerJoin_Test$UserProfileTableFunction';\n"
                + "\n"
                + "CREATE TABLE source_table (\n"
                + "    user_id BIGINT NOT NULL,\n"
                + "    name STRING,\n"
                + "    row_time AS cast(CURRENT_TIMESTAMP as timestamp(3)),\n"
                + "    WATERMARK FOR row_time AS row_time - INTERVAL '5' SECOND\n"
                + ") WITH (\n"
                + "  'connector' = 'datagen',\n"
                + "  'rows-per-second' = '10',\n"
                + "  'fields.name.length' = '1',\n"
                + "  'fields.user_id.min' = '1',\n"
                + "  'fields.user_id.max' = '10'\n"
                + ");\n"
                + "\n"
                + "CREATE TABLE sink_table (\n"
                + "    user_id BIGINT,\n"
                + "    name STRING,\n"
                + "    age INT,\n"
                + "    row_time TIMESTAMP(3)\n"
                + ") WITH (\n"
                + "  'connector' = 'print'\n"
                + ");\n"
                + "\n"
                + "INSERT INTO sink_table\n"
                + "SELECT user_id,\n"
                + "       name,\n"
                + "       age,\n"
                + "       row_time\n"
                + "FROM source_table,\n"
                // Table Function Join 语法对应 LATERAL TABLE
                + "LATERAL TABLE(user_profile_table_func(user_id)) t(age)";

        Arrays.stream(sql.split(";"))
                .forEach(flinkEnv.streamTEnv()::executeSql);
    }

    public static class UserProfileTableFunction extends TableFunction<Integer> {

        public void eval(long userId) {
            // 自定义输出逻辑
            if (userId <= 5) {
                // 一行转 1 行
                collect(1);
            } else {
                // 一行转 3 行
                collect(1);
                collect(2);
                collect(3);
            }
        }

    }
}

执行结果如下：

-- userId <= 5，则只有 1 行结果
+I[3, 7, 1, 2021-05-01T18:23:42.560]
-- userId > 5，则有行 3 结果
+I[8, e, 1, 2021-05-01T18:23:42.560]
+I[8, e, 2, 2021-05-01T18:23:42.560]
+I[8, e, 3, 2021-05-01T18:23:42.560]
-- userId <= 5，则只有 1 行结果
+I[4, 9, 1, 2021-05-01T18:23:42.561]
-- userId > 5，则有行 3 结果
+I[8, c, 1, 2021-05-01T18:23:42.561]
+I[8, c, 2, 2021-05-01T18:23:42.561]
+I[8, c, 3, 2021-05-01T18:23:42.561]

力扣刷题——第一题一维数组的动态和姬公子521 力扣刷题专栏 leetcode 算法动态规划
力扣刷题第一题一维数组的动态和第一题一维数组的动态和给你一个数组nums。数组「动态和」的计算公式为：runningSum[i]=sum(nums[0]…nums[i])。请返回nums的动态和。示例1：输入：nums=[1,2,3,4]输出：[1,3,6,10]解释：动态和计算过程为[1,1+2,1+2+3,1+2+3+4]。来源：力扣（LeetCode）链接：https://leetcode.
【手写数据库内核组件】0301 缓存模型介绍，缓存分层架构与缓存映射算法，以及缓存淘汰替换算法，同步一致的策略韩楚风 C语言实战-手写数据库内核组件数据库缓存架构 c语言数据结构
0301缓存介绍专栏内容：postgresql使用入门基础手写数据库toadb并发编程个人主页：我的主页管理社区：开源数据库座右铭：天行健，君子以自强不息；地势坤，君子以厚德载物.文章目录0301缓存介绍一、概述二、多样的数据造就各异的缓存三、缓存的架构四、缓存算法4.1缓存组织算法4.2缓存映射算法4.3缓存替换算法4.4缓存同步算法五、总结结尾
数据库查询优化：提升性能的关键实践 qcidyu 文章归档 DBA最佳实践性能调优查询执行计划索引 SQL 数据库性能查询优化
title:数据库查询优化：提升性能的关键实践date:2025/1/30updated:2025/1/30author:cmdragonexcerpt:在当今数据驱动的商业环境中，数据库的性能直接影响着应用程序的响应速度和用户体验。查询优化是性能调优的重要组成部分，通过对SQL查询的分析与改进，减少查询执行时间和资源消耗，从而提升整体系统效率。categories:前端开发tags:查询优化数据
LEO、LSO、AR、ISR、HW都表示什么含义？ jasen91 kafka 大数据
LEO（LogEndOffset）：日志末端位移值或末端偏移量，表示日志下一条待插入消息的位移值。举个例子，如果日志有10条消息，位移值从0开始，那么，第10条消息的位移值就是9。此时，LEO=10。LSO（LogStableOffset）：这是Kafka事务的概念。如果你没有使用到事务，那么这个值不存在（其实也不是不存在，只是设置成一个无意义的值）。该值控制了事务型消费者能够看到的消息范围。它经
力扣 349.两个数组的交集（c语言）「已注销」 leetcode 算法职场和发展
1.题目描述2.思路讲解乍一看这题好像挺简单，但我写的时候也出现了很多问题。终究还是自己太菜了。我最后是使用的哈希表来解决，因为测试用例中没有出现负数，所以可行（对我来说），创建两个哈希表，最后值只要不为0就代表一定为交集3.代码实现int*intersection(int*nums1,intnums1Size,int*nums2,intnums2Size,int*returnSize){//创建
问题1问题问题 HhhDreamof_ c语言
#include#include//定义SMap类，用于表示邻接表中的节点classSMap{public:intdata;//数据域SMap*next;//指针域SMap(intv){//初始化data=v;next=nullptr;}~SMap(){//析构函数，正确释放链表后续节点所占用的内存（如果有）while(next!=nullptr){SMap*temp=next;next=next
mybatis 嵌套子查询传参是list CCCout mybatis 数据库
提示：现在要写一个sql以及关联一个子查询，而子查询传入参数和父查询一致例如：接口传参为platIdList，这个列表不仅要作为主查询条件还是子查询条件，这里需要把传参转为字符串并作为返回列传给子查询，由于从list->String所以使用find_in_set或者转为list处理SELECTDISTINCTidFROMdeptWHEREFIND_IN_SET(plat_id,REPLACE(RE
oracle快速统计表条数_oracle 统计指定条件下所有表的行数 weixin_39583222 oracle快速统计表条数
今天需要统计下指定用户下的所有表的行数，于是采用了oracle内置视图：selecttable_name,num_rowsfromdba_tableswhereowner='USERNAME';或selecttable_name,num_rowsfromuser_all_tables;可是统计结果发现，有的表的统计数量和实际数量有差异，因此，直接自己写了个统计指定条件下表的记录的sql：--创建一
pytorch深度Q网络纠结哥_Shrek pytorch 人工智能 python
DQN引入了深度神经网络来近似Q函数，解决了传统Q-learning在处理高维状态空间时的瓶颈，尤其是在像Atari游戏这样的复杂环境中。DQN的核心思想是使用神经网络Q(s,a;θ)Q(s,a;\theta)Q(s,a;θ)来近似Q值函数，其中θ\thetaθ是神经网络的参数。DQN的关键创新包括：经验回放（ExperienceReplay）：在强化学习中，当前的学习可能会依赖于最近的经验，容易
基于最近邻数据进行分类纠结哥_Shrek 分类数据挖掘人工智能
完整代码：importtorchimportnumpyasnpfromsklearn.neighborsimportKNeighborsClassifierfromsklearn.metricsimportaccuracy_scoreimportmatplotlib.pyplotasplt#生成一个简单的数据集(2个特征和2个分类)#X为输入特征，y为标签X=np.array([[1,2],[2,
oracle两列数列找差异,ORACLE中比较两个数据库的差异沙雕网友已上线 oracle两列数列找差异
方法一、用PL/SQLDEVELOPER来比较1.登陆数据库A.2.打开TOOLS菜单下的CompareUserObjects3.点TargetSession，登陆数据库B4.执行Compare5.返回的是所有不同的对象以及更新语句[@more@]方法二、1、对需要比较的表进行分析(可全表可抽样，自选),否则统计信息不准；2、通过dba_tab_col_statistics表的column_nam
PostgreSQL的一主一从集群搭建部署 (同步) keep__go PostgreSQL postgresql 数据库
一、实验环境虚拟机名IP身份简称keep-postgres12-node1192.168.122.87主节点node1keep-postgres12-node2192.168.122.89备节点node2二、安装数据库源码包方式（主）1、创建用户[root@keep-postgres12-node1~]#groupaddpostgres[root@keep-postgres12-node1~]#u
Oracle 统计信息笔记----一、表的统计信息 w.ang.jie oracle 随记统计信息 oracle 数据库统计信息
sosi.txt脚本：SHOWOptimizerStatisticsInformation；显示表级别、分区级别、子分区级别的统计信息。Oracle数据库的统计信息存储在数据字典里1.对表test收集统计信息avg_row_len：表示目标表的平均行长度。（不算行头）数字100在Oracle数据块的行里占2字节，加上描述其长度的1字节，一共3字节同理，'CUIHUA’一共占6+1=7字节。两个字段
搭建 PostgreSQL 阿杰技术数据库数据库 postgresql
端口：5432代理备份端口：6432下载postgresql-15.0-1-windows-x64乱码显示配置环境变量PGDATA=数据目录位置找到postgresql.conf文件，修改参数lc_messages='UTF8'max_connections=1000shared_buffers=4GBwork_mem=8MB问题：远程易掉线方案：修改配置信息tcp_keepalives_idle
SQLAlchemy ORM在Python Web开发中的核心作用探究不一样的信息安全网络杂烩 sql
摘要在PythonWeb开发领域，SQLAlchemyORM扮演着至关重要的角色。作为一种对象关系映射工具，它能够将Python类与数据库表相映射，实现数据行与Python对象之间的转换。开发者可以使用面向对象的方法操作数据库，无需直接编写SQL语句，从而大幅提升开发效率并降低出错概率。SQLAlchemyORM提供了一套强大而灵活的数据库操作方法，助力开发者快速构建和维护复杂的数据模型。关键词S
Windows 远程桌面 RDP 会话超时设置 TechExplorer365 Tool windows
Windows远程桌面RDP会话超时设置Windows远程桌面（RDP）可能由于会话超时而导致重新要求登录。你可以通过修改注册表或组策略来延长远程桌面的会话超时时间。修改注册表：打开注册表编辑器（regedit）。导航到以下路径：HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\TerminalServer找到IdleTimeoutSecs键（
线性表之链表蚂蚁不吃土& C 数据结构链表数据结构
线性表之链表：头结点和头指针的区分：不管带不带头结点，头指针都始终指向链表的第一个结点；而头结点是带头结点的链表中的第一个结点，结点内通常不存储信息。注意：以下代码均是C环境下，不支持C++中的引用传递&typedef在C、C++中对struct的影响typedef表示类型定义的意思，typedefstruct是为了使用这个结构体方便，给结构体起个别名。（1）在C中的区别是使用时，是否可以省去st
非线性动力学笔记C2.6-2.8震荡，势，数值求解阿北Ben 笔记
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言C2一维流动2.6一维流动中震荡(oscillation)的不可能性机械类比2.7势(Potential)例2.7.22.8数值求解(numericalsolution)2.8.1欧拉方法2.8.2例子前言提示：这里可以添加本文要记录的大概内容：参考书《Nonlineardynamicsandchaos》StevenH.S
move移动语义详解 Say-hai C++c++面试
move移动语义移动语义是C++11引入的一种机制，用于提高程序的性能和资源管理效率，特别是在涉及大数据对象的场景下。移动语义通过转移资源所有权，而不是复制资源，减少了不必要的拷贝操作。一、为什么需要移动语义？当对象需要被复制时（如函数返回值或传参），通常会调用复制构造函数（copyconstructor）。复制操作往往意味着需要分配新资源并将原资源的数据拷贝到新资源中；而如果不需要保留原对象的内
第25天：web攻防-通用漏洞&sql读写注入&MYSQL&MSSQL 不灭锦鲤 sql mysql sqlserver
#知识点：1、sql注入-mysql数据库2、sql注入-mssql数据库3、sql注入-postgreSQL数据库#详细点：Access无高权限注入点-只能猜解，还是暴力猜解MYSQL，PostgreSQL，MSSQL高权限注入，可升级为读写执行。演示案例MYSQL读取文件内容，记把my.ini改成utf-8的格式使用load_file读取网站关键性内容，在sql注入中，我试了读取不道，明明在数
MySQL知识点总结（九） a_j58 mysql 数据库
请说明FILE,PROCESS,RELOAD这三个系统权限的作用？FILE：允许运行SQL语句在服务器主机文件系统中读写文件。PROCESS；允许使用SHOWPROCESSLIST语句查看客户端正在执行的所有语句。RELOAD:允许执行FLUSH语句以重新加载日志和权限表。请说明授权表的内容和它的作用MySQL服务器在启动时将授权表从mysql数据库读取到内存中，所有的访问控制决策都以这些表为依据
MySQL中的读锁与写锁：概念与作用深度剖析恩爸编程 mysql mysql 数据库 mysql读锁 mysql写锁 mysql中的读锁啥意思 mysql中的写锁啥意思 mysql锁机制
MySQL中的读锁与写锁：概念与作用深度剖析在MySQL数据库的并发控制机制中，读锁和写锁起着至关重要的作用。它们是确保数据在多用户环境下能够正确、安全地被访问和修改的关键工具。一、读锁（共享锁）概念读锁，也称为共享锁（SharedLock），在MySQL中使用LOCKINSHAREMODE语句来实现。当一个事务对某一数据对象施加读锁时，允许其他事务同时对该数据对象进行读取操作，但不允许其他事务对
C#Halcon扇形/圆环缺陷检测（极坐标变换法）浮生如梦_ c#计算机视觉视觉检测图像处理
扇形交互绘制与极坐标变换插件（加载图像—绘制扇形—极坐标变换—图像返回：运行效果）应用场景：缺陷检测，OCR识别，二维码识别，辅助定位等场景绘制扇形：原型算子create_drawing_object_circle_sector||create_drawing_object_ellipse_sector本次Demo小编用的是标准圆形绘制的扇形，目的是为了后面极坐标变换如果不涉及极坐标变换，可以采用
Java代码-八种数组排序方法忧郁小王子x 算法 java
一.冒泡排序1.1概述对于一组，多次将数组中的数两两比较，较大或者较小的数向后排（经过一轮比较后，最大/最小的数就会到结尾），循环直至有序排列。1.2代码实现importjava.lang.reflect.Array;importjava.util.Arrays;importjava.util.Scanner;publicclassmaopao{publicstaticvoidmain(Strin
9. 马科维茨资产组合模型+FF5+GARCH风险模型优化方案（理论+Python实战） AI量金术师金融资产组合模型进化论 python 开发语言金融人工智能机器学习算法
目录0.承前1.核心风险函数代码讲解1.1数据准备和初始化1.2单资产GARCH建模1.3模型拟合和波动率预测1.4异常处理机制1.5相关系数矩阵计算1.6构建波动率矩阵1.7计算协方差矩阵1.8确保矩阵对称性1.9确保矩阵半正定性1.10格式转换和返回1.11calculate_covariance_matrix函数汇总2.代码汇总3.反思3.1不足之处3.2提升思路4.启后0.承前本篇博文是对
240. 搜索二维矩阵|| cccc楚染rrrr LeetCode 矩阵线性代数 java 算法数据结构
参考题解：https://leetcode.cn/problems/search-a-2d-matrix-ii/solutions/2361487/240-sou-suo-er-wei-ju-zhen-iitan-xin-qin-7mtf将矩阵旋转45度，可以看作一个二叉搜索树。假设以左下角元素为根结点，当target比root大的时候，则舍弃当前列，右移一列；当target比root小的时候，则
Java二维数组排序 purpleFairyx 二维数组排序比较器 Lambda表达式
今天在刷力扣的时候，有道题卡住了，没办法去看题解，发现题解是将其二维数组排序了，我才猛然发现我还不了解二位数组排序的知识。所以来记录一下。答案中的代码是这样的，假设需要排序的数组intervals：int[][]intervals={{2,3},{2,9},{4,5},{3,7},{6,7},{8,9},{1,10}};Arrays.sort(intervals,newComparator(){@
大数据毕业设计hadoop+spark+hive豆瓣图书数据分析可视化大屏豆瓣图书爬虫图书推荐系统 qq_79856539 javaweb java 大数据 hadoop 课程设计
系统总体目标基于Spark的个性化书籍推荐系统是一种基于大数据技术的智能推荐系统，它可以根据用户的历史行为和偏好，为用户提供个性化的书籍推荐。该系统采用Spark技术，可以实现大数据的实时处理，从而提高推荐系统的准确性和可靠性。此外，该系统还可以根据用户的习惯和偏好，提供更加个性化的书籍推荐，从而满足用户的需求。系统的使用者包含普通用户和管理员两类，普通用户是系统的主要服务对象，主流人群是经常查看
vs2015查找功能失效网络解决方案整理铮铭 vc++vs2015
No1：问题的现象:通过使用Ctrl+Shift+F也就是FindInFiles功能，使用之后只能显示统计结果,不显示具体行.如下图regedit中在注册表中查找：HKEY_CLASSES_ROOT\Wow6432Node\CLSID\{73B7DC00-F498-4ABD-AB79-D07AFD52F395}\InProcServer32发现了默认的值被设置成了NULL。(我是x64系统)问题就
IDEA+Java+SSH+Bootstrap+Mysql实现在线考试系统(含论文) 2401_89694162 java intellij-idea ssh
–Recordsoft_managerINSERTINTOt_managerVALUES(1,‘管理员’,‘admin’,‘admin’);–Tablestructurefort_paperDROPTABLEIFEXISTSt_paper;CREATETABLEt_paper(idint(11)NOTNULLAUTO_INCREMENT,joinDatedatetime(0)NULLDEFAULT
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb

【大数据】Flink SQL 语法篇（七）：Lookup Join、Array Expansion、Table Function

Flink SQL 语法篇（七）：Lookup Join、Array Expansion、Table Function

1.Lookup Join（维表 Join）

2.Array Expansion（数组列转行）

3.Table Function（自定义列转行）

你可能感兴趣的:(#,Flink,SQL,大数据,flink,sql,Lookup,Join,Array,Expansion,Table,Function,维表,Join)