问题同样出自问答区某个小伙伴的问题,原地址:https://ask.csdn.net/questions/7897228,不过这次的小伙伴问的是 mysql 的。当时老顾电脑上没有安装 mysql ,临时下载了安装,然后直接在命令行调试,所以当时的指令就显得很繁琐了。
问答中,小伙伴很清楚的给出了逻辑,比如龙山路这个数据,他分成两个连续片段,而不是一个。那么问题来了,简单的 group by 已经无法实现这个小伙伴的需求了,所以,我们来用 cte 完成一次吧。
在当时,老顾也没想那么多,就想着 cte 可以递归,那么就用 cte 来完成就可以了。按照递归分析一下需求:
1、每一个数据与之前的数据比较,如果 position 不相同,则为当前片段的开始
2、对所有非连续片段开始的数据,追加到前一行之后,开始数据 start_md 引用片段开始的数据
3、在所有数据都追加到递归后,取所有 start_md 相同的行及最大 end_md 作为结果返回
嗯,老顾当时就是这么个思路,问答中已经有了 mysql 的写法了,这次,我们用 mssql 写一遍。
with t as ( -- 原始数据
select 1 id, 100 start_md, 121 end_md, '龙山路103号' position
union all select 2, 121, 172, '龙山路103号'
union all select 3, 172, 254, '龙山路103号'
union all select 4, 254, 277, '解放路440号'
union all select 5, 277, 298, '解放路440号'
union all select 6, 298, 401, '团结路205号'
union all select 7, 401, 422, '人民西路97号'
union all select 8, 422, 469, '人民西路97号'
union all select 9, 469, 501, '龙山路103号'
union all select 10, 501, 537, '龙山路103号'
),t1 as (
select * from t a
where not exists(select 1 from t where position=a.position and end_md=a.start_md)
select * from t1
我们都知道,cte 递归的时候,是需要最大关联,也就是笛什么卡什么尔的鸡。。。。?算了,直接写代码吧,老顾没上过学,这些名词搞不懂。。。。
with t as ( -- 原始数据
select 1 id, 100 start_md, 121 end_md, '龙山路103号' position
union all select 2, 121, 172, '龙山路103号'
union all select 3, 172, 254, '龙山路103号'
union all select 4, 254, 277, '解放路440号'
union all select 5, 277, 298, '解放路440号'
union all select 6, 298, 401, '团结路205号'
union all select 7, 401, 422, '人民西路97号'
union all select 8, 422, 469, '人民西路97号'
union all select 9, 469, 501, '龙山路103号'
union all select 10, 501, 537, '龙山路103号'
),t1 as (
select * from t a
where not exists(select 1 from t where position=a.position and end_md=a.start_md)
union all
select a.id,b.start_md,a.end_md,a.position from t a,t1 b
where a.start_md=b.end_md and a.position=b.position
select * from t1 order by start_md
嗯,直接把连续的片段的 start_md 给弄成一样的了,这个时候,我们再按照 start_md 一分组,聚合一下 end_md 就完成了
with t as ( -- 原始数据
select 1 id, 100 start_md, 121 end_md, '龙山路103号' position
union all select 2, 121, 172, '龙山路103号'
union all select 3, 172, 254, '龙山路103号'
union all select 4, 254, 277, '解放路440号'
union all select 5, 277, 298, '解放路440号'
union all select 6, 298, 401, '团结路205号'
union all select 7, 401, 422, '人民西路97号'
union all select 8, 422, 469, '人民西路97号'
union all select 9, 469, 501, '龙山路103号'
union all select 10, 501, 537, '龙山路103号'
),t1 as (
select * from t a
where not exists(select 1 from t where position=a.position and end_md=a.start_md)
union all
select a.id,b.start_md,a.end_md,a.position from t a,t1 b
where a.start_md=b.end_md and a.position=b.position
select start_md,max(end_md) end_md,position
from (
select * from t1
) a
group by position,start_md
order by start_md
还是这个问题,除了 cte 递归之外,我们还可以使用 row_number 来完成哦。这里也许会惊讶一些小伙伴,但是,老顾要说,从来没有人规定,开窗函数在查询中只能使用一次!
1、 使用开窗函数,分别对递增数据进行完整的序号分配,和分组后的序号分配
with t as ( -- 原始数据
select 1 id, 100 start_md, 121 end_md, '龙山路103号' position
union all select 2, 121, 172, '龙山路103号'
union all select 3, 172, 254, '龙山路103号'
union all select 4, 254, 277, '解放路440号'
union all select 5, 277, 298, '解放路440号'
union all select 6, 298, 401, '团结路205号'
union all select 7, 401, 422, '人民西路97号'
union all select 8, 422, 469, '人民西路97号'
union all select 9, 469, 501, '龙山路103号'
union all select 10, 501, 537, '龙山路103号'
select *
,row_number() over(order by start_md) mid
,row_number() over(partition by position order by start_md) nid from t
order by id
老顾这次使用了两个 row_number ,但是分配序号的依据并不一样哦,一个是按顺序分配,一个是分组分配,这个时候,大家看看 mid 和 nid ,有没有感觉逻辑变得简单了?当 mid-nid 相同,且 position 一致。。。。是不是直接就可以得到问答小伙伴的结果了?
with t as ( -- 原始数据
select 1 id, 100 start_md, 121 end_md, '龙山路103号' position
union all select 2, 121, 172, '龙山路103号'
union all select 3, 172, 254, '龙山路103号'
union all select 4, 254, 277, '解放路440号'
union all select 5, 277, 298, '解放路440号'
union all select 6, 298, 401, '团结路205号'
union all select 7, 401, 422, '人民西路97号'
union all select 8, 422, 469, '人民西路97号'
union all select 9, 469, 501, '龙山路103号'
union all select 10, 501, 537, '龙山路103号'
select min(start_md) start_md,max(end_md) end_md,position
from (
select *
,row_number() over(order by start_md) mid
,row_number() over(partition by position order by start_md) nid
from t
) a
group by mid-nid,position