后缀数组经典题---不可重叠最长重复子串 poj1743

内容也是别处看来的,就不写原创了

意:有N(1 <= N <=20000)个音符的序列来表示一首乐曲,每个音符都是1..88范围内的整数,现在要找一个重复的主题。“主题”是整个音符序列的一个子串,它需要满足如下条件:

    1.长度至少为5个音符。

    2.在乐曲中重复出现。(可能经过转调,“转调”的意思是主题序列中每个音符都被加上或减去了同一个整数值)

    3.重复出现的同一主题不能有公共部分。


思路:后缀数组。求出任意相邻音符的差值,然后把问题转化为 不可重叠最长重复子串,用后缀数组来做。先二分答案,把题目变成判定性问题:判断是否存在两个长度为k的子串是相同的,且不重叠。解决这个问题的关键还是利用 height数组。把排序后的后缀分成若干组,其中每组的后缀之间的height值都不小于k。例如,字符串为“aabaaaab”,当k=2时,后缀分成了4组,如下图所示(摘自罗穗骞的国家集训队论文):

ps:在每个分组里面找不重叠的子串

后缀数组经典题---不可重叠最长重复子串 poj1743_第1张图片

然后,易知最长公共前缀不小于k的两个后缀一定在同一组里,也就是说不重复的最长重复子串肯定在同一组了,但是有没有呢还要看同一组里的后缀的sa[]的最大值跟最小值之差是否不小于k,sa[]是排在第几的后缀是谁,即该后缀的起始坐标,你要保证最大值的后缀与最小值的后缀起始坐标之间相差k才行,保证两个后缀的公共前缀不重合才行。

关键是要明确height[]与sa[]数组是干啥的,各代表什么意义才行。

你可能感兴趣的:(后缀数组经典题---不可重叠最长重复子串 poj1743)