导读:k
A.串是字符的有限序列 B.空串是由空格构成的串
C.模式匹配是串的一种重要运算 D.串既可以采用顺序存储,也可以采用链式存储
2 若串S1=‘ABCDEFG’, S2=‘9898’,S3=‘###’,S4=‘012345’,执行
concat(replace(S1,substr(S1,length(S2),length(S3)),S3),substr(S4,index(S2,‘8’),length(S2)))
其结果为( )【北方交通大学 1999 一、5 (25/7分)】
A.ABC###G0123 B.ABCD###2345 C.ABC###G2345 D.ABC###2345
E.ABC###G1234 F.ABCD###1234 G.ABC###01234
3.设有两个串p和q,其中q是p的子串,求q在p中首次出现的位置的算法称为( )
A.求子串 B.联接 C.匹配 D.求串长
【北京邮电大学2000 二、4(20/8分)】【西安电子科技大学1996 一、1 (2分)】
4.已知串S=‘aaab’,其Next数组值为( )。【西安电子科技大学1996 一、7 (2分)】
A.0123 B.1123 C.1231 D.1211
5.串 ‘ababaaababaa’ 的next数组为( )。【中山大学1999 一、7】
A.012345678999 B.012121111212 C.011234223456 D.0123012322345
6.字符串‘ababaabab’ 的nextval 为( )
A.(0,1,0,1,04,1,0,1) B.(0,1,0,1,0,2,1,0,1)
C.(0,1,0,1,0,0,0,1,1) D.(0,1,0,1,0,1,0,1,1 )
【北京邮电大学1999 一、1(2分)】
7.模式串t=‘abcaabbcabcaabdab’,该模式串的next数组的值为( ),nextval数组的值为 ( )。
A.0 1 1 1 2 2 1 1 1 2 3 4 5 6 7 1 2 B.01 1 1 2 1 2 1 1 2 3 4 5 6 1 1 2
C.0 1 1 1 0 0 1 3 1 0 1 1 0 0 7 0 1 D.01 1 1 2 2 3 1 1 2 3 4 5 6 7 1 2
E.0 1 1 0 0 1 1 1 0 1 1 0 0 1 7 0 1 F.01 1 0 2 1 3 1 0 1 1 0 2 1 7 0 1
【北京邮电大学1998 二、3(2分)】
8.若串S=’software’,其子串的数目是( )。【西安电子科技大学2001应用 一、2(2分)】
A.8 B.37 C.36 D.9
9.设S为一个长度为n的字符串,其中的字符各不相同,则S中的互异的非平凡子串(非空且不同于S本身)的个数为( )。【中科院计算所1997 】
A.2n-1 B.n2 C.(n2/2)+(n/2) D.(n2/2)+(n/2)-1 E. (n2/2)-(n/2)-1 F.其他情况
10.串的长度是指( )【北京工商大学2001 一、6 (3分)】
A.串中所含不同字母的个数 B.串中所含字符的个数
C.串中所含不同字符的个数 D.串中所含非空格字符的个数
二、判断题
1.KMP算法的特点是在模式匹配时指示主串的指针不会变小。( )【北京邮电大学2002 一、4 (1分)】
2.设模式串的长度为m,目标串的长度为n,当n≈m且处理只匹配一次的模式时,朴素的匹配(即子串定位函数)算法所花的时间代价可能会更为节省。( )【长沙铁道学院1998 一、1 (1分)】
3.串是一种数据对象和操作都特殊的线性表。( )【大连海事大学2001 1、L (1分)】
二、填空题
1.空格串是指__(1)__,其长度等于___(2)__。 【西安电子科技大学2001软件 一、4(2分)】
2.组成串的数据元素只能是________。 【中山大学1998 一、5 (1分)】
3.一个字符串中________称为该串的子串 。 【华中理工大学2000 一、3(1分)】
4.INDEX(‘DATASTRUCTURE’, ‘STR’)=________。【福州大学1998 二、4(2分)】
5.设正文串长度为n,模式串长度为m,则串匹配的KMP算法的时间复杂度为________。
【重庆大学2000 一、4】
6.模式串P=‘abaabcac’的next函数值序列为________。【西安电子科技大学2001软件 一、6(2分)】
7.字符串’ababaaab’的nextval函数值为________。 【北京邮电大学2001 二、4 (2分)】
8.设T和P是两个给定的串,在T中寻找等于P的子串的过程称为__(1)__,又称P为__(2)__。
【西安电子科技大学1998 二、5 (16/6分)】
9.串是一种特殊的线性表,其特殊性表现在__(1)__;串的两种最基本的存储方式是__(2)__、__(3)__;两个串相等的充分必要条件是__(4)__。 【中国矿业大学2000 一、3 (4分)】
10.两个字符串相等的充分必要条件是_______。 【西安电子科技大学1999软件 一、1 (2分)】
11.知U=‘xyxyxyxxyxy’;t=‘xxy’;
ASSIGN(S,U);
ASSIGN(V,SUBSTR(S,INDEX(s,t),LEN(t)+1));
ASSIGN(m,‘ww’)
求REPLACE(S,V,m)= ________。 【东北大学1997 一、1 (5分)】
12.实现字符串拷贝的函数strcpy为:
void strcpy(char *s , char *t) /*copy t to s*/
{ while (________)
} 【浙江大学1999一、5(3分)】
13.下列程序判断字符串s 是否对称,对称则返回1,否则返回0;如f("abba")返回1,f("abab")返回0;
int f((1)________)
{int i=0,j=0;
while (s[j])(2)________
for(j--; i return((3)_______)
} 【浙江大学1999一、6 (3分)】
14.下列算法实现求采用顺序结构存储的串s和串t的一个最长公共子串。
程序(a)
PROCEDURE maxcomstr(VAR s,t : orderstring; VAR index,length : integer);
VAR i,j,k,length1:integer; con:boolean;
BEGIN
index :=0; length :=0; i :=1;
WHILE(i<=s.len) DO
[j:=1;
WHILE (j<=t.len) DO
[ IF (s[i]=t[j]) THEN
[ k:=1; length1:=1; con:=true;
WHILE con DO
IF (1)__THEN [length1:=length1+1;k:=k+1;] ELSE(2)_
IF (length1>length) THEN [index:=i; length:=length1; ]
(3)____
]
ELSE (4)____
]
(5)___
]
END;
程序(b)
void maxcomstr(orderstring *s,*t; int index, length)
{int i,j,k,length1,con;
index=0;length=0;i=1;
while (i<=s.len)
{j=1;
while(j<=t.len)
{ if (s[i]= =t[j])
{ k=1;length1=1;con=1;
while(con)
if(1)_{ length1=length1+1;k=k+1; } else(2)__
if (length1>length) { index=i; length=length1; }
(3)____
}
else (4)___
}
(5) __
} } 【上海大学2000 一、2 (10分)】
15.完善算法:求KMP算法中next数组。
PROC get _next(t:string,VAR next:ARRAY[1..t.len] OF integer);
BEGIN
j:=1; k:=(1)__ next[1]:=0;
WHILE j IF k=0 OR t.ch[j]=t.ch[k] THEN BEGIN j:=j+1; k:=k+1; next[j]:=kEND
ELSE k:=(2)___
END;
【中山大学1998 四、1 (4分)】
16.下面函数index用于求t是否为s的子串,若是返回t第一次出现在s中的序号(从1开始计),否则返回0。
例如:s=‘abcdefcdek’,t=‘cde’,则indse(s,t)=3, index(s,’aaa’)=0 。已知t,s的串长分别是mt,ms
FUNC index(s,t,ms,mt);
i:=1;j:=1;
WHILE (i IF s[i]=t[j] THEN [ (1)__(2)__]
ELSE[ (3)___(4)_]
IF j>mt THEN return (5)____ELSE return (6)__
ENDF;
【南京理工大学1999 三、2(6分)】
17.阅读下列程序说明和pascal程序,把应填入其中的( )处的字句写在答题纸上。
程序说明:
本程序用于判别输入的字符串是否为如下形式的字符串:
W&M$ 其中,子字符串M是子字符串W的字符反向排列,在此假定W不含有字符&和字符$,字符&用作W与M的分隔符,字符$用作字符串的输入结束符。
例如,对输入字符串ab&ba$、11&12$、ab&dd$、&$,程序将分别输出Ok.(是),No.(不是)。
程序
PROGRAM accept(input,output);
CONST midch=’&’ endch=’$’
VAR an:boolean; ch:char;
PROCEDURE match(VAR answer: boolean);
VAR ch1,ch2:char; f:boolean;
BEGIN
read(ch1);
IF ch1<>endch
THEN IF (1)__
THEN BEGIN match(f);
IF f THEN BEGIN read(ch2); answer:=(2)_END ELSE answer:=false
END
ELSE (3)___
ELSE(4)___
END;
BEGIN
writeln(‘Enter String:’);
match(an);
IF an THEN BEGIN
(5)__IF(6)_THEN writeln(‘Ok.’) ELSE writeln(‘No.’)
END
ELSE writeln(‘No.’)
END.【上海海运学院1998 七 (15分)】
18.试利用下列栈和串的基本操作完成下述填空题。
initstack(s) 置s为空栈;
push(s,x) 元素x入栈
pop(s) 出栈操作
gettop(s) 返回栈顶元素;
sempty(s) 判栈空函数;
setnull(st) 置串st为空串;
length(st) 返回串st的长度;
equal(s1,s2) 判串s1和s2是否相等的函数;
concat(s1,s2) 返回联接s1和s2之后的串;
sub(s,i,1) 返回s中第i个字符;
empty(st) 判串空函数
FUNC invert(pre:string; VAR exp:string):boolean;
{若给定的表达式的前缀式pre正确,本过程求得和它相应的表达式exp并返回“true”,否则exp为空串,并返回“false”。已知原表达式中不包含括弧,opset为运算符的集合。}
VAR s:stack; i,n:integer; succ:boolean; ch: char;
BEGIN
i:=1; n:=length(pre); succ:=true;
(1)__ (2)__
WHILE (i BEGIN ch:=sub(pre,i,l)
IF(3)_ THEN (4)__
ELSE IF (5)__THEN (6)_
ELSE BEGIN
exp:=concat((7)___,(8)____)
exp:=concat((9)___,(10)___);
(11)__
END;
i:=i+1
END;
IF (12)___THEN
BEGIN exp:=concat(exp,sub(pre,n,1)); invert:=true END
ELSE BEGIN setnull(exp); invert:=false END
END;
注意:每个空格只填一个语句。 【清华大学1996 八】
四
、应用题
1.名词解释:串 【大连海事1996 一、10 (1分) 】【河海大学1998 二、5(3分)】
2.描述以下概念的区别:空格串与空串。【大连海事大学1996 三、2、(1)(2分)】
3.两个字符串S1和S2的长度分别为m和n。求这两个字符串最大共同子串算法的时间复杂度为T(m,n)。估算最优的T(m,n),并简要说明理由。 【北京工业大学1996 一、5 (6分)】
4.设主串S=‘xxyxxxyxxxxyxyx’,模式串T=‘xxyxy’。请问:如何用最少的比较次数找到T在S中出现的位置?相应的比较次数是多少? 【大连海事大学2001 四 (8分)】
5.KMP算法(字符串匹配算法)较Brute(朴素的字符串匹配)算法有哪些改进?【大连海事大学1996三、1((2分)】
6.已知模式串t=‘abcaabbabcab’写出用KMP法求得的每个字符对应的next和nextval函数值。
【北京邮电大学1997 三 (10分)】
7.给出字符串‘abacabaaad’在KMP算法中的next和nextval数组。【北京邮电大学2000 三、1(5分)】
8.令t=‘abcabaa’,求其next 函数值和nextval函数值。 【北方交通大学1994 一 (6分)】
9.已知字符串‘cddcdececdea’,计算每个字符的next和nextval函数的值。【南京邮电大学2000 一2】
10.试利用KMP算法和改进算法分别求p1=‘abaabaa’和p2=‘aabbaab’的next函数和nextval函数。
【东南大学1999 一、6(8分)】
11.已知KMP串匹配算法中子串为babababaa,写出next数组改进后的next数组信息值(要求写出数组下标起点)。【西南交通大学2000 二、2】
12.求模式串T=‘abcaabbac' 的失败函数Next(j)值。【西安交通大学1996四、4(5分)】
13.字符串的模式匹配KMP算法中,失败函数(NEXT)是如何定义的?计算模式串p=‘aabaabaaabc’中各字符的失败函数值.【石油大学1998 一、2 (10分)】
14.设字符串S=‘aabaabaabaac',P=‘aabaac'
(1)给出S和P的next值和nextval值;
(2)若S作主串,P作模式串,试给出利用BF算法和KMP算法的匹配过程。
【北方交通大学1998二(15分)】15.设目标为t=‘abcaabbabcabaacbacba’,模式为p=‘abcabaa’
(1)计算模式p的naxtval函数值;(5分)
(2)不写出算法,只画出利用KMP算法进行模式匹配时每一趟的匹配过程。(5分)
【清华大学1998 八(10分)】
16.模式匹配算法是在主串中快速寻找模式的一种有效的方法,如果设主串的长度为m,模式的长度为n,则在主串中寻找模式的KMP算法的时间复杂性是多少?如果,某一模式P=’abcaacabaca’,请给出它的NEXT函数值及NEXT函数的修正值NEXTVAL之值。【上海交通大学2000 一(5分)】
17.设目标为S=‘abcaabbcaaabababaabca’,模式为P=‘babab’,
(1)手工计算模式P的nextval数组的值;(5分)
(2)写出利用求得的nextval数组,按KMP算法对目标S进行模式匹配的过程。(5分)
【清华大学1997 四(10分)】
18.用无回溯的模式匹配法(KMP法)及快速的无回溯的模式匹配法求模式串T的next[j]值,添入下面表中:
j 1 2 3 4 5 6 7
t a a b b a a b
kmp法求得的next[j]值
快速无回溯法求得的next[j]值
【北京邮电大学1992 三、1(25/4分)】
19.在改进了的(无回溯)字符串模式匹配中,要先求next数组的值。下面是求nextval值的算法。
TYPE SAR=ARRAY[1..m] OF INTEGER;
PTY=ARRAY[1..m] OF CHAR;
PROCEDURE next2(P:PTY;VAR NEXTVAL:SAR);
{在模式P中求nextval数组的值}
1 BEGIN
2 J:=1;NEXTVAL[1]:=0;K:=0
3 REPEAT
4 IF (K=0) OR (P[J]=P[K])
5 THEN [ J:=J+1;K:=K+1;
6 IF P[J]=P[K]
7 THEN NEXTVAL[J]:=NEXTVAL[K]
8 ELSE NEXTVAL[J]:=K ]
9 ELSE K:=NEXTVAL[K]
10 UNTIL J=m
11 END;
算法中第4行有P[J]=P[K],第六行中也有P[J]=P[K]。两处比较语句相同。请分析说明此两处比较语句的含义是什么?分析此算法在最坏情况下的时间复杂度是多少?【北京邮电大学1993 二、2(6分)】
20.在字符串模式匹配的KMP算法中,求模式的next数组值的定义如下:
next[j]=
请问:
(1)当j=1时,为什么要取next[1]=0?
(2)为什么要取max{K},K最大是多少?
(3)其它情况是什么情况,为什么取next[j]=1? 【北京邮电大学1994 二(8分)】
21.给出KMP算法中失败函数f的定义,并说明利用f进行串模式匹配的规则,该算法的技术特点是什么?
【东南大学1993 一、3 (9分)1997 一、2 (8分) 2001 一、6 (6分)】
22. 在模试匹配KMP算法中所用失败函数f的定义中,为何要求p1p2……pf(j)为p1p2……pj两头匹配的真子串?且为最大真子串? 【东南大学1996 一、3(7分)】
23.如果两个串含有相等的字符,能否说它们相等?【西安电子科技大学2000软件 一、3 (5分)】
24.设S1,S2为串,请给出使S1//S2=S2//S1成立的所有可能的条件(//为连接符)。
【长沙铁道学院1997 三、5 (3分)】【国防科技大学 1999 一】
25.已知:s ='(xyz)+*',t ='(x+z)*y'。试利用联结、求子串和置换等基本运算,将s 转化为t 。
【北方交通大学1996 一、3(5分)】【山东科技大学2002 一、6 (5分)】
第五部分、算法设计
1.设s、t为两个字符串,分别放在两个一维数组中,m、n分别为其长度,判断t是否为s的子串。如果是,输出子串所在位置(第一个字符),否则输出0。(注:用程序实现)【南京航空航天大学1997 九(10分)】
2.输入一个字符串,内有数字和非数字字符,如:ak123x45617960?302gef4563,将其中连续的数字作为一个整体,依次存放到一数组a中,例如123放入a[0],456放入a[1],… … 。编程统计其共有多少个整数,并输出这些数。【上海大学1998 一(13分)】
3. 以顺序存储结构表示串,设计算法。求串S中出现的第一个最长重复子串及其位置并分析算法的时间复杂度。【东南大学2000 五 (15分)】
类似本题的另外叙述有:
(1)如果字符串的一个子串(其长度大于1)的各个字符均相同,则称之为等值子串。试设计一算法,输入字符串S,以“!”作为结束标志。如果串S中不存在等值子串,则输出信息“无等值子串”,否则求出(输出)一个长度最大的等值子串。
例如:若S=“abc123abc123!”,则输出“无等值子串”;若S=“abceebccadddddaaadd!”,则输出“ddddd”。
【华中科技大学2001】
4.假设串的存储结构如下所示,编写算法实现串的置换操作。【清华大学1995 五(15分)】
TYPE strtp=RECORD
ch: ARRAY[1..maxlen] OF char;
curlen:0..maxlen
END;
5.函数void insert(char*s,char*t,int pos)将字符串t插入到字符串s中,插入位置为pos。请用c语言实现该函数。假设分配给字符串s的空间足够让字符串t插入。(说明:不得使用任何库函数)
【北京航空航天大学2001 六 (10分)】
6.设计一个二分检索的算法,在一组字符串中找出给定的字符串,假设所有字符串的长度为4。
(1)简述算法的主要思想;(3分)
(2)用PASCAL语言分别对算法中用到的类型和变量作出说明;(3分)
(3)用类PASCAL语言或自然语言写算法的非递归过程;(8分)
(4)分析该算法的最大检索长度;(3分)
(5)必要处加上中文注释。(3分)
【山东工业大学1995 八 (20分)】
7.设计一PASCAL 或C语言的函数 atoi(x).其中X为字符串,由0--9十个数字符和表示正负数的‘-’组成,返回值为整型数值 。【浙江大学1994二 (7分)】
8.已知字符串S1中存放一段英文,写出算法format(s1,s2,s3,n),将其按给定的长度n格式化成两端对齐的字符串S2, 其多余的字符送S3。 【首都经贸大学1998 三、8(15分)】
9.串以静态存储结构存储,结构如下所述,试实现串操作equal算法.
CONST maxlen=串被确认的最大长度
TYPE strtp=RECORD
ch:ARRAY[1..maxlen] OF char;
curlen:0..maxlen
END;
(以一维数组存放串值,并设指示器curlen指示当前串长)【北京轻工业大学1998 一(12分)】
10.编写程序,统计在输入字符串中各个不同字符出现的频度并将结果存入文件(字符串中的合法字符为A-Z这26个字母和0-9这10个数字)。【西北大学2000四(10分)】
11.写一个递归算法来实现字符串逆序存储,要求不另设串存储空间。 【西南交通大学2000 三、2】
12.已知三个字符串分别为s=’ab…abcaabcbca…a’,s’=’caab’, s’’=’bcb’。利用所学字符串基本运算的函数得到结果串为:s’’’=’caabcbca…aca…a’,要求写出得到上结果串S’’’所用的函数及执行算法。【东北大学1998 一、1 (10分)】
13.S=“S1S2…Sn”是一个长为N的字符串,存放在一个数组中,编程序将S改造之后输出:
(1)将S的所有第偶数个字符按照其原来的下标从大到小的次序放在S的后半部分;
(2)将S的所有第奇数个字符按照其原来的下标从小到大的次序放在S的前半部分;
例如:
S=‘ABCDEFGHIJKL’
则改造后的S为‘ACEGIKLJHFDB’。【中科院计算所1995】
14.编一程序,对输入的一表达式(字符串),输出其TOKEN表示。表达式由变量A,B,C,常数(数字)0,1,…,9,运算符+,*和括号“(”,“)”组成。首先定义符号的类码:
符号 变量 常量 * + ( )
类码 0 1 2 3 4 5
其次定义符号的TOKEN表示:
其中NAMEL是变量名表(不允许有相同名),CONST是常量表(不允许有相同数)。
例如,假设有表达式(A+A*2)+2*B*3#,则将生成如下TOKENL:
本文转自
http://www.bjdisong.com/zzu/kaoyan/document/kaoyan/shiti/st04.htm