算法笔记:数组和字符串
内容来源:刘汝佳《算法竞赛入门经典(第2版)》
一、数组与字符数组
1. 一维/二维数组声明与使用方法(基础)
※注意两个函数:memcpy和memset
(1)memcpy(b, a,sizeof(type)*k):将数组a的前k个元素复制到数组b(type为数组类型,a数组与b数组的类型需相同)
(2)memset(a,value, sizeof(a)):将数组a的值均初始化为value
需要注意:当a数组为整型时,value只有为0、-1、一个很大的值(如0x7f)或一个很小的值(如0xaf)时才可成功初始化;
当a数组为浮点型时,value=127,可将数组初始化为一个很大的值;value为0时可将数组清零。
例:
#include
#include
#include
int a[10]={1,2,3,4,5,6,7,8,9,10},b[10];
double d[5]={1.1,2.2,3.3,4.4,5.5};
int main()
{
int i;
int k=6;
for(i=0;i<10;i++)
printf("%d ",a[i]);
printf("\n");
memcpy(b,a,k*sizeof(int));
for(i=0;i
2. 字符串的声明、赋值、比较和连接方法(基础)
(1)常见转义字符:\n(回车) \0(空字符)\\(反斜线) \’(单引号) \’’(双引号)
(2)字符串的读入举例:
scanf(“%s”,str);(读入字符串str,不含空白字符)
scanf(“%s”,str[i]);(读入第i个字符串,不含空白字符)
gets(str);gets(str[i]);(读入字符串str/第i个字符串,可包含空白字符)
char c; while(c=getchar()!=EOF){…}(可用于循环读入字符,含空白字符)
(3)字符串的输出举例:printf(“%s”,str); puts(str);
二、典例
1. 蛇形填数
在n*n方阵里填入1,2,...,n*n,要求填成蛇形。例如n=4时方阵为:
10 11 12 1
9 16 13 2
8 15 14 3
7 6 5 4
输入方阵维数(1<=n<=100),输出对应的n阶蛇形方阵。这里规定1填在方阵的右上角。
【分析】矩阵填数问题。
#include
#include
#define maxn 105
int n;
int mat[maxn][maxn];
void Fill(int mat[][maxn])
{
int i=0,j=n-1;
int num=1;
mat[i][j]=num++; //确定起点,填1
while(num<=n*n)
{
while(i+1=0 && mat[i][j-1]==0) //向左
mat[i][--j]=num++;
while(i-1>=0 && mat[i-1][j]==0) //向上
mat[--i][j]=num++;
while(j+1
2. 竖式问题
找出所有形如abc*de(三位数乘以两位数)的算式,使得在完整的竖式中,所有数字都属于一个特定的集合。输入数字集合(相邻数字之间没有空格),输出所有竖式。每个竖式前对应有编号,之后应有一个空行。最后输出解的总数。
样例输入:2357
样例输出:
<1>
775
X 33
-----
2325
2325
-----
25575
The number of solutions = 1
【分析】暴力求解、枚举、数位分离。
#include
#include
char numset[20];
int Judge(int num)
{
int temp=num;
int flag;
int i,digit;
while(temp!=0) //分离num各位(用digit记录),并在numset中查找
{
digit=temp%10;
flag=0;
for(i=0;i\n",ans);
printf("%5d\n",i);
printf("X%4d\n",j);
printf("-----\n");
printf("%5d\n",n1);
printf("%4d\n",n2);
printf("-----\n");
printf("%5d\n\n",ret);
}
int main()
{
int i,j; //i-三位数 j-两位数
int n1,n2,ret;
int ans=0;
scanf("%s",numset);
for(i=100;i<1000;i++) //枚举所有的i.j组合
{
for(j=10;j<100;j++)
{
n1=i*(j%10);
n2=i*(j/10);
ret=i*j;
if(Judge(i) && Judge(j) && Judge(n1) && Judge(n2) && Judge(ret))
{
ans++;
Print(i,j,n1,n2,ret,ans);
}
}
}
printf("The number of solutions = %d\n",ans);
return 0;
}
3. Tex中的引号
在Tex中,左双引号是“``”,右双引号是“’’”。输入一篇包含双引号的文章,把它转换成Tex格式。
样例输入:
“To be or not to be,” quoth the Bard, “that
is the question”.
样例输出:
``To be or not to be,’’ quoth the Bard,``that
is the question’’.
【分析】多组输入输出。注意输入含有空格,考虑使用"while(c=getchar()!=EOF)"的形式。#include
int main()
{
int c,q=1;
while((c=getchar())!=EOF) //循环读取,边读边处理且不需要完整保存输入,直到文件尾
{
if(c=='"') //遇到双引号,根据出现次序处理
{
printf("%s",q?"``":"''"); //左-右-左-右...
q=!q;
}
else //否则原样输出输入的字符
printf("%c",c);
}
return 0;
}
4. WERTYU
把手放在键盘上时,稍不注意就会往右错一位。这样输入Q就会变成W,输入J就会变成K等。
输入一个错位后敲出的字符串(所有字符均为大写字母),输出打字员本来想打出的句子。输入保证合法,即一定是错位后的字符串。例如输入中不会出现大写字母A。
样例输入:
O S, GOMR YPFSU/
样例输出:
I AM FINE TODAY.
【分析】多组输入。这里每输入一个字符,都可以直接输出一个字符,因此可用"while(c=getchar()!=EOF)"输入。在输入输出变换时可使用常量数组,以简化字符变换过程
即charchset[]="`1234567890-=QWERTYUIOP[]\\ASDFGHJKL;'ZXCVBNM,./";
※常量数组的好处:不需指定大小,可由程序自动计算。
#include
#include
char ch;
char chset[]="`1234567890-=QWERTYUIOP[]\\ASDFGHJKL;'ZXCVBNM,./"; //注意'\'处理为转义字符
int main()
{
int i,flag;
while((ch=getchar())!=EOF)
{
flag=0;
for(i=0;i
5. 回文词
输入一个字符串(长度不超过1000),判断它是否为回文串及镜像串。
回文串:反转后的串和原串相同,如abba和madam。
镜像串:左右镜像后的串和原串相同,如2S和3AIAE。
注意并不是每个字符在镜像之后都能得到一个合法字符。在本题中,每个字符的镜像如下图(空白项表示该字符镜像后不能得到一个合法字符):
样例输入:
NOTAPALINDROME
ISAPALINILAPASI
2A3MEAS
ATOYOTA
样例输出:
NOTAPALINDROME – is not a palindrome.
ISAPALINILAPASI – is a regular palindrome.
2A3MEAS – is a mirrored string.
ATOYOTA – is a mirrored palindrome.
【分析】注意这里的镜像串是一种特殊的回文串,且结果只有4中组合:
(1)非回文串
(2)仅回文串
(3)仅镜像串
(4)回文镜像串(最特殊的情况)
因此有以下判断步骤:
(1)首先判断输入的串是否是回文串,如果是,继续判断是否是镜像串。如果是,则该串既是回文串又是镜像串;否则该串仅仅是回文串;
(2)如果不是(1)的情况,则继续判断是否是镜像串,如果是,则该串仅仅是镜像串;否则该串不是回文串(当然也不是镜像串)。
#include
#include
#define maxn 1010
char str[maxn];
char ch[]="ABCDEFGHIJKLMNOPQRSTUVWXYZ123456789"; //原字符集
char re[]="A...3..HIL.JM.O...2TUVWXY51SE.Z..8."; //镜像后字符集
int is_Palindrome(char *str) //回文串判断
{
int i=0,j=strlen(str)-1;
while(i
6. 猜数字游戏的提示
实现一个经典“猜数字”游戏。给出答案序列和用户猜测的序列,统计有多少数字位置正确(A),有多少数字在两个序列都出现过但位置不对(B)。
输入包含多组数据。 每组输入第一行为序列长度n,第二行是答案序列,接下来是若干猜测序列。 猜测序列全0时该组数据结束。 n=0时输入结束。
数据保证:1<=n<=1000,序列中的数均在[1, 9]内。
样例输入:
4
1 3 5 5
1 1 2 3
4 3 3 5
6 5 5 1
6 1 3 5
1 3 5 5
0 0 0 0
10
1 2 2 2 4 5 6 6 6 9
1 2 3 4 5 6 7 8 9 1
1 1 2 2 3 3 4 4 5 5
1 2 1 3 1 5 1 6 1 9
1 2 2 5 5 5 6 6 6 7
0 0 0 0 0 0 0 0 0 0
0
样例输出:
Game 1:
(1,1)
(2,0)
(1,2)
(1,2)
(4,0)
Game 2:
(2,4)
(3,2)
(5,0)
(7,0)
【分析】字符出现次数统计问题。直接统计可得A,为了求B,对于每个数字(1~9),统计二者出现的次数c1和c2,则min(c1, c2)就是该数字对B的贡献,最后减去A的部分。
#include
#include
#define maxn 1010
int n;
int answer[maxn]; //答案序列
int guess[maxn]; //猜测序列
int main()
{
int i,num;
int A,B,c1,c2;
int ncase=1;
while(scanf("%d",&n)==1 && n) //n=0输入结束
{
printf("Game %d:\n",ncase++);
for(i=0;i
7. 生成元
如果x加上x的各位数字之和得到y,就说x是y的生成元。给出T(1<=T<=100)组测试数据及N(1<=N<=100000),求N的最小生成元。若无解,则输出0。
样例输入:
3
216
121
2005
样例输出:
198
0
1979
【分析】不难发现,假设所求生成元为M,则M 但效率不够高,因为每次计算一个生成元都需要枚举N-1个数。因此可考虑“打表”:即一次性枚举所有100000以内的正整数M 法二:(“打表”) 长度为n的环状串表示法,分别为从某个位置开始顺时针得到。例如图: 有10种表示:CGAGTCAGCT,GAGTCAGCTC,AGTCAGCTCG等。在这些表示法中,字典序最小的成为“最小表示”。 输入一个长度为n(1<=n<=100)的环状DNA串(只包含A,C,G,T)的一种表示法,你的任务是输出该环状串的最小表示。例如,CTCC的最小表示是CCCT;CGAGTCAGCT的最小表示为AGCTCGAGTC。 【分析】“字典序”问题 本题出现了一个新概念,字典序。字典序即字符串在字典中的顺序。 一般对于两个字符串,从第一个字符开始比较。当某一个的字符不同时,该位置字符较小的串,字典序较小(例如,abc比bcd小);如果其中一个字符串已经没有更多字符,但另一个字符串还没结束,则较短的字符串的字典序较小(例如,hi比history小)。 此外,字典序的概念可以推广到任意序列,例如,序列1,2,4,7,比1,2,5小。 学会了字典序的概念之后,本题就不难解决了:就像“求n个元素中的最小值”一样,用变量ans表示目前为止,字典序最小串在输入串中的起始位置,然后不断更新ans。 法一:对串进行“循环移位”,随时更新“最小表示” 法二:结合对字典序问题的分析完成求解 三、练习 1. 得分 给出一个由O和X组成的串(长度为1~80),统计得分。每个O的得分为目前连续出现的O的个数,X的得分为0。 样例输入: OOXXOXXOOO 样例输出: 10(1+2+0+0+1+0+0+1+2+3) 给出一种物质的分子式,求其分子量。本题中的分子式不包含括号,只包含4种原子C、H、O、N,原子量分别为12.01、1.008、16.00、14.01(单位g/mol)。 样例输入: C6H5OH C12H22O12 样例输出: 94.108 342.296 把前n(1<=n<=10000)个正整数顺次写在一起:123456789101112…… 数一数0~9各出现多少次。 样例输入: 13(12345678910111213) 样例输出: 0:1 1:6 2:2 3:2 4:1 5:1 6:1 7:1 8:1 9:1 【分析】结合"数位分离"的思想,对[1, n]上的每个数分离数位,用一个数组保存每位(0~9)的出现次数。最后输出数组各项值即可。 输入两个字符串s和t,判断是否可以从t中删除0到多个字符(其他字符顺序不变)得到字符串s。例如abcde可以得到bce(删去2个字符),但无法得到dc。若可以则输出”Yes”; 否则输出”No”。(1<=lens<=lent<=100000,其中lens和lent分别为串s和t的长度) 样例输入: sequence subsequence person compression VERDI vivaVittorioEmanueleReDiItalia caseDoesMatter CaseDoesMatter 样例输出: Yes No Yes No 【分析】直接扫一遍两串即可。 5. 周期串 如果一个字符串可以由某个长度为k的字符串重复多次得到,则称该串以k为周期。例如:abcabcabcabc以3为周期(注意:它也以6和12为周期) 输入一个长度不超过80的字符串,求其最小周期及最小周期串。 样例输入: abcabcabcabc aaaa 样例输出: 3 abc 1 a 【分析】周期串定义:如果一个字符串是以一个或者一个以上的长度为k的重复字符串连接而成的,则该字符串为周期串,且周期为k。 一个周期串可能有多个周期,如”abcabcabcabc”,其周期为3,6,12,其中最小周期为3。 分析该问题时基本思路仍是枚举(这里是枚举k),记串长为len。接下来: (1)如果len%k!=0,则k一定不是串的周期; (2)否则,取子串[0, k)。将子串的第i个字符和输入的字符串的第i+k个字符比对,如果发现不相等,则k也一定不是串的周期,退出循环; (3)如果循环正常结束,则说明k是串的周期,且是最小周期;子串[0, k}为最小周期串。 6. DNA序列 输入m个长度均为n的DNA序列,求一个DNA序列,到所有序列的总Hamming距离尽量小。两个等长字符串的Hamming距离等于字符不同的位置个数,例如,ACGT和GCGA的Hamming距离为2(左数第1, 4个字符不同)。 输入整数m和n(4≤m≤50, 4≤n≤1000),以及m个长度为n的DNA序列(只包含字母A,C,G,T),输出到m个序列的Hamming距离和最小的DNA序列和对应的距离。 如有多解,要求为字典序最小的解。 例如,对于下面5个DNA序列,最优解为TAAGATAC。 TATGATAC TAAGCTAC AAAGATCC TGAGATAC TAAGATGT 样例输入: 3 5 8 TATGATAC TAAGCTAC AAAGATCC TGAGATAC TAAGATGT 4 10 ACGTACGTAC CCGTACGTAG GCGTACGTAT TCGTACGTAA 6 10 ATGTTACCAT AAGTTACGAT AACAAAGCAA AAGTTACCTT AAGTTACCAA TACTTACCAA 样例输出: TAAGATAC 7 ACGTACGTAA 6 AAGTTACCAA 12 【分析】贪心法。按列统计A. C. G. T四种字符的出现次数,将出现次数最多的字符保存在字符数组中。该字符数组(字符串)即到m个序列的Hamming距离和最小的DNA序列(最优解);然后求对应的距离时,只需遍历整个DNA序列,比较DNA序列的第i行第j列和最优解的第j列的字符,若不相同,tot+1,最后即可求得Hamming距离。 7. 谜题 样例输入: TRGSJ 样例输出: Puzzle #1: 【分析】字符输入、输出、处理。需要特别注意读题! (1)输入包含空格,因此考虑使用gets函数读取字符,并标记5*5网格中的空格坐标 (2)移动格子实为两个字符的交换,同时更新空格的坐标 (3)对于输入序列的合法性,在移动格子时,需要注意两点: 1°移动过程中发现空格坐标出界,则输入序列不合法 2°根据输入指令,移动过程中发现原空格周围(A-上B-下 L-左 R-右)的格子坐标出界,则输入序列不合法。 其它情况则表示输入合法。(可以添加标记变量实现上述过程) 8. 纵横字谜的答案 A crossword puzzle consists of a rectangular grid of black and white squares and two lists of definitions (or descriptions). An "across" word for a definition is written on a sequence of white squares in a row starting on a numbered square that does not follow another white square in the same row. The sequence of white squares for that word goes across the row of the numbered square, ending immediately before the next black square in the row or in the rightmost square of the row. 【分析】字符串模拟题。题意:输入一个r行c列的网格(1<=r,c<=10),黑格用*号表示,每个白格都填有一个字母。如果一个白格的左边相邻位置或者上边相邻位置没有白格(可能是黑格,也可能出了网格边界),则称这个白格是一个起始格。首先把所有起始格从左到右,从上到下顺序编号1,2,3,…,要求找出所有横向单词。这些单词必须从一个起始格开始,向右延伸到一个黑格的左边或者整个网格的最右边。最后找出所有的竖向单词。#include
8. 环状序列
#include
#include
#include
2. 分子量
#include
3. 数数字
#include
4. 子序列
#include
#include
#include
#include
例如,图3-5中执行ARRBBL0后,效果如图所示。
XDOKI
M VLN
WPABE
UQHCF
ARRBBL0
ABCDE
FGHIJ
KLMNO
PQRS
TUVWX
AAALLLL0
ABCDE
FGHIJ
KLMNO
PQRS
TUVWX
AAAAABBRRRLL0
T R G S J
X O K L I
M D V B N
W P A E
U Q H C F
Puzzle #2:
A B C D
F G H I E
K L M N J
P Q R S O
T U V W X
Puzzle #3:
This puzzle has no final configuration.#include
One list of definitions is for ``words" to be written left to right across white squares in the rows and the other list is for words to be written down white squares in the columns. (A word is a sequence of alphabetic characters.)
To solve a crossword puzzle, one writes the words corresponding to the definitions on the white squares of the grid.
The definitions correspond to the rectangular grid by means of sequential integers on ``eligible" white squares. White squares with black squares immediately to the left or above them are ``eligible." White squares with no squares either immediately to the left or above are also ``eligible." No other squares are numbered. All of the squares on the first row are numbered.
The numbering starts with 1 and continues consecutively across white squares of the first row, then across the eligible white squares of the second row, then across the eligible white squares of the third row and so on across all of the rest of the rows of the puzzle. The picture below illustrates a rectangular crossword puzzle grid with appropriate numbering.
A "down" word for a definition is written on a sequence of white squares in a column starting on a numbered square that does not follow another white square in the same column. The sequence of white squares for that word goes down the column of the numbered square, ending immediately before the next black square in the column or in the bottom square of the column. Every white square in a correctly solved puzzle contains a letter.
You must write a program that takes several solved crossword puzzles as input and outputs the lists of across and down words which constitute the solutions.
Input
Each puzzle solution in the input starts with a line containing two integers r and c (1 <= r <= 10 and 1 <= c <= 10), where r (the first number) is the number of rows in the puzzle and c (the second number) is the number of columns. The r rows of input which follow each contain c characters (excluding the end-of-line) which describe the solution. Each of those c characters is an alphabetic character which is part of a word or the character "*", which indicates a black square. The end of input is indicated by a line consisting of the single number 0.
Output
Output for each puzzle consists of an identifier for the puzzle (puzzle #1, puzzle #2, etc.) and the list of across words followed by the list of down words. Words in each list must be output one-per-line in increasing order of the number of their corresponding definitions. The heading for the list of across words is "Across". The heading for the list of down words is "Down". In the case where the lists are empty (all squares in the grid are black), the Across and Down headings should still appear.
Sample Input
2 2
AT
*O
6 7
AIM*DEN
*ME*ONE
UPON*TO
SO*ERIN
*SA*OR*
IES*DEA
0
Sample Output
puzzle #1:
Across
1.AT
3.O
Down
1.A
2.TO
puzzle #2:
Across
1.AIM
4.DEN
7.ME
8.ONE
9.UPON
11.TO
12.SO
13.ERIN
15.SA
17.OR
18.IES
19.DEA
Down
1.A
2.IMPOSE
3.MEO
4.DO
5.ENTIRE
6.NEON
9.US
10.NE
14.ROD
16.AS
18.I
20.A#include