难得梅姐带着我们打一遍这个天梯赛的题目,这么好的机会当然不能放过啦,我也就把大致流程整理了一下,源码在最后,不过能从头开始过一遍还是很棒的呀
7-2 AI核心代码 (30 分)
本题要求你实现一个简易版的 AI 英文问答程序,规则是:
无论用户说什么,首先把对方说的话在一行中原样打印出来;
消除原文中多余空格:把相邻单词间的多个空格换成 1 个空格,把行首尾的空格全部删掉,把标点符号前面的空格删掉;
把原文中所有大写英文字母变成小写,除了 I;
把原文中所有独立的 I 和 me 换成 you;
把原文中所有的问号 ? 换成惊叹号 !;
把原文中所有独立的 can you 换成 I can —— 这里“独立”是指被空格或标点符号分隔开的单词;
在一行中输出替换后的句子作为 AI 的回答。
输入格式:
输入首先在第一行给出不超过 10 的正整数 N,随后 N 行,每行给出一句不超过 1000 个字符的、以回车结尾的用户的对话,对话为非空字符串,仅包括字母、数字、空格、可见的半角标点符号。
输出格式:
按题面要求输出,每个 AI 的回答前要加上 AI: 和一个空格。
输入样例:
在这里给出一组输入。例如:
6
Hello ?
Good
to chat with you
can
you speak Chinese?
Really?
Could you show me 5
What Is this prime? I,don 't know
输出样例:
在这里给出相应的输出。例如:
Hello ?
AI: hello!
Good
to chat with you
AI: good to chat with you
can
you speak Chinese?
AI: I can speak chinese!
Really?
AI: really!
Could you show me 5
AI: could you show you 5
What Is this prime? I,don 't know
AI: what Is this prime! you,don’t know
先定义数据结构,自然是字符数组/字符串
最初考虑主函数逻辑,主要是读取输入语句,并调用接口处理输入语句并输出。基本流程是,读入一句,对其进行扫描、判断、操作,再存到新的字符串,最后输出新的字符串。
int main() {
int n; //行数n,s存放输入的语句
string s;
cin >> n;
for (int i = 1; i <= n; i++) {
getline(cin, s);
cout << s << endl; //先输出原话,再输出处理后的AI回答
cout << "AI: ";
answer(); //处理并输出回答
}
return 0;
}
然后对接口answer()进行定义。
首先考虑把多余的空格删到只剩一个
void answer(string s) { //根据s处理并输出回答
int i, j; //i定位到s的第一个非空
for (i = 0; s[i] == ' '; i++) {
}
}
然后对边界问题进行考虑。当字符串全为空格的时候呢?会死循环或越界溢出吗?
其实不会,因为字符串有个结尾符‘\0’,所以及时字符串全空,到最后的结尾符也会停止循环。
定位到第一个非空字符后就可以开始输入。
void answer(string s) { //根据s处理并输出回答
string t; //t为处理后的字符
int i, j = 0; //i定位到s的第一个非空,j表示t串的字符
for (i = 0; s[i] == ' '; i++) {
//仅仅用于定位.因为字符串有个结尾符‘\0’,所以及时字符串全空,到最后的结尾符也会停止循环
}
while (s[i] != '\0') { //进行输入
if (s[i] == ' '&&s[i - 1] == ' ') { //跳过多余的空格
i++;
continue;
}
t[j] = s[i]; //将s串的非空或者单个空格给到t串,之后分别+1进行下一轮输入
j++;
i++;
}
}
但是这个时候有一个个问题,就是t串结尾没有结尾符,这个好办,最后给他加一个。此外,我们在一个个判断的时候,可以顺便实现问号变感叹号,大写变小写的功能。
id answer(string s) {
string t; //t为处理后的字符串
int i, j = 0; //i定位到s的第一个非空,j表示t串的字符
for (i = 0; s[i] == ' '; i++) {
//仅仅用于定位.因为字符串有个结尾符‘\0’,所以及时字符串全空,到最后的结尾符也会停止循环
}
while (s[i] != '\0') { //进行输入
if (s[i] == ' '&&s[i - 1] == ' ') { //跳过多余的空格
i++;
continue;
}
if (s[i] == '?') { //将输入的问号变为感叹号
t[j] = '!';
i++;
j++;
continue;
}
if (s[i] != 'I') { //将除了I的大写变小写
t[j] = tolower(s[i]);
i++;
j++;
}
else {
t[j] = s[i]; //将s串的非空或者单个空格给到t串,之后分别+1进行下一轮输入
j++;
i++;
}
}
t[j] = '\0'; //为t串末尾增加结尾符
这里用到了tolower()函数将大写变成小写。
将s串的有效都给了t串之后,我们可以遍历t串来进行进一步操作,比如将
独立的I和me变成you
j = 0;
while (t[j] != '\0') {
//独立的I,意味着左右均是分隔符
if (t[j] == 'I'&&(j==0||isIndependent(t[j - 1])) && isIndependent(t[j + 1])) {
cout << "you";
j++;
continue;
}
//独立的me
if (t[j] == 'm'&&t[j + 1] == 'e'&& (j == 0 || isIndependent(t[j - 1])) && isIndependent(t[j + 2])) {
cout << "you";
j += 2;
continue;
}
因为需要判断是否独立,所以构造了isIndependent()函数。但是遇到了j+1,j-1等,需要考虑边界情况。
当独立的I,me是在字符串开头,j=0,所以j-1会导致非法访问,我们额外加一个条件(j==0||isIndependent(t[j - 1]),这样j=0的时候前面的条件成立,程序不再判断后面的条件,于是避免了非法访问。
而因为while循环中有s[i] != '\0’的条件,所以及时在串的末尾,之后还有一个\0,也就是说最坏情况下t[j+1]等于\0,不会导致越界。
这里给出是否为分隔符的判断
//判断字符是否为分隔符
bool isIndependent(char ch) {
bool result = true;
ch = tolower(ch);
if ((ch >= '0' && ch <= '9') || (ch >= 'a'&&ch <= 'z')) {
result = false;
}
return result;
}
到此,大致的程序已经出来了,我们还差末尾符号前的空格和把 can you 换成 I can。但是此时运行程序,出现运行时错误,不能正常输出t串,为什么呢?
回头看程序,发现在一开始就有瑕疵。我们string了t,但是没有初始化,于是没有真正地为其分配地址。那么在给t[j]赋值的时候,不会给它分配一个首地址。这就导致直接cout会出错。有两个解决办法,一个是初始化,但是谁会愿意初始化的时候打几千个字符呢?否决!第二个方法使用for循环遍历t串,这样就能顺利输出了。
但还是感觉好麻烦有没有?所以干脆放弃用string,直接用字符数组吧!
那么要预定多长的数组呢?
题目要求一行最多1000个,那就1000个吗?不行哦,我们最后有个结尾符\0,也要占一个。
那就1001个吧。也不行,要是全是1000个I,我们要把I变成you,不就要三倍了吗?
所以还是3001个吧!保险起见再多加一个。
整合一下,就有现在的代码。
int main() {
int n; //行数n,s存放输入的语句
string s;
cin >> n;
getchar();
for (int i = 1; i <= n; i++) {
getline(cin, s);
cout << s << endl; //先输出原话,再输出处理后的AI回答
cout << "AI: ";
answer(s); //处理并输出回答
}
return 0;
}
//根据s处理并输出回答
void answer(string s) {
char t [3002]; //t为处理后的字符串
int i, j = 0; //i定位到s的第一个非空,j表示t串的字符
for (i = 0; s[i] == ' '; i++) {
//仅仅用于定位.因为字符串有个结尾符‘\0’,所以及时字符串全空,到最后的结尾符也会停止循环
}
while (s[i] != '\0') { //进行输入
if (s[i] == ' '&&s[i - 1] == ' ') { //跳过多余的空格
i++;
continue;
}
if (s[i] == '?') { //将输入的问号变为感叹号
t[j] = '!';
i++;
j++;
continue;
}
if (s[i] != 'I') { //将除了I的大写变小写
t[j] = tolower(s[i]);
i++;
j++;
}
else {
t[j] = s[i]; //将s串的非空或者单个空格给到t串,之后分别+1进行下一轮输入
j++;
i++;
}
}
t[j] = '\0'; //为t串末尾增加结尾符
//I,me变成you
j = 0;
while (t[j] != '\0') {
//独立的I,意味着左右均是分隔符
if (t[j] == 'I'&&(j==0||isIndependent(t[j - 1])) && isIndependent(t[j + 1])) {
cout << "you";
j++;
continue;
}
//独立的me
if (t[j] == 'm'&&t[j + 1] == 'e'&& (j == 0 || isIndependent(t[j - 1])) && isIndependent(t[j + 2])) {
cout << "you";
j += 2;
continue;
}
cout << t[j];
j++;
}
cout << endl;
}
//判断字符是否为分隔符
bool isIndependent(char ch) {
bool result = true;
ch = tolower(ch);
if ((ch >= '0' && ch <= '9') || (ch >= 'a'&&ch <= 'z')) {
result = false;
}
return result;
}
然后我们解决剩下的两个问题。
首先是末尾符号前的空格
我们经过对s串的遍历,已经确保连续的空格变成了单个空格,也就是说,如果现在t串末尾是符号,那么我们要去掉符号前的空格。
可以用上之前的isIndependent(),如果这个空格需要去掉,那么他之后一定不是数字或字母(要么符号,要么\0,这两种情况都要去空格)
//如果是标点前的空格就不输出
if (t[j] == ' '&&isIndependent(t[j+1])) {
j++;
continue;
}
cout << t[j];
j++;
}
然后是把 can you 换成 I can,具体方法和me变成you类似(就是长了点嘛),不过太长了我们还是把它写成函数吧
//判断是否为独立的can you
bool isCanyou(char ch[],int n) {
bool result = false;
if (ch[n] == 'c'&&ch[n + 1] == 'a'&&ch[n + 2] == 'n'&&ch[n + 3]==' ' && ch[n + 4] == 'y'&&ch[n + 5] == 'o'&&ch[n + 6] == 'u') {
if ((n == 0 || isIndependent(ch[n - 1])) && isIndependent(ch[n + 7])) {
result = true;
}
}
return result;
}
然后在上面的answer函数中添加判断,如果是,就输出改变“I can”。记得要让j加上can you的长度(7)来跳过其他字符。
······
//独立的can you
if (isCanyou(t, j)) {
cout << "I can";
j += 7;
continue;
}
//独立的could you
if (isCouldyou(t, j)) {
cout << "I could";
j += 9;
continue;
}
······
把上述代码插入到answer()中,代码基本成形。
#include
#include
#include
#include
using namespace std;
void answer(string s);
bool isIndependent(char ch);
bool isCanyou(char ch[], int n);
int main() {
int n; //行数n,s存放输入的语句
string s;
cin >> n;
getchar();
for (int i = 1; i <= n; i++) {
getline(cin, s);
cout << s << endl; //先输出原话,再输出处理后的AI回答
cout << "AI: ";
answer(s); //处理并输出回答
}
return 0;
}
//根据s处理并输出回答
void answer(string s) {
char t[3002]; //t为处理后的字符串
int i, j = 0; //i定位到s的第一个非空,j表示t串的字符
for (i = 0; s[i] == ' '; i++) {
//仅仅用于定位.因为字符串有个结尾符‘\0’,所以及时字符串全空,到最后的结尾符也会停止循环
}
while (s[i] != '\0') { //进行输入
if (s[i] == ' '&&s[i - 1] == ' ') { //跳过多余的空格
i++;
continue;
}
if (s[i] == '?') { //将输入的问号变为感叹号
t[j] = '!';
i++;
j++;
continue;
}
if (s[i] != 'I') { //将除了I的大写变小写
t[j] = tolower(s[i]);
i++;
j++;
}
else {
t[j] = s[i]; //将s串的非空或者单个空格给到t串,之后分别+1进行下一轮输入
j++;
i++;
}
}
t[j] = '\0'; //为t串末尾增加结尾符
//I,me变成you; can you 换成 I can
j = 0;
while (t[j] != '\0') {
//独立的I,意味着左右均是分隔符
if (t[j] == 'I' && (j == 0 || isIndependent(t[j - 1])) && isIndependent(t[j + 1])) {
cout << "you";
j++;
continue;
}
//独立的me
if (t[j] == 'm'&&t[j + 1] == 'e' && (j == 0 || isIndependent(t[j - 1])) && isIndependent(t[j + 2])) {
cout << "you";
j += 2;
continue;
}
//独立的can you
if (isCanyou(t, j)) {
cout << "I can";
j += 7;
continue;
}
//如果是标点前的空格就不输出
if (t[j] == ' '&&isIndependent(t[j+1])) {
j++;
continue;
}
cout << t[j];
j++;
}
cout << endl;
}
//判断字符是否为分隔符
bool isIndependent(char ch) {
bool result = true;
ch = tolower(ch);
if ((ch >= '0' && ch <= '9') || (ch >= 'a'&&ch <= 'z')) {
result = false;
}
return result;
}
//判断是否为独立的can you
bool isCanyou(char ch[],int n) {
bool result = false;
if (ch[n] == 'c'&&ch[n + 1] == 'a'&&ch[n + 2] == 'n'&&ch[n + 3]==' ' && ch[n + 4] == 'y'&&ch[n + 5] == 'o'&&ch[n + 6] == 'u') {
if ((n == 0 || isIndependent(ch[n - 1])) && isIndependent(ch[n + 7])) {
result = true;
}
}
return result;
}
到此,如上代码已经能通过PTA的这道题目了,但是你觉得有些地方冗长,可以再写成接口函数,比如把读入数据、遍历t串并输出写成接口。
#include
#include
#include
#include
using namespace std;
void answer(string s);
bool isIndependent(char ch);
bool isCanyou(char ch[], int n);
void putIn(string s, char t[], int &i, int &j);
void print(char t[], int &j);
int main() {
int n; //行数n,s存放输入的语句
string s;
cin >> n;
getchar();
for (int i = 1; i <= n; i++) {
getline(cin, s);
cout << s << endl; //先输出原话,再输出处理后的AI回答
cout << "AI: ";
answer(s); //处理并输出回答
}
return 0;
}
//根据s处理并输出回答
void answer(string s) {
char t[3002]; //t为处理后的字符串
int i, j = 0; //i定位到s的第一个非空,j表示t串的字符
for (i = 0; s[i] == ' '; i++) {
//仅仅用于定位.因为字符串有个结尾符‘\0’,所以及时字符串全空,到最后的结尾符也会停止循环
}
putIn(s, t, i, j); //把s输入给t
t[j] = '\0'; //为t串末尾增加结尾符
j = 0; //为方便遍历将j置零
print(t,j); //遍历t并一顿操作后输出,主要把I,me变成you; can you 换成 I can
cout << endl;
}
//判断字符是否为分隔符
bool isIndependent(char ch) {
bool result = true;
ch = tolower(ch);
if ((ch >= '0' && ch <= '9') || (ch >= 'a'&&ch <= 'z')) {
result = false;
}
return result;
}
//判断是否为独立的can you
bool isCanyou(char ch[],int n) {
bool result = false;
if (ch[n] == 'c'&&ch[n + 1] == 'a'&&ch[n + 2] == 'n'&&ch[n + 3]==' ' && ch[n + 4] == 'y'&&ch[n + 5] == 'o'&&ch[n + 6] == 'u') {
if ((n == 0 || isIndependent(ch[n - 1])) && isIndependent(ch[n + 7])) {
result = true;
}
}
return result;
}
//把s输入给t
void putIn(string s, char t[],int &i, int &j) {
while (s[i] != '\0') {
if (s[i] == ' '&&s[i - 1] == ' ') { //跳过多余的空格
i++;
continue;
}
if (s[i] == '?') { //将输入的问号变为感叹号
t[j] = '!';
i++;
j++;
continue;
}
if (s[i] != 'I') { //将除了I的大写变小写
t[j] = tolower(s[i]);
i++;
j++;
}
else {
t[j] = s[i]; //将s串的非空或者单个空格给到t串,之后分别+1进行下一轮输入
j++;
i++;
}
}
}
//遍历t并一顿操作后输出,主要把I,me变成you; can you 换成 I can
void print(char t[], int &j) {
while (t[j] != '\0') {
//独立的I,意味着左右均是分隔符
if (t[j] == 'I' && (j == 0 || isIndependent(t[j - 1])) && isIndependent(t[j + 1])) {
cout << "you";
j++;
continue;
}
//独立的me
if (t[j] == 'm'&&t[j + 1] == 'e' && (j == 0 || isIndependent(t[j - 1])) && isIndependent(t[j + 2])) {
cout << "you";
j += 2;
continue;
}
//独立的can you
if (isCanyou(t, j)) {
cout << "I can";
j += 7;
continue;
}
//如果是标点前的空格就不输出
if (t[j] == ' '&&isIndependent(t[j + 1])) {
j++;
continue;
}
cout << t[j];
j++;
}
}
说白了,就是把读入数据的部分额外复制到pushIn()里,把遍历t串并输出的部分复制到print()里。没什么技术含量还要额外开辟空间。但是可以让answer()函数变得更精简更好看嘛QwQ
以上,用餐愉快