Github项目地址:https://github.com/bravedreamer/wordCount/tree/master/wc
一、题目描述:
Word Count
1. 实现一个简单而完整的软件工具(源程序特征统计程序)。
2. 进行单元测试、回归测试、效能测试,在实现上述程序的过程中使用相关的工具。
3. 进行个人软件过程(PSP)的实践,逐步记录自己在每个软件工程环节花费的时间。
二、项目要求:
wc.exe 是一个常见的工具,它能统计文本文件的字符数、单词数和行数。这个项目要求写一个命令行程序,模仿已有wc.exe 的功能,并加以扩充,给出某程序设计语言源文件的字符数、单词数和行数。实现一个统计程序,它能正确统计程序文件中的字符数、单词数、行数,以及还具备其他扩展功能,并能够快速地处理多个文件。
具体功能要求:
程序处理用户需求的模式为:
wc.exe [parameter] [file_name]
基本功能列表:
wc.exe -c file.c //返回文件 file.c 的字符数 ---已实现
wc.exe -w file.c //返回文件 file.c 的词的数目 ---已实现
wc.exe -l file.c //返回文件 file.c 的行数 ---已实现
扩展功能:
-s 递归处理目录下符合条件的文件。---未实现
-a 返回更复杂的数据(代码行 / 空行 / 注释行)。---已实现部分
空行:本行全部是空格或格式控制字符,如果包括代码,则只有不超过一个可显示的字符,例如“{”。
代码行:本行包括多于一个字符的代码。
注释行:本行不是代码行,并且本行包括注释。一个有趣的例子是有些程序员会在单字符后面加注释:
} //注释
在这种情况下,这一行属于注释行。
[file_name]: 文件或目录名,可以处理一般通配符。
高级功能:---未实现
-x 参数。这个参数单独使用。如果命令行有这个参数,则程序会显示图形界面,用户可以通过界面选取单个文件,程序就会显示文件的字符数、行数等全部统计信息。
需求举例:
wc.exe -s -a *.c
返回当前目录及子目录中所有*.c 文件的代码行数、空行数、注释行数。
三、解题思路:
首先考虑到用C语言读取文件的方法去实现。
返回文件 file.c 的字符数 :使用fgetc() 函数从所指向的输入文件中一个一个地读取字符,然后累计。
返回文件 file.c 的词的数目:使用fgetc() 函数从所指向的输入文件有条件地读取a(A)-->z(Z)组成的单词,再累计单词数量。
返回文件 file.c 的行数:使用fgetc() 函数在所指向的输入文件中遇到换行符“\n”后累计加1 。
返回代码行 、 注释行:当fgetc() 函数获取的字符遇到“//”和“/*”就开始累计注释行数量,如果是“//”遇到换行符“\n”或文件结束符则停止累计,如果是“/*”则遇到“*”停 止累计。代码行则是运用之前累计行数的函数返回的结果减去注释行即可得到。
四、设计实现过程:
五、遇到的困难及解决方法:
- 困难描述:对C语言读写文件有关操作不是很熟悉。
- 做过哪些尝试:上网查阅c语言相关资料
- 是否解决:已解决
- 有何收获:对c语言的了解更加深入,遇到知识盲区要及时查阅资料解决。
六、关键代码:
main函数主要代码:
int main(int argc, char *argv[]) { char command[10]; char tag[500];//保存文件路径
int charNum,wordNum,lineNum;//接收函数返回的字符数、单词数、行数 char mainCmd[20][20]={"-c","-w","-l","-a" };//保存指令 while(1){ printf("功能:\n"); printf(" 1:输入 -c 文件路径 返回文件的字符数\n"); printf(" 2;输入 -w 文件路径 返回文件的词的数目\n"); printf(" 3:输入 -l 文件路径 返回文件的行数\n"); printf(" 4:输入 -a 文件路径 返回文件的代码行数和注释行数\n") int characterCount(char *file); int WordCount(char *file); int rowCount(char *file); int complexCount(char *file); printf("请输入指令:wc.exe"); scanf("%s",&command); printf("请输入文件路径:"); scanf("%s",&tag); if(strcmpi(command,mainCmd[0])==0){ charNum=characterCount(tag); printf("字符数:%d",charNum); }else if(strcmpi(command,mainCmd[1])==0){ wordNum=WordCount(tag); printf("词汇数:%d",wordNum); }else if(strcmpi(command,mainCmd[2])==0){ lineNum=rowCount(tag); printf("行数:%d",lineNum); }else if(strcmpi(command,mainCmd[3])==0){ complexCount(tag); }else{ printf("指令错误!"); } printf("\n\n"); } return 0; }
字符数统计函数主要代码:
int characterCount(char *file){//字符数统计函数 FILE *myfile=NULL; int charCount=0;//用于累计读到的字符数 myfile=fopen(file,"r"); if(myfile==NULL){ printf("文件不存在!\n"); exit(-1); } char mychar; mychar = fgetc(myfile); while(mychar!=EOF){ mychar = fgetc(myfile); charCount++; } fclose(myfile); return charCount; }
单词数统计函数代码:
int WordCount(char *file){//单词数统计函数 FILE *myfile=NULL; int wordcount=0;//用于累计读到的单词数量 myfile=fopen(file,"r"); if(myfile==NULL){ printf("文件不存在!\n"); exit(-1); } char mychar; mychar = fgetc(myfile); while(mychar!=EOF){ if((mychar>='a'&&mychar<='z')||(mychar>='A'&&mychar<='Z')){//判断是否为单词 while((mychar>='a'&&mychar<='z')||(mychar>='A'&&mychar<='Z')){ mychar=fgetc(myfile); } wordcount++; } mychar=fgetc(myfile); } fclose(myfile); return wordcount; }
行数统计函数:
int rowCount(char *file){//行数统计函数 FILE *myfile=NULL; int linecount=0;//用于累计读到的行数量· myfile=fopen(file,"r"); if(myfile==NULL){ printf("文件不存在!\n"); exit(-1); } char mychar; mychar = fgetc(myfile); while(mychar!=EOF){ if(mychar=='\n'){ linecount++; mychar = fgetc(myfile); } else{ mychar = fgetc(myfile); } } fclose(myfile); return linecount; }
统计注释行,代码行数量:
int complexCount(char *file){//统计注释行,代码行数量 FILE *myfile=NULL; int noteLine=0;//注释行 int codeLine=0;//代码行 myfile=fopen(file,"r"); if(myfile==NULL){ printf("文件不存在!\n"); exit(-1); } char mychar; mychar= fgetc(myfile); while(mychar!=EOF){ if(mychar=='\''||mychar=='\"'){//防止读取到双引号里面的内容 mychar=fgetc(myfile); while(mychar=='\"'||mychar=='\''){ mychar=fgetc(myfile); } } if(mychar=='/'){//注释行计算 mychar=fgetc(myfile); if(mychar=='/'||mychar=='*'){ if(mychar=='/'){ mychar=fgetc(myfile); while(mychar=="\n"||mychar!=EOF){ mychar=fgetc(myfile); } noteLine++; mychar=fgetc(myfile); } if(mychar=='*'){ mychar=fgetc(myfile); while(mychar=='*'){ if(mychar=="\n"||mychar=='*') noteLine++; mychar=fgetc(myfile); } } } }else{ mychar=fgetc(myfile); } } int rowCount(char *file); codeLine=rowCount(file);//代码行计算 codeLine-=noteLine; fclose(myfile); printf("注释行:%d, 代码行:%d",noteLine,codeLine); return 0; }
七、测试:
空文件测试:
一个字符的文件测试:
一个词的文件测试:
源文件测试:
错误处理:
附:
PSP表格:
PSP2.1 |
Personal Software Process Stages |
预估耗时(分钟) |
实际耗时(分钟) |
Planning |
计划 |
30 |
60 |
· Estimate |
· 估计这个任务需要多少时间 |
30 |
60 |
Development |
开发 |
2*24*60 |
3*24*60 |
· Analysis |
· 需求分析 (包括学习新技术) |
4*60 |
5*60 |
· Design Spec |
· 生成设计文档 |
20 |
30 |
· Design Review |
· 设计复审 (和同事审核设计文档) |
20 |
30 |
· Coding Standard |
· 代码规范 (为目前的开发制定合适的规范) |
50 |
60 |
· Design |
· 具体设计 |
2*60 |
3*60 |
· Coding |
· 具体编码 |
24*60 |
2*24*60 |
· Code Review |
· 代码复审 |
4*60 |
6*60 |
· Test |
· 测试(自我测试,修改代码,提交修改) |
60 |
2*60 |
Reporting |
报告 |
2*60 |
3*60 |
· Test Report |
· 测试报告 |
60 |
2*60 |
· Size Measurement |
· 计算工作量 |
30 |
40 |
· Postmortem & Process Improvement Plan |
· 事后总结, 并提出过程改进计划 |
30 |
20 |
合计 |
|
3*24*60 |
4*24*60 |
总结:
预估时间与实际时间有较大误差,以后得及时把握开发时间,避免出现计划赶不上变化的情况。
遇到问题需要及时查阅资料,避免把时间浪费在不必要的尝试上。
部分功能暂未实现,有些许遗憾,编程能力有待提高。