201621123063叶斓浈 第二周实验报告

Task1:编码要求

1.Fork 码云项目 https://gitee.com/SE-net16/PersonalProject-C;

201621123063叶斓浈 第二周实验报告_第1张图片

2.码云项目地址

https://gitee.com/Yelz/PersonalProject-Java/tree/master/

3.PSP表格

PSP2.1 个人开发流程 预估耗费时间(分钟) 实际耗费时间(分钟)
Planning 计划 30 40
· Estimate 明确需求和其他相关因素,估计每个阶段的时间成本 8 6
Development 开发 90 120
· Analysis 需求分析 (包括学习新技术) 10 16
· Design Spec 生成设计文档 25 35
· Design Review 设计复审 4 6
· Coding Standard 代码规范 3 3
· Design 具体设计 10 12
· Coding 具体编码 36 50
· Code Review 代码复审 10 8
· Test 测试(自我测试,修改代码,提交修改) 13 21
Reporting 报告 10 15
· 测试报告 3 2
· 计算工作量 2 1
· 并提出过程改进计划 3 3

4.解题思路描述

使用Java语言来实现字符单词统计功能,先建一个FileAdapter类用来实现文件的读取和写入,读出文件的内容后遍历统计字符个数和行数,
利用正则表达式判断是否单词,计算出单词个数,利用HashMap存储单词(key)和出现次数(value),将键值对放入List中用sort方法重写
compare进行排序,排序后选出词频最高的前十个单词进行输出。(利用TreeMap重写compare可能可以直接排序,时间问题并未尝试)

5.设计实现过程

一相关类的设计

  • FileAdapter类 该类用于文件写入读取的处理
  • Word类 该类用于统计文件字符数,统计单词数,判断是否是单词,统计单词词频,统计有效行数
  • Main类 调用上述两个类,实现具体功能
    二 相关函数设计
    ①FileAdapter类
  • fileToString函数 将文件转为字符串
  • writeToFile函数 将传入的字符串写入文件
    ②Word类
  • getCharNum() 统计文件字符数
  • getWordNum() 统计单词总数
  • isWord(String s) 判断是否是单词
  • getSortedWord() 统计单词词频,得到一个根据词频和字典序排序后的List
  • getLines() 统计有效行数

6.代码说明

1.getCharNum()函数

public int getCharNum() // 统计文件字符数
    {
        char c;
        for (int i = 0; i < text.length(); i++) {
            c = text.charAt(i);
            if (c >= 32 && c <= 126 || c == '\r' || c == '\n'|| c == '\t') {
                charNum++;
            }
        }
        return charNum;
    }

2.getWordNum()函数

    public int getWordNum() // 统计单词总数
    {
        String t = text;
        String[] words = t.split("\\s"); // 对字符串进行分词操作
        for (int i = 0; i < words.length; i++) {
                if (isWord(words[i]) ) {//如果是单词
                    wordNum++;//数量+1
                }
        }
        return wordNum;
    }

3.isWord(String s)函数

    public  boolean isWord(String s)//判断是否是单词
    {
        if(s.matches("[a-zA-Z]{4}[a-zA-Z0-9]*"))//利用正则表达式判断是否是单词(以4个英文字母开头,跟上字母数字符号,单词以分隔符分割,不区分大小写)
            return true;
        else
            return false;
    }
    

4.getSortedWord()//返回一个排序好的存放单词和出现次数的List

    public List getSortedWord()
    {
        wordMap = new HashMap();
        String t = text;
    
        String[] words = t.split("\\s"); // 对字符串进行分词操作
        for (int i = 0; i < words.length; i++) {
                if (isWord(words[i])) { // 如果是单词
                    words[i] = words[i].trim().toLowerCase();//转换为小写
                    if (wordMap.get(words[i]) == null) { // 判断之前Map中是否出现过该字符串
                        wordMap.put(words[i], 1);//没出现过把这个单词作为key放入map,value值设为1
                    } else
                        wordMap.put(words[i], wordMap.get(words[i]) + 1);//出现过value值+1
                }
        }
        
        List> list = new ArrayList>(wordMap.entrySet());//把map的键值对装入一个list中
        list.sort(new Comparator>() {//对list排序
            @Override
            public int compare(Entry o1, Entry o2) {  //重写compare方法,对list中内容进行排序,先按词频后按字典顺序
                if (o1.getValue() == o2.getValue()) {//如果词频相等
                    return o1.getKey().compareTo(o2.getKey());//就按字典序排列
                }
                return o2.getValue() - o1.getValue();//否则直接按词频排列
            }

        });
        
        return list;//返回排列好后的list
    }

5.getLines() 函数

    public int getLines() { // 统计有效行数
        String[] line = text.split("\r\n"); // 将每一行分开放入一个字符串数组
        for (int i = 0; i < line.length; i++) { // 找出无效行,统计有效行
            if (line[i].trim().length() == 0)//trim函数删除字符串的头尾空白符
                continue;
            lines = lines + 1;
        }
        return lines;
    }

测试

201621123063叶斓浈 第二周实验报告_第2张图片

7.结合在构建之法中学习到的相关内容与个人项目的实践经历,撰写解决项目的心路历程与收获。

在这次实验中暴露了自己很多地方的不足,因为之前没有按照流程一步一步把实验写下来,在这次实验上耗费的时间比计划的时间要多

你可能感兴趣的:(201621123063叶斓浈 第二周实验报告)