• 201671010454词频统计软件项目报告


    一、课程名称:2016级计算机科学与工程学院软件工程(西北师范大学)

    二、课程要求:实验二 软件工程个人项目

    三、实验目标:

    (1)掌握软件项目个人开发流程。
    (2)掌握Github上发布软件项目的操作方法。

    四、实验内容:

    (一)需求分析

    1. 程序可读入任意英文文本文件,改文件中英文词数大于等于1个,且能读取容纳英文原版《哈利波特》10万词以上的文章。
    2. 指定单词词频统计功能:用户可输入从该文本中想要查找词频的一个或任意多个英文单词,运行程序的统计功能可显示对应单词在文本中出现的次数和柱状图。
    3. 高频词统计功能:用户从键盘输入高频词输出的个数k,运行程序统计功能,可按文本中词频数降序显示前k个单词的词频及单词。
    4. 统计该文本所有单词数量及词频数,并能将单词及词频数按字典顺序输出到文件result.txt。

    (二)功能设计

    1. 文件的读入输出功能:针对需求一和需求四。
    2. 键盘输入功能:针对需求二和需求三(用户可从键盘输入查看词频统计个数的的展示)。
    3. 频词统计功能:针对需求二、三、四(运用程序的统计功能进行词频统计)。
    4. 排序功能:针对需求三和需求四(按照词频数降序,按照字典顺序排序)。

    (三)设计实现

    1. 该程序共有四个类,包括一个主函数Main.java和三个功能类。主函数Main.java用来控制整个流程(读入文本、单词词频统计、柱状图展示)
    2. WordCount.java:指定单词词频统计,可显示对应单词在文本中出现的次数和柱状图。
    3. HighCount.java:用户从键盘输入高频词输出的个数k,运行程序统计功能,可按文本中词频数降序显示前k个单词的词频及单词。
    4. WordSave.java:统计文本所有单词数量及词频数,并将单词及词频数按字典顺序输出到文件result.txt。

    (四)测试运行

    1. 功能1测试
    2. 功能2测试
    3. 功能3测试
    4. 功能4测试

    (五)代码展示

    1. 读入文本,并将文本内容按照正则表达式截取纯单词文本(即不包含其他字符)
    ```//读入《哈利波特》 String line = "src/word.txt"; File file = new File(line); InputStreamReader is = new InputStreamReader(new FileInputStream(file), "utf-8"); BufferedReader buff = new BufferedReader(is); List list = new ArrayList();//list中只存放纯单词文本 String readLine = null;//单词列表初始为空 while((readLine = buff.readLine())!=null){ String[] WordsArr = readLine.split("[^a-zA-z]"); for(String word:WordsArr){ if(word.length()!=0){ list.add(word);//将截取后的纯单词放入list } } } buff.close(); ```
    1. 本段代码实现了最后一个功能:将单词及词频数按字典顺序输出到文件result.txt
    ```//按字典顺序输出到文件result.txt File file = new File("src/result.txt"); if(file.exists()) { file.createNewFile(); } FileWriter fop = new FileWriter(file.getAbsoluteFile()); for(Entry entry : Map2.entrySet()) { fop.write(entry.getKey()+": "+entry.getValue()+" "); } fop.close(); System.out.println("存放成功!"); ```

    (六)总结

    在程序设计过程中,需求分析必不可少。如果一开始就写代码,能写一两个功能,但是要完整地实现整个程序并运行,必须对每个功能模块进行分析。该程序中,涉及到了文本的读入和输出、单词个数的统计以及排序功能,各个功能模块之间虽然都有联系,但最好保证各模块之间的独立性,便于程序的测试和维护。

    (七)PSP

    PSP2.1任务内容计划共完成需要的时间(min)实际完成需要的时间(min)
    Planning计划88
    Estimate估计这个任务需要多少时间,并规划大致工作步骤1010
    Development开发200230
    Analysis需求分析 (包括学习新技术)1515
    Design Spec生成设计文档1012
    Design Review设计复审 (和同事审核设计文档)24
    Coding Standard代码规范 (为目前的开发制定合适的规范)88
    Design具体设计1520
    Coding具体编码150220
    Code Review代码复审1010
    Test测试(自我测试,修改代码,提交修改)1515
    Reporting报告2020
    Test Report测试报告55
    Size Measurement计算工作量55
    Postmortem & Process Improvement Plan事后总结 ,并提出过程改进计划58

    (八)经验分享

    编写程序不是单纯的写代码,在正式写代码之前,设计显得尤为重要。而且在设计功能模块时不能将所有功能放在一起,要做到功能模块独立性,模块独立是优秀设计的关键,而设计又是决定软件质量的关键环节。其次,要学会正确的查阅资料。

    点此查看项目源代码

  • 相关阅读:
    powermock测试
    一些疑惑
    Java基础总结3
    Java学习路线
    Java基础总结2
    关于我
    翻转单词序列
    和为s的两个数字
    和为s的连续正数序列
    数组中只出现一次的数字
  • 原文地址:https://www.cnblogs.com/12zl12/p/10550472.html
Copyright © 2020-2023  润新知