仔细分析,程序面临的最大困难其实是识别单词,并且top10一定要按字典顺序输出.对于单词,就只有纯字母单词,带数字的单词,应设计测试验证各种情况下其单词的最优先顺序变化时,top10也能输出正确的形式。还有命令行输入参数自动识别文件与文件夹的功能。
1 空文件夹 ok 文件夹输入
验证空文件,仍然能输出结果,并且没有单词数目少于10个输出没有报错。
2 一个文件 file fiLE ,命令行文件输入。 测试txt文件
可见输出正确,同样一个单词在遇到字典顺序靠前的可以识别。命令行输入文件名识别。
3 file File FilE1233
碰见带数字但是字典顺序靠前的,能正确更新。并且三个相同的单词一起可以识别为两个相同的词组。
4
碰到数在中间的能正确识别,并且行数正确统计,验证换行符前后依旧可以识别为词组。
5
中间有数字的碰到比自己靠前依旧能正确更新。
6 测试cpp文件与特殊字符。
碰到特殊字符能自动过滤,并且正确识别词组与单词。
7 文件夹下双文件
正确统计
8 测试html文件 大量数据
可以识别并统计。
9 大数据量下更改单词字典顺序看是否能识别。
可见正确识别,单词词组都输出了最前的单词顺序。
10 前十单词增加
测试助教文件,单词词组全对,大小写输出正确,行数接近,单词数目与字符数有差异,但是许多的同学都有类似的问题。
11 给测试文件热词添加数字后缀
正确。
以上就是针对此次作业的测试。