刚开始在做词频统计时只能在代码中更改统计的段落,这样使代码看起来非常的乱而且容易出错,随着老师的要求有变更,我的代码也开始进行更新,词频统计实现可以从控制台进行输入要统计文档的名字进行统计,实现统计所有词频数目以及按词频的数量从大到小的顺序进行排序。直到现在可以将原本控制台工程迁移到了web工程上。
词频统计现在具有以下的特点: 1.把程序迁移到web平台,通过用户上传TXT的方式接收文件; 2.在页面上给出链接 (如果有封皮、作者、字数、页数等信息更佳)或表格,展示经典英文小说词频统计结果;3. 用柱状图进行数据展示。4. 图表上只显示文件名、总次数、排序后的前30个单词。 5.不能识别“it's,I'm,he's”这样的连词。
在词频统计的时候可以实现以下的功能: 1. 上传文档。 可以选择文档的路径然后上传直接文档。2. 统计所有单词数目。 3. 统计文档的总行数。4. 统计文档中相邻两个单词出现的次数。5. 按词频的数量从大 到小进行排序。 6. 图表显示数据。
一点一点的需求变更,使我的词频统计也越来的越完善,词频统计让我重新复习了文件、文件输出流、字符流以及集合类等相关知识,代码能力也有进步。做项目的过程还是挺辛苦的。