第1步:输出单个文件中的前 N 个最常出现的英语单词。
功能1:输出文件中所有不重复的单词,按照出现次数由多到少排列,出现次数同样多的,以字典序排列。
功能2: 指定文件目录,对目录下每一个文件执行统计的操作。
功能3:指定文件目录,是会递归遍历目录下的所有子目录的文件进行统计单词的功能。
功能4:输出出现次数最多的前 n 个单词,
前几个功能已经在之前的博客园中回答相应的解决方法,所以重点来看一下第三个功能,如何递归查询所有子目录下的文件,并进行单词统计。
那么我们首先要解决的是判断这个文件是否是TXT文件,代码如何下:
String name = file.getName(); if(!name.trim().toLowerCase().endsWith(".txt")) { System.out.println("非.txt文件"); return; } if(!file.isFile()) { System.out.println("不是文件"); return; }
然后我们开始来进行递归遍历:
while (!list.isEmpty()) { temp_file = list.removeFirst(); files = temp_file.listFiles(); for (File file2 : files) { if (file2.isDirectory()) { System.out.println("文件夹:" + file2.getAbsolutePath()); folderNum++; } else { System.out.println("文件:" + file2.getAbsolutePath()); fileNum++; } } } } else { System.out.println("文件不存在!"); }
最后再依据之前的博客代码得到完整的四个功能。