• 单词统计


    用户需求:

    英语的26 个字母的频率在一本小说中是如何分布的?

    某类型文章中常出现的单词是什么?

    《哈利波特》 中最常用的短语是什么,等等。

    我们要用程序来解决这个问题,毕竟我们是软工人。

     

     

    public class test{

    /*
    * 读取指定路径下的文件名和目录名
    */
    public void getFileList() throws IOException {
    System.out.println("请输入路径");
    Scanner scan=new Scanner(System.in);
    String a=scan.next();
    File file = new File(a);

    File[] fileList = file.listFiles();

    for (int i1 = 0; i1 < fileList.length; i1++) {
    if (fileList[i1].isFile()) {
    String fileName = fileList[i1].getName();
    if(fileName.indexOf(".txt")!=-1)
    {
    Word word=new Word(); //单词的链头
    Word lian,xin;
    String str="";
    String S=a+"\"+fileName;
    System.out.println(S);
    FileReader f=new FileReader(S); 
    char[] c=new char[1]; 
    int b=0;
    boolean exist=false; 
    while((b=f.read(c))!=-1)
    {
    if(String.valueOf(c).equals(" ")||String.valueOf(c).equals(" ")||String.valueOf(c).equals(" ")||String.valueOf(c).equals(",")||String.valueOf(c).equals(".")||String.valueOf(c).equals(""")||String.valueOf(c).equals("'"))
    {
    lian=word;
    while(lian!=null)
    {
    if(lian.value.equalsIgnoreCase(str)) 
    {
    lian.geshu++;exist=true;break;
    }
    else
    {
    lian=lian.next;
    }
    }
    if(exist==false) 
    {
    xin=new Word(str,1);
    xin.next=word.next;
    word.next=xin;
    str="";
    }
    else
    {
    exist=false;
    str="";
    }
    }
    else //单词
    {
    str+=String.valueOf(c);
    }
    }

    System.out.println("请输入您想查询的前几个出现此处最多的单词");
    int N=scan.nextInt();
    for(int i=1;i<=N;i++)
    {
    xin=new Word("",0);
    lian=word.next;

    while(lian!=null)
    {
    if(lian.geshu>xin.geshu)
    {
    xin=lian;
    }
    lian=lian.next;
    }

    System.out.println("第"+i+"个 :"+xin.value+"个数:"+xin.geshu);
    lian=word;

    while(lian.next!=null)
    {
    if(lian.next.value.equalsIgnoreCase(xin.value))
    {
    lian.next=lian.next.next;
    break;
    }
    lian=lian.next;
    }
    }
    }
    System.out.println("文件:" + fileName);
    }

    }
    }

    }

     

    是多疑还是去相信 谎言背后的忠心 或许是自己太执迷 命题游戏 沿着他的脚步 呼吸开始变得急促 就算看清了面目 设下埋伏 真相却居无定处 I swear I'll never be with the devil 用尽一生孤独 没有退路的路 你看不到我 眉眼焦灼却不明下落 命运的轮轴 伺机而动 来不及闪躲 沿着他的脚步 呼吸开始变得急促 就算看清了面目 设下埋伏 真相却居无定处 I swear I'll never be with the devil 用尽一生孤独 没有退路的路 你看不到我 眉眼焦灼却不明下落 命运的轮轴 伺机而动 来不及闪躲 你看不到我 眉眼焦灼却不明下落 命运的轮轴 伺机而动 来不及闪躲 黑夜和白昼 你争我夺 真相被蛊惑 心从不退缩 这天堂荒漠 留给孤独的猎手
  • 相关阅读:
    BZOJ 3555: [Ctsc2014]企鹅QQ hash
    bzoj 4300: 绝世好题 dp
    Codeforces Round #192 (Div. 1) C. Graph Reconstruction 随机化
    Codeforces Round #192 (Div. 1) B. Biridian Forest 暴力bfs
    Codeforces Round #192 (Div. 1) A. Purification 贪心
    HDU 5514 Frogs 容斥定理
    HDU 5515 Game of Flying Circus 二分
    HDU 5521 Meeting 最短路
    HDU 5510 Bazinga 暴力匹配加剪枝
    HDU 5512 Meeting 博弈论
  • 原文地址:https://www.cnblogs.com/muailiulan/p/11070714.html
Copyright © 2020-2023  润新知