• 词频统计改进版1


    需求分析:从控制台读取文件并对文件中的词频进行统计,文件可以是自己输入也可以是指定目录自动读入。

    功能一:从命令行读入文章:

    功能二:手动输入单词并统计词频:

    代码实现:

    case 1:
            {
                fp=fopen("d:\2.txt","w");
                ch=getchar();
                while(ch!='
    ')
                {
                    fputc(ch,fp);
                    ch=getchar();
                }
                fclose(fp);
                fp=fopen("d:\2.txt","r");
            }
            break;
        sum=0;
        map<string,int>list;
        while(fgets(text,1000,fp)!=NULL)
        {    
             i=0;
            while(text[i]!='')
            {
                char s[40];
                int k=0;
                while((text[i]>='A'&&text[i]<='Z')||(text[i]>='a'&&text[i]<='z'))
                {
                    if(text[i]>='A'&&text[i]<='Z')
                    text[i]+='a'-'A';
                    s[k++]=text[i++];
                }
                s[k]='';//一个单词结束
                list[s]++;
                if(text[i]=='')break;//一行单词结束
                else i++;
                sum++;
            }
            
        }
        fclose(fp);
        map<string,int>::iterator m;
        cout<<"总共出现的单词数:"<<endl;
        cout<<sum<<endl;
        cout<<"每个词出现的频数如下:"<<endl;
        for(m=list.begin(),i=1;m!=list.end();i++,m++)
        {
            if(m->first=="")
            continue;
    
            cout<<left;
            cout<<setw(15)<<m->first<<setw(10)<<m->second;
            if(i%5==0)
            cout<<endl;
        }
        cout<<endl;

    功能三:通过指定路径进行文件中单词词频统计

    代码实现:

    case 2:
            {
                cout<<"请输入所要统计词频的文章路径及文件名:"<<endl;
                cin>>str;
                fp=fopen(str,"r");
            }    
        sum=0;
        map<string,int>list;
        while(fgets(text,1000,fp)!=NULL)
        {    
             i=0;
            while(text[i]!='')
            {
                char s[40];
                int k=0;
                while((text[i]>='A'&&text[i]<='Z')||(text[i]>='a'&&text[i]<='z'))
                {
                    if(text[i]>='A'&&text[i]<='Z')
                    text[i]+='a'-'A';
                    s[k++]=text[i++];
                }
                s[k]='';//一个单词结束
                list[s]++;
                if(text[i]=='')break;//一行单词结束
                else i++;
                sum++;
            }
            
        }
        fclose(fp);
        map<string,int>::iterator m;
        cout<<"总共出现的单词数:"<<endl;
        cout<<sum<<endl;
        cout<<"每个词出现的频数如下:"<<endl;
        for(m=list.begin(),i=1;m!=list.end();i++,m++)
        {
            if(m->first=="")
            continue;
    
            cout<<left;
            cout<<setw(15)<<m->first<<setw(10)<<m->second;
            if(i%5==0)
            cout<<endl;
        }
        cout<<endl;

    ssh:git@git.coding.net:ziyoujay/cipintongji1.git

  • 相关阅读:
    洛谷八连测R7 nzhtl1477-我回来了
    String中的equals方法原理分析
    Java线程
    Spring配置日志级别报红:Caused by: org.springframework.boot.context.properties.bind.BindException: Failed to bind properties under 'logging.level' to java.util.Map<java.lang.String
    # SpringMVC跨服务器上传文件出现的问题
    使用Maven创建Spring-web项目的基本流程
    Maven的下载与安装(环境变量的配置)
    eNSP的安装(附链接)
    数据库分页操作
    Sql语句占位符?的使用
  • 原文地址:https://www.cnblogs.com/ziyoujay/p/5868882.html
Copyright © 2020-2023  润新知