• (2016春) 作业3:个人项目-词频统计


    词频统计 (个人项目)

    • 总分:20分

    1. 目标

    • 使用开发工具 (Eclipse 或者 Visual Studio)
    • 开发语言 (C、C++、C# 或者Java )
    • 使用源代码管理工具(Github)

    2. 要求

    (1). 实现一个控制台程序,给定一段英文字符串,统计其中各个英文单词(4字符以上含4字符)的出现频率。

    • 输出要求:按照频率降序输出单词及频率,相同频率则按字母顺序输出。 如下所示:
    file: 3
    word: 2
    case: 1
    considered: 1
    insensitive: 1
    same: 1
    
    • 附加要求:读入一段文本文件,统计该文本文件中单词的频率,并上面要求输出统计结果。

    (2). 性能分析:

    3. 提交内容包括:

    (1).github: 代码签入github

    • 确保结果正确
    • 不要有警告
    • 良好的性能
    • 确保单元测试代码通过

    (2).博客:提交博客

    • 在开始项目前,你预估各个功能模块要花的时间
    • 在项目完成后,你实际在各个功能模块花的时间
    • 描述你花了多少时间在提高程序性能上,利用VS的性能分析工具,展示你的性能图表
    • 展示你的单元测试结果,说明你是如何确保单元测试结果正确的
    • 你在这次练习中学到了什么
    • 在博客上写“你这个程序最得意、最独特的设计是哪里? 你是怎么想到的?最大的bug 在哪里? 请贴部分代码并解释”(ZX_Proposal)

    4. 作业提示

    (1). 定义

    • 字母: A-Z, a-z.
    • 字母数字: A-Z, a-z, 0-9.
    • 分隔符: 字母数字
    • 单词:
      • 包含有4个4个以上的字母
      • 单词分隔符分开
      • 如果一个字符串包含_非_字母数字,则不是单词
      • 单词大小写不敏感,例如 “file”、“FILE”和“File”可以看作同一个单词
      • 单词必须是字母开头,“file123”是单词,“123file”不是单词

    (2). 示例

    输入

    Word is case insensitive, i.e. “file”, “FILE” and “File” are considered the same word.
    

    输出

    file: 3
    word: 2
    case: 1
    considered: 1
    insensitive: 1
    same: 1
    

    (3). 参考资源


  • 相关阅读:
    Tomcat 7 简单定制
    Tomcat 启动卡在 Root WebApplicationContext: initialization completed in
    nacos 1.1.x 集群部署笔记
    ERROR 1044 (42000): Access denied for user 'root'@'localhost'
    logrotate 不生效
    Keepalived + Haproxy + PXC 理论篇
    Percona MongoDB 4 搭建副本集
    装饰器模式
    上拉电阻和下拉电阻
    Arduino基本数据类型
  • 原文地址:https://www.cnblogs.com/juking/p/5259432.html
Copyright © 2020-2023  润新知