• 第二周词频统计


    作业的要求参见https://edu.cnblogs.com/campus/nenu/2018fall/homework/2126

    代码地址https://git.coding.net/xucs/cptj.git

     

     功能一

    实现小文件输入,先用open打开文件后,将字符替换成空格,大写字母转化为小写字母,然后将文本转化为列表。进行词频统计后排序输出

    name = raw_input('enter the novel:')
    file = open(name)
    novel = file.read()

    然后将字符替换成空格,大写字母转化为小写字母

     for ch in ['~','!','@','#', '$','^','&','*',':','(',')','_','+','=','[',']','"','{','}',',','.','?',';','|','/']:
            novel = article.replace(ch, ' ')
            exchange = novel.lower()

    然后将文本转化为列表。进行词频统计后排序

    list = exchange.split()
    xs = {}
    for i in list:
        count = list.count(i)
        xs[i] = count
    xs1 = sorted(xs.items(), key=lambda d: d[1], reverse=True)

    结果如下:

    功能二

    配置Python运行的环境变量后在cmd输入Python后空格再输入文件名即可

    功能三

     先调用三个模块

    import os
    import os.path
    import glob

    然后读取目录下的txt文件

    elif path1 != '':
        os.chdir(path1)
        files = glob.glob('*.txt')
        for file in files:
            # name = os.path.basename(file)
            # path2 = os.path.abspath(name)
            novel = open(file)
            novel = novel.read()

    运行之后没有结果,我没能实现这个功能。

    功能四

    从控制台输入英文单篇作品

    当从article输入是使用功能四。

    article = raw_input('enter the article:')
    if article != '':
        for ch in ['~','!','@','#', '$','^','&','*',':','(',')','_','+','=','[',']','"','{','}',',','.','?',';','|','/']:
            novel = article.replace(ch, ' ')
            exchange = novel.lower()

     

     psp表格

    Psp阶段

    估计时间

    实际时间

    时间差原因

    实现功能一

    120分钟

    207分钟

    符号替换失误

    实现功能二

    20分钟

    413分钟

    不会命令行

    实现功能三

    100分钟

    未能实现

     不会读取文件

    实现功能四

    20min

    259min

    编译错误

  • 相关阅读:
    ASP.NET Web API 记录请求响应数据到日志的一个方法
    EF删除集中方法对比
    CSS 的优先级机制[总结]
    sql备份命令
    sql两张表关联更新字段
    VSCode隐藏node_modules目录
    C# RSACryptoServiceProvider加密解密签名验签和DESCryptoServic
    模拟退火(转)
    HNOI2006-鬼谷子的钱袋
    HNOI2006-公路修建问题(二分答案+并查集)
  • 原文地址:https://www.cnblogs.com/xvcs/p/9696815.html
Copyright © 2020-2023  润新知