• 计算与软件工程作业四


    作业要求 https://edu.cnblogs.com/campus/jssf/infor_computation17-31/homework/10534
    我在这个课程的目标是 掌握软件开发知识,自己设计简单的程序,发布并维护
    此作业在哪个具体方面帮我实现目标 熟悉掌握代码规范,与同学合作交流
    其他参考文献 https://blog.csdn.net/qq_41764621/article/details/87364318?from=singlemessage&isappinstalled=0
    作业正文 https://www.cnblogs.com/xych/p/12636940.html

    作业1

    评价内容








    整体看法

    同学们基本上都能做到代码风格符合规范,满足简明、易读、无二义性的原则。部分同学在缩进方面处理不当,也存在注释过多或者过少的问题。代码设计方面,仍有不少同学不能成功的完成作业要求,有待进一步学习完善。

    作业2

    1.实现一个简单而完整的软件工具(中文文本文件人物统计程序):针对小说《红楼梦》要求能分析得出各个人物在每一个章回中各自出现的次数,将这些统计结果能写入到一个csv格式的文件。
    2.进行单元测试、回归测试、效能测试,在实现上述程序的过程中使用相关的工具。
    3.进行个人软件过程(PSP)的实践,逐步记录自己在每个软件工程环节花费的时间。
    4.使用源代码管理系统 (GitHub, Gitee, Coding.net, 等);
    5.针对上述形成的软件程序,对于新的文本小说《水浒传》分析各个章节人物出现次数,来考察代码。

    • 将上述程序开发结对编程过程记录到新的博客中,尤其是需要通过各种形式展现结对编程过程,并将程序获得的《红楼梦》与《水浒传》各个章节人物出现次数与全本人物出现总次数,通过柱状图、饼图、表格等形式展现。
    • 《红楼梦》与《水浒传》的文本小说将会发到群里。

    代码

    import jieba
    #添加jieba分词
    mydict = ['琏二奶奶','凤哥儿','凤丫头','宝姑娘','颦儿','二姑娘','三姑娘','四姑娘','云妹妹','蓉大奶奶']
    for item in mydict:
        jieba.add_word(item)
    txt = open('d:python\红楼梦.txt',"r", encoding='utf-8').read()
    #定义别名列表
    bieming = [["林妹妹","黛玉",'林姑娘','林黛玉'],[ "宝钗" ,'宝姑娘','宝丫头',
    '宝姐姐','薛宝钗'],['元春','大姑娘','娘娘','贵妃','元妃','贾元春'],
    ['迎春','二姑娘','贾迎春'],['探春','三姑娘','贾探春'],['惜春','四姑娘',
    '贾惜春'],[ "王熙凤","凤丫头",'琏二奶奶','凤姐','凤哥儿','凤辣子'],['巧姐'],
    ['湘云','云妹妹','史湘云'],['妙玉'],['李纨','大嫂子'],['秦可卿','可卿','蓉大奶奶']]
    words=jieba.lcut(txt)
    counts={}
    for word in words:
        if len(word) ==1:
            continue
        else:
            counts[word] = counts.get(word,0)+1
    #计算出场次数(各个别名的合计次数)
    lst=list()
    for i in range(12):
        lt=0
        for item in bieming[i]:
            lt += counts.get(item,0)
        lst.append(lt)
        
    twelvechai= ['林黛玉','薛宝钗','贾元春','贾迎春','贾探春','贾惜春','王熙凤','巧姐','史湘云','妙玉','李纨','秦可卿']
    items=list()
    for i in range(12):
        items.append([twelvechai[i],lst[i]])
    items.sort(key=lambda x:x[1], reverse=True) 
    for i in range(12):
        word, count = items[i]
        print ("{0:<10}{1:>5}".format(word, count))
    

    运行结果



    码云地址

    https://gitee.com/sichuan_crane/firstwarehouse/blob/master/红楼梦.txt

  • 相关阅读:
    Elasticsearchdump 数据导入/导出
    04.2 go-admin前后端打包为一个服务上线
    go-admin开发小技巧
    假设知道服务器IP,如何查询它绑定的域名?
    webstorm eslint 配置格式化的两种方式
    lodash中的深拷贝方法cloneDeep()
    go 操作elaticsearch
    gin返回json假数据
    gin 图片上传到本地或者oss
    世界地图
  • 原文地址:https://www.cnblogs.com/xych/p/12636940.html
Copyright © 2020-2023  润新知