• 组合数据类型练习,英文词频统计实例


      1. 列表实例:由字符串创建一个作业评分列表,做增删改查询统计遍历操作。例如,查询第一个3分的下标,统计1分的同学有多少个,3分的同学有多少个等。
        s=list('12323231312')
        s.append('3')
        s.pop(0)
        s[1]='2'
        s.index('2')
        s.count('1')
        s.count('3')

      2. 字典实例:建立学生学号成绩字典,做增删改查遍历操作。
        d={'01':85,'02':80,'03':90,'04':95,'05':75,'06':85,'07':86}
        d['01']
        d['08']=96
        d.pop('01')
        d.keys()
        d.values ()

      3. 列表,元组,字典,集合的遍历。
        l=list('12311312231')
        s=tuple('bsfdsbsk')
        t={'01':'98','02':'99','03':'92','04':'95'}
        d={'10','11','12','13','14'}
        for i in l:
            print(i,end='')
        for i in s:
            print(i,end='')
        for i in d:
            print(i,end='')
        for i in t:
            print(i,end='')
        for i in t:
            print(i,t.values())

        属性 列表list 元祖tuple                  字典dict      集合set
        有序 是 (正向递增/反向递减)
        数据可重复 key值唯一
        数据可修改
        特点

        查询速度随内容增加而变慢

        占用内存较小

        表达固定数据项、函数多返回值、

        多变量同步赋值、循环遍历等情况下适用

        改&查操作速度快,

        不会因key值增加而变慢。

        占用内存大,内存浪费多

        (利用空间成本换时间)

        数据独立性:

        能够过滤重复参数


        总结列表,元组,字典,集合的联系与区别。
      4. 英文词频统计实例
        1. 待分析字符串
        2. 分解提取单词
          1. 大小写 txt.lower()
          2. 分隔符'.,:;?!-_’
        3. 计数字典
          1. 排除语法型词汇,代词、冠词、连词

        4. 排序list.sort()
        5. 输出TOP(10)
          s=open('s.txt','r').read()
          exc={'the','a','to','of','and','in','on','that','i','it','at'}
          s=s.lower()
          for i in ''',.?!''':
              s=s.replace(i,' ')
          words=s.split(' ')
          dic={}
          keys=set(words)
          for w in exc:
              keys.remove(w)
          for i in keys:
              dic[i]=words.count(i)
          wc=list(dic.items ())
          wc.sort(key=lambda x:x[1],reverse=True)
          for i in range(20):
              print(wc[i])

  • 相关阅读:
    待学习资料
    Hive之数据类型
    Hive 之元数据库的三种模式
    Hive之数据模型
    311 jvm类加载以及对象回收相关
    221 netty模型相关
    J101
    213 NIO编程
    XXLJOB终止定时任务的犯二小故事
    XXL-JOB源码研究(1)---version 2.1.2
  • 原文地址:https://www.cnblogs.com/lcm1995/p/7569585.html
Copyright © 2020-2023  润新知