• 字符串操作、文件操作,英文词频统计预处理


    1.字符串操作:

    • 解析身份证号:生日、性别、出生地等。
    • 凯撒密码编码与解码
    • 网址观察与批量生成

    (1)解析身份证号:

    str="""
    440000     广东省
    440100   广州市
    440103   荔湾区
    440104   越秀区
    440105   海珠区
    440106   天河区
    440111   白云区
    440112   黄埔区
    440113   番禺区
    440114   花都区
    440115   南沙区
    440116   萝岗区
    440183   增城区
    440184   从化区
    440200   韶关市
    440203   武江区
    440204   浈江区
    440205   曲江区
    440222   始兴县
    440224   仁化县
    440229   翁源县
    440232   乳源县
    440233   新丰县
    440281   乐昌市
    440282   南雄市
    440300   深圳市
    440303   罗湖区
    440304   福田区
    440305   南山区
    440306   宝安区
    440307   龙岗区
    440308   盐田区
    440400   珠海市
    440402   香洲区
    440403   斗门区
    440404   金湾区
    440500   汕头市
    440507   龙湖区
    440511   金平区
    440512   濠江区
    440513   潮阳区
    440514   潮南区
    440515   澄海区
    440523   南澳县
    440600   佛山市
    440604   禅城区
    440605   南海区
    440606   顺德区
    440607   三水区
    440608   高明区
    440700   江门市
    440703   蓬江区
    440704   江海区
    440705   新会区
    440781   台山市
    440783   开平市
    440784   鹤山市
    440785   恩平市
    440800   湛江市
    440802   赤坎区
    440803   霞山区
    440804   坡头区
    440811   麻章区
    440823   遂溪县
    440825   徐闻县
    440881   廉江市
    440882   雷州市
    440883   吴川市
    440900   茂名市
    440902   茂南区
    440903   茂港区
    440923   电白区
    440981   高州市
    440982   化州市
    440983   信宜市
    441200   肇庆市
    441202   端州区
    441203   鼎湖区
    441223   广宁县
    441224   怀集县
    441225   封开县
    441226   德庆县
    441283   高要区
    441284   四会市
    441300   惠州市
    441302   惠城区
    441303   惠阳区
    441322   博罗县
    441323   惠东县
    441324   龙门县
    441400   梅州市
    441402   梅江区
    441421   梅县区
    441422   大埔县
    441423   丰顺县
    441424   五华县
    441426   平远县
    441427   蕉岭县
    441481   兴宁市
    441500   汕尾市
    441502   城区
    441521   海丰县
    441523   陆河县
    441581   陆丰市
    441600   河源市
    441602   源城区
    441621   紫金县
    441622   龙川县
    441623   连平县
    441624   和平县
    441625   东源县
    441700   阳江市
    441702   江城区
    441721   阳西县
    441723   阳东区
    441781   阳春市
    441800   清远市
    441802   清城区
    441821   佛冈县
    441823   阳山县
    441825   连山县
    441826   连南县
    441827   清新县
    441881   英德市
    441882   连州市
    441900   东莞市
    442000   中山市
    445100   潮州市
    445102   湘桥区
    445103   潮安区
    445122   饶平县
    445200   揭阳市
    445202   榕城区
    445221   揭东区
    445222   揭西县
    445224   惠来县
    445281   普宁市
    445300   云浮市
    445302   云城区
    445303   云安区
    445321   新兴县
    445322   郁南县
    445381   罗定市
    """
    ID=input('请输入有效的身份证号码(18位):')
    if len(ID)!=18:
        print('输入错误')
    else:
        print('你的身份证号码是'+ ID)
        birth=ID[6:14]
        print('您的生日是:',format(birth))
        sex=ID[14:17]
        if int(sex) % 2==0:
            print('您的性别为:女')
        else:
            print('您的性别为:男')
        adress=ID[0:6]
        print('您的地址号码是:',format(adress),"出生地方:"+str[str.find(adress)+9:str.find(adress)+12])
    

    (2)凯撒密码编码:

    plaincode = input('请输入内容:')
    for i in plaincode:
        print(chr(ord(i)+3),end="")
    

    (3)网址观察与批量生成

    import webbrowser
    for i in range(19,23):
        url = 'http://news.gzcc.cn/html/2019/xibusudi_0304/109{}.html'.format(i)
        webbrowser.open_new_tab(url)
        print(url)
    

     

    2.英文词频统计预处理

    • 下载一首英文的歌词或文章或小说。
    • 将所有大写转换为小写
    • 将所有其他做分隔符(,.?!)替换为空格
    • 分隔出一个一个的单词
    • 并统计单词出现的次数。
    f = open('a.txt','r+')
    text = f.read()
    f.close()
    text=text.lower()
    sep=",.'?!"
    for s in sep:
        text=text.replace(s,' ')
    print(text.split())
    print(text.count('i'),text.count('to'))
    

    3.文件操作

    • 同一目录、绝对路径、相对路径
    • 凯撒密码:从文件读入密函,进行加密或解密,保存到文件。
    • 词频统计:下载一首英文的歌词或文章或小说,保存为utf8文件。从文件读入文本进行处理。

     4.函数定义

    • 加密函数
    def jiami(a,num):
        result=''
        for i in a:
            result+=unichr(ord(i)+int(num));
        return result;
    • 解密函数
    def jiemi(a,num):
        result=''
        for i in a:
            result+=unichr(ord(i)-int(num));
        return result;
    • 读文本函数
    def read(a):
      file=open(a,'r')
    return file.read();
    

      

  • 相关阅读:
    数据访问之注册审核(重点是审核!!!)常用于企业、公司、医院等网站---2017-05-04
    5个简约的网站---2017-05-03
    数据访问(租房子多条件查询)---2017-05-03
    数据访问之 批量删除 ---2017-05-03
    数据访问之查询数据 ---2017--05-02
    php部分--数组(包含指针思想遍历数组);
    php部分---面向对象静态、抽象类、oop接口、加载类、魔术方法、关键字。
    PHP部分---字符串处理(文中例子不断更新);
    php部分--面向对象三大特性-封装(另加连续调用的一个例子)、继承(重写、重载的例子)、多态;
    php部分---面向对象:定义、实例化、构造函数、析构函数;
  • 原文地址:https://www.cnblogs.com/hujialin/p/10497193.html
Copyright © 2020-2023  润新知