• html邮件解析


    #-*- encoding: gb18030 -*-

    import email

    fp = open("a.eml", "r")

    msg = email.message_from_file(fp)

    # 循环信件中的每一个mime的数据块

    for par in msg.walk():

        if not par.is_multipart(): # 这里要判断是否是multipart,是的话,

                                   #里面的数据是一个message 列表

            name = par.get_param("name") #如果是附件,这里就会取出附件的文件名

            if name:

                #有附件

                # 下面的三行代码只是为了解码象=?gbk?Q?=CF=E0=C6=AC.rar?=这样的文件名

                h = email.Header.Header(name)

                dh = email.Header.decode_header(h)

                fname = dh[0][0]

                print '附件名:', fname

                data = par.get_payload(decode=True) # 解码出附件数据,然后存储到文件中

                try:

                    f = open(fname, 'wb') #注意一定要用wb来打开文件,因为附件一般都是二进制文件

                except:

                    print '附件名有非法字符,自动换一个'

                    f = open('aaaa', 'wb')

                f.write(data)

                f.close()

            else:

                #不是附件,是文本内容

                aa=par.get_payload(decode=True) # 解码出文本内容,直接输出来就可以了。

                new=open("./tuan_email.html","w")

                new.write(aa)

                new.close()

                print aa

                print "dddddddddffffffffff"

            print '+'*60 # 用来区别各个部分的输出

    MIME定义两种编码方式:Base64与QP(Quote-Printable)。

    http://www.pythonclub.org/python-network-application/email-format

     

  • 相关阅读:
    stringstream用法
    来到上海了
    [转]强悍!情书居然能写得如此专业
    asp.net控件开发基础(23)
    当你遇到internal的时候
    asp.net控件设计时支持(3)
    asp.net控件设计时支持(5)
    CS中的缓存类,保证都看的懂
    快要毕业了
    asp.net控件设计时支持(4)
  • 原文地址:https://www.cnblogs.com/lexus/p/1906083.html
Copyright © 2020-2023  润新知