• pop3&smtp


    pop3&smtp

    pop3

    Post Office Protocol - Version 3

    pop3协议是离线邮件协议,是客户端取邮件用的。

    默认监听在TCP:110端口.

    POP3会话有3个状态AUTHORIZATION、TRANSACTION和UPDATE不同状态能用的命令不同。

                等待连接 身份确认 quit命令

                —— |AUTHORIZATION|————— |TRANSACTION|——————|UPDATE|

                |________________________________________________________|

                重返认可状态

     POP3命令码如下:

    命令(ascII字符) 参数 状态 描述
    USER username AUTHORIZATION 用户名
    PASS password AUTHORIZATION 密码,若成功,将导致状态转换
    APOP username Digest(加密后密码) AUTHORIZATION Digest是MD5消息摘要
    STAT none TRANSACTION 请求服务器发回关于邮箱的统计资料,如邮件总数和总字节数
    UIDL(unique-id listing) [message] TRANSACTION 返回邮件的唯一标识符,POP3会话的每个标识符都将是唯一的
    LIST [message] TRANSACTION 返回邮件数量和每个邮件的大小
    RETR(retrieve) [message] TRANSACTION 返回由参数标识的邮件的全部文本
    DELE [message] TRANSACTION 服务器将由参数标识的邮件标记为删除,会话进入UPDATE后删除
    RSET [message] TRANSACTION 服务器将重置所有标记为删除的邮件,用于撤消DELE命令
    TOP [message] TRANSACTION 服务器将返回由参数标识的邮件前n行内容,n必须是正整数
    NOOP [message] TRANSACTION 服务器返回一个肯定的响应
    QUIT none UPDATE pop3服务器删除标记为deleted的邮件,无论错误与否,释放独占锁、关闭TCP连接

    wireshark抓包:第一张为开始,第二章为结束

    SMTP

    SMTP工作在两种情况下

    1. 发件人客户端传输到服务器
    2. 邮件服务器向另一个邮件服务器传输邮件

    smtp是个请求/响应协议,命令和响应都是基于ascii文本,并以cr和lf符结束。响应包括一个表示返回状态的三位数字代码。

    网图,来自https://blog.csdn.net/bripengandre/article/details/2191048

    模型

      -------------------------------------------------------------
    
       
                   +----------+                +----------+
       +------+    |          |                |          |
       | User |<-->|          |      SMTP      |          |
       +------+    |  Sender- |Commands/Replies| Receiver-|
       +------+    |   SMTP   |<-------------->|    SMTP  |    +------+
       | File |<-->|          |    and Mail    |          |<-->| File |
       |System|    |          |                |          |    |System|
       +------+    +----------+                +----------+    +------+
       
    
                    Sender-SMTP                Receiver-SMTP
    
         -------------------------------------------------------------
    

    命令格式

    COMMAND [Parameter] 。其中COMMAND是ASCII形式的命令名,Parameter是相应的命令参数,是回车换行符(0DH, 0AH)。

    XXX Readable Illustration。XXX是三位十进制数;Readable Illustration是可读的解释说明,用来表明命令是否成功等。XXX具有如下的规律:以2开头的表示成功,以4和5开头的表示失败,以3开头的表示未完成(进行中)。

    命令

    命令 描述
    HELO 向服务器标识用户身份
    MAIL FROM: 为发送者地址
    RCPT TO: 用来标志邮件接收者的地址,常用在MAIL FROM后,可以有多个RCPT TO
    DATA 将之后的数据作为数据发送,以.标志数据的结尾
    REST 重置会话,当前传输被取消
    NOOP 要求服务器返回OK应答,一般用作测试
    QUIT 结束会话
    VRFY 验证指定的邮箱是否存在,由于安全方面的原因,服务器大多禁止此命令
    EXPN 验证给定的邮箱列表是否存在,由于安全方面的原因,服务器大多禁止此命令
    HELP 查询服务器支持什么命令
    AUTH LOGIN 认证请求
    EHLO 除了HELO所具有的功能外,EHLO主要用来查询服务器支持的扩充功能

    编码

    250 8BITMIME /* 最后一个响应数字应答码之后跟的是一个空格,而不是'-' */

    用户名、密码需采用base64编码(Base64就是一种基于64个可打印字符来表示二进制数据的表示方法。)

    以“X”开头的关键字都是指服务器自定义的扩充(还没纳入RFC标准)

    还有一些重要字段

    Received: from DM6NAM11HT080.eop-nam11.prod.protection.outlook.com
     (2603:1096:201:20::24) by HK0PR06MB3714.apcprd06.prod.outlook.com with HTTPS
     via HK2PR02CA0212.APCPRD02.PROD.OUTLOOK.COM; Sat, 12 Oct 2019 02:04:31 +0000
    Received: from DM6NAM11FT041.eop-nam11.prod.protection.outlook.com
     (10.13.172.57) by DM6NAM11HT080.eop-nam11.prod.protection.outlook.com
     (10.13.172.248) with Microsoft SMTP Server (version=TLS1_2,
     cipher=TLS_ECDHE_RSA_WITH_AES_256_CBC_SHA384) id 15.20.2347.16; Sat, 12 Oct
     2019 02:04:30 +0000
    Authentication-Results: spf=pass (sender IP is 120.26.244.201)
     smtp.mailfrom=smail.kzedu.cc; hotmail.com; dkim=none (message not signed)
     header.d=none;hotmail.com; dmarc=bestguesspass action=none
     header.from=smail.kzedu.cc;
    Received-SPF: Pass (protection.outlook.com: domain of smail.kzedu.cc
     designates 120.26.244.201 as permitted sender)
     receiver=protection.outlook.com; client-ip=120.26.244.201;
     helo=smtp552.submail.cn;
    Received: from smtp552.submail.cn (120.26.244.201) by
     DM6NAM11FT041.mail.protection.outlook.com (10.13.172.98) with Microsoft SMTP
     Server id 15.20.2347.16 via Frontend Transport; Sat, 12 Oct 2019 02:04:29
     +0000
    X-IncomingTopHeaderMarker:
     OriginalChecksum:24B3073D37E1488647AB6D33914E56311671421DA99AC9F3ACCE5038C61D9AED;UpperCasedChecksum:4E628F444082EA3506FF7B7B728D6469D42940820A842E95A6AF817CE7359561;SizeAsReceived:633;Count:10
    Date: Sat, 12 Oct 2019 2:4:28 +0000
    

    Received是smtp服务器记录的从哪里收到的邮件。从上往下就是SMTP中继的各个节点。最下面的是发件服务器IP。

    Received-SPF是防止假邮件的mail from可以伪造from更不用说,但是SPF记录该域名的邮件服务器的发件IP地址,可以验证真伪(要发假的垃圾邮件要模仿的是SMTP服务器行为,除非黑客控制了一个域名的邮件服务器)。

    MIME消息由消息头和消息体两大部分组成,邮件头与邮件体之间以空行进行分隔

    邮件头包含了发件人、收件人、主题、时间、MIME版本、邮件内容的类型等重要信息。每条信息称为一个域,由域名后加“: ”和信息内容构成,可以是一行,较长的也可以占用多行。域的首行必须“顶头”写,即左边不能有空白字符(空格和制表符);续行则必须以空白字符打头,且第一个空白字符不是信息本身固有的,解码时要过滤掉。

    邮件体包含邮件的内容,它的类型由邮件头的“Content-Type”域指出。常见的简单类型有text/plain(纯文本)和text/html(超文本),multipart/mixed, multipart/related和multipart/alternative。

    multipart类型,是MIME邮件的精髓。邮件体被分为多个段,每个段又包含段头和段体两部分,这两部分之间也以空行分隔。常见的multipart类型有三种:multipart/mixed, multipart/related和multipart/alternative。

    +------------------------- multipart/mixed ----------------------------+
    |                                                                      |
    |  +----------------- multipart/related ------------------+            |
    |  |                                                      |            |
    |  |  +----- multipart/alternative ------+  +----------+  |  +------+  |
    |  |  |                                  |  | 内嵌资源 |  |  | 附件 |  |
    |  |  |  +------------+  +------------+  |  +----------+  |  +------+  |
    |  |  |  | 纯文本正文 |  | 超文本正文 |  |                |            |
    |  |  |  +------------+  +------------+  |  +----------+  |  +------+  |
    |  |  |                                  |  | 内嵌资源 |  |  | 附件 |  |
    |  |  +----------------------------------+  +----------+  |  +------+  |
    |  |                                                      |            |
    |  +------------------------------------------------------+            |
    |                                                                      |
    +----------------------------------------------------------------------+
    

    可以看出,如果在邮件中要添加附件,必须定义multipart/mixed段;如果存在内嵌资源,至少要定义multipart/related段;如果纯文本与超文本共存,至少要定义multipart/alternative段。什么是“至少”?举个例子说,如果只有纯文本与超文本正文,那么在邮件头中将类型扩大化,定义为multipart/related,甚至multipart/mixed,都是允许的。

    multipart诸类型的共同特征是,在段头指定“boundary”参数字符串,段体内的每个子段以此串定界。所有的子段都以“--”+boundary行开始,父段则以“--”+boundary+“--”行结束。段与段之间也以空行分隔。在邮件体是multipart类型的情况下,邮件体的开始部分(第一个“--”+boundary行之前)可以有一些附加的文本行,相当于注释,解码时应忽略。

    可以观察一下边界001、002、003等

    提取pcapng中流量可以从wireshark中直接将邮件正文部分复制出来保存到文件中后缀改为.eml拿客户端打开。反正我觉得自己解析邮件中的文件太难了,取个巧。

    base64

    Base64的索引表,字符选用了"A-Z、a-z、0-9、+、/"
    64个可打印字符。数值代表字符的索引,这个是标准Base64协议规定的,不能更改。64个字符用6个bit位就可以全部表示,一个字节有8个bit位,剩下两个bit就浪费掉了,这样就不得不牺牲一部分空间了。这里需要弄明白的就是一个Base64字符是8个bit,但是有效部分只有右边的6个bit,左边两个永远是0。

    那么怎么用6个有效bit来表示传统字符的8个bit呢?8和6的最小公倍数是24,也就是说3个传统字节可以由4个Base64字符来表示,保证有效位数是一样的,这样就多了1/3的字节数来弥补Base64只有6个有效bit的不足。

    我的邮件当中有那么一段

    先用base64解码,然后用GB2312解码

    需要注意的是根据RFC 822规定,每76个字符,还需要加上一个回车换行。所以字符串要手动去除回车换行。

    参考:

    https://zh.wikipedia.org/wiki/Base64

    https://www.cnblogs.com/luguo3000/p/3940197.html

    https://blog.csdn.net/bripengandre/article/details/2192982

  • 相关阅读:
    D. The Fair Nut and the Best Path 树形dp (终于会了)
    (二)网络流之最大流
    网络流(知识点) 一 终究还是躲不掉
    dp 优化 F2. Pictures with Kittens (hard version)
    da shu mo ban
    AtCoder Regular Contest 090 F
    Codeforces 918D MADMAX 图上dp 组合游戏
    Codeforces 918C The Monster
    AtCoder Regular Contest 090 C D E F
    poj 3623 Best Cow Line, Gold 后缀数组 + 贪心
  • 原文地址:https://www.cnblogs.com/wan-xiang/p/11666728.html
Copyright © 2020-2023  润新知