网络知识杂谈

网络知识杂谈
1. 概述
  1. 简单描述 https
  2. 尽量介绍它的原理
    
    实际的机制, 可能会更加复杂一些...
  3. 2020-10-07
    
    回过头来看, 感觉还是很臃肿的样子, 怎么能把这些东西讲得简单呢
2. 背景
  1. 这玩意, 困扰我好多年了
  2. 今天开始, 想做个了断
  3. 之前工作也接触过, 但从我的角度来说, 认识很浅
    
    会配置
    
    给个证书, 放好位置, 调一下选项
    
    会抓包
    
    开个 charles, 配置几下, 手机挂代理, 安装证书
    
    具体干啥
    
    只知道是个加密的体系
    
    因为抓包知道, 这不是明文
    
    机制的理解和思考
    
    看过图解http, 没理解就放过去了...
  4. 最后, 将这个东西的时候, 如果你忍无可忍想说一句, 禁止套娃...
    
    我只能说, 我无能为力...
    
    我也不想套娃啊...
1. http 的不足, 与 https 的产生
1. 概述
  1. 简述两者关系
1. http 的不足

1. 没有状态
1. 问题
  1. 没有状态, 在识别身份的时候, 就会遇到困难,
2. 解决
  1. 没关系, 我们有 cookie 和 session
  2. 依靠客户端和服务端, 保存身份信息到状态里
  3. 每一次的交互, 都需要携带这个不完整的上下文
2. 依赖连接, 但又没有连接
1. 问题
  1. http 基于 tcp, 所以通信的时候, 首先要建立起 tcp 连接
    
    但是 http 传输的内容, 有很多其实是小内容, 这是 http 头反而是大内容
    
    css
    
    js
    
    ajax 交互的
    
    然后就是这样
    
    三次握手创建连接
    
    收到一个小玩意
    
    连接断开
    
    然后要收下一个, 然后继续握手
    
    重复这么几次, 其实很影响客户端的效率
    
    当然, 之前的服务, 扛不住那么多的长连接...
2. 解决
  1. keep-alive
    
    概述
    
    只要任意一端没有明确提出断开连接，则保持TCP连接状态
    
    字段
    
    Connection: keep-alive
    
    结果
    
    减少了反复连接, 带来的额外等待
3. 其他问题
1. 问题
  1. 请求只能从客户端发起, 服务端只能被动接受
  2. 客户端和服务端之间, 一次只能首发一个请求和响应
2. 解决
  1. http2
    
    这个现在还没有全面普及
    
    现在主要的版本, 是 http1.1
    
    http2 以后还是要学一下
4. 还有一个问题
1. 问题
  1. 安全问题
    
    http 的内容, 基本全是明文
    
    而且 http 报文会在网络里经过若干跳转, 才能最终传播到服务器
    
    如果中途你的报文被拷贝了, 或者被人拦截了, 你的信息全都泄露了...
2. 解决办法
  1. 部分加密
    
    这个主要是针对密码内容
    
    场景
    
    用户在客户端输入密码
    
    客户端加密密码, 生成一个密文B
    
    客户端将密文发送给服务端
    
    用户注册时, 输入的密码并没有明文保存, 也是用生成密文的方法, 生成了密文A
    
    对比密文A 和密文B, 就可以得到用户登录的结果
    
    好处
    
    避免了明文传播
    
    问题
    
    如果前端加密方式被破解了, 是不是又是明文了
    
    解决
    
    可以采用不可逆的加密, 比如 md5
    
    当然, 现在的 md5 可能不那么安全了, 服务端可以再对 md5 的结果加盐, 然后再做其他
    
    如果密文被拦截了, 不用密码而用密文, 是不是也能直接登录
    
    这个我目前解释不了
    
    如果跟我通信的, 一开始就是个假服务器, 我有办法吗?
    
    这个我目前也解释不了
    
    还有可能, 你的消息在传到你手上之前, 就被别人改了
    
    这个我目前也解释不了
    
    或者说
    
    其实问题 2 和 3, 都是身份确认的问题
    
    问题2, 本质是服务端无法确认客户端就是那个真正的客户端
    
    问题3, 本质是客户端无法确认服务端就是那个真正的服务端
    
    问题4
    
    本质上是消息完整性的问题
2. 问题的解决
1. 安全问题的解决方案
  1. https
2. https 解决了什么问题
  1. 消息
    
    消息的不可见性
    
    消息的完整性
  2. 通信双方
    
    客户端的身份认证
    
    服务端的身份认证
3. 当然, 一下解决了这么多问题, 毕竟不是一个一句两句, 就能说清楚的东西
  1. 所以, 先说最好理解的东西
    
    消息的不可见性
2. 加密的基本常识
1. 概述
  1. 简单介绍一下加密中会用到的一些常识
1. 场景: 一个有点类似写信的场景
1. 假定加密的应用, 都是在这样的场景下
  1. 角色
    
    发信人
    
    知道原文内容
    
    加密原文, 产生密文
    
    将密文送给收信人
    
    收信人
    
    收获密文
    
    解密密文
    
    获取原文中信息
    
    其他
    
    可能会有其他角色, 这个后面说道再补充
    
    身份问题
    
    收件人和发件人可以彼此 100% 的确认对方身份
    
    当然真实环境下, 这个未必
  2. 信息
    
    原文
    
    发信人本来想要传达的信息
    
    密文
    
    原文经过某种手段, 得到的一个与原来信息看起来完全不同的内容
  3. 行为
    
    加密
    
    原文 -> 密文
    
    解密
    
    密文 -> 原文
  4. 其他
    
    算法
    
    加密/解密的过程
    
    输入
    
    原文/密文
    
    密钥
    
    密钥
    
    一个特殊的因子
    
    配合加密/解密算法, 可以得到原文/密文
    
    理解
    
    算法就是一个 function
    
    原文/密文和密钥是 function 的参数
  5. 概念好像有点多啊...
    
    最开始, 只打算写角色和信息
    
    结果怎么越写越多了...
2. 加密的方法
1. 分类
  1. 可逆
    
    对称加密
    
    非对称加密
  2. 不可逆
    
    这个东西, 后面再说
    
    之前说的 md5, 就是属于这种
3. 对称加密
1. 概述
  1. 加密和解密, 使用同样的密钥
2. 机制
  1. 加密
    
    输入
    
    原文
    
    密钥
    
    算法
    
    加密算法
    
    输出
    
    密文
  2. 解密
    
    输入
    
    密文
    
    密钥
    
    算法
    
    解密算法
    
    输出
    
    原文
3. 特点
  1. 加密
    
    对于没有密钥或者不知道算法的第三人来说, 密文就无法理解
  2. 方便
    
    加密解密用一个密钥
  3. 双向
    
    发信人和收信人的身份, 可以互相替换
4. 问题
  1. 发信人想和多个收信人通信, 但又不想收信人之间互相知道
    
    那你每个收信人整个密码呗
    
    密码多了, 老实说, 不方便管理
    
    而且, 协商密码, 也是个麻烦事
    
    如果协商过程被人拦截, 基本也是明文传输
    
    所以, 协商通常会使用非对称加密
  2. 又有这么个问题, 发件人如何将这个公共密钥, 发送给收件人呢?
    
    方案1
    
    思路
    
    直接发送密钥和密文
    
    结果
    
    如果密钥被劫, 以后的消息, 搞不好都是明文
    
    方案2
    
    思路
    
    非对称加密
    
    不得不说, 那帮搞数学的真的牛皮
    
    这个就是对称加密里, 常见的密钥配送问题
4. 非对称加密
1. 概述
  1. 使用公钥和私钥, 对信息进行处理
  2. 以 rsa 算法为例
2. 机制
  1. 公钥与私钥
    
    密钥对
    
    通常生成密钥, 是成对的
    
    公? 私?
    
    其实本质上, 两个密钥, 是对等的
    
    通常的约定
    
    公钥
    
    密钥对生成者, 公开出去的密钥
    
    所有人都知道
    
    私钥
    
    密钥对生成者, 自己保存下来的密钥
    
    只有生成者自己知道
    
    在非对称加密中, 加密和解密需要的密钥不一样
    
    场景
    
    公钥加密, 私钥解密
    
    私钥加密, 公钥解密
    
    疑问: 加密的密钥, 能在用来解密吗?
    
    不可以
    
    在同一个流程里, 它就是不可以
    
    这个很关键
3. 场景
  1. 好了, 扯了这么些, 看看这下俩人如何送密码
  2. 步骤
    
    发信人让收信人送密钥
    
    这个直接明文传送, 都没关系
    
    收信人生成 rsa 密钥对
    
    收信人将公钥, 发送给发信人
    
    发信人收到公钥
    
    发信人生成对称加密密钥
    
    发信人将对称加密密钥, 用公钥加密
    
    注意, 我们要开始套娃了
    
    发信人将密文发送
    
    收信人收到密文, 用私钥解密
    
    收信人用对称加密密钥, 发送密文
    
    发信人收到密文, 用对称加密密钥解密, 确认之后通信开始
4. 特点
  1. 加密
    
    自然而然
  2. 稍微有点麻烦
    
    一套流程, 需要两个不一样的密钥
    
    而且加密解密的速度, 没有对称加密快
  3. 单向
    
    通常情况下, 这种通信是单向的
    
    不是说公钥私钥本质上对等吗?
    
    确实是, 但是如果你用私钥加密, 有公钥的人开起来, 不就是明文了吗?
    
    所以在这个体系中, 每个人都要有一套自己的公钥
5. 现实中, 很多场景都会这样
  1. 用非对称加密, 传递钥匙
  2. 用对称加密来加密解密信息, 进行通信
6. 又有问题了
  1. 如果收信人协商中的有了中间人, 替换了公钥怎么办
    
    也就是说, 发信人收到的公钥, 是中间人的
    
    然后发信人最后是和中间人进行了加密通信, 还自以为很安全...
    
    本质上来说, 就是无法确认公钥的真假
3. 简单的数字证书
1. 概述
  1. 简述数字证书模型
    
    不是真正的数字证书
2. 解决思路
  1. 收信人将自己的公钥, 存放在权威第三方
    
    一般来说, 是个认证中心
  2. 认证中心用私钥, 将收件人的公钥加密
    
    注意, 要开始套娃了
    
    我们把这个加密后的公钥(套娃), 叫做证书吧
    
    切记, 这不是现实中的证书
    
    通常这个证书, 会保存在收信人那里
    
    简化模型, 方便理解
  3. 发信人通常会持有认证中心的公钥
    
    这个一般改不了
    
    主流浏览器, 自带了认证中心的公钥, 一般不会被骗的
  4. 发信人请求收信人, 获取证书
    
    也忘了之前在哪里看到, 是请求认证中心, 获取证书
    
    坑了我好多年
  5. 发信人解密证书, 获取收信人公钥
  6. 后面的过程, 就是上面的非对称加密交换密钥的过程, 就不再重复了
3. 问题
  1. 如果有中间人怎么办呢?
    
    中间人有什么
    
    中间人也有认证中心的公钥
    
    中间人可以获取发信人的通信数据包
    
    中间人可以干什么
    
    中间人可以获取收信人的公钥
    
    但是有公钥, 除了加密, 你还能干什么呢?
    
    然后, 好像就没有什么了
    
    看起来好像, 有那么点安全了
  2. 然而, 中间人气急败坏又不甘, 他还可以做别的尝试...
    
    认证中心
    
    既然叫认证中心, 不可能只对一个收信人做认证吧
    
    收信人可以注册, 中间人也可以啊
    
    中间人的新思路
    
    拦截收信人的数字证书, 换成中间人的数字证书
    
    拦截发信人的加密通信
    
    此时, 发信人用中间人的私钥, 加密了对称密钥
    
    解析加密请求
    
    用的中间人的公钥, 中间人当然能解开
    
    响应发信人的请求
    
    然后两边开会加密通信...
    
    发信人自以为在和收信人通信, 并且觉得很安全...
  3. 怎么感觉忽然又不安全起来了
    
    这个时候, 需要引入数字签名了
4. 数字签名
1. 概述
  1. 简述数字签名的机制
2. 数字签名
  1. 概述
    
    一段加密信息
    
    作用是用来帮助验证证书的真假
  2. 生成
    
    前提
    
    认证中心获取了收信人的公钥
    
    假定认证中心只使用 md5 作为摘要生成手段
    
    步骤
    
    将收信人公钥, 以及收信人的信息, 使用 md5, 生成一个摘要
    
    将摘要通过认证中心的私钥, 加密, 生成数字签名
3. 真正的数字证书
  1. 内容
    
    收信人的公钥
    
    收信人其他身份信息
    
    比如 url 等, 可以确认身份的信息
    
    摘要生成方式, 这里默认是 md5
    
    数字签名
4. 使用数字证书
  1. 获取收信人公钥
  2. 将收信人公钥和相关信息, 使用 md5, 生成摘要1
  3. 将数字签名, 用认证中心公钥解密, 还原为摘要2
  4. 比对摘要1 和摘要2
    
    如果相等, 证书就没有被修改过
  5. 然后继续比对
    
    证书中身份信息, 这里可以用和当前的通信者进行比对
    
    如果不符合, 说明证书是假的
5. 好, 现在来看看, 中间人还能做着呢吗
  1. 假设还想上次一样, 中间人用自己的证书, 返回发信人
    
    结果
    
    解析出来证书里的其他身份信息与正在访问的地址不匹配
    
    中间人窃听失败
5. 总结
1. 反思之前为什么没搞懂
  1. 从 2016年到 2019年都快完了, 我终于把这些原理搞懂了
    
    之前搞不懂的原因
    
    对称加密和非对称加密, 我是搞明白了的
    
    简单的原理, 以及他们解决的问题
    
    没有理解, 加密 https 的重点
    
    基础
    
    发送者获取接收者的公钥, 之后采用对称加密通信
    
    重点
    
    如何保证接收者的公钥, 是真实而有效的
    
    对认证中心的工作, 比较模糊
    
    对数字签名, 数字证书的认识, 比较模糊
    
    再次谴责套娃
    
    没有采用循序渐进的方式, 来理解这些复杂, 但又有关联的机制
    
    机制虽然比较多, 但却是逐步演进
    
    后一个机制的出现, 都是为了填补前一个机制埋下的坑
    
    理解了机制之间的关系后, 机制之间的具体细节, 感觉会稍微清楚一些
    
    在没有搞清楚机制的情况下, 继续去看握手
    
    我当时是有多牛逼, 觉得自己能直接硬啃
2. 尝试简单整理下 https
  1. 意义
    
    可靠的加密通信
  2. 基础
    
    发信人获取收信人公钥
  3. 重点
    
    数字证书的有效性
  4. 难点
    
    数字证书的组成, 以及验证方式
    
    数字签名
  5. 实际通信方式
    
    协商后的对称加密
    
    233333
ps
1. ref
  1. 即时通讯安全篇（七）：如果这样来理解HTTPS，一篇就够了
    
    这个老哥写的挺好的
    
    特别是场景的举例, 好些场景我开始没有考虑到, 被他一说, 我觉得挺有道理的...
  2. 图解 http
    
    16 年看过这本书, 但还是没看懂
    
    https 这段, 当时觉得很简略
    
    现在看
    
    大体流程也说了
    
    但是对数字签名和数字证书, 说的比较简单
    
    这个大概是我困扰的由来吧
  3. 图解密码学
    
    之前过了一遍, 内容记不大清了, 但还是记得那是本好书
  4. HTTPS认证解决什么问题，以及实现原理
2. 持久连接
  1. 意义
  2. 感觉这里, 其实东西不少
    
    channel
    
    并行传输
3. https
  1. 原理已经简单说明
  2. 实际的机制, 我想以后有空, 还是要说一下
    
    ssl 和握手什么的...
4. 再有个疑问
  1. 既然都这么安全了, 为啥还是可以用 charles 或者 fiddler 来看抓包
    
    为啥信任一个抓包工具的证书, 就可以看明文 https 了
    
    那如果我不小心信任了中间人, 是不是就不行了
尽量尝试解释清楚; 自己校对能力有限, 如果有错误欢迎指出
相关阅读:
Android SDK Android NDK 官方下载地址
 编码转换工具源码
 st_mode的剖析
 关于 python 字符编码的一些认识
 MFC中的argc和argv参数
 VC实现文件拖拽获取文件名
 CString 转 int
《C语言程序设计实践教程》实验题源程序
 C语言文件操作结构体与文件 fgetc fputc fread fwrite
C++语言创建状态栏
原文地址：https://www.cnblogs.com/xy14/p/11994528.html

网络知识杂谈

1. http 的不足, 与 https 的产生

1. http 的不足

1. 没有状态

2. 依赖连接, 但又没有连接

3. 其他问题

4. 还有一个问题

2. 问题的解决

2. 加密的基本常识

1. 场景: 一个有点类似 写信 的场景

2. 加密的方法

3. 对称加密

4. 非对称加密

3. 简单的数字证书

4. 数字签名

5. 总结

ps

1. 场景: 一个有点类似写信的场景