[信安Presentation]一种基于GPU并行计算的MD5密码解密方法

[信安Presentation]一种基于GPU并行计算的MD5密码解密方法
-------------------paper---------------------

一种基于GPU并行计算的MD5密码解密方法

0.abstract
1.md5算法概述
2.md5安全性分析
3.基于GPU的爆破
3.1GPGPU
3.2CUDA
3.3implementation
4性能对比

-----------------presentation------------------

[Code]

Section 0：Introduction of MD5, and its application

Application：

Unix系统中的密码

Section 1：MD5 Algorithm [Ref]
```
STEP1：从plaintext末尾开始填充1000000.....，直到(数据长度)%512=448【单位：bit
STEP2：继续填充64bit，这64bit里存储的是填充前plaintext的长度
STEP3：将填充好的信息拆分成整数个512bit的blocks，一个一个block处理
STEP4：FOR EACH 512b_BLOCKS:
　　　　　　Round(1..4)
　　　　　　
```
Section 2：How to crack MD5

1.MD5理论上不可能恢复出原文（According to Information Theory）

但是存在暴力破解方法

常用爆破方法：彩虹表、暴力

　　彩虹表：提前打好的一个大大大大大大Table，里面记录一大坨plaintext和对应的MD5

　　暴力：穷举

破解密码？无需从MD5恢复出plaintext。只需枚举plaintext，然后找到MD5相同的即可

Section 3：usage of CUDA in parallel computing

Introduction of CUDA

Section 4: the parallel algorithm for cracking MD5

将plaintext解空间（alphabet的排列组合）分解成若干组，交给不同的GPU SM并行计算出MD5，并与原MD5比对。

Section 5：Performance testing

好的很呐

Section 6：Conclusion

虽然可以爆破，但是对于长密码，代价还是巨大的。MD5还能接着续几年

Section ?：Future Researching

[Ref] [Ref] [Ref]

6.Future Researching

其实对于很多MD5解密的问题，我们并不需要根据MD5码找出原文，而是只要找到了MD5加密后与原文的MD5值相同的字符串即可。比如破解密码经过了MD5加密的数据库或服务器这就是所谓的MD5碰撞（Collision）问题。因为MD5是一种信息摘要算法，由信息论基础可知，对于原文长度稍长一些的信息，这种碰撞是肯定存在的。

在1993年，Den Boer和Bosselaers发现了最初步的MD5碰撞方法"pseudo-collision"。1996年，H. Dobbertin提出了另一种碰撞方法。这种方法需要将原始的MD5算法初值修改成指定的初值：......[pic from wikipedia]......。2005年，山东大学的王小云教授提出了一种新的方法，可以对于原始MD5算法实现碰撞。对于任意一个信息(M0,M1)，经过一系列操作后可以得到另一个信息(M0',M1')，使得MD5(M0,M1)==MD5(M0',M1')。而且这些操作都可以在可接受的时间内完成。
王小云在论文中提出了一种message modification technique，对于信息(M0,M1)，首先将M0中的若干位进行修改，令M0'=M0+deltaM0。之后再对M1做类似操作。最终可得到一段新的信息(M0',M1')，这段信息与(M0,M1)是有差异的，但是MD5却完全相同。如下图所示：
这篇论文提出了一个寻找MD5碰撞的可行方法，这无疑是个巨大的突破。

《How to Break MD5 and Other Hash Functions》, Xiaoyun Wang and Hongbo Yu

1.目的：对于已有的message(M0,M1)找到一个message(M0',M1')，s.t.发生碰撞（collisions after the second block，即在M1和M1'时出现。其实就意味着这两个message发生了碰撞。因为MD5需要先处理M0再处理M1。）【详见原文Section 1】

2.Wang提出了一个message modification technique，通过改变原文的若干个位来大大增加出现上述collision的概率

3.Wang的论文提出了一套方案，对于两个1024bit的plaintext(M0,M1)和(M0',M1')，可以找到很多collision，而且只需original initial value of MD5即可，这和之前被发现的pseudo-collision相比是个巨大的进步。（前提是要经过message modification technique）

3.按照该方案（原文Section 4.5），可以以极大的概率找到collision。在超级计算机上只需若干分钟。

该paper是个巨大的突破，但短期内仍然不可行：

0.对于很多的MD5破解问题，我们不需要知道原文（也无法得到原文），只需找到collision即可（比如攻破md5加密的数据库）。对于这类问题该paper是个巨大的突破，但是paper中message(M0,M1)是已知了的。
1.个人计算机性能达不到（IBM P690，1.3312 TFlop/s）
2.对于需要破解出原文的MD5问题，paper中的方法需要message modification，改变的原文可能已经无意义

【个人理解，仅供参考】
相关阅读:
一次硬盘安装debian的过程
 Java热替换
 Hibernate缓存
 Java消息机制
 Hibernate批量操作（一）
SQLite与SQL差异
 tablelayout:fixed 在一些情况下会导至width失效。
heiht三种浏览器的写法
 [WebMethod(EnableSession = true)]
10分钟学会基于ASP.NET的 JQuery实例 (转)
原文地址：https://www.cnblogs.com/pdev/p/5388996.html