python的hashlib模块

python的hashlib模块
一、hashlib基本使用

　　python中的hashlib模块用来进行hash或者md5加密，而且这种加密是不可逆的，所以这种算法又被称为摘要算法。其支持Openssl库提供的所有算法，包括md5、sha1、sha224、sha256、sha512等。

常用的属性和方法：

algorithms：列出所有加密算法（'md5','sha1','sha224','sha256','sha384','sha512'）

digesti_size：产生的散列的字节大小

md5()/sha1()：创建一个md5或者sha1加密模式的hash对象

update(arg)：用字符串参数来更新hash对象，如果同一个has对象重复调用该方法，如下：m.update(a); m.update(b)，则等于m.update(a+b)

digest()：返回摘要，作为二进制数据字符串值

hexdigest()：返回摘要，作为十六进制数据字符串值

copy()：复制

下面是一个简单的加密示例：
```
import hashlib

m = hashlib.md5()
m.update('how to use md5'.encode('utf-8'))
m.update('in python hashlib'.encode('utf-8'))
print m.hexdigest()
```
返回值如下：
```
9f97604918a2e86bfcc4aea5c35a4c8b
```
下面一个示例用于计算文件md5值：
```
#!/usr/bin/env python
#coding: utf-8

import hashlib
import sys

def main():
    if len(sys.argv) != 2:
        sys.exit('Usage: %s file' % sys.argv[0])

    filename = sys.argv[1]
    m = hashlib.md5()
    with open(filename, 'rb') as fp:
        while True:
            blk = fp.read(4096) # 每次读取4kb
            if not blk: break
            m.update(blk)
    print m.hexdigest(), filename

if __name__ == '__main__':
    main()
```
二、hashlib的应用场景

　　摘要算法通常应用于网站存储用户的帐号密码相关信息。默认情况下，我们插入到数据库的帐号密码都是以明文保存。这样的话，一旦数据库泄露，所有用户的口令都会直接泄露，而且明文保存，网站管理员也可以直接查看到用户口令，这样及不安全。所以我们可以在获取到用户输入的密码以后，直接对其进行加密处理。然后将加密的字符串存入数据库。这样当下次用户登录时，再对用户输入的密码进行加密处理，然后与数据库中存储的加密字串进行比对，如果匹配，则说明密码正确。

　　当然上述方法比明文存储密码确实要安全不少。但在有些场景中，用户通常会将密码设置的尤为简单。这样如果数据库泄露，黑客可以通过简单的密码尝试来完成对加密字串的匹配。为了解决这种方法，我们通常需要对密码做“加盐”处理。如下：
```
def get_md5(password):  
    m = hashlib.md5()
    m.update(password)
    return m.hexdigest()

def calc_md5(password):
    return get_md5(password + 'the-Salt')


db = {}

def register(username,password):
    db[username] = username
    db[password] = calc_md5(password)
```
这样，只要'the-Salt'部分不被泄露，就没办法反推用户的简单密码。

但是这样仍然有个问题，那就是多个用户的密码可能重复，这样，在数据库里就会出现相同的加密字串。我们知道通常而言，用户的用户名肯定不会相同。我们再假设用户的用户名不会改变。我们可以使用用户的用户名来做加盐处理，如下：
```
def clc_md5(username,password):
    return get_md5(passwd + username + 'the-Salt')
```
相关阅读:
将n个不同的球放到m个相同的袋子里有多少种方案？
堆
 平面分割直线2
差分
 并查集(UnionFind)
约瑟夫环公式
 Kruskal
线性欧拉筛
 SPAF
Dijkstra
原文地址：https://www.cnblogs.com/fmgao-technology/p/9085617.html