一、hashlib基本使用
python中的hashlib模块用来进行hash或者md5加密,而且这种加密是不可逆的,所以这种算法又被称为摘要算法。其支持Openssl库提供的所有算法,包括md5、sha1、sha224、sha256、sha512等。
常用的属性和方法:
algorithms:列出所有加密算法('md5','sha1','sha224','sha256','sha384','sha512')
digesti_size:产生的散列的字节大小
md5()/sha1():创建一个md5或者sha1加密模式的hash对象
update(arg):用字符串参数来更新hash对象,如果同一个has对象重复调用该方法,如下:m.update(a); m.update(b),则等于m.update(a+b)
digest():返回摘要,作为二进制数据字符串值
hexdigest():返回摘要,作为十六进制数据字符串值
copy():复制
下面是一个简单的加密示例:
import hashlib
m = hashlib.md5()
m.update('how to use md5'.encode('utf-8'))
m.update('in python hashlib'.encode('utf-8'))
print m.hexdigest()
返回值如下:
9f97604918a2e86bfcc4aea5c35a4c8b
下面一个示例用于计算文件md5值:
#!/usr/bin/env python
#coding: utf-8
import hashlib
import sys
def main():
if len(sys.argv) != 2:
sys.exit('Usage: %s file' % sys.argv[0])
filename = sys.argv[1]
m = hashlib.md5()
with open(filename, 'rb') as fp:
while True:
blk = fp.read(4096) # 每次读取4kb
if not blk: break
m.update(blk)
print m.hexdigest(), filename
if __name__ == '__main__':
main()
二、hashlib的应用场景
摘要算法通常应用于网站存储用户的帐号密码相关信息。默认情况下,我们插入到数据库的帐号密码都是以明文保存。这样的话,一旦数据库泄露,所有用户的口令都会直接泄露,而且明文保存,网站管理员也可以直接查看到用户口令,这样及不安全。所以我们可以在获取到用户输入的密码以后,直接对其进行加密处理。然后将加密的字符串存入数据库。这样当下次用户登录时,再对用户输入的密码进行加密处理,然后与数据库中存储的加密字串进行比对,如果匹配,则说明密码正确。
当然上述方法比明文存储密码确实要安全不少。但在有些场景中,用户通常会将密码设置的尤为简单。这样如果数据库泄露,黑客可以通过简单的密码尝试来完成对加密字串的匹配。为了解决这种方法,我们通常需要对密码做“加盐”处理。如下:
def get_md5(password):
m = hashlib.md5()
m.update(password)
return m.hexdigest()
def calc_md5(password):
return get_md5(password + 'the-Salt')
db = {}
def register(username,password):
db[username] = username
db[password] = calc_md5(password)
这样,只要'the-Salt'部分不被泄露,就没办法反推用户的简单密码。
但是这样仍然有个问题,那就是多个用户的密码可能重复,这样,在数据库里就会出现相同的加密字串。我们知道通常而言,用户的用户名肯定不会相同。我们再假设用户的用户名不会改变。我们可以使用用户的用户名来做加盐处理,如下:
def clc_md5(username,password):
return get_md5(passwd + username + 'the-Salt')