• python的hashlib模块


    一、hashlib基本使用

      python中的hashlib模块用来进行hash或者md5加密,而且这种加密是不可逆的,所以这种算法又被称为摘要算法。其支持Openssl库提供的所有算法,包括md5、sha1、sha224、sha256、sha512等。

    常用的属性和方法:

    algorithms:列出所有加密算法('md5','sha1','sha224','sha256','sha384','sha512')

    digesti_size:产生的散列的字节大小

    md5()/sha1():创建一个md5或者sha1加密模式的hash对象

    update(arg):用字符串参数来更新hash对象,如果同一个has对象重复调用该方法,如下:m.update(a); m.update(b),则等于m.update(a+b)

    digest():返回摘要,作为二进制数据字符串值

    hexdigest():返回摘要,作为十六进制数据字符串值

    copy():复制

    下面是一个简单的加密示例:

    import hashlib
    
    m = hashlib.md5()
    m.update('how to use md5'.encode('utf-8'))
    m.update('in python hashlib'.encode('utf-8'))
    print m.hexdigest()

    返回值如下:

    9f97604918a2e86bfcc4aea5c35a4c8b

    下面一个示例用于计算文件md5值:

    复制代码
    #!/usr/bin/env python
    #coding: utf-8
    
    import hashlib
    import sys
    
    def main():
        if len(sys.argv) != 2:
            sys.exit('Usage: %s file' % sys.argv[0])
    
        filename = sys.argv[1]
        m = hashlib.md5()
        with open(filename, 'rb') as fp:
            while True:
                blk = fp.read(4096) # 每次读取4kb
                if not blk: break
                m.update(blk)
        print m.hexdigest(), filename
    
    if __name__ == '__main__':
        main()
    复制代码

    二、hashlib的应用场景

      摘要算法通常应用于网站存储用户的帐号密码相关信息。默认情况下,我们插入到数据库的帐号密码都是以明文保存。这样的话,一旦数据库泄露,所有用户的口令都会直接泄露,而且明文保存,网站管理员也可以直接查看到用户口令,这样及不安全。所以我们可以在获取到用户输入的密码以后,直接对其进行加密处理。然后将加密的字符串存入数据库。这样当下次用户登录时,再对用户输入的密码进行加密处理,然后与数据库中存储的加密字串进行比对,如果匹配,则说明密码正确。

      当然上述方法比明文存储密码确实要安全不少。但在有些场景中,用户通常会将密码设置的尤为简单。这样如果数据库泄露,黑客可以通过简单的密码尝试来完成对加密字串的匹配。为了解决这种方法,我们通常需要对密码做“加盐”处理。如下:

    复制代码
    def get_md5(password):  
        m = hashlib.md5()
        m.update(password)
        return m.hexdigest()
    
    def calc_md5(password):
        return get_md5(password + 'the-Salt')
    
    
    db = {}
    
    def register(username,password):
        db[username] = username
        db[password] = calc_md5(password)
    复制代码

    这样,只要'the-Salt'部分不被泄露,就没办法反推用户的简单密码。

    但是这样仍然有个问题,那就是多个用户的密码可能重复,这样,在数据库里就会出现相同的加密字串。我们知道通常而言,用户的用户名肯定不会相同。我们再假设用户的用户名不会改变。我们可以使用用户的用户名来做加盐处理,如下:

    def clc_md5(username,password):
        return get_md5(passwd + username + 'the-Salt')
  • 相关阅读:
    将n个不同的球放到m个相同的袋子里有多少种方案?

    平面分割直线2
    差分
    并查集(UnionFind)
    约瑟夫环公式
    Kruskal
    线性欧拉筛
    SPAF
    Dijkstra
  • 原文地址:https://www.cnblogs.com/fmgao-technology/p/9085617.html
Copyright © 2020-2023  润新知