摘要算法又称哈希算法,它表示输入任意长度的数据,输出固定长度的数据,相同的输入数据始终得到相同的输出,不同的输入数据尽量得到不同的输出。
Java中的Object.hashCode()
方法就是一个摘要算法,它可以输入任意数据,它的输出是一个int类型,即4个字节的固定长度数据,同时,相同的输入会得到相同的输出,这也是重写equals方法必须重写hashCode方法的原因。
由于输出的长度是固定且输出的长度是不固定的,意味着两个不同的输入可能得到相同的输出,这就是碰撞问题。这就要求在设计Hash算法时,尽量使得碰撞率低,而且不能猜测输出,例如:hash("java1")="123456",hash("java2")="123457",那么我们就可以猜测出hash("java3")="123458",也就是说一个安全的hash算法很难从输出反推输入,只能依靠暴力穷举。
目前常用的摘要算法:
算法 | 输出长度 |
---|---|
MD5 | 128bit |
SHA-1 | 160bit |
SHA-256 | 256bit |
MD5
MD5的用途
- 验证文件完整性
- 存储用户口令
系统不用存储用户原始口令,而是存储用户原始口令的MD5,系统计算用户输入的原始口令的MD5并与数据存储的MD5进行对比,如果相同,则说明口令正确,反之则说明口令错误。在使用MD5时我们需要注意彩虹表攻击,彩虹表就是预先存储常用口令和对应MD5值,那么黑客就可以根据彩虹表反查MD5对应的密码,所以为了抵御彩虹表攻击我们不能简单的记录原始口令的MD5值,而是对每个口令额外添加随机数salt,即md5(salt+password)。Java代码如下:
// MD5的输入是字节数组
public static byte[] toMD5(byte[] input) {
MessageDigest md = null;
try {
md = MessageDigest.getInstance("MD5");
} catch (NoSuchAlgorithmException e) {
e.printStackTrace();
}
md.update(input);
return md.digest();
}
public static void main(String[] args) throws UnsupportedEncodingException {
String str = "MD5摘要算法测试";
byte[] r = toMD5(str.getBytes());
// %x表示返回的是16进制,而32表示16个字节
System.out.println(String.format("%32x", new BigInteger(1, r)));
String salt = "random";
byte[] digest = toMD5((str + salt).getBytes("UTF-8"));
System.out.println(String.format("%32x", new BigInteger(1, digest)));
}
SHA-1
SHA-1算法也是一种哈希算法,输出160bit,它的同类型算法有SHA-256和SHA-512,输出的长度分别是256bit和512bit。SHA-1在Java中使用同MD5类似:
public static byte[] sha(byte[] input) {
MessageDigest md = null;
try {
md = MessageDigest.getInstance("SHA-1");
} catch (NoSuchAlgorithmException e) {
e.printStackTrace();
}
md.update(input);
return md.digest();
}
public static void main(String[] args) throws UnsupportedEncodingException {
String str = "SHA-1摘要算法测试";
byte[] r = sha(str.getBytes());
System.out.println(String.format("%040x", new BigInteger(1, r)));
}
欢迎关注微信公众号:木可大大,所有文章都将同步在公众号上。