什么叫短链或短址?
就是把长的 URL 转成短的 URL, 现在提供这种服务的有很多公司,我们以google家的 URL shortener 服务: http://goo.gl/ 为例。 任何长网址都会转换成6位由大小写字母和数字组合而成的短址,例如:http://goo.gl/QfuI3i 。长网址和短址都会存在google服务器,当我们请求http://goo.gl/QfuI3i这个短址,google服务器就会根据QfuI3i这个参数找到并跳转到对应长网址。
新浪微博为什么使用短链?
- 无论多长的微博,都能够转成固定长短的短链,防止某些连接太长影响用户输入其他内容;
- 所有短链在算法上无法直接解链,必须经过新浪的服务器,把链接系统控制到自己的手上。这对网络内容审察来说作用极其大,如果有人发的微博包含敏感内容,新浪就不予中转;
- 重新组织链接网页的内容,方便用户在手机端查看;
- 由于长链中可能会包含#或者@这些特殊字符,给客户端的字符串处理带来压力,编码可以消除这些特殊符号;
- 由于所有链接都要经新浪的服务器,因此服务器保存有所有的链接,方便进行数据挖掘和统计分析。
Java实现
1 package com.wanda.restful.framework.test.shorturl; 2 3 import java.security.MessageDigest; 4 5 /** 6 * @version v1.0.0 7 * @author: wangyang 8 * Date: 2016-9-8 Time: 15:32 9 */ 10 public class Encript { 11 //十六进制下数字到字符的映射数组 12 private final static String[] hexDigits = {"0","1","2","3","4","5","6","7","8","9","A","B","C","D","E","F"}; 13 14 /**把inputString加密*/ 15 public static String md5(String inputStr){ 16 return encodeByMD5(inputStr); 17 } 18 19 /** 20 * 验证输入的密码是否正确 21 * @param password 真正的密码(加密后的真密码) 22 * @param inputString 输入的字符串 23 * @return 验证结果,boolean类型 24 */ 25 public static boolean authenticatePassword(String password,String inputString){ 26 if(password.equals(encodeByMD5(inputString))){ 27 return true; 28 }else{ 29 return false; 30 } 31 } 32 33 /**对字符串进行MD5编码*/ 34 private static String encodeByMD5(String originString){ 35 if (originString!=null) { 36 try { 37 //创建具有指定算法名称的信息摘要 38 MessageDigest md5 = MessageDigest.getInstance("MD5"); 39 //使用指定的字节数组对摘要进行最后更新,然后完成摘要计算 40 byte[] results = md5.digest(originString.getBytes()); 41 //将得到的字节数组变成字符串返回 42 String result = byteArrayToHexString(results); 43 return result; 44 } catch (Exception e) { 45 e.printStackTrace(); 46 } 47 } 48 return null; 49 } 50 51 /** 52 * 轮换字节数组为十六进制字符串 53 * @param b 字节数组 54 * @return 十六进制字符串 55 * 56 */ 57 private static String byteArrayToHexString(byte[] b){ 58 StringBuffer resultSb = new StringBuffer(); 59 for(int i=0;i<b.length;i++){ 60 resultSb.append(byteToHexString(b[i])); 61 } 62 return resultSb.toString(); 63 } 64 65 //将一个字节转化成十六进制形式的字符串 66 private static String byteToHexString(byte b){ 67 int n = b; 68 if(n<0) 69 n=256+n; 70 int d1 = n/16; 71 int d2 = n%16; 72 return hexDigits[d1] + hexDigits[d2]; 73 } 74 }
1 package com.wanda.restful.framework.test.shorturl; 2 3 /** 4 * Generator ShortUrl 5 * 数据库中需要保存长链与短链之间的关系,通过访问短链跳转到长链接 6 * 7 * @version v1.0.0 8 * @author: wangyang 9 * Date: 2016-9-8 Time: 15:42 10 */ 11 public class ShortUrlGenerator { 12 public static void main(String[] args) { 13 String sLongUrl = "http://www.baidu.com"; 14 for (String shortUrl : shortUrl(sLongUrl)) { 15 System.out.println(shortUrl); 16 } 17 } 18 19 public static String[] shortUrl(String url) { 20 // 可以自定义生成 MD5 加密字符传前的混合 KEY 21 String key = "wangyang"; 22 // 要使用生成 URL 的字符 23 String[] chars = new String[]{"a", "b", "c", "d", "e", "f", "g", "h", 24 "i", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s", "t", 25 "u", "v", "w", "x", "y", "z", "0", "1", "2", "3", "4", "5", 26 "6", "7", "8", "9", "A", "B", "C", "D", "E", "F", "G", "H", 27 "I", "J", "K", "L", "M", "N", "O", "P", "Q", "R", "S", "T", 28 "U", "V", "W", "X", "Y", "Z" 29 }; 30 // 对传入网址进行 MD5 加密 31 String sMD5EncryptResult = (Encript.md5(key + url)); 32 String hex = sMD5EncryptResult; 33 String[] resUrl = new String[4]; 34 //得到 4组短链接字符串 35 for (int i = 0; i < 4; i++) { 36 // 把加密字符按照 8 位一组 16 进制与 0x3FFFFFFF 进行位与运算 37 String sTempSubString = hex.substring(i * 8, i * 8 + 8); 38 // 这里需要使用 long 型来转换,因为 Inteper .parseInt() 只能处理 31 位 , 首位为符号位 , 如果不用 long ,则会越界 39 long lHexLong = 0x3FFFFFFF & Long.parseLong(sTempSubString, 16); 40 String outChars = ""; 41 //循环获得每组6位的字符串 42 for (int j = 0; j < 6; j++) { 43 // 把得到的值与 0x0000003D 进行位与运算,取得字符数组 chars 索引(具体需要看chars数组的长度 以防下标溢出,注意起点为0) 44 long index = 0x0000003D & lHexLong; 45 // 把取得的字符相加 46 outChars += chars[(int) index]; 47 // 每次循环按位右移 5 位 48 lHexLong = lHexLong >> 5; 49 } 50 // 把字符串存入对应索引的输出数组 51 resUrl[i] = outChars; 52 } 53 return resUrl; 54 } 55 }