• 短链(ShortURL)的Java实现


    什么叫短链或短址?

    就是把长的 URL 转成短的 URL, 现在提供这种服务的有很多公司,我们以google家的 URL shortener 服务: http://goo.gl/ 为例。 任何长网址都会转换成6位由大小写字母和数字组合而成的短址,例如:http://goo.gl/QfuI3i 。长网址和短址都会存在google服务器,当我们请求http://goo.gl/QfuI3i这个短址,google服务器就会根据QfuI3i这个参数找到并跳转到对应长网址。

    新浪微博为什么使用短链?

    1. 无论多长的微博,都能够转成固定长短的短链,防止某些连接太长影响用户输入其他内容;
    2. 所有短链在算法上无法直接解链,必须经过新浪的服务器,把链接系统控制到自己的手上。这对网络内容审察来说作用极其大,如果有人发的微博包含敏感内容,新浪就不予中转;
    3. 重新组织链接网页的内容,方便用户在手机端查看;
    4. 由于长链中可能会包含#或者@这些特殊字符,给客户端的字符串处理带来压力,编码可以消除这些特殊符号;
    5. 由于所有链接都要经新浪的服务器,因此服务器保存有所有的链接,方便进行数据挖掘和统计分析。

    Java实现

     1 package com.wanda.restful.framework.test.shorturl;
     2 
     3 import java.security.MessageDigest;
     4 
     5 /**
     6  * @version v1.0.0
     7  * @author: wangyang
     8  * Date: 2016-9-8 Time: 15:32
     9  */
    10 public class Encript {
    11     //十六进制下数字到字符的映射数组
    12     private final static String[] hexDigits = {"0","1","2","3","4","5","6","7","8","9","A","B","C","D","E","F"};
    13 
    14     /**把inputString加密*/
    15     public static String md5(String inputStr){
    16         return encodeByMD5(inputStr);
    17     }
    18 
    19     /**
    20      * 验证输入的密码是否正确
    21      * @param password 真正的密码(加密后的真密码)
    22      * @param inputString 输入的字符串
    23      * @return 验证结果,boolean类型
    24      */
    25     public static boolean authenticatePassword(String password,String inputString){
    26         if(password.equals(encodeByMD5(inputString))){
    27             return true;
    28         }else{
    29             return false;
    30         }
    31     }
    32 
    33     /**对字符串进行MD5编码*/
    34     private static String encodeByMD5(String originString){
    35         if (originString!=null) {
    36             try {
    37                 //创建具有指定算法名称的信息摘要
    38                 MessageDigest md5 = MessageDigest.getInstance("MD5");
    39                 //使用指定的字节数组对摘要进行最后更新,然后完成摘要计算
    40                 byte[] results = md5.digest(originString.getBytes());
    41                 //将得到的字节数组变成字符串返回
    42                 String result = byteArrayToHexString(results);
    43                 return result;
    44             } catch (Exception e) {
    45                 e.printStackTrace();
    46             }
    47         }
    48         return null;
    49     }
    50 
    51     /**
    52      * 轮换字节数组为十六进制字符串
    53      * @param b 字节数组
    54      * @return 十六进制字符串
    55      *
    56      */
    57     private static String byteArrayToHexString(byte[] b){
    58         StringBuffer resultSb = new StringBuffer();
    59         for(int i=0;i<b.length;i++){
    60             resultSb.append(byteToHexString(b[i]));
    61         }
    62         return resultSb.toString();
    63     }
    64 
    65     //将一个字节转化成十六进制形式的字符串
    66     private static String byteToHexString(byte b){
    67         int n = b;
    68         if(n<0)
    69             n=256+n;
    70         int d1 = n/16;
    71         int d2 = n%16;
    72         return hexDigits[d1] + hexDigits[d2];
    73     }
    74 }
     1 package com.wanda.restful.framework.test.shorturl;
     2 
     3 /**
     4  * Generator ShortUrl
     5  * 数据库中需要保存长链与短链之间的关系,通过访问短链跳转到长链接
     6  *
     7  * @version v1.0.0
     8  * @author: wangyang
     9  * Date: 2016-9-8 Time: 15:42
    10  */
    11 public class ShortUrlGenerator {
    12     public static void main(String[] args) {
    13         String sLongUrl = "http://www.baidu.com";
    14         for (String shortUrl : shortUrl(sLongUrl)) {
    15             System.out.println(shortUrl);
    16         }
    17     }
    18 
    19     public static String[] shortUrl(String url) {
    20         // 可以自定义生成 MD5 加密字符传前的混合 KEY
    21         String key = "wangyang";
    22         // 要使用生成 URL 的字符
    23         String[] chars = new String[]{"a", "b", "c", "d", "e", "f", "g", "h",
    24                 "i", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s", "t",
    25                 "u", "v", "w", "x", "y", "z", "0", "1", "2", "3", "4", "5",
    26                 "6", "7", "8", "9", "A", "B", "C", "D", "E", "F", "G", "H",
    27                 "I", "J", "K", "L", "M", "N", "O", "P", "Q", "R", "S", "T",
    28                 "U", "V", "W", "X", "Y", "Z"
    29         };
    30         // 对传入网址进行 MD5 加密
    31         String sMD5EncryptResult = (Encript.md5(key + url));
    32         String hex = sMD5EncryptResult;
    33         String[] resUrl = new String[4];
    34         //得到 4组短链接字符串
    35         for (int i = 0; i < 4; i++) {
    36             // 把加密字符按照 8 位一组 16 进制与 0x3FFFFFFF 进行位与运算
    37             String sTempSubString = hex.substring(i * 8, i * 8 + 8);
    38             // 这里需要使用 long 型来转换,因为 Inteper .parseInt() 只能处理 31 位 , 首位为符号位 , 如果不用 long ,则会越界
    39             long lHexLong = 0x3FFFFFFF & Long.parseLong(sTempSubString, 16);
    40             String outChars = "";
    41             //循环获得每组6位的字符串
    42             for (int j = 0; j < 6; j++) {
    43                 // 把得到的值与 0x0000003D 进行位与运算,取得字符数组 chars 索引(具体需要看chars数组的长度   以防下标溢出,注意起点为0)
    44                 long index = 0x0000003D & lHexLong;
    45                 // 把取得的字符相加
    46                 outChars += chars[(int) index];
    47                 // 每次循环按位右移 5 位
    48                 lHexLong = lHexLong >> 5;
    49             }
    50             // 把字符串存入对应索引的输出数组
    51             resUrl[i] = outChars;
    52         }
    53         return resUrl;
    54     }
    55 }

    参考资料

  • 相关阅读:
    TCP Socket服务器编程[转文]
    http协议学习和总结系列[转 ]
    linux C函数大全
    HTTP 协议详解
    Pthread 多线程总结
    linux 中解析命令行参数 (getopt_long用法)
    微软企业库4.1学习笔记(十八)缓存模块6 缓存的设计目的
    微软企业库4.1学习笔记(十七)缓存模块5 缓存的典型用法
    进程和线程的区别
    C#二叉树遍历算法实现浅析
  • 原文地址:https://www.cnblogs.com/wangyangliuping/p/5855360.html
Copyright © 2020-2023  润新知