我们知道通过正则表达式可以实现对字符的匹配,正好项目中有个需要去掉图片url的域名部分,比如:http://xxx.yyy.cn/aa/bb.jpg,去掉后为aa/bb.jpg。这个用正则表达式可以轻松实现。
表达式如下:
^((http://)|(https://))?([a-zA-Z0-9]([a-zA-Z0-9-]{0,61}[a-zA-Z0-9])?.)+[a-zA-Z]{2,6}(/)
该表达式可以匹配以http://或者https://开头且支持域名中有中划线的情况,并且会匹配到域名后的第一个/.
也就是我们开题说的替换完的结果就是 aa/bb.jpg。
简要说明:
()中表示一个子表达式,
| 或关系,比如这里匹配http://或https://
? 表示匹配 0 次或一次。 也就是如果要匹配 xxx.yyy.cn/aa/bb.jpg 这个链接匹配的结果也是 aa/bb.jpg
{n,m}限定表达式,最少n次,最大m次。n<=m
java处理:
public static void main(String[] args) { String pattern = "^((http://)|(https://))?([a-zA-Z0-9]([a-zA-Z0-9\-]{0,61}[a-zA-Z0-9])?\.)+[a-zA-Z]{2,6}(/)"; Pattern p = Pattern.compile(pattern); String line = "https://xxx.yyy.cn/aa/bb.jpg"; Matcher m = p.matcher(line); if(m.find()){ //匹配结果 System.out.println("=" + m.group()); } //替换 System.out.println(line.replaceAll(pattern, "")); }
参考:http://www.cnblogs.com/LCX/archive/2008/07/16/1244481.html
http://www.runoob.com/regexp/regexp-syntax.html