• Java 正则表达式 Pattern & Matcher


      通常会有这种需求: 在文档中搜索有规律的字符串,然后进行统计或者替换。Java.util.regex包下的Pattern和Matcher这两个类提供了通过正则表达式来匹配查询,甚至替换的功能。那么我们接下来就举个栗子吧 : 

    栗子1:查找文件中以img_数字.png格式的字符串,并在前面添加路径: /test/img/ 

    package test;
    
    import java.io.File;
    import java.util.regex.Matcher;
    import java.util.regex.Pattern;
    import org.apache.commons.io.FileUtils;
    
    public class PatternTest {
    
    	private static final String CONSTSTRING = "<a><img src='img_01.png'/></a>";
    	public static void main(String[] args) throws Exception {
    		File file = new File("C:\Users\Admin\Desktop\test.txt");
    		FileUtils.writeStringToFile(file, CONSTSTRING);
    		String str = FileUtils.readFileToString(file, "UTF-8");
    		StringBuffer stringBuffer = new StringBuffer();
    		//设置Pattern的正则表达式
    		Pattern p = Pattern.compile("img_[0-9]+\u002png");
    		//按规则匹配
    		Matcher m = p.matcher(str);
    		while(m.find()){
    			//将匹配到并替换后的字符串以及前面的字符串添加到StringBuffer中
    			m.appendReplacement(stringBuffer, "/test/img/"+m.group());
    			System.out.println(stringBuffer.toString());
    			System.out.println();
    		}
    		//将匹配到的字符串之后的字符串添加到StringBuffer中
    		m.appendTail(stringBuffer);
    		FileUtils.writeStringToFile(file, stringBuffer.toString(), "UTF-8");
    	}
    }
    

      其实这个问题有个简单方法,这里扩展一下 : 

    package test;
    
    import java.io.File;
    import java.util.regex.Matcher;
    import java.util.regex.Pattern;
    import org.apache.commons.io.FileUtils;
    
    public class PatternTest {
    
        private static final String CONSTSTRING = "<a><img src='img_01.png'/></a>";
        public static void main(String[] args) throws Exception {
            File file = new File("C:\Users\JD07201\Desktop\test.txt");
            FileUtils.writeStringToFile(file, CONSTSTRING);
            String str = FileUtils.readFileToString(file, "UTF-8");
            str = str.replace("img_", "/test/img/"+"img_");
            FileUtils.writeStringToFile(file, str, "UTF-8");
        }
    }
    

      这个方法的前提是匹配条件必须只能映射到目标字符串,在这里就是指匹配条件"img_"必须等价于 "img_[0-9]+\u002png",否则就有可能将不符合条件的字符串也给替换了。

      

  • 相关阅读:
    前端开发 Knockout
    一套基于Spring Boot+Vue+Shiro前后端分离的代码生成器
    七个开源的 Spring Boot 前后端分离项目
    Java老司机:把这些主流技术搞懂,拿20K没问题
    svn无法cleanup解决方案
    软件测试-1挡板测试
    电子琴
    myeclipse10激活注册码生成器代码
    LNK2005
    无法打开包含文件:"fstream.h"
  • 原文地址:https://www.cnblogs.com/djoel/p/5645846.html
Copyright © 2020-2023  润新知