// 去除富文本中的html标签 // <p>段落替换为换行 content = content.replaceAll("<p .*?>", " "); // <br><br/>替换为换行 content = content.replaceAll("<br\s*/?>", " "); // 去掉其它的<>之间的东西 content = content.replaceAll("\<.*?>", ""); // 处理特殊字符导致的json格式不正确 content = Pattern.compile("\s*| | | ").matcher(content).replaceAll(""); // %在URL中是特殊字符,需要特殊转义一下,解决办法:使用%25替换字符串中的%号 content = content .replaceAll("%(?![0-9a-fA-F]{2})", "%25");