1、思路:用正则表达式匹配,使用反向引用,替换。查找(.+?)1 替换为 $1
(.+)1 为什么不好?因为量词优先,+会尽可能地吃,然后又要一个一个吐出来,效率太差,使用(.+?)1 取消量词优先,尽量少吃。
(.*?)1 为什么不好,因为.* 可以匹配没有字符的情况,.+ 要求至少有一个字符,既然是删除相邻重复的内容,当然要求至少有一个字符。
2、删除相邻重复的行,可以转化为删除相邻重复的内容。只不过中间有一个换行符,如下:查找(.+?)(
)1 替换为 $1。
注意:这里千万不能使用(.*?)(
)1,会导致没有了换行符,为什么?
因为 (.*?)能匹配空,紧接着换行,反向引用空,替换为空,导致换行符没有了。
3、注意:上面只是删除相邻两个重复的内容,对于多个连续重复的内容,比如:aaaa,怎么办?
查找 (.+?)(1)+ 替换为 $1,注意这里不能使用(.+)(1)+,不是效率的问题,而是.+ 会多吃,导致.+ 匹配aa,最后结果为aa。
对于多个连续重复的行,查找 (.+?)( 1)+ 替换为 $1