首先要学会使用正则表达式
关于替换文本的最主要的功能就是 对正则表达式类的学习
学习正则表达式,推荐 下面这个网址(30分钟 学会正则表达式)
http://deerchao.net/tutorials/regex/regex.htm
在程序中引用 using System.Text.RegularExpressions;
在程序中使用 Regex.Replace 来完成文本替换工作
Regex 是正则表达式类。来源于上面那个引用
Regex.Replace(要替换的原始文本,正则表达式内容,替换后的内容,选项)
选项有 RegexOptions 来指定。
举个例子
using System.Text.RegularExpressions;
public static string ReplaceText(string text, string search, string replace)
{
return Regex.Replace(text, search, replace, RegexOptions.Singleline);
}
这是一个替换文本的函数
使用方法
using System.IO; //这里的 File 类是在这个空间里引用的。
string text = File.ReadAllText(filename, Encoding.GetEncoding("gb2312"));
text = ReplaceText(text, "<span.*?>", "");
将 以<span开始 以 > 结尾 中间有不限数量个任意字符(由于设定 RegexOptions.Singleline)所以,任意字符中也包括换行符回车符\n
具体的含义:请参考正则表达式教程。
File.WriteAllText(newfilename, text, Encoding.GetEncoding("gb2312"));