数据采集器,其实很简单,没有想像的那么复杂。
1使用HttpWebRequest或者WebClient获取数据
2 使用正则表达式获取你想要的数据
现在将相关代码贴出来
public static string GetHtml(string begin, string end, string content)
{
Regex reg = new Regex(begin + "((.*?\\n?)*?)" + end);
Match match = reg.Match(content);
if (match != Match.Empty)
{
//content = content.Replace(match.Groups[1].ToString(), string.Empty);
return match.Groups[1].ToString();
}
else
{
return string.Empty;
}
}
public static StringCollection GetHtmls(string begin, string end, string content)
{
Regex reg = new Regex(begin + "((.*?\\n?)*?)" + end);
MatchCollection matches = reg.Matches(content);
StringCollection list=new StringCollection();
foreach(Match match in matches)
{
if (match != Match.Empty)
{
list.Add(match.Value);
}
}
return list;
}