最近有朋友想要采集优酷的视频标题和缩略图 (哈哈, 并非商业目的). 找到我帮忙, 考虑到有我刚刚发布的SpiderStudio, 我毫不犹豫的答应了.
首先在网页上视频的基本结构为:
div.v - div.v-meta-title //标题 - div.v-thumb / img //缩略图
对应的JQuery表达式为:
$("div.v").find("div.v-meta-title"); $("div.v").find("div.v-thumb img");
然后运行SpiderStudio, 编写相关脚本:
public void Run() { Logger.ClearAll(); var vList = Default.SelectNodes("div.v"); foreach(var v in vList) { Logger.Log(v.SelectSingleNode("div.v-meta-title").Text()); Logger.Log(v.SelectSingleNode("div.v-thumb img").Attr("src")); } }
运行, 得到结果:
这里有我几篇文章介绍如何在C#脚本中运用JQuery, 供大家参考: