在andrewcx的日志中有相应的教程,但是可能因为豆瓣页面改版了现在已经不能抓取,我把其中的代码重新写了一遍,如果有firefox请先进入红心页面(确保已经登录不然也进不去)请打开Web开发工具中的暂存器然后黏贴代码进去执行就可以了,结果会在copyright的地方显示。格式为“歌曲名-作者-专辑” 代码: var tpage = 6; var page = 1; var n = 0; var songNum=0; $("div.copyright").html(""); for(page=1;page<=tpage;page++) { n = (page - 1) * 9; var url = "http://douban.fm/mine?start=" + n + "&type=liked"; $.ajax({ type:"GET" ,url:url ,async:false ,dataType:"html" , success:function(html){ songNum+=$(html).find("div.song_info").length; $(html).find("div.song_info").each(function(s) { var d = ""; d=$(this).find("p.song_title").first().text()+"-"+ $(this).find("p.performer").first().text()+"-"+ $(this).find("p.source>a").first().text()+"<br>"; $("div.copyright").html($("div.copyright").html()+d); }); $("div.copyright").html($("div.copyright").html()+"此页面收集到歌曲:"+$(html).find("div.song_info").length+"<br/><br/>"); } }); }
抓取结果