这个zencart图片采集器是我在业余时间写的,测试网站是 http://www.fashioneasylife.com/,目前采集器已经成功了目标网站列表页的图片,产品页的图片也是可以采集的,只是我是在 测试的时候,一直没换代理,频繁地做测试,被目标网站发现后,把我的ip给封了,所以产品页的采集应该还会有些地方要小改一下。等有时间,发布 zencart采集器的2.0版本就会彻底的做一次修改。
先上代码包的下载链接地址:
下载地址>>
文件说明:共四个文件
1.multi.php,这个是公共函数文件,里面有四个函数,都有非常详细的注解,这个文件不需要做改动。
multi_get_url(),这个是用来多线程抓取页面的。
crawurls(),抓取列表分页的urls。
rexg(),正则匹配函数。
valid(),这个是用来验证图片资源是否响应有效。
2.retrive.php,这个是使用文件,需要根据目标url填入相应的参数。
这个文件有几个重要的参数需要说明一下:
$mission , 这个变量可以有两个字符串参数选择:"ls_contents_url" 采集产品内容页的内容, "ls_img"采集产品列表页的内容。
$url, 填入你采集的目标网站域名:$url= "http://www.fashioneasylife.com/nike-air-jordan-mens-c-104.html"。
$urls,在函数中填入你想要采集的页数:$urls = crawurls($url,$param,10);
$domain,填入你的目标网站域名:$domain = "http://www.fashioneasylife.com/";
$param ,网页的动态参数,比如有个网址的分页参数是 'page',你就可以写成:$param = 'page';
3.ls.php,这个是用来放入列表页图片采集函数的,需要对正则部分做修改。
getimgs(),这个函数用来获取指定URL的所有图片,需要根据网站修改的参数有$preg
4.grab.php,这个是用来抓取zencart详细产品页面图片的,需要修改的参数仍是正则式
geturls(),这个函数用来抓取列表页内容页面的url,也就是产品详细内容页面的url。
get_product_content(),这个函数用来抓取单个内容页面的图片,(注意:这个函数可能有错误,需要在细节部分做些改动,敬请期待 2.0版本zencart采集器),需要修改$preg参数。
写在最后的话:如果大家有什么好的建议,可以发邮件给我。错误地方还请不吝赐教。本采集器将会不断完善,有需要的读者朋友们可以回到电商沙龙首页,点击头部导航栏下面的按钮,订阅本站。
原创文章,转载请注明: 转载自电商沙龙ec-shalom.com,专研电商艺术。
本文链接地址: 免费zencart网站图片采集器下载-版本1.0