PHP中Snoopy类的使用

最近看PHP书籍，发现了一个好东东，就是Snoopy类。Snoopy是一个php类库，用来模拟浏览器的功能，可以获取网页内容，发送表单。

Snoopy的一些特点:

1抓取网页的内容 fetch
2 抓取网页的文本内容 (去除HTML标签) fetchtext
3抓取网页的链接，表单 fetchlinks fetchform
4 支持代理主机
5支持基本的用户名/密码验证
6 支持设置 user_agent, referer(来路), cookies 和 header content(头文件)
7支持浏览器重定向，并能控制重定向深度
8能把网页中的链接扩展成高质量的url(默认)
9提交数据并且获取返回值
10 支持跟踪HTML框架
11支持重定向的时候传递cookies
要求php4以上就可以了由于本身是php一个类无需扩支持服务器不支持curl时候的最好选择，

使用方法：

1、先下载Snoopy类，下载地址：http://sourceforge.net/projects/snoopy/

2、先实例化一个对象，然后调用相应的方法即可获取抓取的网页信息

一，取得HTML内容

例子如下：

<?php
include "../Snoopy/Snoopy.class.php";
$snoopy = new Snoopy;
$snoopy->fetch("http://www.baidu.com");
$line = $snoopy->results;
print_r($line);
?>

得到的结果如下所示：

二，取得纯文本内容

<?php
include "../snoopy/snoopy.class.php";
$snoopy = new Snoopy;
$snoopy->fetchtext("http://baidu.com");
$line = $snoopy->results;
print_r($line);
?>

结果如下：

3，取得表单字段内容

程序如下：

<?php

include "../snoopy/snoopy.class.php";
$snoopy = new Snoopy;
@$snoopy->fetchform("http://baidu.com");
print $snoopy->results;

?>

结果如下：

相关阅读:
如何从零开始创建一个IT信息系统
Linux常用命令
vue.js 3.2.20: 用rem实现移动端和pc的兼容
vue.js3.2.6:路由处理404报错(vue-router@4.0.11)
vue.js项目在nginx上部署:使spring后端记录真实ip地址
vue.js 3.0.5:用vue-i18n开发i18n国际化功能(vue-i18n@9.2.0)
前台项目基础框架之spring boot后端(spring boot v2.5.4)
前台项目基础框架之vue前端(vue@3.2.6)
intellij idea 2021.2:为一个spring boot项目改名
git:修改项目的remote地址(git version 2.30.2)

原文地址：https://www.cnblogs.com/cmderq/p/9130922.html