php获取页面所有链接的正则表达式

$pattern = '/<a(?:.*?)href="(((?:http(?:s?):\/\/)?([^\"\/]+))?(?:[^\"]*))"(?:[^>]*?)>([^<]*?)<\/a>/i';
preg_match_all($pattern, $data, $links);
$links[0]是所有<a>标签。
$links[1]是所有href。
$links[2]是所有带http(s)://链接。
$links[3]是所有域名，如:www.cnblogs.com。
$links[4]是所有a标签内容。
直接获取<a>标签：$pattern = '/<a.*?<\/a>/i';
仅获取href数据：$pattern = '/<a(?:.*?)href=[\'"]([^\"\']*)[\'"][^<]*?<\/a>/i';        //仅href

单双引号，href前换行，href后等号前后夹杂空格，a标签内嵌标签等一堆情况解决方案：
$pattern = '/<a(?:[\s\S]*?)href\s*?=\s*?[\'"](((?:http(?:s?):\/\/)?([^\"\'\/]+))?(?:[^\"\']*))[\'"](?:[^>]*?)>([\s\S]*?)<\/a>/i';

演示网址：phpParseLinks

修改：上面pattern中新增?，红色标记。修复无http://与域名情况。

相关阅读:
《仔仔细细分析Ext》第N2章 GridPanel的小难点第一节每条数据后面跟随几个操作按钮
TextField输入验证
Ext.FormPanel 及控件横排显示
备份
重写
this关键字
TestCircle程序分析
java方法重载
static关键字
super关键字

原文地址：https://www.cnblogs.com/Zjmainstay/p/php_get_links.html