runxinzhi.com
首页
百度搜索
正则-匹配超链接地址及内容
今天做文章抓取程序的完善开发,碰到了以下问题
“<a href=aaa.html>A页</a><a href=bbb.html>B页</b>” 利用正则从中分别取出 aaa.html ,A页 ,bbb.html,B页。
自己写了俩正则 算是都能实现,但是是先匹配出所有的href对应的Html,再匹配出类似"A页"标题这段。 但是感觉很麻烦,从网上一搜,果然看到有位大侠写的正则很简炼,贴出记下,膜拜之
Code
1
MatchCollection mc
=
Regex.Matches(htmlstring,
@"
<a\s+href=(?<url>.+?)>(?<content>.+?)</a>
"
);
2
foreach
(Match m
in
mc)
3
{
4
url
=
m.Groups[
"
url
"
].Value;
5
6
content
=
m.Groups[
"
content
"
].Value;
7
}
其中htmlstring 为输入代码
相关阅读:
排序算法分析
图论算法小结
A*算法
分支界限法的应用
图的搜索策略
最大二分匹配
C++学习笔记(1)
vscode简单c语言多文件编译
c语言变量大小
十大排序算法总结
原文地址:https://www.cnblogs.com/wfwup/p/1336133.html
最新文章
Day 80 量化投资与Python——项目案例
Day 79 量化投资与Python——Matplotlib
Day 78 量化投资与Python——Pandas
Day 77 量化投资与Python——NumPy
Day 76 CRM业务——stark组件
Day 75 CRM业务——rbac组件
Day 74 算法进阶
Day 75 数据结构
Python大数据分析之网络爬虫
sql server2008R2自动备份和自动删除过期bak文件
热门文章
存储过程的简单应用
触发器的简单应用
带你了解SQL Server的性能优化工具Profiler
SQL如何求解连续性的问题
使用exec和sp_executesql动态执行SQL语句
SQL Server中CROSS APPLY和OUTER APPLY的应用详解
数据库SQL优化大总结之 百万级数据库优化方案
数据库管理工具DataGrip使用总结
数据库设计及三大范式
字符串匹配算法
Copyright © 2020-2023
润新知