用正则表达式做替换

import re

#将<script>……</script>删掉
f=open(os.path.join(cur_path,'growth.html'),'r')
text = f.read()

script=re.compile("<script>.*?</script>",re.M)   #re.M多行匹配
b=script.sub('',text)

对于这样的文本，要取到￥168这个值：　

money = re.findall(ur"<td class="total">(.*?)</td>", text)
print money[0]     #返回<span class="money">¥</span>168
#删掉<span class="money"></span>标签
m = re.sub("(<span class="money">|</span>)", "", money[0])
print m   #返回￥168

注意：sub返回的不是list，而是字符串

相关阅读:
【题解】P3796【模板】AC自动机（加强版）
【模板】P3806点分治1
【题解】P2602[JZOI2010]数字计数
【题解】P2444 病毒
【题解】[P3557 POI2013]GRA-Tower Defense Game
【题解】DZY Loves Chinese
【题解】[Ghd]
【题解】CF264B Good Sequences
【题解】P3162CQOI2012组装
【题解】P2279消防局的设立

原文地址：https://www.cnblogs.com/taurusfy/p/7198801.html