python超简单爬虫

import codecs
import requests
from bs4 import BeautifulSoup
import re
from lxml import etree
url = 'https://jbk.jiankang.com/zhengzhuang/pinyin-z/?p=5'
r = requests.get(url).text
sym = re.findall('<a href="/zhengzhuang/[0-9]{1,5}.*(?=</a>)',r)
print(sym)
for line in sym:
    print(line)
with codecs.open('症状.txt','a','utf8') as f:
    for line in sym:
        f.write(line+'
')

相关阅读:
【转帖】如何学好 C 语言
设计模式：单件模式（Singleton Pattern）
如果软件正在占领全世界.为什么程序员得不到任何尊重?
【转】程序员技术练级攻略
JS闭包理解的彻底吗？
设计模式：原型模式（Prototype Pattern）
关于基础类型
IIS5和IIS6的Asp.net应用程序生命周期事件和Global.asax文件
App_Code文件夹和Bin文件夹
构造函数

原文地址：https://www.cnblogs.com/yiwoqu/p/11542065.html