python3爬虫 -----新浪微博(m)-------评论爬取

 1 import requests
 2 import time
 3 import re
 4 
 5 
 6 
 7 p=0
 8 while p<=0:
 9     p+=1
10     url = "https://m.weibo.cn/api/comments/show?id=4257289713596342&page="+str(p) #杨洋为例
11     html = requests.get(url)
12     print(html)
13     try:
14         for c in range(len(html.json()['data']['data'])):
15             data=html.json()['data']['data'][c]['text']
16             with open('comments.txt','a',encoding='utf-8') as f:
17                 comments=''.join(re.findall('[u4e00-u9fa5]',data))
18                 print(comments)
19                 f.write(comments+'
'*2)
20     except:
21         None

效果如下所示：

相关阅读:
Quartz.net 定式调度任务
Quartz.net 定时调度CronTrigger时间配置格式说明
json 数据添加删除排序
Myeclipse 安装离线adt的方法（）
关于C# DataTable 的一些操作
Android 设置代理（验证用户名和密码）
js ShowDialogModal 关闭子页面并刷新父页面，保留查询条件
sql语句中----删除表数据drop、truncate和delete的用法
SQL数据库增删改查基本语句
asp.net(C#)利用QRCode生成二维码---.NET菜鸟的成长之路

原文地址：https://www.cnblogs.com/z-712/p/9694932.html