利用python获取自己的qq群成员信息!
首先说明一下需要使用的工具以及技术:python3 + selenium
selenium安装方法:pip install selenium
前提:获取自己的qq群成员信息,自己必须是群主或者管理员,然后通过管理页面进入到成员高级管理网页端,就可以对数据进行爬取了!
步骤:
①:首先安装环境 selenium库,selenium是一个自动化库,但是使用它必须用到浏览器驱动,不同的浏览器有不同的驱动,所以需自行下载,我这里是chrome浏览器。
②:运行 程序,然后会需要点击一键登录按钮,点击即可,点击完后,整个页面还未加载全所有的成员信息,所以需要将滚动条下拉至底。
③:等待运行结束,结束后 同目录下就会出现一个xslx文档,里面就是所有的群成员信息
话不多说,上代码就完了!
1 from selenium import webdriver 2 3 from time import sleep 4 #1.创建Chrome浏览器对象,这会在电脑上在打开一个浏览器窗口 5 browser = webdriver.Chrome(executable_path ="D:chromedownloadchromedriver") 6 7 #2.通过浏览器向服务器发送URL请求 8 browser.get("https://qun.qq.com/member.html#gid=951192978") 9 sleep(20) 10 11 12 13 #browser.sleep(3) 14 all_number_nickname = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[3]/span[1]') 15 all_number_name = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[4]/span[1]') 16 all_number_order = browser.find_elements_by_class_name('td-no') 17 all_number_qq = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[5]') 18 all_number_sex = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[6]') 19 all_number_qqage = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[7]') 20 all_number_intime = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[8]') 21 all_number_marks = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[9]') 22 all_number_lastsaytime = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[10]') 23 # for i in [all_number_qq,all_number_nickname,all_number_name,all_number_order,all_number_sex,all_number_qqage,all_number_intime,all_number_marks,all_number_lastsaytime]: 24 # for j in i: 25 # print(j.text) 26 list=[] 27 for k in range(len(all_number_qq)): 28 list.append([]) 29 list[k].append(all_number_qq[k].text) 30 list[k].append(all_number_nickname[k].text) 31 list[k].append(all_number_name[k].text) 32 list[k].append(all_number_order[k].text) 33 list[k].append(all_number_sex[k].text) 34 list[k].append(all_number_qqage[k].text) 35 list[k].append(all_number_intime[k].text) 36 list[k].append(all_number_marks[k].text) 37 list[k].append(all_number_lastsaytime[k].text) 38 39 40 import openpyxl 41 42 def write_excel_xlsx(path, sheet_name, value): 43 index = len(value) 44 workbook = openpyxl.Workbook() 45 sheet = workbook.active 46 sheet.title = sheet_name 47 for i in range(0, index): 48 for j in range(0, len(value[i])): 49 sheet.cell(row=i+1, column=j+1, value=str(value[i][j])) 50 workbook.save(path) 51 print("xlsx格式表格写入数据成功!") 52 53 54 book_name_xlsx = 'python小白交流群成员.xlsx' 55 56 sheet_name_xlsx = 'python小白交流群成员' 57 58 value = list 59 60 write_excel_xlsx(book_name_xlsx, sheet_name_xlsx, value)