• wechat 网页版通信全过程


    想要记录总结一下自己在这个小项目中所遇到的坑,以及解决问题的思路。

      首先我觉得这个小项目挺有实际市场的,市场上有一定的需求量,这个就是驱动力吧。这个小项目的关键点是wechat网页版通信全过程,讲真挺繁琐的。chrome自带的抓包,简直不要太好用。

    说一说最主要的两个post请求,一个是心跳包,检测是否有消息到达,一个是账单消息到达后的账单信息提取。其他所有的预备操作仅仅是为了获取sid,uin,pass_ticket,skey和key-value值,说起这个就头大,微信的通信流程还真是复杂,我大支付宝至少还有公开的接口,微信全靠google。

      难点:一:post请求返回空数据,这是我整个项目中遇到最常见的问题,原因则是发起请求参数不对,其中domainName是不唯一的,浏览器三巨头,headers,host,refer。

    二:post请求data为json数据,这个也是和一般爬虫项目有所不同的地方。三:账单信息乱码问题,返回的json数据一部分是正常,但凡是在content内容中的中文则出现了乱码情况,很明显是因为编码问题,返回的req.text无论如何使用decode或是encode都失败了,最后看到已有前人,req.content.decode("utf-8")完美解决了这个问题。四:文本生成语音这部分就真的是条条大路通罗马了,pyttsx3可以调用系统的语音来生成语音播报,但是语速很感人太快了,调用第三方接口(我使用的是百度的语音合成接口)生成MP3文件,playsound读取MP3文件,但是又一个bug,playsound读取后未将音频文件关闭。

    整个流程基本如下(无论是监控微信账单或是收发消息):

    1、获取会话UUID

    微信Web版本不使用用户名和密码登录,而是采用扫描二维码登录,所以服务器需要首先分配一个唯一的会话ID,用来标识当前的一次登录。

    使用get方法,通过请求地址:https://login.weixin.qq.com/jslogin?appid=wx782c26e4c19acffb&fun=new&lang=zh_CN&_=时间戳

    其中,时间戳这个值是当前距离林威治标准时间的毫秒。

    get成功,则返回:window.QRLogin.code = 200; window.QRLogin.uuid = "XXXXXXX"

    其中的XXXXXXX就是我们需要的uuid

    2、获取登录二维码

    访问网址:https://login.weixin.qq.com/qrcode/XXXXXX

    这里的XXXXXXX就是我们刚才获取的uuid,这个网址直接显示的就是二维码

    3、查询是否扫描二维码登录

    显示了二维码以后,用户必须用手机微信扫描这个二维码才能登录。(微信为啥要这么设计?很奇怪的思维。。。我用电脑很多情况不就是因为手机没在旁边吗。。。)

    使用get方法,查询地址:https://login.weixin.qq.com/cgi-bin/mmwebwx-bin/login?uuid=XXXXXX&tip=1&_=时间戳

    这里的XXXXXX是我们刚才获取的uuid,时间戳同上。tip在第一次获取时应为1,这个数是每次查询要变的。

    如果服务器返回:window.code=201,则说明此时用户在手机端已经完成扫描,但还没有点击确认,继续使用上面的地址查询,但tip要变成0;

    如果服务器返回:

    window.code=200
    window.redirect_uri="XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX"

    则说明此时用户在手机端已经确认登录,window.redirect_uri=后面的这个网址要记下来,接着要访问这个地址。

    如果服务器返回:window.code=408,则说明等待超时,继续使用上面的地址查询,但tip=1

    4、访问登录地址,获得uin、sid、pass_ticket、skey

    用get方法,访问在上一步骤获得访问地址,并在参数后面加上:&fun=new,会返回一个xml格式的文本,类似这样:

    <error>
        <ret>0</ret>
        <message>OK</message>
        <skey>xxx</skey>
        <wxsid>xxx</wxsid>
        <wxuin>xxx</wxuin>
        <pass_ticket>xxx</pass_ticket>
        <isgrayscale>1</isgrayscale>
    </error>

    把这里的wxuin,wxsid,skey,pass_ticket都记下来,这是重要数据。

    5、微信初始化

    这个是很重要的一步,我在这个步骤折腾了很久。。。

    要使用POST方法,访问地址:https://wx2.qq.com/cgi-bin/mmwebwx-bin/webwxinit?r=时间戳&lang=ch_ZN&pass_ticket=XXXXXX

    其中,时间戳不用解释,pass_ticket是我们在上面获取的一长串字符。

    POST的内容是个json串,{"BaseRequest":{"Uin":"XXXXXXXX","Sid":"XXXXXXXX","Skey":XXXXXXXXXXXXX","DeviceID":"e123456789012345"}}

    uin、sid、skey分别对应上面步骤4获取的字符串,DeviceID是e后面跟着一个15字节的随机数。

    程序里面要注意使用UTF8编码方式。

    POST成功,则服务器返回一个很长的JSON串,格式是这样:

    {
        "BaseResponse": {
            "Ret": 0,
            "ErrMsg": ""
        },
        "Count": 8,
        "ContactList": [...],
        "SyncKey": {
            "Count": 4,
            "List": [
                {
                    "Key": 1,
                    "Val": 635705559
                },
                ...
            ]
        },
        "User": {
            "Uin": xxx,
            "UserName": xxx,
            "NickName": xxx,
            "HeadImgUrl": xxx,
            "RemarkName": "",
            "PYInitial": "",
            "PYQuanPin": "",
            "RemarkPYInitial": "",
            "RemarkPYQuanPin": "",
            "HideInputBarFlag": 0,
            "StarFriend": 0,
            "Sex": 1,
            "Signature": "Apt-get install B",
            "AppAccountFlag": 0,
            "VerifyFlag": 0,
            "ContactFlag": 0,
            "WebWxPluginSwitch": 0,
            "HeadImgFlag": 1,
            "SnsFlag": 17
        },
        "ChatSet": xxx,
        "SKey": xxx,
        "ClientVersion": 369297683,
        "SystemTime": 1453124908,
        "GrayScale": 1,
        "InviteStartCount": 40,
        "MPSubscribeMsgCount": 2,
        "MPSubscribeMsgList": [...],
        "ClickReportInterval": 600000
    }

    这其中,User里面是自己的信息,UserName是用户名,NickName是昵称。要注意UserName是每次都会变的。。。也就是说,获取不到唯一的不变标识表示身份,无语。。。SyncKey一般是4个,要记下这里的Key和val,后面每次收信息都要用。至于count和contactList先不用管。

    6、获取好友列表

    使用POST方法,访问:https://wx2.qq.com/cgi-bin/mmwebwx-bin/webwxgetcontact?r=时间戳

    POST的内容为空。成功则以JSON格式返回所有联系人的信息。格式类似:

    {
        "BaseResponse": {
            "Ret": 0,
            "ErrMsg": ""
        },
        "MemberCount": 21,
        "MemberList": [
            {
                "Uin": 0,
                "UserName": xxx,
                "NickName": "Urinx",
                "HeadImgUrl": xxx,
                "ContactFlag": 3,
                "MemberCount": 0,
                "MemberList": [],
                "RemarkName": "",
                "HideInputBarFlag": 0,
                "Sex": 0,
                "Signature": "xxxx",
                "VerifyFlag": 8,
                "OwnerUin": 0,
                "PYInitial": "URINX",
                "PYQuanPin": "Urinx",
                "RemarkPYInitial": "",
                "RemarkPYQuanPin": "",
                "StarFriend": 0,
                "AppAccountFlag": 0,
                "Statues": 0,
                "AttrStatus": 0,
                "Province": "",
                "City": "",
                "Alias": "Urinxs",
                "SnsFlag": 0,
                "UniFriend": 0,
                "DisplayName": "",
                "ChatRoomId": 0,
                "KeyWord": "gh_",
                "EncryChatRoomId": ""
            },
            ...
        ],
        "Seq": 0
    }

    其中,MemberCount表示总共有多少联系人,里面的内容都比较清晰。

    7、开启微信状态通知

    用POST方法,访问:https://wx.qq.com/cgi-bin/mmwebwx-bin/webwxstatusnotify

    POST的内容是JSON串,格式:


         BaseRequest: { Uin: xxx, Sid: xxx, Skey: xxx, DeviceID: xxx }, 
         Code: 3, 
         FromUserName: 自己ID, 
         ToUserName: 自己ID, 
         ClientMsgId: 时间戳 
    }

    8、心跳包,与服务器同步并获取状态

    以上步骤完成以后,就可以进入收发微信的循环了,可以用线程方式发送心跳包。

    使用get方法,设置超时为60秒,访问:https://webpush.wx2.qq.com/cgi-bin/mmwebwx-bin/synccheck?sid=XXXXXX&uin=XXXXXX&synckey=XXXXXX&r=时间戳&skey=XXXXXX&deviceid=XXXXXX&_=时间戳

    其他几个参数不用解释,这里的synckey需要说一下,前面的步骤获取的json串中有多个key信息,需要把这些信息拼起来,key_val,中间用|分割,类似这样:

    1_652651920|2_652651939|3_652651904|1000_0

    服务器返回:window.synccheck={retcode:”0”,selector:”0”}

    retcode为0表示成功,selector为2和6表示有新信息。4表示公众号新信息。

    9、读取新信息

    检测到有信息以后,用POST方法,访问:https://wx2.qq.com/cgi-bin/mmwebwx-bin/webwxsync?sid=XXXXXX&skey=XXXXXX

    POST的内容:

    {"BaseRequest" : {"DeviceID":"XXXXXX,"Sid":"XXXXXX", "Skey":"XXXXXX", "Uin":"XXXXXX"},"SyncKey" : {"Count":4,"List":[{"Key":1,"Val":652653204},{"Key":2,"Val":652653674},{"Key":3,"Val":652653544},{"Key":1000,"Val":0}]},"rr" :时间戳}

    注意这里的SyncKey格式,参考前面的说明。

    请求成功之后服务器会返回一个JSON串,其中AddMsgCount表示有多少信息,AddMsgList中是一个数组,包含了所有新消息,里面的MsgType表示信息类型,Content就是信息内容。

    注意again,返回的信息中,会有新的synckey,要更新这个内容,下次获取信息访问要用这个新的key。

    10、发送信息

    这个比较简单,用POST方法,访问:https://wx2.qq.com/cgi-bin/mmwebwx-bin/webwxsendmsg

    POST的还是json格式,类似这样:

    {"Msg":{"Type":1,"Content":"测试信息","FromUserName":"XXXXXX","ToUserName":"XXXXXX","LocalID":"时间戳","ClientMsgId":"时间戳"},"BaseRequest":{"Uin":"XXXXXX","Sid":"XXXXXX","Skey":"XXXXXX","DeviceID":"XXXXXX"}}

    这里的Content是信息内容,LocalID和ClientMsgId都用当前时间戳。

    以上就是基本的微信收发流程了。参考这个,可以自己去开发其他相关内容,比如群发消息,监听收款之类的。

  • 相关阅读:
    mysql workbench 建表时PK, NN, UQ, BIN, UN, ZF, AI
    Asan检测内存读越界
    C 实现 C++ 的面向对象特性(封装、继承、多态)
    VIBE算法
    Go 大坑 nil
    求二叉树中节点的最大距离
    计算[1,N]范围内含有7的数字的个数
    一组便于创建线程和线程池的简单封装函数
    用C#执行doc命令
    可以自由停靠的窗体!
  • 原文地址:https://www.cnblogs.com/zenan/p/9003852.html
Copyright © 2020-2023  润新知