1.项目需求分析
立项:Javis&&taisen(三个月全部,先模拟出一个玩具,硬件需要周期长一些)
想法 --- 需求分析: 1.通过玩具与孩子实时进行沟通 2.希望玩具的知识渊博 3.希望玩具最好能代替我陪伴孩子 4.给孩子播放幼教内容 儿歌 睡前故事 国学 5.自扩散 - 幼儿社交圈 需求分析: 4.给孩子播放幼教内容 儿歌 睡前故事 国学 - 数据采集(爬虫) - 获取本地资源 - 家长可以控制玩具播放的内容 - 控制端 App 2019年4月19日: 1.喜马拉雅听 采集数据 2.存放数据目录结构 3.数据存放在MongoDB中 4.在App中展示资源: 通过/content_list接口获取资源 5.播放幼教内容在App端播放 plus.audio.createPlayer(URL_PATH).play() 6.家长可以控制玩具播放的内容 1.通过玩具与孩子实时进行沟通 - 对玩具发起消息 - 手机 App - 基于通讯录的IM功能 IM:即时通讯 - WebSocket 2.希望玩具的知识渊博 - 问题库 百科 - 问答机器人 Tuling 3.希望玩具最好能代替我陪伴孩子 - 聊天库 - 问答机器人 Tuling 5.自扩散 - 幼儿社交圈 - 玩具与玩具之间对话 - 玩具需要具有通讯录的功能 - 基于通讯录的IM功能 IM:即时通讯 - WebSocket App的功能? 1.用户管理 - 注册登录 - 用户信息 - 通讯录 - 绑定玩具 2.管理玩具 - 绑定玩具 - 控制玩具通讯录 - 帮助玩具建立社交圈 3.内容审核 - App看到内容 - App听内容 - App给玩具发过去 - 遥控器(只要有网就行) 4.与玩具通讯功能 - App通讯录 - App聊天界面 - 语音消息发送 - 录音 - 播放录音 玩具的功能?由于玩具硬件开发周期非常长,自己模拟WebToy玩具 1.播放幼教内容 - 点播 语音指令 - 遥控 App发送音乐给玩具 {music:"小毛驴.mp3"} - WebToy - audio 2.播放语音消息 - 通讯 - 收取消息 实时 - WebSocket - WebToy - audio 3.发送语音消息 - 录音 - 发送? - App - 玩具 - 问答机器人 4.语音指令 - 录音 - 上传 - NLP 自然语言处理 - 我要听 - 发消息给xxxx
注意:没有谁一看到项目,马上就有思路了,都是一步一步来的,不要慌,一点一点来
2.数据采集 xmly
首先,我们需要采集数据,存在法律风险,需要带上出处和作者这个东西,否则很可能出现赔偿问题
音频可能没有太大影响,但是视频是视觉上的,就存在风险了
起名字无所谓的.
yinwangba//12//eightapp//13king//14tuxingsun//15chunsheng//16laopobing//17vista//18javis
创建完后端,需要在前端同步开发
在前端中,新建一个app
清除原来的内容,写一个md代码块,进行得到下面的内容:
我们想要采集的内容爬爬内容:"幼教类网站"=>"幼教网"
上边的名词难度有点高
亲宝网,"贝瓦儿歌"
"喜马拉雅"
不入虎穴焉得虎子,舍不得孩子套不着狼(鞋子)
动态class是最难爬取的
请求头里边有请求地址
上边显示请求的URL和请求的方式GET
上边显示的是响应应用类型:
下图显示的是普通请求方式:
用户代理,在请求头里边:见下图
我们需要用get请求进行访问,
得到下面的结果,响应的是200,也就是可以响应
在打印一下里边的内容,结果是空的
反爬请求方式1:校验当前的用户是否为浏览器访问
下面,我们开始模拟一下:
这个时候,我们爬取的内容,见上图
反爬的机制1就是"动态class"随时可能变化
下面我们通过json,变成字典:
rest是一种开发方式,一种标准:类似于下图的一种标准的格式
下面,我们需要通过for循环,拿取里边的内容:也就是先拿名字:
下面我们除了需要名字,还需要播放的链接地址:
我们需要存储起来,防止网址变更.
我们下面,验证的结果就是流:
也就是不需要请求头的.
下面我们需要开始写入某个内容:
运行之后的到的结果:
右击,打开文件的位置:
不要以为别人好像很简单做成了某件事情,别人可能花了你所不知道的更多的时间,进行处理这个问题.
有可能链接可能变了
上边写的方式是单线程的,但是会慢一些,但是无所谓了,现在能用就行.
下面新建两个文件夹:一个存图片,一个存音乐
我们再见一个settings.py进行数据库的配置,优选mongodb,简单粗暴
最终版程序:
papaxiao.py
# Author: studybrother sun import os import time import requests from uuid import uuid4 from settings import MONGODB,MUSIC_PATH,COVER_PATH xmly_url="https://www.ximalaya.com/revision/play/album?albumId=424529&pageNum=1&sort=1&pageSize=30" # 424529指的是专题ID header={ "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36" } def papaxiao(tar): res = requests.get(xmly_url, headers=header) music_list=[]# 新建一个空列表music的 for audio_info in res.json().get("data").get("tracksAudioPlay"): print(audio_info.get("trackName"), audio_info.get("src")) music = requests.get(audio_info.get("src")) # 音乐 cover = requests.get("http:" + audio_info.get("trackCoverPath")) # 图片 filename = uuid4() # 保证每个名字都不一样 cover_file = os.path.join(COVER_PATH, f"{filename}.jpg") # 拼接路径 music_file = os.path.join(MUSIC_PATH, f"{filename}.mp3") # 拼接路径 with open(music_file, "wb")as f: f.write(music.content) with open(cover_file, "wb")as f: f.write(cover.content) music_info = { "music": f"{filename}.mp3", "cover": f"{filename}.jpg", "title": audio_info.get("trackName"), # 展示的内容 "ZJ": audio_info.get("albumName"), # 专辑名字需要拿出来,防止被告 "class": tar # "class": "儿歌分类" } music_list.append(music_info) # time.sleep(0.12)#防止无限爬取,我们需要防止屏蔽 # 将music_info插入数据库,30次 MONGODB.content.insert_many(music_list) papaxiao("儿歌")
settings.py
# Author: studybrother sun from pymongo import MongoClient mc=MongoClient("127.0.0.1",27017) MONGODB=mc["Taisen_J"] #目录配置 MUSIC_PATH="Music" COVER_PATH="Cover"
目录结构:
还有,我们需要开启mongodb
最终得到的结果:
注意,反爬机制会很全面的,特别是这种大的网站
播放次数.点播次数&&推荐次数,这种算法.
我们采集完内容,我们应该怎样操作?
3.App内容列表&&App播放歌曲
我们需要将数据库,里边的内容,变成列表返回这些内容:
我们需要写一个视图函数进行返回,
新建一个manager.py和一个文件夹,serv
主要用C#的一种架构方式写的:
下面我们再写一个content内容蓝图
只支持"POST"的方式,是复写而不是追加,原因是源码中进行了覆盖methods
面对一个美丽的前端小姐姐,我们该如何处理?
我们需要,在前端中导入上边的内容,
# Author: studybrother sun from flask import Blueprint,jsonify from settings import MONGODB,RET content=Blueprint("content",__name__) @content.route("/content_list",methods=["POST"]) def content_list(): #写一个视图函数,在上边导入mongodb res=list(MONGODB.content.find()) #这是一个生成器,需要转换成一个列表 for index,con in enumerate(res): res[index]["_id"]=str(con.get("_id")) # 需要修改格式和_id RET["code"]=0 RET["msg"]="查询内容列表" RET["data"]=res return jsonify(RET)
我们写了揽入需要在manager.py里边先注册一下:
下面,我们需要在Hbuilder前端里边写一个内容,开始拿我们的请求内容:
清空前端index.html里边的内容,然后md代码块,
先运行项目:Hbuilder,这个时候我们可以得到一个干净的项目,也就是什么都没有
注意,建立连接的过程会比较慢,这很正常,多长时间几次就可以连接上了
再加上mat代码块,底部多了一个
然后输入代码块在body里边:
新建一个home.html页面,清空改成md
再在home里边加上mhe
先写一个mbo,再在里边写一个msl轮播图
再写一个mg九宫格
我们再写一个mlis代码块,选择第三个
这个时候,我们需要在index.html里边的初始化进行修改
先删除上边的第30行,
这个时候,我们再进行保存处理
再次得到下面熟悉的界面:
但是标题已经发生了改变,我们自己起的名字"泰森_贾"
将后边的数字,都改成4,就变成了九宫格
也就是说一共屏幕上有12个格,每个占4个,就显示3个标签
下面,我们需要对"幸福","木屋","CBD"等进行替换成歌曲
也就是说,我们加载完home页面之后,需要对服务器发起一个请求,
写一个mpl
下面,我们发起一个post请求
注意,这个后端,需要开启后端的服务,
现在,前端,我们保存一次就会运行一次.
我们想将li包裹的里边的东西进行处理:
也就是说,我们要将下图中红框的位置删除:
代码,见下图:
很明显,我们这样操作会出错,显示下图中的语法错误:
接下来,我们应该如何操作?
下面,我们要创建标签,
这个时候可以把上边的结构表删除了
也就是下图中,红框的内容:
我们需要执行的位置,见下图:
上图是执行的位置,我们可以判断的是,这个js不是按照从上到下执行的
写代码块fori,得到下图的内容
我们将Things修改成data.data,也就是数据的长度
我们先运行起后端程序manager.py,在保存也就是运行home.html,得到下面的结果:
我们再处理下面的内容:
注意,要把内容,写对,内容可能会出来的慢一些,不要着急
修改p标签为ZJ
上边表示可以加载出歌名来.
保存也就是运行,得到下面的结果:
思考,可不可以直接那里边的图片:也就是
img.src=content.cover;
访问的结果,我们需要的是一个流,进行处理
下面我们需要再创建一个接口进行处理:
下面,我们需要注册一个蓝图,进行处理,
保存上图的内容,这个时候,应该可以加载出图片了.
这个地方爬虫写错了一个字母,导致后边出现的歌名全部一样:
就是因为爬虫中写错了一个字母,导致了这个音乐列表中的名字和图片都出现的不正确,现在上边就显示正常了
下面,我们想要播放列表中的音乐,我们该如何处理?
点击事件,我们想要,点击a标签就可以播放音乐
下面,我们再创建一个player页面:
在清空,写入代码块:md
在body里边写mhe,选择带箭头的,原因是"这是一个子集"
将title里边写上标题,
下面我们再写一个mbo代码块,
下面我们再在home.html里编写,打开页面,写mop代码块,打开页面
我们需要将上图中的styles去掉,保存也就是运行:
这个时候,机器可能的比较慢
点击任意一首歌曲,都会跳转到player.html界面
下面,我们还需要传递一个参数,进行处理.
下面,我们将执行的参数进行传递:
也就是传递到player.html,这个时候player.html就可以接收了
这个时候,我们可以得到上边的内容,其中webview里边可以包含传递过来的参数content,也就是data.data
这个时候再次保存,就可以,点击歌曲里边,可以看到结果了,但是这个时候,电脑可能会卡一下,注意一下
这样就可以根据点击进去的歌名,显示标题的样式了
下面,再写一个mro
这个时候,我们想要再在下图写一个图片:
下面,我们再加上一个id=cover
因为是传递过来的,我们需要修改的位置,见下图:
我们看到所占的页面是有点大的,下面处理一下:
我们需要在这里改变大小,并且居中
距离顶部一定的距离,改成圆形
下面,我们再写一个按钮
如何进行播放,这个时候,我们需要查一下文档,
选择第二个Audio,也就是音频的录制和播放
这个时候,我们需要在后端写一个getmusic
注意,这个时候,我们不在需要注册了,注册的是实例化之后的蓝图,不是函数,记住这一点
之所以,没有播放的原因是缺少一行代码
这个时候,我们点击,就可以播放音乐了.
后端的请求就拿到了MP3
设置=>声音=>默认通知声音=>选择声音
现在,我们想要音乐停止,怎么操作?
4.Player用法
下面,我们需要加上几个按钮,实现暂停,继续等功能
mbu代码块功能,选择第一个
下面我们开始绑定事件:
dga代码块
player 并且我们在plusReady里边赋值成了一个新的对象
下面我们可以用了.
下面,我们再上边再定义一个公共事件:
也就是说我们再plusReady里边先设置好值.
此时的播放是重建的对象,再次播放是从头开始进行播放的.
上边出错的原因是加上了var
下面,我们修改一下home里边九宫格所代表的东西:
MUI自己学习这些功能:
我们需要的是上拉下载:
国学列表,古诗列表等等.
5.Websocket遥控器
需求分析: 4.给孩子播放幼教内容 儿歌 睡前故事 国学 - 数据采集(爬虫) - 获取本地资源 - 家长可以控制玩具播放的内容 - 控制端 App 2019年4月19日: 1.喜马拉雅听 采集数据 2.存放数据目录结构 3.数据存放在MongoDB中 4.在App中展示资源: 通过/content_list接口获取资源 5.播放幼教内容在App端播放 plus.audio.createPlayer(URL_PATH).play() 6.家长可以控制玩具播放的内容 1.通过玩具与孩子实时进行沟通 - 对玩具发起消息 - 手机 App - 基于通讯录的IM功能 IM:即时通讯 - WebSocket 2.希望玩具的知识渊博 - 问题库 百科 - 问答机器人 Tuling 3.希望玩具最好能代替我陪伴孩子 - 聊天库 - 问答机器人 Tuling 5.自扩散 - 幼儿社交圈 - 玩具与玩具之间对话 - 玩具需要具有通讯录的功能 - 基于通讯录的IM功能 IM:即时通讯 - WebSocket App的功能? 1.用户管理 - 注册登录 - 用户信息 - 通讯录 - 绑定玩具 2.管理玩具 - 绑定玩具 - 控制玩具通讯录 - 帮助玩具建立社交圈 3.内容审核 - App看到内容 - App听内容 - App给玩具发过去 - 遥控器 4.与玩具通讯功能 - App通讯录 - App聊天界面 - 语音消息发送 - 录音 - 播放录音 玩具的功能?由于玩具硬件开发周期非常长,自己模拟WebToy玩具 1.播放幼教内容 - 点播 语音指令 - 遥控 App发送音乐给玩具 {music:"小毛驴.mp3"} - WebToy - audio 2.播放语音消息 - 通讯 - 收取消息 实时 - WebSocket - WebToy - audio 3.发送语音消息 - 录音 - 发送? - App - 玩具 - 问答机器人 4.语音指令 - 录音 - 上传 - NLP 自然语言处理 - 我要听 - 发消息给xxxx
下面进行模拟一个web进行处理:
下面需要再创建一个html文件:,注意,现在我们模拟的是web页面,不写前后端分离了
江老师传授的播放方式:
音乐的名字 可以直接copy采集下来的数据名称用上边的命令进行处理
下面我们再写一个发送按钮:
在组件中看一下颜色:
下面,我们需要再次写一个事件
我们先写一些数字,看能不能发送成功:
下面,我们需要在服务端新建一个ws_serv.py开启一个通讯服务
下面,我们需要基于flask,写一个websocket服务
两套服务,写在同一套代码里边:一个开ws_serv.py,另一个专门开manager.py
刚才江老师的方式也是一种get请求方式
我以为你是个暖男,结果你只支持get请求:
先安装好这个包,再处理:
ws_serv.py
import json from flask import Flask,request ws_serv=Flask(__name__) from geventwebsocket.websocket import WebSocket from gevent.pywsgi import WSGIServer #替换werkzurg from geventwebsocket.handler import WebSocketHandler #处理wsgi带的请求头的信息 user_socket_dict={} @ws_serv.route("/app/<app_id>") def app(app_id): user_socket=request.environ.get("wsgi.websocket") if user_socket: user_socket_dict[app_id]=user_socket print(len(user_socket_dict),user_socket_dict) while True: msg=user_socket.receive() msg_dict=json.loads(msg) #msg{to_user:toy01,music: getmusic/25d3c036-4b1f-4f4b-827a-fc4ddc50286f.mp3 } print(msg_dict)
if __name__ == '__main__':
http_serv=WSGIServer(("0.0.0.0",9528),app,handler_class=WebSocketHandler)
http_serv.serve_forever()
下面,我们看一下,能不能拿出值来
运行上边的ws_serv.py程序,这个时候就会阻塞住
这个时候,我们随便点击一首歌,点击发送
报错,不能传递两个参数
错误的原因是上边的app写错了,应该是ws_serv
这个时候运行,再次点击进入一首歌,点击"发送",然后我们再后端就可以收到信息了
下面我们看一下,能不能发送这个字典:
我们再次方式会报一堆错误:
思考,我们应该如何处理?我们应该先转成字符串在进行处理,也就是json转换成字符串:
上边报错的原因是,我把点好写成了冒号上边是改正过来的信息
再次修改:
再次发送,得到下面发送的结果:
为了保证不出错,注意放的位置
为了不出错,我们可以有两种方式,防止内容:下图是放置好的方式,目的就是,放好了防止出错,JavaScript是异步代码,防止线程过快等问题
下面,我们需要接收代码:
下面是ws_serv.py的代码
# Author: studybrother sun import json from flask import Flask,request ws_serv=Flask(__name__) from geventwebsocket.websocket import WebSocket from gevent.pywsgi import WSGIServer #替换werkzurg from geventwebsocket.handler import WebSocketHandler #处理wsgi带的请求头的信息 user_socket_dict={} @ws_serv.route("/app/<app_id>") def app(app_id): user_socket=request.environ.get("wsgi.websocket") if user_socket: user_socket_dict[app_id]=user_socket print(len(user_socket_dict),user_socket_dict) while True: msg=user_socket.receive() msg_dict=json.loads(msg) #msg{to_user:toy01,music: getmusic/25d3c036-4b1f-4f4b-827a-fc4ddc50286f.mp3 } print(msg_dict) @ws_serv.route("/toy/<toy_id>") def toy(toy_id): user_socket=request.environ.get("wsgi.websocket") if user_socket: user_socket_dict[toy_id]=user_socket print(len(user_socket_dict),user_socket_dict) while True: msg=user_socket.receive() msg_dict=json.loads(msg) #msg{to_user:toy01,music: getmusic/25d3c036-4b1f-4f4b-827a-fc4ddc50286f.mp3 } print(msg_dict) if __name__ == '__main__': http_serv=WSGIServer(("0.0.0.0",9528),ws_serv,handler_class=WebSocketHandler) http_serv.serve_forever()
下面是WebToy.html代码:
<!DOCTYPE html> <html lang="zh-CN"> <head> <meta http-equiv="content-Type" charset="UTF-8"> <meta http-equiv="x-ua-compatible" content="IE=edge"> <meta name="viewport" content="width=device-width" ,initial-scale="1"> <!--上边这个表示手机版的调整尺寸--> <!--上述2个meta标签"必须"放在最前面,任何其他内容都必须跟随其后--> <title>Title</title> </head> <body> <audio controls autoplay id="player"></audio> <!--我们通过id进行控制--> </body> <script type="application/javascript"> var ws=new WebSocket("ws://192.168.14.133:9528/toy/toy01"); //这样写的原因是toy有很多种,不得不这样写 ws.onmessage=function (eventMessage) { msg=JSON.parse(eventMessage.data) //字符串转换成object document.getElementById("player").src="http://192.168.14.133:9527/getmusic"+msg.music;//大前提是需要发送消息 }//这个时候能够接收消息 </script> </html>
目录结构:
因为这个涉及到web录音,我们需要用到火狐浏览器,重启一下ws_serv.py文件
用火狐浏览器访问,注意这个访问的端口是服务器的端口"9527"
报错原因,是我们没有放值
这个时候,就没有问题了
如果,我们访问的是9528,得到下面的结果:
正确访问地址之后,ws_serv得到下面的结果:
另一个,点击发送歌曲的时候,就连接上了,第一个是火狐浏览器输入地址,就能访问,第二个是app点击发送得到的结果:
修改成下面的内容:
再次运行ws_serv.py,运行火狐
下图就是我们的单聊:
也就是遥控器功能.给服务器前端节省一些资源
在火狐上一直出不来的原因就是少写了一个/
写完之后,运行manager.py和ws_serv.py,运行前端程序,在浏览器上输入网址:(192.168.14.133:9527),在模拟器上打开歌曲,点击发送,这个时候,浏览器就可以接收到音乐了,可以进行播放了.
6.可以进行的一些拓展
1.立项 - 名字随意 - 最好有意义 2.Index + Home + Player 3.图文列表通过JS document.createElement Item 4.Player 播放内容 实现暂停继续 5.App遥控玩具 - Websocket 单聊技术 扩展任务: 6.自动登录 + 注册 { _id:"", username:"", password:"MD5", nickname:"", gender: 1 / 2, avatar: 1==girl.jpg / 2==boy.jpg, bind_toy : [], firend_list:[] } reg.html gender 单选框 password MD5 login.html 自动登录
核心问题:
先研究好这些逻辑的问题再说.
查文档,看视频.