Python40 epoll 使用和数据库 1.数据库相关概念--非常重要 2.数据库与文件系统的对应关系---非常重要 3.数据库安装方式--掌握 4. 连接服务器的指令必要掌握 5.修改管理员密码---了解

Python40 epoll 使用和数据库 1.数据库相关概念--非常重要 2.数据库与文件系统的对应关系---非常重要 3.数据库安装方式--掌握 4. 连接服务器的指令必要掌握 5.修改管理员密码---了解
复习

IO模型

1.阻塞IO模型

2.非阻塞IO模型

3.多路复用IO模型

4.异步IO模型
详解：
IO 模型

网络传输数据的两个阶段

send 从应用程序copy到操作系统
recv 等待数据到达缓冲区 wait_data 然后在从操作系统缓冲区copy应用程序
wait_data 耗时最长
我们的目的就等待数据的这一段时间合理的利用CPU来提高效率

1.阻塞IO
默认情况下就是阻塞IO模型
当执行recv时如果对方没有数据到达那么程序阻塞在原地
线程池有最大限制不能无限的开线程
来了1000 所以开了1000线程导致1001 客户端不能正常访问
而且很有可能很多线程处于阻塞状态,浪费了资源
可以使用协程
协程是单线程并发处理,
检测IO操作当发生IO操作时切换到其他任务来执行
协程的原理是把原本阻塞的操作换成非阻塞的操作

2.非阻塞IO === 非阻塞的网络IO 了解
非阻塞即即使遇到了IO操作也不会阻塞在原地会继续往下执行
server 是一个服务器socket对象
server.setblocking(Fasle) 设置为非阻塞
问题是: 每次读取数据时不一定有数据为了能够及时处理数据只能不停的询问忙轮询
这种忙轮询的方式,即使没有数据需要处理也需要不停的循环,造成了无用CPU占用

3.多路复用
假设原本有30个socket 需要我们自己来处理, 如果是非阻塞IO模型,相当于从头开始问道尾,如果没有需要处理的
回过头来再次重复,

多路复用解决问题的思路,找一个代理即select,将你的socket交给select来检测
select 会返回那些已经准备好的可读或者可写的socket
我们拿着这些准备好的socket 直接处理即可

对比线程池
避免了开启线程的资源消耗
缺点:
同时检测socket不能超过1024
注：epol就可以解决1024这个限制（仅在Linux）

4.异步IO
阻塞IO recv accept 会将当前线程阻塞住同步
非阻塞IO recv accept 不会阻塞当前线程 ,没有数据直接抛出异常
分析属于同步还是异步?
recv (wait_data,copy_data) 设置为非阻塞之后 wait_data不会再阻塞
但是copy_data 也是IO操作还是会阻塞
也属于同步

多路复用也属于同步IO

同步异步任务的执行方式
同步IO 执行IO任务的方式
异步IO

异步IO
线程池中的submit 就是异步任务
异步的特点就是立马就会返回
同步翻译为sync 异步async
今日内容

1.epoll

2.程序阻塞过程分析

3.进程的唤醒

4.select监控多个socket

5.epol l要解决的问题

6.epoll相关函数

7.案例说明：格式

1.epoll

select 只能同时处理1024个客户端,

多线程会遇到资源瓶颈,什么才是解决高并发最有效的方式呢

linux中提供了epoll 这种多路复用的IO模型,注意其他平台没有相应的实现

所以epoll仅在linux中可用

2.程序阻塞过程分析

   1.系统会创建文件描述符指向一个socket对象 ,其包含了读写缓冲区,已经进行等待队列

   2.当执行到accept / recv 时系统会讲进程A 从工作队列中移除

   3.将进程A的引用添加到 socket对象的等待队列中

3.进程的唤醒

1.当网卡收到数据后会现将数据写入到缓冲区

2.发送中断信号给CPU

3.CPU执行中断程序,将数据从内核copy到socket的缓冲区

4.唤醒进程,即将进程A切换到就绪态,同时从socket的等待队列中移除这个进程引用

4.select监控多个socket
select的实现思路比较直接

   1.先将所有socket放到一个列表中,

   2.遍历这个列表将进程A 添加到每个socket的等待队列中   然后阻塞进程

   3.当数据到达时,cpu执行中断程序将数据copy给socket 同时唤醒处于等待队列中的进程A

为了防止重复添加等待队列还需要移除已经存在的进程A

4.进程A唤醒后由于不清楚那个socket有数据,所以需要遍历一遍所有socket列表

从上面的过程中不难看出

   1.select,需要遍历socket列表,频繁的对等待队列进行添加移除操作,

   2.数据到达后还需要给遍历所有socket才能获知哪些socket有数据

两个操作消耗的时间随着要监控的socket的数量增加而大大增加,

   处于效率考虑才规定了最大只能监视1024个socket

5.epol l要解决的问题

1.避免频繁的对等待队列进行操作

2.避免遍历所有socket

对于第一个问题我们先看select的处理方式
```
while True:
    r_list,w_list,x_list = select.select(rlist,wlist,xlist)
  
```
每次处理完一次读写后,都需要将所用过冲重复一遍,包括移除进程,添加进程,默认就会将进程添加到等待队列,并阻塞住进程,然而等待队列的更新操作并不频繁,

所以对于第一个问题epoll,采取的方案是,将对等待队列的维护和,阻塞进程这两个操作进行拆分,

相关代码如下
```
import socket,select
server = socket.socket()
server.bind(("127.0.0.1",1688))
server.listen(5)

#创建epoll事件对象，后续要监控的事件添加到其中
epoll = select.epoll()
#注册服务器监听fd到等待读事件集合
epoll.register(server.fileno(), select.EPOLLIN)   # 需要关注 server这个socket的可读事件

# 等待事件发生
while True:
    for sock,event in epoll.poll():
    pass
```
在epoll中register 与 unregister函数用于维护等待队列

register 是进程添加到等待队列中 unregister 把进程从等待队列中删除

使用这两个函数我们自己来控制等待队列的添加和删除从而避免频繁操作等待队列

epoll.poll则用于阻塞进程

这样一来就避免了每次处理都需要重新操作等待队列的问题

第二个问题是select中进程无法获知哪些socket是有数据的所以需要遍历

epol为了解决这个问题,在内核中维护了一个就绪列表,

   1.创建epoll对象,epoll也会对应一个文件,由文件系统管理

   2.执行register时,将epoll对象添加到socket的等待队列中

   3.数据到达后,CPU执行中断程序,将数据copy给socket

   4.在epoll中,中断程序接下来会执行epoll对象中的回调函数,传入就绪的socket对象

   5.将socket,添加到就绪列表中

   6.唤醒epoll等待队列中的进程,

进程唤醒后,由于存在就绪列表,所以不需要再遍历socket了,直接处理就绪列表即可

成果：解决了这两个问题后,并发量得到大幅度提升,最大可同时维护上万级别的socket
6.epoll相关函数

import select 导入select模块

epoll = select.epoll() 创建一个epoll对象

epoll.register(文件句柄,事件类型) 注册要监控的文件句柄和事件

事件类型:

　　select.EPOLLIN    可读事件

　　select.EPOLLOUT   可写事件

　　select.EPOLLERR   错误事件

　　select.EPOLLHUP   客户端断开事件

epoll.unregister(文件句柄)   销毁文件句柄

epoll.poll(timeout) 当文件句柄发生变化，则会以列表的形式主动报告给用户进程,timeout

                     为超时时间，默认为-1，即一直等待直到文件句柄发生变化，如果指定为1

                     那么epoll每1秒汇报一次当前文件句柄的变化情况，如果无变化则返回空

epoll.fileno() 返回epoll的控制文件描述符(Return the epoll control file descriptor)

epoll.modfiy(fineno,event) fineno为文件描述符 event为事件类型作用是修改文件描述符所对应的事件

epoll.fromfd(fileno) 从1个指定的文件描述符创建1个epoll对象

epoll.close()   关闭epoll对象的控制文件描述符

7.案例说明：格式

客户端：

#coding:utf-8
#客户端
#创建客户端socket对象
import socket
clientsocket = socket.socket(socket.AF_INET,socket.SOCK_STREAM)
#服务端IP地址和端口号元组
server_address = ('127.0.0.1',1688)
#客户端连接指定的IP地址和端口号
clientsocket.connect(server_address)

while True:
    #输入数据
    data = raw_input('please input:')
    if data == "q":
        break
    if not data:
      continue
    #客户端发送数据
    clientsocket.send(data.encode("utf-8"))
    #客户端接收数据
    server_data = clientsocket.recv(1024)
    print ('客户端收到的数据：',server_data)
#关闭客户端socket
clientsocket.close()

服务器：

# coding:utf-8
import socket, select

server = socket.socket()
server.bind(("127.0.0.1", 1688))
server.listen(5)

msgs = []

fd_socket = {server.fileno(): server}
epoll = select.epoll()
# 注册服务器的写就绪
epoll.register(server.fileno(), select.EPOLLIN)

while True:
    for fd, event in epoll.poll():
        sock = fd_socket[fd]
        print(fd, event)
        # 返回的是文件描述符需要获取对应socket
        if sock == server: # 如果是服务器就接受请求
            client, addr = server.accept()
            # 注册客户端写就绪
            epoll.register(client.fileno(), select.EPOLLIN)
            # 添加对应关系
            fd_socket[client.fileno()] = client

        # 读就绪
        elif event == select.EPOLLIN:
            data = sock.recv(2018)
            if not data:
                # 注销事件
                epoll.unregister(fd)
                # 关闭socket
                sock.close()
                # 删除socket对应关系
                del fd_socket[fd]
                print(" somebody fuck out...")
                continue

            print(data.decode("utf-8"))
            # 读完数据需要把数据发回去所以接下来更改为写就绪=事件
            epoll.modify(fd, select.EPOLLOUT)
            #记录数据
            msgs.append((sock,data.upper()))
        elif event == select.EPOLLOUT:
            for item in msgs[:]:
                if item[0] == sock:
                    sock.send(item[1])
                    msgs.remove(item)
            # 切换关注事件为写就绪
            epoll.modify(fd,select.EPOLLIN)

数据库安装

1.数据库相关概念--非常重要

2.数据库与文件系统的对应关系---非常重要

3.数据库安装方式--掌握

4. 连接服务器的指令必要掌握

5.修改管理员密码---了解

1.数据库相关概念非常重要

数据库本质就是一套CS结构的TCP程序，

客户端连接到服务器向服务器发送指令，来完成数据的操作

2.数据库与文件系统的对应关系非常重要

一个数据项   name = jerry 本质是文件中某一行的一部分数据

一条记录 jerry，18，man    本质是文件里的一行数据

一张表本质是一个文件

数据库文件夹

DBMS DataBaseManagerSystem      数据库管理系统   数据库的服务器端程序

数据库服务器    运行有DBMS的计算机

3.安装方式:    掌握

1.下载解压包

2.解压到某个目录下

3.添加环境变量

将bin所在的完整路径 copy 添加系统的path中

4.作为服务器应该自启动mysql服务器   需要制系统服务

mysqld --install    运行输入services 查看是是否成功

删除服务 sc delete mysql    如果需要重装的话...

启动服务 net start mysql

停止服务 net stop mysql

4. 连接服务器的指令必要掌握

本质是TCP程序,必须指定ip和端口 ,如果服务器就运行在本机上可以省略ip 如果端口没改过也可以省略端口

完整的写法 :

```
mysql -hip -P端口 -u用户名 -p密码
实例: mysql -uroot -p

mysql 5.6 默认是没有密码的
```

5. 修改管理员密码   了解

1.如果知道原始密码可以使用mysqladmin 这个工具

```python
mysqladmin -p旧密码 -u用户名 password 新密码
实例: mysqladmin -uroot -p password 123
```

2.不知道原始密码的情况

删除密码文件,会删除所有授权信息

跳过授权表我们可以在启动服务器时指定让其忽略授权信息

1.先关闭mysql服务器直接在终端执行 mysqld --skip-grant-tables

2.无密码登录root账户

3.执行更新语句

  update mysql.user set password = password("123") where user="root" and host = "localhost";
相关阅读:
模态框显示出模态框后在加载（可用模块框中加入editormd编辑器）
python实现列表内元素按照出现次数排序
 Selenium
Python的Tqdm模块——进度条配置
 [Python3]selenium爬取淘宝商品信息
 如何用Matplotlib画一张好看的图
 maven如何引入本地jar
tensorflow和bazel版本对应问题及对应的bazel安装
 tensorflow保存模型的3种方式的资源汇总
 利用率统计脚本
原文地址：https://www.cnblogs.com/llx--20190411/p/11005852.html

Python40 epoll 使用和数据库 1.数据库相关概念--非常重要 2.数据库与文件系统的对应关系---非常重要 3.数据库安装方式--掌握 4. 连接服务器的指令 必要掌握 5.修改管理员密码---了解

1.避免频繁的对等待队列进行操作

2.避免遍历所有socket

对于第一个问题我们先看select的处理方式

第二个问题是select中进程无法获知哪些socket是有数据的所以需要遍历

Python40 epoll 使用和数据库 1.数据库相关概念--非常重要 2.数据库与文件系统的对应关系---非常重要 3.数据库安装方式--掌握 4. 连接服务器的指令必要掌握 5.修改管理员密码---了解