Tornado
简介
Tornado全称Tornado Web Server,是一个用Python语言写成的Web服务器兼Web应用框架,由FriendFeed公司在自己的网站FriendFeed中使用,被Facebook收购以后框架在2009年9月以开源软件形式开放给大众。
Tornado与其他Web框架的区别
以Django为代表的python web应用部署时采用wsgi协议与服务器对接(被服务器托管),而这类服务器通常都是基于多线程的,也就是说每一个网络请求服务器都会有一个对应的线程来用web应用(如Django)进行处理。
考虑两类应用场景
-
用户量大,高并发
如秒杀抢购、双十一某宝购物、春节抢火车票
-
大量的HTTP持久连接
使用同一个TCP连接来发送和接收多个HTTP请求/应答,而不是为每一个新的请求/应答打开新的连接的方法。
对于HTTP 1.0,可以在请求的包头(Header)中添加Connection: Keep-Alive。
对于HTTP 1.1,所有的连接默认都是持久连接。
对于这两种场景,通常基于多线程的服务器很难应对。
对于前面提出的这种高并发问题,我们通常用C10K这一概念来描述。C10K—— Concurrently handling ten thousandconnections,即并发10000个连接。对于单台服务器而言,根本无法承担,而采用多台服务器分布式又意味着高昂的成本。如何解决C10K问题?
Tornado在设计之初就考虑到了性能因素,旨在解决C10K问题,这样的设计使得其成为一个拥有非常高性能的解决方案(服务器与框架的集合体)。
Hello Word
第一个py
安装Tornado部分略过,我们直接进入正题,PyCharm没有新建Tornado项目的选项,我们直接新建一个py即可。
1 # -*- coding=utf-8 -*- 2 import tornado.web 3 import tornado.ioloop 4 5 6 class Index(tornado.web.RequestHandler): 7 # 封装一个类 8 def get(self): 9 # get请求进入该方法 10 # 返回字符串 11 self.write('Hello World') 12 13 14 class Home(tornado.web.RequestHandler): 15 def get(self): 16 self.write('Home') 17 18 19 if __name__ == '__main__': 20 app = tornado.web.Application([ 21 # 相当于路由 22 (r'/', Index), 23 (r'/home', Home), 24 ]) 25 # 指定端口 26 app.listen(8000) 27 # 开启 28 tornado.ioloop.IOLoop.current().start()
我们直接启动即可,然后使用postman或者浏览器访问(我习惯使用postman)
http://localhost:8000
我们测试一下结果
当服务器收到请求时会进入Application,进入路由顺序查找匹配。匹配到进入相关class,再根据方法进行处理
如果没有对应class报404,没有相应的方法报405
开启多进程
之前说过Tornado的特点便是多进程,但是上面的代码是单进程的,我们需要修改代码来开启多进程
# -*- coding=utf-8 -*- import tornado.web
import tornado.httpserver import tornado.ioloop
class Index(tornado.web.RequestHandler): # 封装一个类 def get(self): # get请求进入该方法 # 返回字符串 self.write('Hello World') class Home(tornado.web.RequestHandler): def get(self): self.write('Home') if __name__ == '__main__': app = tornado.web.Application([ # 相当于路由 (r'/', Index), (r'/home', Home), ]) # 手动生成server http_server = tornado.httpserver.HTTPServer(app) # 指定端口 http_server.bind(8000) # 开启多进程 http_server.start(0) # 开启 tornado.ioloop.IOLoop.current().start()
注意:指定多进程在linux上可行,在windows会报错,因为fork这个系统命令,只在linux中才有用。所以windows请留空(默认为1)或者填1
http_server.start(num_processes=1)方法指定开启几个进程,参数num_processes默认值为1,即默认仅开启一个进程;如果num_processes为None或者<=0,则自动根据机器硬件的cpu核芯数创建同等数目的子进程;如果num_processes>0,则创建num_processes个子进程。
虽然tornado给我们提供了一次开启多个进程的方法,但是由于:
- 每个子进程都会从父进程中复制一份IOLoop实例,如过在创建子进程前我们的代码动了IOLoop实例,那么会影响到每一个子进程,势必会干扰到子进程IOLoop的工作;
- 所有进程是由一个命令一次开启的,也就无法做到在不停服务的情况下更新代码;
- 所有进程共享同一个端口,想要分别单独监控每一个进程就很困难。
不建议使用这种多进程的方式,而是手动开启多个进程,并且绑定不同的端口。
Tornado options组件(命令行加参数)
像端口这种易改变的配置写在代码里则会有解耦性的问题,这个时候我们就需要Tornado的options组件。他可以帮助我们实现全局参数的定义存储和转换。
tornado.options.define()
参数有
- name 选项变量名,须保证全局唯一性,否则会报“Option 'xxx' already defined in ...”的错误;
- default 选项变量的默认值,如不传默认为None;
- type 选项变量的类型,从命令行或配置文件导入参数的时候tornado会根据这个类型转换输入的值,转换不成功时会报错,可以是str、float、int、datetime、timedelta中的某个,若未设置则根据default的值自动推断,若default也未设置,那么不再进行转换。可以通过利用设置type类型字段来过滤不正确的输入。
- multiple 选项变量的值是否可以为多个,布尔类型,默认值为False,如果multiple为True,那么设置选项变量时值与值之间用英文逗号分隔,而选项变量则是一个list列表(若默认值和输入均未设置,则为空列表[])。
- help 选项变量的帮助提示信息,在命令行启动tornado时,通过加入命令行参数 --help 可以查看所有选项变量的信息(注意,代码中需要加入tornado.options.parse_command_line())。
define("port", default=8000, help="run on the given port", type=int)
此处做到可以在启动时输入一个port,来指定端口,不传默认为8000,输入类型为int
python tdo_helloword.py --port=9000
指定端口为9000
那么代码修改为
# -*- coding=utf-8 -*- import tornado.web import tornado.ioloop import tornado.httpserver import tornado.options # 可以多行 tornado.options.define("port", default=8000, help="run on the given port", type=int) class Index(tornado.web.RequestHandler): # 封装一个类 def get(self): # get请求进入该方法 # 返回字符串 self.write('Hello World') class Home(tornado.web.RequestHandler): def get(self): self.write('Home') if __name__ == '__main__': # 注意加上这句 tornado.options.parse_command_line() app = tornado.web.Application([ # 相当于路由 (r'/', Index), (r'/home', Home), ]) # 手动生成server http_server = tornado.httpserver.HTTPServer(app) # 指定端口 http_server.bind(tornado.options.options.port) # 开启多进程 http_server.start(1) # 开启 tornado.ioloop.IOLoop.current().start()
我们在命令行加入port参数
python tdo_helloword.py --port=9999
查看效果
Tornado options组件(从配置文件导入)
配置文件格式要对
我们要更新一下代码
# -*- coding=utf-8 -*- import tornado.web import tornado.ioloop import tornado.httpserver import tornado.options # 可以多行 tornado.options.define("port", default=8000, help="run on the given port", type=int) class Index(tornado.web.RequestHandler): # 封装一个类 def get(self): # get请求进入该方法 # 返回字符串 self.write('Hello World') class Home(tornado.web.RequestHandler): def get(self): self.write('Home') if __name__ == '__main__': # 注意加上这句 # tornado.options.parse_command_line() # 从文件读取配置 tornado.options.parse_config_file('./config') app = tornado.web.Application([ # 相当于路由 (r'/', Index), (r'/home', Home), ]) # 手动生成server http_server = tornado.httpserver.HTTPServer(app) # 指定端口 http_server.bind(tornado.options.options.port) # 开启多进程 http_server.start(1) # 开启 tornado.ioloop.IOLoop.current().start()
这样便是读取配置文件来启动tornado
关闭日志
在我们访问网站的时候,我们会发现屏幕打印了访问和返回的记录,我们可以将他关闭
想要关闭,我们可以在开启时加上--logging=none
python td_helloword.py --logging=none
或者修改代码为
1 # -*- coding=utf-8 -*- 2 import tornado.web 3 import tornado.ioloop 4 import tornado.httpserver 5 import tornado.options 6 # 可以多行 7 tornado.options.define("port", default=8000, help="run on the given port", type=int) 8 9 10 class Index(tornado.web.RequestHandler): 11 # 封装一个类 12 def get(self): 13 # get请求进入该方法 14 # 返回字符串 15 self.write('Hello World') 16 17 18 class Home(tornado.web.RequestHandler): 19 def get(self): 20 self.write('Home') 21 22 23 if __name__ == '__main__': 24 # 不打印日志 25 tornado.options.options.logging = None 26 tornado.options.parse_command_line() 27 # 从文件读取配置 28 # tornado.options.parse_config_file('./config') 29 app = tornado.web.Application([ 30 # 相当于路由 31 (r'/', Index), 32 (r'/home', Home), 33 ]) 34 # 手动生成server 35 http_server = tornado.httpserver.HTTPServer(app) 36 # 指定端口 37 http_server.bind(tornado.options.options.port) 38 # 开启多进程 39 http_server.start(1) 40 # 开启 41 tornado.ioloop.IOLoop.current().start()
路由
路由的匹配
Tornado的路由匹配采用的是正则匹配
一般情况下不需要多复杂的正则,正则的基本规则如下(站长之家)
举个例子
(r'/sum/(d+)', Sum),
该代码指匹配 /sum/ 后跟至少一个数字且只有数字的情况
* 需要注意的是网络上传输都是字符串
类 Sum编写
class Sum(tornado.web.RequestHandler): # 数字类 def get(self, sum): # 获取数字并返回 self.write('%s,%s' % (type(sum), sum))
我们访问 http://localhost:8001/sum/12 时
返回正常
我们访问 http://localhost:8001/sum/1a2 http://localhost:8001/sum/a12 http://localhost:8001/sum/12a http://localhost:8001/sum/a 时,均会报出404错误,证明没有匹配到路由
同理,当我们需要匹配两个参数时
(r'/(w+)/stuggle/(d+)', Stugggle),
接收时接收两个参数即可
def get(self, st, ins):
pass
post参数
与get一样,post请求会寻找到该视图的 post 方法
我们给视图 Hello 增加一个post
class Hello(tornado.web.RequestHandler): # 封装一个类 def get(self): # get请求进入该方法 self.write('Hello') def post(self): # post请求 txt = self.get_argument('txt') self.write(txt)
self.get_argument('txt') 指获取post传参中 Key 为 txt 的值,路由无需改动
get参数
get获取参数与上面的post没有差别
我们修改get方法来进行测试
def get(self): # get请求进入该方法 arg = self.get_argument('arg') arg1 = self.get_argument('arg1') self.write('%s+%s' % (arg,arg1))
但是需要注意的是, get_argument 在获取不到该key时会报错,抛出400错误
get_argument 方法其实可以接收三个参数
get_argument(name,default=_ARG_DEFAULT,strip=True)
第一个参数就是key的值,第二个参数为如果接收不到默认的值,第三个是默认去除前后空格
一般情况下我们第二个参数传 None
def get(self): # get请求进入该方法 arg = self.get_argument('arg', None) arg1 = self.get_argument('arg1', None) self.write('%s+%s' % (arg,arg1)) def post(self): # post请求 txt = self.get_argument('txt', None) self.write(txt)
这样就增加了兼容性
Tornado学习笔记(三) 请求方式/状态码
本章我们来学习 Tornado 支持的请求方式
请求方式
Tornado支持任何合法的HTTP请求(GET、POST、PUT、DELETE、HEAD、OPTIONS)。你可以非常容易地定义上述任一种方法的行为,只需要在 RequestHandler 类中使用同名的方法。(也就是在视图中定义同名的方法)
关于请求方式对应的操作和返回码可以参考 http://www.runoob.com/w3cnote/restful-architecture.html 不过具体还是要与业务进行匹配。
状态码
使用RequestHandler类的set_status()方法显式地设置HTTP状态码。然而,你需要记住在某些情况下,Tornado会自动地设置HTTP状态码。
比如如果访问一个无法匹配的路由,则会返回404报错,而且状态码是404
但是我们在代码中没有指定返回的状态码,常用的有:
404 Not Found
Tornado会在HTTP请求的路径无法匹配任何RequestHandler类相对应的模式时返回404(Not Found)响应码。
400 Bad Request
如果你调用了一个没有默认值的get_argument函数,并且没有发现给定名称的参数,Tornado将自动返回一个400(Bad Request)响应码。
405 Method Not Allowed
如果传入的请求使用了RequestHandler中没有定义的HTTP方法(比如,一个POST请求,但是处理函数中只有定义了get方法),Tornado将返回一个405(Methos Not Allowed)响应码。
500 Internal Server Error
当程序遇到任何不能让其退出的错误时,Tornado将返回500(Internal Server Error)响应码。你代码中任何没有捕获的异常也会导致500响应码。
200 OK
如果响应成功,并且没有其他返回码被设置,Tornado将默认返回一个200(OK)响应码。
我们也可以自定义错误返回,只需在class中定义一个名为 write_error 的方法
比如
def write_error(self, status_code, **kwargs): self.write('%s' % status_code)
该段代码会将 错误code以字符串的形式返回回去
需要注意的是该方法是写在类中,也就是说该方法只能作用于一个视图。