• 在使用python日志异步发送到远程服务器的方式--你是这样的吗!


    在python中使用日志最常用的方式就是在控制台和文件中输出日志了,logging模块也很好的提供的相应的类,使用起来也非常方便,但是有时我们可能会有一些需求,如还需要将日志发送到远端,或者直接写入数据库,这种需求该如何实现呢?

    一、StreamHandler和FileHandler

    首先我们先来写一套简单输出到cmd和文件中的代码


    首先初始化一个logger, 并且设置它的日志级别是DEBUG,然后添初始化了 cmd_handler和 file_handler, 最后将它们添加到logger中, 运行脚本,会在cmd中打印出 [2020-09-23 10:45:56] [DEBUG] 今天天气不错 且会写入到当前目录下的debug.log文件中.

    二、添加HTTPHandler

    如果想要在记录时将日志发送到远程服务器上,可以添加一个 HTTPHandler , 在python标准库logging.handler中,已经为我们定义好了很多handler,有些我们可以直接用,本地使用tornado写一个接收日志的接口,将接收到的参数全都打印出来


    结果在服务端我们收到了很多信息


    可以说是信息非常之多,但是却并不是我们想要的样子,我们只是想要类似于 [2020-09-23 10:45:56] [DEBUG] 今天天气不错 这样的日志.

    logging.handlers.HTTPHandler 只是简单的将日志所有信息发送给服务端,至于服务端要怎么组织内容是由服务端来完成. 所以我们可以有两种方法,一种是改服务端代码,根据传过来的日志信息重新组织一下日志内容, 第二种是我们重新写一个类,让它在发送的时候将重新格式化日志内容发送到服务端.

    我们采用第二种方法,因为这种方法比较灵活, 服务端只是用于记录,发送什么内容应该是由客户端来决定。

    我们需要重新定义一个类,我们可以参考 logging.handlers.HTTPHandler 这个类,重新写一个httpHandler类

    每个日志类都需要重写emit方法,记录日志时真正要执行是也就是这个emit方法


    上面代码中有一行定义发送的参数 msg = self.format(record)

    这行代码表示,将会根据日志对象设置的格式返回对应的内容.

    之后再将内容通过requests库进行发送,无论使用get 还是post方式,服务端都可以正常的接收到日志

    {'log': [b'[2020-09-23 11:39:45] [DEBUG] xe4xbbx8axe5xa4xa9xe5xa4xa9xe6xb0x94xe4xb8x8dxe9x94x99']}

    将bytes类型转一下就得到了 [2020-09-23 11:43:50] [DEBUG] 今天天气不错

    三、异步的发送远程日志

    现在我们考虑一个问题,当日志发送到远程服务器过程中,如果远程服务器处理的很慢,会耗费一定的时间,那么这时记录日志就会都变慢

    修改服务器日志处理类,让其停顿5秒钟,模拟长时间的处理流程


    此时我们再打印上面的日志


    得到的输出为


    我们注意到,它们的时间间隔也是5秒。

    那么现在问题来了,原本只是一个记录日志,现在却成了拖累整个脚本的累赘,所以我们需要异步的来处理远程写日志。

    3.1 使用多线程处理

    首先想的是应该是用多线程来执行发送日志方法


    这种方法是可以达到不阻塞主目的,但是每打印一条日志就需要开启一个线程,也是挺浪费资源的。我们也可以使用线程池来处理

    3.2 使用线程池处理

    python 的 concurrent.futures 中有ThreadPoolExecutor, ProcessPoolExecutor类,是线程池和进程池,就是在初始化的时候先定义几个线程,之后让这些线程来处理相应的函数,这样不用每次都需要新创建线程

    线程池的基本使用


    如果线程池中有n个线程,当提交的task数量大于n时,则多余的task将放到队列中.

    再次修改上面的emit函数


    这里为什么要只初始化一个只有一个线程的线程池? 因为这样的话可以保证先进队列里的日志会先被发送,如果池子中有多个线程,则不一定保证顺序了。

    3.3 使用异步aiohttp库来发送请求

    上面的CustomHandler类中的emit方法使用的是requests.post来发送日志,这个requests本身是阻塞运行的,也正上由于它的存在,才使得脚本卡了很长时间,所们我们可以将阻塞运行的requests库替换为异步的aiohttp来执行get和post方法, 重写一个CustomHandler中的emit方法


    这时代码执行崩溃了


    服务端也没有收到发送日志的请求。

    究其原因是由于emit方法中使用 async with session.post 函数,它需要在一个使用async 修饰的函数里执行,所以修改emit函数,使用async来修饰,这里emit函数变成了异步的函数, 返回的是一个 coroutine 对象,要想执行coroutine对象,需要使用await, 但是脚本里却没有在哪里调用 await emit() ,所以崩溃信息中显示 coroutine 'CustomHandler.emit' was never awaited .

    既然emit方法返回的是一个coroutine对象,那么我们将它放一个loop中执行


    执行依然报错


    意思是需要的是一个coroutine,但是传进来的对象不是。

    这似乎就没有办法了,想要使用异步库来发送,但是却没有可以调用await的地方.

    解决办法是有的,我们使用 asyncio.get_event_loop() 获取一个事件循环对象, 我们可以在这个对象上注册很多协程对象,这样当执行事件循环的时候,就是去执行注册在该事件循环上的协程, 我们通过一个小例子来看一下


    我们使用 loop = asyncio.get_event_loop() 创建了一个事件循环对象loop, 并且在loop上创建了两个task, 并且给task1添加了一个回调函数,在task1它执行结束以后,将loop停掉.

    注意看上面的代码,我们并没有在某处使用await来执行协程,而是通过将协程注册到某个事件循环对象上,然后调用该循环的 run_forever() 函数,从而使该循环上的协程对象得以正常的执行.

    上面得到的输出为


    可以看到,使用事件循环对象创建的task,在该循环执行run_forever() 以后就可以执行了.

    如果不执行 loop.run_forever() 函数,则注册在它上面的协程也不会执行


    上面的代码将loop.run_forever() 注释掉,换成time.sleep(5) 停5秒, 这时脚本不会有任何输出,在停了5秒以后就中止了.

    回到之前的日志发送远程服务器的代码,我们可以使用aiohttp封装一个发送数据的函数, 然后在emit中将这个函数注册到全局的事件循环对象loop中,最后再执行loop.run_forever() .



    这时脚本就可以正常的异步执行了.

    loop.create_task(self.submit(msg)) 也可以使用 asyncio.ensure_future(self.submit(msg), loop=loop) 来代替,目的都是将协程对象注册到事件循环中.

    但这种方式有一点要注意,loop.run_forever() 将会一直阻塞,所以需要有个地方调用 loop.stop() 方法. 可以注册到某个task的回调中.

    此文转载文,著作权归作者所有,如有侵权联系小编删除!

    原文地址:https://www.tuicool.com/articles/FjY3iez

    需要源代码或者想了解更多内容(点击这里下载)

  • 相关阅读:
    K8S 本地 配置 Local PV 实践
    Filebeat 收集K8S 日志,生产环境实践
    K8S 上部署 Redis-cluster 三主三从 集群
    Kubernetes 用户流量接入方案
    给Nginx配置日志格式和调整日期格式
    唇亡齿寒,运维与安全
    Nginx记录用户请求Header到access log
    Kubernetes中利用Kubectl set 让Deployment更新镜像
    故障管理:故障定级和定责
    使用 Elastic 技术栈构建 Kubernetes全栈监控
  • 原文地址:https://www.cnblogs.com/wxys/p/13750442.html
Copyright © 2020-2023  润新知