这周主要任务是扩容有关下载和播放的服务,阿里云3台,腾讯云8台。
由于之前该服务不是由我部署,而且是非容器化的传统部署方式,因此部署时比较谨慎,各个环境都需要与原先保持一致。后续服务也按预期正常运行了。趁这次机会也总结一下各个流程。
第一:基础设置的一致
配置,系统版本,内核参数,路由等等,通常这些由基础运维负责。
第二:善用salt/ansible之类的批量运维工具
我是使用salt部署,严格按照顺序执行。
第三:日志割切
防止服务器磁盘跑满。
第四:部署好各类监控
基础监控,prometheus,以及钉钉的通知,同时部署好服务高可用脚本。