IT运维,指的是对已经搭建好的网络,软件,硬件进行维护.运维领域也是有细分的,有硬件运维和软件运维
- 硬件运维主要包括对基础设施的运维,比如机房的设备,主机的硬盘,内存这些物理设备的维护
- 软件运维主要包括系统运维和应用运维,系统运维主要包括对OS,数据库,中间件的监控和维护,这些系统介于设备和应用之间,应用运维主要是对线上业务系统的运维
我们现在讨论的主要是软件运维的自动化,包括系统运维和应用运维的自动化
自动化运维平台的特性
运维自动化最重要的就是标准化一切
1 os的选择统一化,同一个项目使用同样的OS系统部署器所需要的各类软件 2 软件安装标准化,例如JAVA虚拟机,php,nginx,mysql等各类应用需要的软件版本,安装目录,数据存放目录,日志存放目录等 3 应用包目录同意标准化,即应用命名标准化 4 启动脚本统一目录和名字,需要变化的部分通过参数传递 5 配置文件标准化,需要变化的部分通过参数传递 6 日志输出,日志目录,日志名字标准化 7 应用生成的数据实现统一的目录存放 8 主机/虚拟机命名标准化.虚拟机管理使用标准化模板 9 使用docker比较容易实现软件运行环境的标准化
资产管理系统(CMDB)
CMDB是所有运维工具的数据基础
CMDB包含的功能
1 用户管理,记录测试,开发,运维人员的用户表 2 业务线管理,需要记录业务的详情 3 项目管理,指定此项目用属于哪条业务线,以及项目详情 4 应用管理,指定此应用的开发人员,属于哪个项目,和代码地址,部署目录,部署集群,依赖的应用,软件等信息 5 主机管理,包括云主机,物理机,主机属于哪个集群,运行着哪些软件,主机管理员,连接哪些网络设备,云主机的资源池,存储等相关信息 6 主机变更管理,主机的一些信息变更,例如管理员,所属集群等信息更改,连接的网络变更等 7 网络设备管理,主要记录网络设备的详细信息,及网络设备连接的上级设备 8 IP管理,IP属于哪个主机,哪个网段, 是否被占用等
CMDB实现的四种方式
1 Agent实现方式
可以将服务器上面的Agent程序作定时任务,定时的将资产信息提交到API录入数据库
流程图在这
本质
其本质就是在每一台服务器上执行subprocess.getoutput(),将每台服务器的执行结果返回到主机API上,主机API接收到这些数据库后保存到数据库中,最终通过web方式显示给用户
优点:速度快
缺点:需要在每一台服务器上部署Agent程序
2 ssh实现方式(基于paramiko模块)
中控机通过paramiko模块,登录到各个服务器上,执行命令获取各个服务器上面的信息
优点:无Agent
缺点:速度慢
在服务器较少的情况下课应用次方法
mport paramiko # 创建SSH对象 ssh = paramiko.SSHClient() # 允许连接不在know_hosts文件中的主机 ssh.set_missing_host_key_policy(paramiko.AutoAddPolicy()) # 连接服务器 ssh.connect(hostname='c1.salt.com', port=22, username='root', password='123') # 执行命令 stdin, stdout, stderr = ssh.exec_command('df') # 获取命令结果 result = stdout.read() # 关闭连接 ssh.close()
3 saltstack方式
中控机发送命令给服务器执行,服务器将结果放入另一个队列中,中控机将服务信息发送到API进而录入数据库
优点:速度快,开发成本低
缺点:依赖第三方工具
salstack的安装和配置
1.安装和配置
2.授权
1
2
3
4
5
6
|
"""
salt-key -L # 查看已授权和未授权的slave
salt-key -a salve_id # 接受指定id的salve
salt-key -r salve_id # 拒绝指定id的salve
salt-key -d salve_id # 删除指定id的salve
"""
|
3.执行命令
在master服务器上对salve进行远程操作
1
|
salt 'c2.salt.com' cmd.run 'ifconfig'
|
基于API的方式
1
2
3
|
import salt.client
local = salt.client.LocalClient()
result = local.cmd('c2.salt.com', 'cmd.run', ['ifconfig'])
|
参考安装:
http://www.cnblogs.com/tim1blog/p/9987313.html
https://www.jianshu.com/p/84de3e012753
- Puppet(ruby语言开发)(了解)
每隔30分钟,通过RPC消息队列将执行的结果返回给用户