• cmdb实现的四种方式


    1. IT运维的分类
    2. 传统运维痛点
    3. 自动化运维平台的特性
    4. 资产管理系统(CMDB)
      1. CMDB包含的功能
      2. CMDB实现的四种方式

    IT运维的分类

    IT运维,指的是对已经搭建好的网络,软件,硬件进行维护。运维领域也是细分的,有硬件运维和软件运维

    • 硬件运维主要包括对基础设施的运维,比如机房的设备,主机的硬盘,内存这些物理设备的维护
    • 软件运维主要包括系统运维和应用运维,系统运维主要包括对OS,数据库,中间件的监控和维护,这些系统介于设备和应用之间,应用运维主要是对线上业务系统的运维

    这里讨论的主要是软件运维的自动化,包括系统运维和应用运维的自动化

    传统运维痛点
    • 日常工作繁琐

    日常运维工作是比较繁琐的,研发同学会经常需要到服务器上查日志,重启应用,或者是说今天上线某个产品,需要部署下环境。这些琐事是传统运维的大部分工作

    • 应用运行环境不统一

    在部署某应用后,应用不能访问,就会听到开发人员说,在我的环境运行很好的,怎么部署到测试环境后,就不能用了,因为各类环境的类库不统一
    还有一种极端情况,运维人员习惯不同,可能凭自己的习惯来安装部署软件,每种服务器上运行软件的目录不统一

    • 运维及部署效率低下

      想想运维人员需要登陆到服务器上执行命令,部署程序,不仅效率很低,并且非常容易出现人为的错误,一旦手工出错,追溯问题将会非常不容易

    • 无用报警信息过多

      经常会收到很多报警信息,多数是无用的报警信息,造成运维人员经常屏蔽报警信
      另外如果应用的访问速度出了问题,总是需要从系统、网络、应用、数据库等一步步的查找原因

    • 资产管理和应用管理混乱

      资产管理,服务管理经常记录在excel、文本文件或者wiki中,不便于管理,老员工因为比较熟,不注重这些文档的维护,只有靠每次有新员工入职时,资产才能够更正一次

    自动化运维平台的特性

    针对传统运维的痛点,我们可以知道自动化运维需要支持哪些功能

    运维自动化最重要的就是标准化一切

    • OS的选择统一化,同一个项目使用同样的OS系统部署其所需要的各类软件
    • 软件安装标准化,例如JAVA虚拟机,php,nginx,mysql等各类应用需要的软件版本,安装目录,数据存放目录,日志存放目录等
    • 应用包目录统一标准化,及应用命名标准化
    • 启动脚本统一目录和名字,需要变化的部分通过参数传递
    • 配置文件标准化,需要变化的部分通过参数传递
    • 日志输出,日志目录,日志名字标准化
    • 应用生成的数据要实现统一的目录存放
    • 主机/虚拟机命名标准化,虚拟机管理使用标准化模板
    • 使用docker比较容易实现软件运行环境的标准化
    资产管理系统(CMDB)

    CMDB是所有运维工具的数据基础

    CMDB包含的功能
    1. 用户管理,记录测试,开发,运维人员的用户表
    2. 业务线管理,需要记录业务的详情
    3. 项目管理,指定此项目用属于哪条业务线,以及项目详情
    4. 应用管理,指定此应用的开发人员,属于哪个项目,和代码地址,部署目录,部署集群,依赖的应用,软件等信息
    5. 主机管理,包括云主机,物理机,主机属于哪个集群,运行着哪些软件,主机管理员,连接哪些网络设备,云主机的资源池,存储等相关信息
    6. 主机变更管理,主机的一些信息变更,例如管理员,所属集群等信息更改,连接的网络变更等
    7. 网络设备管理,主要记录网络设备的详细信息,及网络设备连接的上级设备
    8. IP管理,IP属于哪个主机,哪个网段, 是否被占用等
    CMDB实现的四种方式
    • Agent实现方式

    Agent方式,可以将服务器上面的Agent程序作定时任务,定时将资产信息提交到指定API录入数据库

    agent方式.png

    其本质上就是在各个服务器上执行subprocess.getoutput()命令,然后将每台机器上执行的结果,返回给主机API,然后主机API收到这些数据之后,放入到数据库中,最终通过web界面展现给用户

    优点:速度快
    缺点:需要为每台服务器部署一个Agent程序


    • ssh实现方式 (基于Paramiko模块)

    中控机通过Paramiko(py模块)登录到各个服务器上,然后执行命令的方式去获取各个服务器上的信息

    paramiko方式.png

    优点:无Agent 缺点:速度慢

    如果在服务器较少的情况下,可应用此方法

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    import paramiko
     
    # 创建SSH对象
    ssh = paramiko.SSHClient()
    # 允许连接不在know_hosts文件中的主机
    ssh.set_missing_host_key_policy(paramiko.AutoAddPolicy())
    # 连接服务器
    ssh.connect(hostname='c1.salt.com', port=22, username='root', password='123')
     
    # 执行命令
    stdin, stdout, stderr = ssh.exec_command('df')
    # 获取命令结果
    result = stdout.read()
     
    # 关闭连接
    ssh.close()

    • saltstack方式

    saltstack方式.png

    此方案本质上和第二种方案大致是差不多的流程,中控机发送命令给服务器执行。服务器将结果放入另一个队列中,中控机获取将服务信息发送到API进而录入数据库。

    优点:快,开发成本低 缺点:依赖于第三方工具

    salstack的安装和配置

    1.安装和配置

    点击显/隐
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    master端:
    """
    1. 安装salt-master
    yum install salt-master
    2. 修改配置文件:/etc/salt/master
    interface: 0.0.0.0 # 表示Master的IP
    3. 启动
    service salt-master start
    """
     
    slave端:
    """
    1. 安装salt-minion
    yum install salt-minion
     
    2. 修改配置文件 /etc/salt/minion
    master: 10.211.55.4 # master的地址
    master:
    - 10.211.55.4
    - 10.211.55.5
    random_master: True
     
    id: c2.salt.com # 客户端在salt-master中显示的唯一ID
    3. 启动
    service salt-minion start
    """

    2.授权

    1
    2
    3
    4
    5
    6
    """
    salt-key -L # 查看已授权和未授权的slave
    salt-key -a salve_id # 接受指定id的salve
    salt-key -r salve_id # 拒绝指定id的salve
    salt-key -d salve_id # 删除指定id的salve
    """

    3.执行命令

    在master服务器上对salve进行远程操作

    1
    salt 'c2.salt.com' cmd.run 'ifconfig'

    基于API的方式

    1
    2
    3
    import salt.client
    local = salt.client.LocalClient()
    result = local.cmd('c2.salt.com', 'cmd.run', ['ifconfig'])

    参考安装:
    http://www.cnblogs.com/tim1blog/p/9987313.html
    https://www.jianshu.com/p/84de3e012753

    • Puppet(ruby语言开发)(了解)

    每隔30分钟,通过RPC消息队列将执行的结果返回给用户

    AES介绍

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    from Crypto.Cipher import AES
    def encrypt(message):
    key = b'dfdsdfsasdfdsdfs'
    cipher = AES.new(key, AES.MODE_CBC, key)
    ba_data = bytearray(message,encoding='utf-8')
    v1 = len(ba_data)
    v2 = v1 % 16
    if v2 == 0:
    v3 = 16
    else:
    v3 = 16 - v2
    for i in range(v3):
    ba_data.append(v3)
    final_data = ba_data.decode('utf-8')
    msg = cipher.encrypt(final_data) # 要加密的字符串,必须是16个字节或16个字节的倍数
    return msg
     
    # ############################## 解密 ##############################
    def decrypt(msg):
    from Crypto.Cipher import AES
    key = b'dfdsdfsasdfdsdfs'
    cipher = AES.new(key, AES.MODE_CBC, key)
    result = cipher.decrypt(msg) # result = b'xe8xa6x81xe5x8axa0xe5xafx86xe5x8axa0xe5xafx86xe5x8axa0sdfsd '
    data = result[0:-result[-1]]
    return str(data,encoding='utf-8')
     
    msg = encrypt('你好好爱好爱好sss')
     
    res = decrypt(msg)
     
    print(res)

    字符串格式化函数

    1
    2
    3
    4
    5
    String.prototype.format = function(args){
    return this.replace(/{(w+)}/g, function(s, i){
    return args[i];
    });
    };



  • 相关阅读:
    Spark Standalone集群搭建
    虚拟机Ubuntu磁盘扩容
    Caused by: org.apache.hadoop.hbase.ipc.RemoteWithExtrasException(org.apache.hadoop.hbase.ipc.ServerNotRunningYetException): org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not runn
    centos脚本编写
    centos中的shell编程
    从零开始部署hadood分布式数据平台!
    从0开始部署hadoop HA集群,使用zk实现自动容灾
    zookeeper动物园管理员学习笔记
    hive UDF
    创建视图
  • 原文地址:https://www.cnblogs.com/tangda/p/11116072.html
Copyright © 2020-2023  润新知