cmdb客户端代码完善2

1.面试提问

2.完善采集端代码

3.唯一标识的问题

4.API的验证

1.面试会问到的问题：

#   1. 为啥要做CMDB？
#     - 实现运维自动化， 而CMDB是实现运维自动化的基石
#     - 之前公司统计资产的时候，使用Excel来统计，  为了年底资产审计方便，因此需要做CMDB
#
#  2. CMDB的架构以及你们公司采用的架构是啥？
#     Agent
#     ssh类
#     saltstck
#
#
#  3. 你做这个项目的时候， 主要负责哪一块？
#
#     - 数据的采集和发送
#
#        a.数据的采集：
#           - 高级的配置文件 （整合了自定制的配置文件和全局的配置文件）
#           - 高内聚低耦合的思想， 实现了插件采集的可插拔式
#
#           参考了django的配置和django的中间件
#
#     - 数据的二次清洗和加密
#
#
#     - 数据的展示（图表部分）
#
#  4. 遇到了那些问题？ 怎么解决的？
#
#     - linux的命令不熟   -----> 找运维 或者 百度
#     - 沟通问题， 和产品经理的沟通
#     - 唯一标识的问题

#     几个人做的？做了多长时间？
#
#     刚开始：
#
#        1-2人做的客户端采集， 1人做API验证和数据清洗  ，1人做的数据的展示 （layui的 xadmin）
#
#        1-2个月的时间， 快速上线
#
#
#     后面：
#
#        1-2人做的客户端采集（代码的迭代）， 1人做API验证和数据清洗，也负责用drf写接口 1个前端使用vue展示数据 （前后端分离的）
#
#        完善 1个月左右， 后面的时间就是不断的迭代， 维护， 完善整个项目的功能

5. 此项目花了多长时间？ 几个人完成的？
   
   3-4个人左右， 花的时间大概是 4个月：
         
      1个月 ： 调研， 排期， 开会选择方案
      1-2个月 ：项目快速上线 （不需要代码写的多么的好， 快快快）  （2-3人   前后端不分离的项目）
      1-2个月 ：项目的完善 （代码的迭代，扩展性要高， 中间加一些产品经理提出的需求） （前后端分离的项目）

2.完善采集端代码

已经完成了采集数据，现在是要发送数据，一开始想到的是在启动文件中直接写代码

from lib.config.config import settings
import json
import requests

from src.plugins import PluginsManger

if __name__ == '__main__':
    if settings.MODE == 'agent':
        res = PluginsManger().execute()
        requests.post('http://127.0.0.1:8000', data=json.dumps(res))
    else:
        res = PluginsManger().execute()

而逻辑代码是不能写在启动文件中的，所以在src创一个文件client.py

from lib.config.config import settings
import json
import requests

from src.plugins import PluginsManger


 if settings.MODE == 'agent':
    res = PluginsManger().execute()
        requests.post('http://127.0.0.1:8000', data=json.dumps(res))
 else:
    res = PluginsManger().execute()

但是以上又是面向过程的思想，所以要面向对象的思想

服务端的IP地址写在custom_settings。py里

import os

BASEDIR = os.path.dirname(os.path.dirname(os.path.abspath(__file__)))



MODE = 'agent'


SSH_USERNAME = 'root'

SSH_PASSWORD = '123'

SHH_PORT = 22


### APIurl地址
API_URL = 'http://127.0.0.1:8000/getInfo/'


DEBUG = True


PLUGINS_DICT = {
    'basic':'src.plugins.basic.Basic',
    'board': 'src.plugins.board.Board',
    'disk': 'src.plugins.disk.Disk',
    'memory': 'src.plugins.memory.Memory',
    'cpu':'src.plugins.cpu.Cpu',
    'nic':'src.plugins.nic.Nic'
}

client.py（先对agent采集模式进行测试）

from src.plugins import PluginsManger

import json

import requests

from lib.config.config import settings

class Agent(object):

    #收集数据并发送
    def collectAndPost(self):
        res = PluginsManger().execute()
        for k,v in res.items():
            print(k,v)
        requests.post(settings.API_URL, data=json.dumps(res))

start.py

from src.client import Agent

if __name__ == '__main__':
    Agent().collectAndPost()

起一个django (我的是2.0版本) 服务端，应用项目是api

from django.contrib import admin
from django.urls import path,re_path

from api import views

urlpatterns = [
    path('admin/', admin.site.urls),
    re_path('getInfo/', views.getInfo),
]

将settings中drf注掉

#      a.   request.body中永远都是有数据的
#
#
#        当 Content-Type: application/x-www-form-urlencoded，   request.POST中才会有值
#        当 Content-Type':"application/json"  这是采集端发送数据的头形式

views.py

from django.shortcuts import render,HttpResponse

# Create your views here.


def getInfo(request):


    print(request.body)

    return  HttpResponse('ok')

shh, salt是通过服务端向db获取hostname主机名数据的，然后再朝客户端shh,salt返回数据库获取到的主机名列表

autoserver服务端

views.py

from django.shortcuts import render,HttpResponse

# Create your views here.


def getInfo(request):
    if request.method == 'POST':   发送采集数据的话就是post请求
        print(request.body)
        return  HttpResponse('ok')
    else:
         ### 连接数据库获取主机名列表
        return ['c1.com', 'c2.com']  sshsalt发送get请求来获取主机名，返回主机名列表

#      python2:
#
#        进程池       有
#        线程池       无
#
#     python3:
#
#        进程池       有
#        线程池       有

使用线程池的方式采集数据，因为可以提高效率，比如一次采集10台服务器的数据

先进行测试
s6.py

#### 线程池

import time
from concurrent.futures import ThreadPoolExecutor



def run(i):
    time.sleep(2)
    print(i)


p = ThreadPoolExecutor(10)

for i in range(100):
    p.submit(run, i)

client.py

from src.plugins import PluginsManger

import json

import requests

from lib.config.config import settings


class Base():    专门用来进行发送数据采集到的数据
    def post_data(self, server_info):
        requests.post(settings.API_URL, json=server_info)


class Agent(Base):  继承base

    #收集数据并发送
    def collectAndPost(self):
        server_info = PluginsManger().execute()
        for k,v in server_info.items():
            print(k,v)
        self.post_data(server_info)  调用函数


class SHHSalt(Base):  继承base
    def get_hostname(self):    发送get请求获取主机名列表
        hostname = requests.get(settings.API_URL)
        return ['c1.com', 'c2.com']    先自定义进行测试一下



    def run(self, hostname):
        server_info = PluginsManger(hostname).execute()
        self.post_data(server_info)


    def collectAndPost(self):

        hostnames = self.get_hostname()

        #单线程执行，循环速度比较慢
        # for hostname in hostnames:
        #
        #     server_info = PluginsManger().execute()
        #     self.post_data(server_info)




        from concurrent.futures import ThreadPoolExecutor

        p = ThreadPoolExecutor(10)
        for hostname in hostnames:
            p.submit(self.run, hostname)

在src新建script.py用于判断mode,再调用不同采集方式的发送数据的方式

script.py

from src.client import Agent

from src.client import SHHSalt

from lib.config.config import settings

def run():
    if settings.MODE == 'agent':
        obj = Agent()
    else:
        obj = SHHSalt()


    obj.collectAndPost()

start.py

from src.script import run
if __name__ == '__main__':
    run()

3.唯一标识码的问题

#      目标：将变更的信息通过程序的比对， 记录下来
#
#      第一天的时候：
#
#        采集数据：
#           {'status': 10000, 'data': {'os_platform': 'linux', 'os_version': 'CentOS release 6.6 (Final)
Kernel 
 on an \m', 'hostname': 'c2.com'}}
#
#        API清洗的时候:
#           因为是第一次， 数据库中并没有采集的数据
#
#        数据入库：
#
#           server：1000条
#              id    sn        os_platform   os_version    disk_size
#              1     dsadsa       linux        CentOS        250G
#              ........
#
#     第二天的时候：
#
#        采集数据：
#
#           {'status': 10000, 'data': {'os_platform': 'linux', 'os_version': 'CentOS release 6.6 (Final)
Kernel 
 on an \m', 'hostname': 'c2.com'}}
#
#           {'status': 10000, 'data': {'0': {'slot': '0', 'pd_type': 'SAS', 'capacity': '300G', 'model': 'SEAGATE ST300MM0006     LS08S0K2B5NV'}, '1': {'slot': '1', 'pd_type': 'SAS', 'capacity': '279.396', 'model': 'SEAGATE ST300MM0006     LS08S0K2B5AH'}, '2': {'slot': '2', 'pd_type': 'SATA', 'capacity': '476.939', 'model': 'S1SZNSAFA01085L     Samsung SSD 850 PRO 512GB               EXM01B6Q'}, '3': {'slot': '3', 'pd_type': 'SATA', 'capacity': '476.939', 'model': 'S1AXNSAF912433K     Samsung SSD 840 PRO Series              DXM06B0Q'}, '4': {'slot': '4', 'pd_type': 'SATA', 'capacity': '476.939', 'model': 'S1AXNSAF303909M     Samsung SSD 840 PRO Series              DXM05B0Q'}, '5': {'slot': '5', 'pd_type': 'SATA', 'capacity': '476.939', 'model': 'S1AXNSAFB00549A     Samsung SSD 840 PRO Series              DXM06B0Q'}}}
#
#        API清洗的时候:
#
#           应该在新的POST数据中选取一个 唯一 的字段， 然后到数据库中作为where条件， 获取到对应的数据
#
#        问题是  应该选取谁？
#           选取的是 sn 序列号（mac地址） 作为唯一的字段
#
#        用sn遇到的问题：
#           虚拟机和实体机共用一个sn， 导致数据不准确
#
#        解决的方案：
#
#           a. 如果公司不需要采集虚拟机的信息， 使用sn没有问题
#           b. 采用 hostname 作为唯一标识
#
#              - 是允许开发可以临时修改主机名的
#
#              引入规则/原则， 流程：
#
#              第一天：
#                 1. 给这些服务器分配唯一的主机名
#
#                 2. 将分配好的主机名录入到后台管理的DBserver表中
#
#                 3. 将采集的client客户端代码， 运行一次，
#                    然后将得到的主机名地址保存到一个文件中
#
#              第二天：
#
#
#                 hostname = server_info['basic']['data']['hostname']  ### c10000.com
#                 res = open(os.path.join(settings.BASEDIR, 'config/cert'), 'r', encoding='utf-8').read()
#
#                 if not res.strip():
#                    #### 第一次采集, 将采集的hostname写入到一个文件中
#                    with open(os.path.join(settings.BASEDIR, 'config/cert'), 'w', encoding='utf-8') as fp:
#                       fp.write(hostname)
#                 else:
#                    #### 第二次采集的时候， 永远以第一次文件中保存的主机名为标准
#                    server_info['basic']['data']['hostname'] = res
#
#

client.py 只有agent才用上

from src.plugins import PluginsManger

import json

import os

import requests

from lib.config.config import settings


class Base():
    def post_data(self, server_info):
        requests.post(settings.API_URL, json=server_info)


class Agent(Base):

    #收集数据并发送
    def collectAndPost(self):
        server_info = PluginsManger().execute()

        hostname = server_info['basic']['data']['hostname']

        res = open(os.path.join(settings.BASEDIR,'conf/cert'), 'r', encoding='utf-8').read()

        if not res.strip():
            # 第一次擦剂，将采集的hostname写入到一个文件中
            with open(os.path.join(settings.BASEDIR,'confcert'), 'w', encoding='utf-8')as fp:
                fp.write(hostname)
        else:
            # 第二次采集的时候， 永远以第一次文件中保存的主机名为标准
            server_info['basic']['data']['hostname'] = res

        # for k,v in server_info.items():
        #     print(k,v)
        self.post_data(server_info)


class SHHSalt(Base):
    def get_hostname(self):
        hostname = requests.get(settings.API_URL)
        return ['c1.com', 'c2.com']



    def run(self, hostname):
        server_info = PluginsManger(hostname).execute()
        self.post_data(server_info)


    def collectAndPost(self):

        hostnames = self.get_hostname()

        #单线程执行，循环速度比较慢
        # for hostname in hostnames:
        #
        #     server_info = PluginsManger().execute()
        #     self.post_data(server_info)




        from concurrent.futures import ThreadPoolExecutor

        p = ThreadPoolExecutor(10)
        for hostname in hostnames:
            p.submit(self.run, hostname)

3.API验证

客户端test文件夹中新建测试文件先进行测试

test.py

#原始的方式请求数据
import requests


res = requests.get('http://127.0.0.1:8000/getInfo/')

print(res.text)

服务端autoserver进行接受，返回数据

views.py

from django.shortcuts import render,HttpResponse

# Create your views here.


def getInfo(request):
    if request.method == 'POST':
        print(request.body)
        return  HttpResponse('ok')
    else:
         ### 连接数据库获取主机名列表
        # return ['c1.com', 'c2.com']  #如果要返回列表或者字典必须要用jsonresponse发送不然会报错return HttpResponse('非常重要的数据')

客户端发送token

test.py

# 第一种方式
import requests
token = "dangerfad"

# 切记，进行token验证的时候一定是将token写在http的请求头中
requests.get('http://127.0.0.1:8000/getInfo/', headers={"token":token})

服务端views.py

from django.shortcuts import render,HttpResponse

# Create your views here.


def getInfo(request):
    if request.method == 'POST':
        print(request.body)
        return  HttpResponse('ok')
    else:
         ### 连接数据库获取主机名列表
        # return ['c1.com', 'c2.com']

         print(request.META)  #可以获取到HTTP_TOKEN也就是我发过来的token

         return HttpResponse('非常重要的数据')

第一种方式完整版

client.py

# 第一种方式
import requests
token = "dangerfad"

# 切记，进行token验证的时候一定是将token写在http的请求头中
res = requests.get('http://127.0.0.1:8000/getInfo/', headers={"token":token})
print(res.text)

服务端views.py

from django.shortcuts import render,HttpResponse

# Create your views here.


def getInfo(request):
    if request.method == 'POST':
        print(request.body)
        return  HttpResponse('ok')
    else:
         ### 连接数据库获取主机名列表
        # return ['c1.com', 'c2.com']

         token = request.META
         server_token = "dangerfad"
         if token != server_token:
             return HttpResponse("token值是错误的")
         return HttpResponse('非常重要的数据')

设置超时时间，失效token不能再访问

服务端views.py

from django.shortcuts import render,HttpResponse

# Create your views here.


def getInfo(request):
    if request.method == 'POST':
        print(request.body)
        return  HttpResponse('ok')
    else:
         ### 连接数据库获取主机名列表
        # return ['c1.com', 'c2.com']

         token = request.META.get('HTTP_TOKEN')
         print(token)
         client_md5_token,client_time = token.split('|')

         client_time = float(client_time)
         import time
         server_time = time.time()

         if server_time -client_time > 5:
             return HttpResponse('第一关【超时了】')


         server_token = "dangerfad"

         tmp = "%s|%s" % (server_token, client_time)

         import hashlib
         m = hashlib.md5()
         m.update(bytes(tmp, encoding='utf8'))
         server_md5_token = m.hexdigest()


         if server_md5_token !=client_md5_token:
             return HttpResponse("第二关数据被修改了")

         return HttpResponse('非常重要的数据')

客户端test.py

#第二种方式
import requests

token = "dangerfad"
import time
client_time = time.time()
tmp = "%s|%s"%(token, client_time)



import hashlib
m = hashlib.md5()
m.update(bytes(tmp, encoding='utf8'))
res = m.hexdigest()
print(res)

client_md5_token  = '%s|%s' %(res, client_time)


data = requests.get('http://127.0.0.1:8000/getInfo/', headers = {"token":client_md5_token})

print(data)

以上还存在一些问题：

client向server在五秒之内发送请求过了一关，紧接着将token发送给服务端，服务端拿到token之后进行解析认证，这是正常用户。

如果说一个黑客，在2s访问完了服务端，然后生成token

,迅速在第3s的时候截取你刚刚访问的token,然后拿到token之后不做任何处理，然后再向服务端发送请求，可以通过验证。

解决：客户端的token只能用一次就好了，在服务端只能让你访问一次token,将客户端的token存起来，如果存在数据库或者文件里面，每天如果频繁去发送的话，这个文件或数据库记录越来越多，然后之前的client_md5_token过期了就没用，所以要存在一个定期清理一些我们不需要的数据的介质里面，存在redis里面（听下回详解）

# 第一次来的时候，先去redis判断client_md5_token是否在redis中，如果在就代表已经访问过了，直接return回去
#如果不在redis第一次访问就添加到redis中并且设置过期时间：5s



总结：

1. 完善了采集端的代码：
   
   - 完善了发送  （agent 和 sshsalt的发送）
      
      class BASE():
         def post_data():
            requests.post(API_URL)
            
      class Agent(Base):
         
         def collectAndPost():
            1. 收集服务器的信息
            2. self.post_data()
            
      class SSHSalt(Base):
         def collectAndPost():
            1. 获取服务器主机名列表,收集服务器的信息
            2. self.post_data() 
   
   
   
   - 改进了sshsalt的登录并发执行：
      
      python2:
         线程池    无
         进程池    有
         
      python3:
         线程池    有
         进程池    有
      

2. 唯一标识的问题：
   
   之前的方法：
      sn
   改进的方法：
      hostname
      遵守一些规则：
         1. 给这些服务器分配唯一的主机名

         2. 将分配好的主机名录入到后台管理的DBserver表中

         3. 将采集的client客户端代码， 运行一次，
            然后将得到的主机名保存到一个文件中
   
3. API验证：
   
   第一关：
      验证时间是否超时
      
      server_time - client_time > 3
      
   第二关：
      
      对数据由原来的的明文 加密成现在的密文 
      
      md5() : 不可逆的算法         sha256   sha128  
      
   第三关：
      只允许 client_md5_token 只能用一次
      
      redis：
         - 速度快
         - 设置超时时间   10S
      
   JWT

相关阅读:
字典或者数组与JSON串之间的转换
 银联支付支付代码
 iOS 一个新方法：- (void)makeObjectsPerformSelector:(SEL)aSelector；
iOS 直接使用16进制颜色
 iOS 添加view的分类(更加方便的设置view的位置)
iOS 中UITableView的深理解
 Swift 中调试状态下打印日志
 手把手教React Native实战开发视频教程【更新到40集啦。。。】
React Native 开发
 React-Native学习指南
原文地址：https://www.cnblogs.com/huangxuanya/p/11626920.html