• OpenStack 创建虚机过程简要汇总


    1. 总体流程

    翻译自原文(英文):https://ilearnstack.com/2013/04/26/request-flow-for-provisioning-instance-in-openstack/

    创建虚机的请求流如下:

    1. Dashboard 或者 CLI 获取用户的登录信息,调用 Keystone 的 REST API 去做用户身份验证。
    2. Keystone 对用户登录信息进行校验,然后产生验证token并发回。它会被用于后续 REST 调用请求。
    3. Dashboard 或者 CLI 将创建虚机的 REST请求中的‘launch instance’ 或‘nova-boot’ 部分进行转换,然后调用 nova-api 的 REST 接口。
    4. nova-api 接到请求,向 keystone 发送 auth-token 校验和权限认证请求。
    5. Keystone 校验 token,并将 auth headers 发回,它包括了 roles 和 permissions。
    6. nova-api 和 nova-database 进行交互。
    7. nova-database 为新实例创建一个数据库条目。
    8. nova-api 向 nova-scheduler 发送  rpc.call 请求,期望它能通过附带的 host ID 获取到数据库条目。
    9. nova-scheduler 从 queue 中获取到请求。
    10. nova-scheduler 和 nova-database 交互,获取集群中计算节点的信息和状态。
    11. nova-scheuler 通过过滤(filtering)和称重(weighting)找到一个合适的计算节点(host)。
    12. nova-scheduler 向找到的那个host上的 nova-compute 发送 rpc.cast 请求去启动虚机。
    13. 目标 host 上的 nova-compute 从 queue 中获取到请求。
    14. nova-compute 向 nova-condutor 发送 rpc.call 请求去获取待创建虚机的信息比如 host ID 和 flavor 等。
    15. nova-conductor 从queue 中获取到请求。
    16. nova-conductor 和 nova-database 交互。
    17. nova-database 向 nova-conductor 返回虚机的信息。
    18. nova-conductor 向 nova-compute 发送 rpc.call,附带所请求的信息。图中应该是遗漏了一个步骤,就是 nova-compute 从queue 中获取返回的数据。
    19. nova-compute 调用 glance-api 的 REST API,传入 auth-token,去根据镜像 ID 获取镜像 URI,从镜像存储中下载(原文为upload)镜像。
    20. glance-api 向 keystone 校验 auth-token。
    21. nova-compute 获取 image 的元数据。
    22. nova-compute 调用 Neutron API ,传入 auth-token,去分配和配置网络,比如虚机的IP地址。
    23. neutron-server 通过 keystone 校验 auth-token。
    24. nova-compute 获得网络信息。
    25. nova-compute 调用 Cinder API,传入 auth-token,去将 volume 挂接到实例。
    26. cinder-api 通过 keystone 校验 auth-token。
    27. nova-compute 获得块存储信息。
    28. nova-compute 为 hypervisor driver 产生数据,并调用 Hypersior 执行请求(通过 libvirt 或者 api)。

    下表列出了每个步骤中实例的状态:

    Status Task Power state Steps
    Build scheduling None 3-12
    Build networking None 22-24
    Build block_device_mapping None 25-27
    Build spawing None 28
    Active none Running  

     2.  nova compute 接到创建虚机指令后开始创建虚机的代码流程分析 (第代码在 https://github.com/openstack/nova/blob/master/nova/compute/manager.py 中的 def _build_and_run_instance 函数中

    _build_resources // 准备网络和磁盘
        //Start building networks asynchronously for instance
        self._build_networks_for_instance //为 instance 准备网络资源,实际上是创建一个 neutron port
            macs = self.driver.macs_for_instance(instance) //分配mac地址。多绝大多数hypersivor,返回None,也就是不预先分配
            network_info =self._allocate_network //开始异步网络分配
                nwinfo = self.network_api.allocate_for_instance //Allocate network resources for the instance
                    _validate_requested_port_ids //校验 port ids
                    _validate_requested_network_ids //校验 network ids
                    _clean_security_groups //删除 default 安全组
                    _process_security_groups //Processes and validates requested security groups for allocation
                    _create_ports_for_instance //Create port for network_requests that don't have a port_id
                        _create_port_minimal //如果port 没有的话,则Attempts to create a port for the instance on the given network.
                            port_client.create_port //调用 port api 来创建 port,包括创建 port,分配MAC及IP地址,更新数据库
    _generate_mac //生成MAC地址
    _create_port_with_mac //创建 port
    //DHCP 相关操作:port 创建完成后会通知 neutron-dhcp-agent去执行port_create_end函数,它会将port的ip和mac信息加载到dnsmasq所需的配置文件中
    _allocate_ips_for_port //为 port 分配 IP,要么用户有指定,要么从subnets 中选择一个
    _allocate_specific_ip //如果指定了IP
    _generate_ip //如果没指定IP
    return requests_and_created_ports _update_ports_for_instance //为特殊case 更新 port _populate_neutron_extension_values _populate_pci_mac_address //只用于处理 SRIOV_PF _populate_mac_address _update_port port_client.update_port //将上述修改通过调用 port api 得以更新port _update_port_dns_name neutron.update_port(port_id, port_req_body) //将 port 的 dns_name 设置为 hostname nw_info = self.get_instance_nw_info _build_network_info_model //Return list of ordered VIFs attached to instance _gather_port_ids_and_networks //Return an instance's complete list of port_ids and networks ifaces = instance.get_network_info() return nw_info
    //Start building block device mappings for instance
    self._prep_block_device //处理挂接到虚机的磁盘,可能有多个,目标可能是 volume,snapshot 和 image。 当是 image 时,其实就是 boot from volume
    block_device_info = driver.get_block_device_info(instance, bdms) //Converts block device mappings for instance to driver format mapping = driver.block_device_info_get_mapping(block_device_info) return block_device_mapping driver_block_device.attach_block_devices //nova/virt/block_device.py _log_and_attach //写日志关于instance 将从哪里启动,可能从 volume,snapshot,image 上启动 bdm.attach //这里会调用 cinder api 去创建 volume,并且挂接到 nova compute host 上
    //为每个磁盘调用 _log_and_attach _block_device_info_to_legacy return block_device_info
    self.driver.spawn //调用 nova/virt/libvirt/driver.py 中的 spawn 函数,首先创建 image,然后创建domain disk_info = blockinfo.get_disk_info _create_configdrive _create_image //创建镜像
    fileutils.ensure_tree(libvirt_utils.get_instance_path(instance)) //在计算节点本地创建目录 /var/lib/nova/instances/${uuid}/
    _create_and_inject_local_root
    if not booted_from_volume //判断是否从 volume 启动
    backend = self.image_backend.by_name //根据配置的 image type 获取 image backend,现在支持 rbd(使用 rbd volume),lvm(使用 lvm volume),qcow2(使用本地文件),flat 和 Ploop 等几种。
    if backend.SUPPORTS_CLONE: //判断 backend 是否支持 clone
    backend.clone(context, disk_images['image_id']) //调用 backend 的 clone 方法
    RbdProxy().clone //RBD 的clone 方法,从 image 的 snapshot 上 clone
    else
    fetch_func = libvirt_utils.fetch_image //从 Glance 下载镜像
    _try_fetch_image_cache
    self._inject_data(backend, instance, injection_info) //处理数据注入
    else
    //对boot volume 不允许注入 _create_ephemeral
    libvirt_utils.create_image('raw', target, '%dG' % ephemeral_size)
    utils.execute('qemu-img', 'create', '-f', disk_format, path, size) _create_swap
    libvirt_utils.create_image('raw', target, '%dM' % swap_mb)
    nova.privsep.fs.unprivileged_mkfs('swap', target) xml = self._get_guest_xml //生成 domain xml 字符串
    conf = self._get_guest_config
    _get_guest_numa_config
    _get_guest_memory_backing_config
    _get_guest_config_meta
    _update_guest_cputune
    _cpu_config_to_vcpu_model
    _configure_guest_by_virt_type
    _set_features
    _set_clock
    _get_guest_storage_config
    self.vif_driver.get_config
    _create_consoles
    _guest_add_spice_channel
    _add_video_driver
    _set_qemu_guest_agent
    _guest_add_pci_devices
    _guest_add_watchdog_action
    _guest_add_memory_balloon
    _guest_add_mdevs
    return guest
    xml = conf.to_xml()
    return xml
    self._create_domain_and_network
    //nova侧去等待neutron侧发送network-vif-pluggend事件。neutron-linuxbridge-agent服务检测tap设备,neutron-server发送event事件给nova-api
    self.virtapi.wait_for_instance_event
    self.plug_vifs(instance, network_info)
    self.firewall_driver.setup_basic_filtering
    self.firewall_driver.prepare_instance_filter
               self._create_domain(xml)
                   libvirt_guest.Guest.create(xml, self._host)
                       write_instance_config // nova/virt/libvirt/host.py 中
                       domain = self.get_connection().defineXML(xml)
                       return libvirt_guest.Guest(domain)
                   return guest
          _wait_for_boot   //每隔 0.5秒检查虚机是否启动
    _update_instance_after_spawn
    _update_scheduler_instance_info
        scheduler_client.update_instance_info
    _notify_about_instance_usage

     补充:

    • port 创建成功后的 dhcp 相关操作(参考 https://blog.csdn.net/gj19890923/article/details/51558598):
      • 1. 创建VM时,nova-compute与neutron的plugin交互,在neutron的数据库中创建VM所需的port信息。

      • 2. neutron数据库中的port信息创建完成后,通知neutron-dhcp-agent去执行port_create_end函数。该函数将数据库中的port中的ip和mac信息加载到dnsmasq所需的配置文件中(包括host和addn_hosts文件)。

      • [root@nova 43c0e274-28e3-482e-a32b-d783980fc3ed]# cat addn_hosts
        1.1.1.1 host-1-1-1-1.openstacklocal host-1-1-1-1
        1.1.1.2 host-1-1-1-2.openstacklocal host-1-1-1-2
        1.1.1.10 host-1-1-1-10.openstacklocal host-1-1-1-10
        
        [root@nova 43c0e274-28e3-482e-a32b-d783980fc3ed]# cat host
        fa:16:3e:d1:d7:72,host-1-1-1-1.openstacklocal,1.1.1.1
        fa:16:3e:da:42:50,host-1-1-1-2.openstacklocal,1.1.1.2
        fa:16:3e:3c:a3:3e,host-1-1-1-10.openstacklocal,1.1.1.10

          [root@nova 43c0e274-28e3-482e-a32b-d783980fc3ed]# cat leases

          1464599134 fa:16:3e:3c:a3:3e 1.1.1.10 host-1-1-1-10 01:fa:16:3e:3c:a3:3e

          1464598886 fa:16:3e:da:42:50 1.1.1.2 host-1-1-1-2 *

          1464598886 fa:16:3e:d1:d7:72 1.1.1.1 host-1-1-1-1 *

      • 3. 在VM启动时,广播dhcp discover请求,当dnsmasq进程的监听接口ns-xxx监听到这种请求时,dnsmasq进程将根据配置文件(host和leases文件)中的内容去判定是否有未分配的ip和mac为请求者进行提供。

      • 4. 最终VM便真实的获取到与保存在数据库中的ip和mac信息。neutron-dhcp-agent只是将所创建VM的ip和mac信息从数据库中获取到自己的配置文件中,然后等到VM启动时,为它提供。因此neutron-dhcp-agent相当于在VM和数据库之间起了个中间桥梁的作用。

    • nova 在 domain 被创建后等待 neutron event 的过程(请参考 http://www.aichengxu.com/linux/9307663.htm
      1. 创建VM时,nova-compute 服务调用 wait_for_instance_event 函数等待 neutron 侧发送来的event。
      2. neutron的neutron-linuxbridge-agent定时检测tap设备的增加或删除,当创建VM时,将创建新的tap设备,此时将更新neutron数据库中的ports表,而neutron-server服务创建core_plugin时,将利用sqlalchemy自带的event对neutron数据库中的ports表进行监视,当ports表发生变化时,neutron-server将通过HTTP请求的方式发送event事件给nova。
      3. nova 收到 neutron 发送来的 event 时间,结束等待,继续创建VM下面的操作。

    3. 虚机被创建后的L2网络操作

    虚机被创建后,nova-compute 节点上的 neutron-linuxbridge-agent 会检测到新建的 tap 设备(通过轮询 /sys/class/net/ 里面的tap 设备),找到后则执行一系列网络方面的操作,包括设置安全组,

    tap设备示例:

    [root@test net]# ls
    brq8165bc3d-40 eth0 eth1 eth1.120 eth2 lo tap712a2c63-e6 tap83e7c095-f0 tap8f4fcfbb-2b

    tap 设备信息:

    Port tap93121330-58 updated. Details: {u'profile': {}, u'allowed_address_pairs': [], u'admin_state_up': True, u'network_id': u'8165bc3d-400a-48a0-9186-bf59f7f94b05', u'segmentation_id': 120,u'device_owner': u'compute:nova',
    u'physical_network': u'physnet1', u'mac_address': u'fa:16:3e:9f:6f:c5', u'device': u'tap93121330-58', u'port_security_enabled': True, u'port_id': u'93121330-58', u'fixed_ips': [{u'subnet_id': u'ec1028b2-7cb0-4feb-b974-6b8ea7e7f08f', u'ip_address': u'172.16.0.7'}],
    u'network_type': u'vlan'}

    参考文档:

  • 相关阅读:
    Mobile phones(poj1195)
    Matrix(poj2155)
    1080
    1266
    codeforces626D . Jerry's Protest
    字符串格式化
    附加MySQL数据库的方法
    avaScript中变量的声明和赋值
    选择法排序
    JavaScript中变量的类型
  • 原文地址:https://www.cnblogs.com/sammyliu/p/9192592.html
Copyright © 2020-2023  润新知