• [虚拟化]Proxmox VE+ceph+物理网络超融合生产环境部署案例


    原文:https://blog.csdn.net/hanziqing0630/article/details/114262035

    1 Proxmox Virtual Environment介绍
      Proxmox VE 是用于企业虚拟化的开源服务器管理平台。它在单个平台上紧密集成了KVM虚拟机管理程序和LXC,软件定义的存储以及网络功能。借助基于Web的集成用户界面,您可以轻松管理VM和容器,高可用性群集或集成的灾难恢复工具。
      同时Proxmox VE对接Proxmox备份服务器,可实现对VM、容器的全量和增量备份,可显著减少网络负载并节省宝贵的存储空间。

    2 环境介绍
      本文章所述环境采用3台物理服务器(含4口万兆网卡),1台万兆业务交换机,1台万兆管理交换机。
      注意:由于使用ceph搭建分布式存储,为保证性能,管理网络及业务网络强烈建议采用全万兆部署。
    2.1 软件版本
      本次部署采用当前最新版本:Proxmox VE 6.3
    2.2 服务器配置

    型号配置数量
    DELL R930 CPU:Intel® Xeon® CPU E7-8870 v4 @ 2.10GHz
    内存:512GB
    RAID卡:PERC H730P Adapter
    SSD:1.5TB 4块
    HDD:1.2TB 10块
    3

    3 软件获取
      访问官网下载ISO镜像文件
    https://www.proxmox.com/en/downloads/item/proxmox-ve-6-3-iso-installer


    4 RAID规划
    4.1 系统盘
        建议采用两块SSD组成raid 1,作为系统盘。
        不同品牌服务器设置方法不同,请参照各品牌官方文档。
    4.2 ceph盘
        ceph不推荐基于raid盘创建osd,所以除系统盘外,其余磁盘全部设置为非raid模式。
        不同品牌服务器设置方法不同,请参照各品牌官方文档。

    5 物理网络
      生产环境对可靠性要求较高,所以建议采用链路聚合方式,将多个物理网卡绑定为一个逻辑接口,从而提高网络的性能及可靠性。
    链路聚合可在以下三种模式中选择:
       1,LACP(802.3ad):基于LACP协议的链路聚合,此模式交换机需配置链路聚合,模式为lacp。
       2,静态聚合:静态链路聚合,此模式交换机需配置链路聚合,模式为静态(华为、H3C默认为此模式;思科为on模式)。
       3,Active+Backup:主备模式,网卡一主一备,主网卡故障时备份网卡接替主网卡工作,此模式交换机无需做链路聚合配置。
        若交换机支持LACP,推荐采用LACP模式。此处采用LACP模式进行演示。

    5.1 网络规划
    5.1.1 物理网络拓扑

     5.1.2 vlan及网段规划

    vlan号用途IP网段网关
    1 管理 10.1.1.0/24 10.1.1.254
    3 业务 10.1.3.0/24 10.1.3.254
    4 业务 10.1.4.0/24 10.1.4.254
    5 业务 10.1.5.0/24 10.1.5.254


    5.2 网络配置
    以华为交换机为例。
    5.2.1 创建vlan:

    vlan batch 3 to 5 

    5.2.2 创建vlan-if(网关):

    interface Vlanif1      //vlan1,管理网络网关
     ip address 10.1.1.254 255.255.255.0
    interface Vlanif3      //vlan3,业务网络网关
     ip address 10.1.3.254 255.255.255.0
    interface Vlanif4      //vlan4,业务网络网关
     ip address 10.1.4.254 255.255.255.0
    interface Vlanif5      //vlan5,业务网络网关
     ip address 10.1.5.254 255.255.255.0

    5.2.3 创建聚合接口(eth-trunk):

    interface Eth-Trunk101    //用于节点1管理口
     description to-pve1-mgmt
     port link-type access
     mode lacp
    #
    interface Eth-Trunk102    //用于节点2管理口
     description to-pve2-mgmt
     port link-type access
     mode lacp
    #
    interface Eth-Trunk103    //用于节点3管理口
     description to-pve3-mgmt
     port link-type access
     mode lacp
    #
    interface Eth-Trunk104    //用于节点1业务口
     description to-pve1-yewu
     port link-type trunk
     port trunk allow-pass vlan 2 to 4094
     mode lacp
    #
    interface Eth-Trunk105    //用于节点2业务口
     description to-pve2-yewu
     port link-type trunk
     port trunk allow-pass vlan 2 to 4094
     mode lacp
    #
    interface Eth-Trunk106    //用于节点3业务口
     description to-pve3-yewu
     port link-type trunk
     port trunk allow-pass vlan 2 to 4094
     mode lacp

    5.2.4 物理接口加入聚合接口

    interface GigabitEthernet0/0/10    //连接节点1管理口eno1
     description pve1-mgmt-eno1
     eth-trunk 101
    #
    interface GigabitEthernet0/0/11    //连接节点1管理口eno2
     description pve1-mgmt-eno2
     eth-trunk 101
    #
    interface GigabitEthernet0/0/12    //连接节点2管理口eno1
     description pve2-mgmt-eno1
     eth-trunk 102
    #
    interface GigabitEthernet0/0/13    //连接节点2管理口eno2
     description pve2-mgmt-eno2
     eth-trunk 102
    #
    interface GigabitEthernet0/0/14    //连接节点3管理口eno1
     description pve3-mgmt-eno1
     eth-trunk 103
    #
    interface GigabitEthernet0/0/15    //连接节点3管理口eno2
     description pve3-mgmt-eno2
     eth-trunk 103
    #
    interface GigabitEthernet0/0/16    //连接节点1业务口eno3
     description pve1-data-eno3
     eth-trunk 104
    #
    interface GigabitEthernet0/0/17    //连接节点1业务口eno4
     description pve1-data-eno4
     eth-trunk 104
    #
    interface GigabitEthernet0/0/18    //连接节点2业务口eno3
     description pve2-data-eno3
     eth-trunk 105
    #
    interface GigabitEthernet0/0/19    //连接节点2业务口eno4
     description pve2-data-eno4
     eth-trunk 105
    #
    interface GigabitEthernet0/0/20    //连接节点3业务口eno3
     description pve3-data-eno3
     eth-trunk 106
    #
    interface GigabitEthernet0/0/21    //连接节点3业务口eno4
     description pve3-data-eno4
     eth-trunk 106

    6 PVE安装

    1,选择第一个选项,安装PVE

    2,同意协议

    3,选择系统盘
    注意:此处一定要选择RAID规划中创建的RAID 1系统盘

    4,配置国家、地区,

    5,配置密码、邮箱
    如果为生产环境务必配置为强口令。邮箱建议配置为真实邮箱

    6,配置网卡、主机名、IP地址、DNS等信息

    此处选择服务器第一块网卡,用于管理网络,按我们的规划应为eno1

    每个节点主机名不能相同,主机名可以参考以下规划,域名请按需配置。

    序号主机名域名
    1 pve1 test.local
    2 pve2 test.local
    3 pve3 test.local

    主机名、IP地址等信息按实际情况配置,配置公网DNS,用于pve连接互联网。

    7,检查无误后点击安装。

    安装结束后重启,通过浏览器访问,出现以下页面证明安装成功。
    地址:https://你的IP地址:8006
    用户名:root
    密码:为安装时配置的密码。
    域:选择Linux PAM

    8,按照此方法安装全部服务器。

    7 更换软件源(三个节点都需要配置)

    由于自带的软件源速度较慢,此处选择科大源:http://mirrors.ustc.edu.cn
    涉及的软件源有三个,分别为debain、pve、ceph,需要分别修改下列文件。

    名称source文件路径
    debain /etc/apt/sources.list
    pve /etc/apt/sources.list.d/pve-no-subscription.list
    ceph /etc/apt/sources.list.d/ceph.list
    • 操作流程:

    1,通过web管理页面中的shell或ssh登录后台。

     2,更换debian源:

    vi /etc/apt/sources.list

    删除默认的源,替换为:

    deb http://mirrors.ustc.edu.cn/debian/ buster main contrib non-free
    # deb-src http://mirrors.ustc.edu.cn/debian/ buster main contrib non-free
    deb http://mirrors.ustc.edu.cn/debian/ buster-updates main contrib non-free
    # deb-src http://mirrors.ustc.edu.cn/debian/ buster-updates main contrib non-free
    deb http://mirrors.ustc.edu.cn/debian-security/ buster/updates main contrib non-free
    # deb-src http://mirrors.ustc.edu.cn/debian-security/ buster/updates main contrib non-free

    3,更换pve源为非订阅源:

        //备份默认源:
    mv /etc/apt/sources.list.d/pve-enterprise.list /root
    
        //创建pve-no-subscription.list文件:
    vi /etc/apt/sources.list.d/pve-no-subscription.list
    
        //增加以下内容:
    deb http://mirrors.ustc.edu.cn/proxmox/debian/pve buster pve-no-subscription

    4,更换ceph源

        //创建ceph.list文件:
    vi /etc/apt/sources.list.d/ceph.list
    
        //增加以下内容:
    deb http://mirrors.ustc.edu.cn/proxmox/debian/ceph-octopus buster main

    5.更新软件列表

    apt update

    8. 更新PVE至最新版本(按需)

    根据实际需求决定是否更新为最新版本。

    如需更新三台节点都需要执行:

    apt upgrade

    9 基础配置(三个节点都需要配置)

    9.1 安装ifupdown2

    此组件用于配置网卡后重启网卡操作:

    apt install ifupdown2

    9.2 安装vim

    apt install vim

    9.3 配置ntp服务

    1,配置统一的时钟源
    如果有条件建议在内网部署一台ntp服务器,所有节点与内网ntp同步时钟。
    如果没有内网NTP服务器,可以采用下列NTP服务器

    阿里云:ntp.aliyun.com
    国家授时中心:ntp.ntsc.ac.cn

    2,将NTP取消注释,填写ntp服务器地址

    vim /etc/systemd/timesyncd.conf

     3,配置完成后重启时间服务

    systemctl restart systemd-timesyncd

    10 PVE网络配置(三个节点都需要配置)

    10.1 PVE服务器网络拓扑

    放一张图有助于理解配置,可以结合5.1.1章节拓扑图理解。

    10.2 管理网络

    1,编辑vmbr0
    移除eno0,以便于将eno0加入到bond0中
    删除桥接端口中的eno0,然后点击OK。

     2,创建bond0
    点击创建Linux Bond。
    名称:bond0
    slaves:eno0 eno1
    模式:LACP (802.3ad)
    Hash策略:layer2+3
    按以上参数配置,然后点击OK。

     3,编辑vmbr0
    桥接端口配置:bond0。
    选中“vlan感知”选项,然后点击OK。

    4,应用配置
    如果感觉配置有问题可以点击还原按钮,还原为配置前状态。
    如果没有问题,点击应用配置使配置生效。
    网络配置不正确可能会导致无法管理节点,应用配置前请确认配置正确,如果出现无法管理的情况需要进入shell手动修改配置。

    10.3 业务网络

    业务网络配置与管理网络类似。

    1,创建bond1
    点击创建Linux Bond。
    名称:bond1
    slaves:eno2 eno3
    模式:LACP (802.3ad)
    Hash策略:layer2+3
    按以上参数配置,然后点击OK。

     2,创建vmbr1
    桥接端口配置:bond1。
    选中“vlan感知”选项,然后点击OK。

     3,应用配置
    点击应用配置使配置生效。

    10.4 网络配置检查

    在交换机中检查聚合接口状态是否正常。

    display eth-trunk 101
    display eth-trunk 102
    display eth-trunk 103
    display eth-trunk 104
    display eth-trunk 105
    display eth-trunk 106

    查看所有eth-trunk接口状态,Status为Selected,则聚合接口正常。

    11 集群组建

    创建集群,将三台节点加入同一集群。

    1,在其中一个节点上点击,”数据中心“ — ”集群“ — ”创建集群“。

    2,点击加入信息,复制加入信息。

     3,在其他两个节点上,点击加入集群,粘贴加入信息,然后输入第一台节点的root密码,即可完成加入。

     4,加入集群完成后需要刷新页面才能正常使用,全部加入完成后,就可以在一个节点上管理集群中所有节点了。

    12 ceph
    Ceph是一种为优秀的性能、可靠性和可扩展性而设计的统一的、分布式文件系统。它可以将多台服务器中的硬盘聚合成一个集群,对外可提供文件存储、块存储、对象存储等多种形式,ceph的另一个特点是数据采用多副本方式存储,避免由于单点故障造成的业务中断和数据丢失。
    PVE自带了ceph的图形化安装、管理工具,集群搭建完成后,可以快速完成ceph的安装、配置。同时pve也提供命令行工具,可以使用命令行对ceph进行自定义配置。

    12.1 ceph磁盘规划
    我的环境中,sda到sdh为8块HDD硬盘,sdi到sdl为4块SSD硬盘。
    为提高hdd的性能,我们将sdi作为所有hdd硬盘的DB盘,将sdj作为所有hdd硬盘的WAL磁盘。
    请注意DB盘和WAL盘不能相同,如果只有一块SSD可以将SSD分为两个区,分别作为DB盘和WAL盘。
    分区建议:根据PVE文档建议,DB盘容量=数据盘总容量10%,WAL盘容量=数据盘总容量1%,假设数据盘共8T,则DB分区容量需>800G,WAL分区容量需>80G,考虑到单位换算及损耗,需要适当增加容量,请根据实际情况规划。

    详细规划如下:,
    物理路径    磁盘类型    DB磁盘    WAL磁盘    角色
    /dev/sda    HDD    /dev/sdi    /dev/sdj    数据盘
    /dev/sdb    HDD    /dev/sdi    /dev/sdj    数据盘
    /dev/sdc    HDD    /dev/sdi    /dev/sdj    数据盘
    /dev/sdd    HDD    /dev/sdi    /dev/sdj    数据盘
    /dev/sde    HDD    /dev/sdi    /dev/sdj    数据盘
    /dev/sdf    HDD    /dev/sdi    /dev/sdj    数据盘
    /dev/sdg    HDD    /dev/sdi    /dev/sdj    数据盘
    /dev/sdh    HDD    /dev/sdi    /dev/sdj    数据盘
    /dev/sdi     SSD    不适用    不适用       DB盘
    /dev/sdj     SSD    不适用    不适用       WAL盘
    /dev/sdk    SSD    /dev/sdk    /dev/sdk    数据盘
    /dev/sdl    SSD    /dev/sdl    /dev/sdl     数据盘

    12.2 ceph安装

    在全部节点中,安装ceph组件。

    1,选择节点 — ”ceph“ 点击 ” Install ceph ”

     2,选择版本,此处选择 “ 15.2 ”

    3,入 ” Y “ 开始安装
    如果软件包下载速度较慢,可以先安装一台,然后将安装包拷贝到其他节点相同路径中。
    安装包保存路径:/var/cache/apt/archives

    12.3 ceph配置

    此配置是将ssd硬盘和hdd硬盘分别创建pool,分别为sdd_data和hdd_data,如需将ssd作为hdd的缓存层请关注我的后续文章。


    12.3.1 创建osd
    在 ”ceph“ — ”osd“ 选项卡创建OSD。
    正常情况下磁盘类型会自动识别,如果识别的不正确,注意手动调整。
    创建方式如下:

    HDD盘
        创建hdd时注意选择DB和WAL磁盘。

    SSD盘

    如果创建时类型选择错误,可以用命令行修改:
    假设osd0需要更改。

    1,删除osd类别信息

    ceph osd crush rm-device-class osd.0

    2,设置osd类别信息

    ceph osd crush set-device-class ssd osd.0
    12.3.2 创建class rule

    创建HDD rule

    ceph osd crush rule create-replicated ssd_rule default host ssd

    创建SSD rule

    ceph osd crush rule create-replicated hdd_rule default host hdd
    12.3.3 创建存储池

    创建HDD pool

    ceph osd pool create hdd_data hdd_rule

     创建SSD pool

    ceph osd pool create ssd_data ssd_rule
    12.3.4 添加存储池至PVE

    ”数据中心“ — ”存储“ — ”添加“ — ”RBD“。

    添加hdd存储池:

     添加ssd存储池:

    13 安全加固

    13.1 配置公钥登录

    1,禁止ssh使用密码登录

    #编辑sshd配置文件
    vim /etc/ssh/sshd_config
    #将下列配置添加到最后一行
    PasswordAuthentication no
    #重启sshd服务
    systemctl restart sshd

    2,生成密钥对

    以xshell为例,生成密钥

    设置名称及密码
    设置密码为可选项,为保证密钥安全,建议设置。

    3,将公钥上传至服务器中

    vim /root/.ssh/authorized_keys

     13.2 配置OTP登录

    1,下载google身份验证器,
        安卓
        链接: https://pan.baidu.com/s/1WBMZ83aVAqTgmTavSJRwVw 提取码: sekv
        苹果
        在app store中搜索“Google Authenticator”

    2, 添加令牌
        点击右上角用户名 - TFA,扫描二维码添加令牌,将令牌中显示的数字输入下方验证码框中,点击应用即可。

    3,为防止手机故障造成令牌不可用,请备份令牌
    点击右上角三个点,选择转移账号,导出账号,选择需要导出的账号,备份此二维码或使用其他手机扫描此二维码。需要恢复时,用其他手机扫描此二维码即可。

  • 相关阅读:
    Flask&&人工智能AI -- 12
    Flask&&人工智能AI -- 11
    Flask&&人工智能AI -- 10
    Flask&&人工智能AI -- 9
    Flask&&人工智能AI -- 8
    Flask&&人工智能AI -- 8 HTML5+ 初识,HBuilder,夜神模拟器,Webview
    Flask&&人工智能AI -- 7 MongoDB
    Flask&&人工智能AI -- 6 人工智能初识,百度AI,图灵机器人
    Flask&&人工智能AI --5 Flask-session、WTForms、数据库连接池、Websocket
    [转]八款开源Android游戏引擎
  • 原文地址:https://www.cnblogs.com/airoot/p/14916065.html
Copyright © 2020-2023  润新知