• Ubuntu安装MPICH3集群计算环境


    本文是在Ubuntu15.10麒麟版中安装过程的实录。


    准备工作:

    1.设置root用户密码(命令:sudo passwd root)

    2.正确设置各个节点IP(各个节点应该使用静态IP)

    3.正确设置各个Host名字(sudo gedit /etc/hostname,同时要修改/etc/hosts内容使得Host名字保持一致)

    4.安装OpenSSH软件(sudo apt-get install openssh-server)


    注意点:

    安装过程中,如果修改了一些参数,有时需要删除~/.ssh/known_hosts文件,然后重新用ssh命令连接到其他节点机器上。


    MPICH官网是http://www.mpich.org/(点击进入,下同)。


    setp1:下载软件

    软件下载地址是:http://www.mpich.org/downloads/。如下图所示:


    点击上图中mpich-3.2相关的"http"链接,即可下载软件。下载的软件文件名是“mpich-3.2.tar.gz”。


    step2.解压缩软件
    可以用提取菜单功能进行提取,也可以使用以下命令解压缩:

    tar -xzvf soft/mpich-3.2.tar.gz

    解压缩后得到目录“mpich-3.2”。


    step3.软件安装

    运行以下命令进行安装(将软件安装在/usr/local/mpich目录下):

    cd mpich-3.2

    ./configure --prefix=/usr/local/mpich

    对于上述命令,如果没有安装Fortran语言编译器,则需要给该命令增加选项,屏蔽Fortran语言支持,否则会出现错误。可以运行以下命令:

    ./configure --prefix=/usr/local/mpich --disable-fortran

    然后,运行以下命令:

    make

    make install


    step4.环境变量设置

    运行以下命令,编辑文件“/etc/profile”中的环境变量:

    sudo gedit /etc/profile

    在该文件的最后,添加以下的行:

    PATH=$PATH:/usr/local/mpich/bin
    MANPATH=$MANPATH:/usr/local/mpich/man
    export PATH MANPATH


    step5.单节点测试

    运行以下命令(将本地目录下程序拷贝到安装软件的位置):

    cp -r examples/ /usr/local/mpich

    运行测试,运行以下命令:

    mpiexec -n 10 /usr/local/mpich/examples/cpi



    step6.其他测试

    可以运行以下命令进行测试,检查MPICH是否正确安装。

    which mpicc

    which mpiexec



    step7.集群机器免密码登录设置

    事先需要安装OpenSSH软件,运行以下命令:

    sudo apt-get install openssh-server

    同时需要启动ssh服务,运行以下命令:

    /etc/init.d/ssh start

    接着进行ssh配置。运行以下命令:

    ssh-keygen -t dsa

    需要输入3次Enter,生成的文件在~/.ssh目录下。

    然后,使用以下命令,将文件id_rsa.pub拷贝到authorized_keys(在~/.ssh目录下运行以下命令):

    cat id_rsa.pub authorized_keys

    同时,需要把这两个文件(id_rsa.pub和authorized_keys)拷贝到各个节点的~/.ssh目录下


    step8.ssh登录测试

    可以输入以下命令,登录到其他机器中:

    ssh m1

    这里,m1是集群节点的某个机器IP名字,m1也可以是IP。


    step9.各个集群节点的软件安装

    各个集群节点也需要安装MPICH软件,同时配置做step7的配置(将文件id_rsa.pub和authorized_keys拷贝到各个节点的~/.ssh目录下


    step10.多机集群计算测试

    通常在~(主目录)目录下,创建machinefile(该文件名可以是其他名字,也可以是这个名字),其内容如下:

    m1:4

    m2:4

    m3:4

    m4:4

    这里,m1-m4为各个节点的IP值,冒号后面的是节点的线程数。然后,运行以下命令,进行集群计算测试:

    mpiexec -n 10 -machinefile ./machinefile /usr/local/mpich/examples/cpi



    至此,MPICH集群计算环境安装设置完成。








  • 相关阅读:
    leetcode144 longest-palindromic-substring
    数据结构之二叉树
    数据结构之堆
    数据结构之图
    数据结构之排序
    数据结构之动态规划
    14 RPC
    数据结构之字符串
    数据结构之散列表
    16 中间人攻击
  • 原文地址:https://www.cnblogs.com/tigerisland/p/7564292.html
Copyright © 2020-2023  润新知