简介:LSF机群作业管理系统是曙光公司自己的一套作业管理系统,采用B/S架构,直接在网页管理界面就可以管理整个作业和作业节点;
1 LSF常用作业管理命令:
作业提交bsub
查看自己运行的所有作业的情况bjobs
跟踪某任务屏幕输出bpeek
bkill 杀死某个作业
bqueues作业队列情况
bstop停止挂起作业
bresume 恢复挂起作业
lshost查看节点信息
bhosts查看所有节点作业信息
lshosts查看所有节点负载信息
busers 查看用户最大可用核心以及用户作业情况,比如busers hubo.huang(hubo.huang是用户名)
作业脚本范例:
计算任务是通过脚本文件提交到作业管理系统的(也即是在pac管理平台提交,pac管理平台有作业脚本范例),脚本文件是一个可执行文件;
脚本参数说明:
1作业要使用的队列 2作业需要的核心数 3每节点分配给作业运行的核心数
lsf一般有主节点,和从节点,防止作业管理单点故障;