mpi程序本地能运行,使用bsub提交后却在mpi广播函数处挂住不运行了?怎么回事儿?求解决



  • 问题还原方式:
    进入程序所在目录/GPFS/cess/liuc/cams-csm/run/ECMOM5_1deg_T106_CoLM/mom4
    运行source .liuchao配置运行环境
    执行sh run.sh脚本提交程序会出现如题所示的问题,如果将此脚本中的bsub提交命令换成mpirun在登录节点上运行时却不会出现如题所示的问题



  • 我的提交脚本是bsub -I -q q_x86_cn_cess -n 2 /GPFS/cess/liuc/cams-csm/run/ECMOM5_1deg_T106_CoLM/binmom4/echam5 : -n 1 /GPFS/cess/liuc /cams-csm/run/ECMOM5_1deg_T106_CoLM/binmom4/fms_test8.x两程序同时协作运行。但是bsub好像不支持这种mpp模式,请问有什么解决方法吗?



  • 从运维人员得知,无法支持这种提交两个不同程序的mpi通信模式。但是经过思考,可以写一个wrapper将fms_test8.x和echam5两个程序打包,然后bsub提交,经过两天的调试实现了该方法。



  • @superliu 有运维人员的联系方式吗?有事请教


登录后回复