<br>Hi,<div><br></div><div>I had some time ago problems running a parallel application using the mpich2 with the mpd daemon. One of the users from the mpich-list suggested I should install the new version of mpich with hydra process manager.</div>
<div><br></div><div>Now I can run the application but at some poitn it stops with this error:</div><div><br></div><div><div>InitMesh: Mesh cutoff (required, used) =   400.000   418.568 Ry</div><div><br></div><div>=====================================================================================</div>
<div>=   BAD TERMINATION OF ONE OF YOUR APPLICATION PROCESSES</div><div>=   EXIT CODE: 11</div><div>=   CLEANING UP REMAINING PROCESSES</div><div>=   YOU CAN IGNORE THE BELOW CLEANUP MESSAGES</div><div>=====================================================================================</div>
<div>[proxy:0:1@cn102.cluster.local] HYD_pmcd_pmip_control_cmd_cb (./pm/pmiserv/pmip_cb.c:906): assert (!closed) failed</div><div>[proxy:0:1@cn102.cluster.local] HYDT_dmxu_poll_wait_for_event (./tools/demux/demux_poll.c:77): callback returned error status</div>
<div>[proxy:0:1@cn102.cluster.local] main (./pm/pmiserv/pmip.c:226): demux engine error waiting for event</div><div>[proxy:0:3@cn104.cluster.local] HYD_pmcd_pmip_control_cmd_cb (./pm/pmiserv/pmip_cb.c:906): assert (!closed) failed</div>
<div>[proxy:0:3@cn104.cluster.local] HYDT_dmxu_poll_wait_for_event (./tools/demux/demux_poll.c:77): callback returned error status</div><div>[proxy:0:3@cn104.cluster.local] main (./pm/pmiserv/pmip.c:226): demux engine error waiting for event</div>
<div>[mpiexec@headnode.cluster.local] HYDT_bscu_wait_for_completion (./tools/bootstrap/utils/bscu_wait.c:70): one of the processes terminated badly; aborting</div><div>[mpiexec@headnode.cluster.local] HYDT_bsci_wait_for_completion (./tools/bootstrap/src/bsci_wait.c:23): launcher returned error waiting for completion</div>
<div>[mpiexec@headnode.cluster.local] HYD_pmci_wait_for_completion (./pm/pmiserv/pmiserv_pmci.c:189): launcher returned error waiting for completion</div><div>[mpiexec@headnode.cluster.local] main (./ui/mpich/mpiexec.c:397): process manager error waiting for completion</div>
</div><div><br></div><div>I am using a cluster with 8 nodes (cn101 to cn108) having 2 procs each</div><div><br></div><div>The example with the cpi works fine.</div><div><br></div><div>AAny idea what could be the problem?</div>
<div><br></div><div>Thank you, Eli</div><div><br></div>