<p>Hi,</p>
<p>I installed mpich2-1.2.1p1 on a Linux cluster with 6 nodes, (Intel xeon,3Gz/node, 64bit, Kernel 2.6.18-128.1.6.el5), with pgf90+pgcc compilers.</p>
<p>While testing the example program cpi with more than 2 tasks, it shows the&#160; error,</p>
<p>================</p>
<p>mpiexec -l -n 2 -host k4 ./cpi<br />
0: Process 0 of 2 is on k4<br />
1: Process 1 of 2 is on k4<br />
0: pi is approximately 3.1415926544231318, Error is 0.0000000008333387<br />
0: wall clock time = 0.000232<br />
rank 1 in job 10&#160; k1_37752&#160;&#160; caused collective abort of all ranks<br />
&#160; exit status of rank 1: killed by signal 11<br />
rank 0 in job 10&#160; k1_37752&#160;&#160; caused collective abort of all ranks<br />
=================</p>
<p>And when I try with 2 hosts,</p>
<p>mpiexec -l -n 2 -host k6 ./cpi : -n 2 -host k4 ./cpi<br />
0: Process 0 of 4 is on k6<br />
1: Process 1 of 4 is on k6<br />
3: Process 3 of 4 is on k4<br />
2: Process 2 of 4 is on k4<br />
0: pi is approximately 3.1415926544231239, Error is 0.0000000008333307<br />
0: wall clock time = 0.001073<br />
rank 0 in job 13&#160; k1_37752&#160;&#160; caused collective abort of all ranks<br />
&#160; exit status of rank 0: killed by signal 11<br />
===================</p>
<p>While the same with 1 task each works fine, like</p>
<p>mpiexec -l -n 1 -host k6 ./cpi : -n 1 -host k4 ./cpi<br />
0: Process 0 of 2 is on k6<br />
1: Process 1 of 2 is on k4<br />
0: pi is approximately 3.1415926544231318, Error is 0.0000000008333387<br />
0: wall clock time = 0.033167<br />
&#160;</p>
<p>What could be the reason for this?</p>
<p>Thank you,</p>
<p>Thejna.</p>