Hi,<br>
<br>
i have one executable compiled with mpich-1.2.7p1. it works fine if run 
on one server (node) but it gives following error if i try to run it 
across multiple nodes.<br>
<br>
<br>
 p15_4211:  p4_error: net_recv read:  probable EOF on socket: 1<br>
&gt; p14_4184:  p4_error: net_recv read:  probable EOF on socket: 1<br>
&gt; p13_4157:  p4_error: net_recv read:  probable EOF on socket: 1<br>
&gt; p12_4130:  p4_error: net_recv read:  probable EOF on socket: 1<br>
&gt; p11_4103:  p4_error: net_recv read:  probable EOF on socket: 1<br>
&gt; p10_4076:  p4_error: net_recv read:  probable EOF on socket: 1<br>
&gt; p8_4022:  p4_error: net_recv read:  probable EOF on socket: 1<br>
&gt; p9_4049:  p4_error: net_recv read:  probable EOF on socket: 1<br>
&gt; p23_9466:  p4_error: net_recv read:  probable EOF on socket: 1<br>
&gt; p18_9331:  p4_error: net_recv read:  probable EOF on socket: 1<br>
&gt; p22_9439:  p4_error: net_recv read:  probable EOF on socket: 1<br>
&gt; p16_9277:  p4_error: net_recv read:  probable EOF on socket: 1<br>
&gt; p17_9304:  p4_error: net_recv read:  probable EOF on socket: 1<br>
&gt; p3_32073:  p4_error: net_recv read:  probable EOF on socket: 1<br>
&gt; p6_32157:  p4_error: net_recv read:  probable EOF on socket: 1<br>
&gt; p7_32185:  p4_error: net_recv read:  probable EOF on socket: 1<br>
&gt; p4_32101:  p4_error: net_recv read:  probable EOF on socket: 1<br>
&gt; p5_32129:  p4_error: net_recv read:  probable EOF on socket: 1<br>
&gt; rm_l_2_32068: (1003.843750) net_send: could not write to fd=5, errno = 32<br>
<br>
I have tried changing P4_GLOBMEMSIZE but it did not work. machine is having linux (rhel 5.2) with 48 GB of memory.<br>Where to llok for errors? I know that mpich-1 is no longer supported. But looking for help.<br>