<DIV>Hi £¬</DIV>
<DIV>My hosts:</DIV>
<DIV>hksbs-s13.com:8<BR>hksbs-s11.com:8</DIV>
<DIV>&nbsp;</DIV>
<DIV>When i run in one node,it is ok.</DIV>
<DIV>[root@hksbs-s13 examples_collchk]# mpiexec -f hosts -n 8 ./time_bcast_nochk<BR>time taken by 1X1 MPI_Bcast() at rank 0 = 0.000005<BR>time taken by 1X1 MPI_Bcast() at rank 1 = 0.000002<BR>time taken by 1X1 MPI_Bcast() at rank 2 = 0.000003<BR>time taken by 1X1 MPI_Bcast() at rank 3 = 0.000002<BR>time taken by 1X1 MPI_Bcast() at rank 4 = 0.000004<BR>time taken by 1X1 MPI_Bcast() at rank 5 = 0.000002<BR>time taken by 1X1 MPI_Bcast() at rank 6 = 0.000003<BR>time taken by 1X1 MPI_Bcast() at rank 7 = 0.000002</DIV>
<DIV>&nbsp;</DIV>
<DIV>but when i connect to other node, it failed</DIV>
<DIV>&nbsp;</DIV>
<DIV>&nbsp;</DIV>
<DIV>[root@hksbs-s13 examples_logging]# mpiexec -f hosts -n 9 ./srtest<BR>Fatal error in PMPI_Bcast: Other MPI error, error stack:<BR>PMPI_Bcast(1478)......................: MPI_Bcast(buf=0x16fc2aa8, count=1, MPI_INT, root=0, MPI_COMM_WORLD) failed<BR>MPIR_Bcast_impl(1321).................:<BR>MPIR_Bcast_intra(1119)................:<BR>MPIR_Bcast_scatter_ring_allgather(961):<BR>MPIR_Bcast_binomial(213)..............: Failure during collective<BR>MPIR_Bcast_scatter_ring_allgather(952):<BR>MPIR_Bcast_binomial(189)..............:<BR>MPIC_Send(63).........................:<BR>MPIDI_EagerContigShortSend(262).......: failure occurred while attempting to send an eager message<BR>MPIDI_CH3_iStartMsg(36)...............: Communication error with rank 8</DIV>
<DIV>&nbsp;</DIV>
<DIV>&nbsp;</DIV>
<DIV>when i ssh the other node, for example</DIV>
<DIV>&nbsp;</DIV>
<DIV><BR>[root@hksbs-s13 examples_logging]# ssh hksbs-s11.com<BR>Last login: Tue Jul 26 15:45:22 2011 from 10.33.15.233<BR>[root@hksbs-s11 ~]#<BR></DIV>
<DIV>&nbsp;</DIV>
<DIV>it works.</DIV>
<DIV>&nbsp;</DIV>
<DIV>How can check the reason?</DIV>
<DIV><BR><BR>&nbsp;</DIV>