<table cellspacing="0" cellpadding="0" border="0" ><tr><td valign="top" style="font: inherit;"><div>ello&nbsp;<span class="Apple-style-span" style="font-weight: bold; ">Rajeev,</span></div><div><b><br></b></div>ahh sorry about last email, my OS on two machine are different<div><br></div><div>quadcore machine is 64bit and OS is "Linux myquadcore_machine 2.6.18-128.1.1.el5 #1 SMP Tue Feb 10 11:36:29 EST 2009 x86_64 x86_64 x86_64 GNU/Linux"</div><div><br></div><div><br></div><div>dual core is 32bit and IS is :: "Linux mydualcore_machine 2.6.18-128.1.6.el5PAE #1 SMP Wed Apr 1 07:24:39 EDT 2009 i686 i686 i386 GNU/Linux"</div><div><br></div><div>Are these the cause of my problem? Do i need to run my MPI with the same 32-bit machines? Are there any configurations i need to set , to make them work togather?</div><div><br></div><div>thank you very much,and sorry again about wrong OS info in my last
 email</div><div><br></div><div>regards,</div><div>Gra&nbsp;</div><div><br>--- On <b>Sat, 7/18/09, Rajeev Thakur <i>&lt;thakur@mcs.anl.gov&gt;</i></b> wrote:<br><blockquote style="border-left: 2px solid rgb(16, 16, 255); margin-left: 5px; padding-left: 5px;"><br>From: Rajeev Thakur &lt;thakur@mcs.anl.gov&gt;<br>Subject: Re: [mpich-discuss] I wonder if my mpdboot is the causeofproblem...help me!<br>To: mpich-discuss@mcs.anl.gov<br>Date: Saturday, July 18, 2009, 8:42 AM<br><br><div id="yiv572692151">

 
 
 
<div dir="ltr" align="left"><span class="031414115-18072009"><font color="#0000ff" size="2" face="Arial">Are the CPUs identical on them? Is one 32-bit, the other 
64-bit?</font></span></div>
<div dir="ltr" align="left"><span class="031414115-18072009"></span>&nbsp;</div><br>
<blockquote style="BORDER-LEFT:#0000ff 2px solid;PADDING-LEFT:5px;MARGIN-LEFT:5px;MARGIN-RIGHT:0px;">
  <div dir="ltr" lang="en-us" class="OutlookMessageHeader" align="left">
  <hr tabindex="-1">
  <font size="2" face="Tahoma"><b>From:</b> mpich-discuss-bounces@mcs.anl.gov 
  [mailto:mpich-discuss-bounces@mcs.anl.gov] <b>On Behalf Of </b>Gra 
  zeus<br><b>Sent:</b> Saturday, July 18, 2009 10:27 AM<br><b>To:</b> 
  mpich-discuss@mcs.anl.gov<br><b>Subject:</b> Re: [mpich-discuss] I wonder if 
  my mpdboot is the causeofproblem...help me!<br></font><br></div>
  <div></div>
  <table border="0" cellspacing="0" cellpadding="0">
    <tbody>
    <tr>
      <td valign="top">one of them is quad core and another one is dual core. 
        however, OS,account,my password,install path are all the same.
        <div>I use this &nbsp;configuration "./configure 
        --prefix=/opt/localhomes/myname/mpich2-install" in both 
        machines.</div><br>--- On <b>Sat, 7/18/09, Rajeev Thakur 
        <i>&lt;thakur@mcs.anl.gov&gt;</i></b> wrote:<br>
        <blockquote style="BORDER-LEFT:rgb(16,16,255) 2px solid;PADDING-LEFT:5px;MARGIN-LEFT:5px;"><br>From: 
          Rajeev Thakur &lt;thakur@mcs.anl.gov&gt;<br>Subject: Re: 
          [mpich-discuss] I wonder if my mpdboot is the cause ofproblem...help 
          me!<br>To: mpich-discuss@mcs.anl.gov<br>Date: Saturday, July 18, 2009, 
          7:02 AM<br><br>
          <div id="yiv189604466">
          <div dir="ltr" align="left"><span class="406120114-18072009"><font color="#0000ff" size="2" face="Arial">What are the exact parameters you 
          passed to configure when building MPICH2? Are the two machines 
          identical?</font></span></div>
          <div dir="ltr" align="left"><span class="406120114-18072009"><font color="#0000ff" size="2" face="Arial"></font></span>&nbsp;</div>
          <div dir="ltr" align="left"><span class="406120114-18072009"><font color="#0000ff" size="2" face="Arial">Rajeev</font></span></div><br>
          <blockquote style="BORDER-LEFT:#0000ff 2px solid;PADDING-LEFT:5px;MARGIN-LEFT:5px;MARGIN-RIGHT:0px;">
            <div dir="ltr" lang="en-us" class="OutlookMessageHeader" align="left">
            <hr tabindex="-1">
            <font size="2" face="Tahoma"><b>From:</b> 
            mpich-discuss-bounces@mcs.anl.gov 
            [mailto:mpich-discuss-bounces@mcs.anl.gov] <b>On Behalf Of </b>Gra 
            zeus<br><b>Sent:</b> Saturday, July 18, 2009 12:06 AM<br><b>To:</b> 
            mpich-discuss@mcs.anl.gov<br><b>Subject:</b> [mpich-discuss] I 
            wonder if my mpdboot is the cause ofproblem...help 
            me!<br></font><br></div>
            <div></div>
            <table border="0" cellspacing="0" cellpadding="0">
              <tbody>
              <tr>
                <td valign="top">hello, 
                  <div><br></div>
                  <div>thx for answer yesterday.</div>
                  <div>I tested my code in one machine (with"mpiexec -n 2 
                  ./myprog"),everything work fine - my program can use 
                  MPI_Send,MPI_Recv without any problems.</div>
                  <div><br></div>
                  <div>today, I setup mpich2 on two machines. Both machines can 
                  communicate with others, ssh are tested on both machines, mpd 
                  work, mpdringtest work.</div>
                  <div><br></div>
                  <div>however,when i run my program that use MPI_Send and 
                  MPI_Recv, &nbsp;MPI_Recv is blocked forever.</div>
                  <div>so i write new simple code to test MPI_Send,MPI_Recv like 
                  this</div>
                  <div><br></div>
                  <div>&nbsp;&nbsp; &nbsp; &nbsp; &nbsp;int myrank;</div>
                  <div>
                  <div>&nbsp;&nbsp; &nbsp; &nbsp; &nbsp;MPI_Status status;</div>
                  <div><span style="WHITE-SPACE:pre;" class="Apple-tab-span"></span>MPI_Init( &amp;argc, &amp;argv 
                  );</div>
                  <div><span style="WHITE-SPACE:pre;" class="Apple-tab-span"></span>MPI_Comm_rank( MPI_COMM_WORLD, 
                  &amp;myrank );</div>
                  <div><span style="WHITE-SPACE:pre;" class="Apple-tab-span"></span>if (myrank == 0)&nbsp;</div>
                  <div><span style="WHITE-SPACE:pre;" class="Apple-tab-span"></span>{</div>
                  <div><span style="WHITE-SPACE:pre;" class="Apple-tab-span"></span>int senddata = 1;</div>
                  <div><span style="WHITE-SPACE:pre;" class="Apple-tab-span"></span>MPI_Send(&amp;senddata, 1, 
                  MPI_INT, 1, 0, MPI_COMM_WORLD);</div>
                  <div><span style="WHITE-SPACE:pre;" class="Apple-tab-span"></span>}</div>
                  <div><span style="WHITE-SPACE:pre;" class="Apple-tab-span"></span>else if (myrank == 1)&nbsp;</div>
                  <div><span style="WHITE-SPACE:pre;" class="Apple-tab-span"></span>{</div>
                  <div><span style="WHITE-SPACE:pre;" class="Apple-tab-span"></span>int recvdata = 0;</div>
                  <div><span style="WHITE-SPACE:pre;" class="Apple-tab-span"></span>MPI_Recv(&amp;recvdata, 1, 
                  MPI_INT, 0, 0, MPI_COMM_WORLD, &amp;status);</div>
                  <div><span style="WHITE-SPACE:pre;" class="Apple-tab-span"></span>printf("received :%d:\n", 
                  recvdata);</div>
                  <div><span style="WHITE-SPACE:pre;" class="Apple-tab-span"></span>}</div>
                  <div><span style="WHITE-SPACE:pre;" class="Apple-tab-span"></span>MPI_Finalize();</div>
                  <div><br></div>
                  <div><br></div>
                  <div>i got this error</div>
                  <div><br></div>
                  <div><br></div>
                  <div>
                  <div>Assertion failed in file ch3_progress.c at line 489: 
                  pkt-&gt;type &gt;= 0 &amp;&amp; pkt-&gt;type &lt; 
                  MPIDI_NEM_PKT_END</div>
                  <div>internal ABORT - process 1</div>
                  <div>Fatal error in MPI_Finalize: Other MPI error, error 
                  stack:</div>
                  <div>MPI_Finalize(315)..................: MPI_Finalize 
                  failed</div>
                  <div>MPI_Finalize(207)..................:&nbsp;</div>
                  <div>MPID_Finalize(92)..................:&nbsp;</div>
                  <div>PMPI_Barrier(476)..................: 
                  MPI_Barrier(comm=0x44000002) failed</div>
                  <div>MPIR_Barrier(82)...................:&nbsp;</div>
                  <div>MPIC_Sendrecv(164).................:&nbsp;</div>
                  <div>MPIC_Wait(405).....................:&nbsp;</div>
                  <div>MPIDI_CH3I_Progress(150)...........:&nbsp;</div>
                  <div>MPID_nem_mpich2_blocking_recv(1074):&nbsp;</div>
                  <div>MPID_nem_tcp_connpoll(1667)........:&nbsp;</div>
                  <div>state_commrdy_handler(1517)........:&nbsp;</div>
                  <div>MPID_nem_tcp_recv_handler(1413)....: socket closed</div>
                  <div><br></div>
                  <div>////////////////////////////////////////////////////////////////</div>
                  <div><br></div>
                  <div>I also tried example/cpi that come with install package 
                  -&gt; result is the example program freezed, without any 
                  errors.(I assume it stopped at MPI_Bcast())</div>
                  <div><br></div>
                  <div>Can anyone help me with this?</div>
                  <div>This code and my program can run smoothly when I use 1 
                  machine (with option , &nbsp;-n 2, -n 4 .... etc) but whenever 
                  I start mpdboot with 2 machines, mpi processes can't 
                  communicate with other mpi processes via 
                  MPI_Send,MPI_Recv.</div>
                  <div><br></div>
                  <div>thx,</div>
                  <div>gra</div></div>
                  <div><br></div></div>
                  <div><br></div></td></tr></tbody></table><br></blockquote></div></blockquote></td></tr></tbody></table><br></blockquote> 
</div></blockquote></div></td></tr></table><br>