Thanks for your reply. To answer your questions, I configured MPICH2 to use gfortran (v 4.5.1). I am compiling with the newly installed mpif90, not the original<div><br></div><div>which mpif90</div><div>/usr/local/mpich2/bin/mpif90</div>

<div><br></div><div>not /usr/bin/mpif90, which gives a different error message about not supporting fortran.</div><div><br></div><div>The output from using show is:</div><div><br></div><div><div>/usr/local/bin/gfortran -c bla.f -mcmodel=large -I/usr/local/mpich2/include -L/usr/local/mpich2/lib -cpp -I/usr/local/mpich2/include -I/usr/local/mpich2/include</div>

</div><div><br></div><div>And just to repeat, the compiler error messages are below.</div><div><br></div><div><div>/var/folders/zz/zzzivhrRnAmviuee++2ZO++-7KU/-Tmp-//ccsWDdv3.s:23533:junk `@PLTOFF&#39; after expression</div>

<div>/var/folders/zz/zzzivhrRnAmviuee++2ZO++-7KU/-Tmp-//ccsWDdv3.s:23537:junk `@GOTOFF&#39; after expression</div></div><div><br></div><div><br></div><div>Thanks for your help!</div><div>Brandt</div><div><br></div><div><br>

<br><div class="gmail_quote">On Fri, Feb 11, 2011 at 2:35 AM,  <span dir="ltr">&lt;<a href="mailto:mpich-discuss-request@mcs.anl.gov">mpich-discuss-request@mcs.anl.gov</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">

Send mpich-discuss mailing list submissions to<br>
        <a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>
<br>
To subscribe or unsubscribe via the World Wide Web, visit<br>
        <a href="https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss" target="_blank">https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss</a><br>
or, via email, send a message with subject or body &#39;help&#39; to<br>
        <a href="mailto:mpich-discuss-request@mcs.anl.gov">mpich-discuss-request@mcs.anl.gov</a><br>
<br>
You can reach the person managing the list at<br>
        <a href="mailto:mpich-discuss-owner@mcs.anl.gov">mpich-discuss-owner@mcs.anl.gov</a><br>
<br>
When replying, please edit your Subject line so it is more specific<br>
than &quot;Re: Contents of mpich-discuss digest...&quot;<br>
<br>
<br>
Today&#39;s Topics:<br>
<br>
   1. Re:  Error when compiling with mpif90 (Dave Goodell)<br>
   2. Re:  problem when installing MPICH2 (Rajeev Thakur)<br>
   3. Re:  MPICH 2 on Window 7 home premium (Koh Voon Li)<br>
   4. Re:  Problem with spawning child with same executable name<br>
      (Yauheni Zelenko)<br>
   5.  Strange MPI_Recv error (Xiao Li)<br>
   6. Re:  Strange MPI_Recv error (Xiao Li)<br>
<br>
<br>
----------------------------------------------------------------------<br>
<br>
Message: 1<br>
Date: Thu, 10 Feb 2011 12:35:08 -0600<br>
From: Dave Goodell &lt;<a href="mailto:goodell@mcs.anl.gov">goodell@mcs.anl.gov</a>&gt;<br>
Subject: Re: [mpich-discuss] Error when compiling with mpif90<br>
To: <a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>
Message-ID: &lt;<a href="mailto:C92F4176-7680-48BD-ADB7-D8AC30FB16F0@mcs.anl.gov">C92F4176-7680-48BD-ADB7-D8AC30FB16F0@mcs.anl.gov</a>&gt;<br>
Content-Type: text/plain; charset=us-ascii<br>
<br>
What Fortran compiler are you using?  Is your application compiled with &quot;mpif90&quot;?  Are you sure that it&#39;s the MPICH2 mpif90 script and not the one from the system-installed Open MPI in /usr/bin/mpif90?<br>
<br>
Those error messages are strange.  I think that indicate your compiler is producing assembly code that contains ELF-specific code, even though Darwin uses the Mach-O binary format.  What adding &quot;-show&quot; to your failing mpif90 compile command yield?<br>


<br>
-Dave<br>
<br>
On Feb 9, 2011, at 10:54 PM CST, Brandt Belson wrote:<br>
<br>
&gt; Hello,<br>
&gt; I&#39;m a relatively new user of MPICH2. I installed it and tried to compile a fortran code on mac OS 10.6. The code has compiled on linux machines before with other MPI libraries. I configured with:<br>
&gt;<br>
&gt; ./configure --enable-sharedlibs=osx-gcc --prefix=/usr/local/mpich2 --enable-f77 --enable-fx --enable-shared<br>
&gt;<br>
&gt; The installation seemed to go well, I installed to /usr/local/mpich2 and set my PATH and LD_LIBRARY_PATH variables to match this. When compiling, I also included the folder with -I/usr/local/mpich2/include. However, I get this strange looking (at least to me) error message.<br>


&gt;<br>
&gt; /var/folders/zz/zzzivhrRnAmviuee++2ZO++-7KU/-Tmp-//ccVkj3hf.s:595:junk `@PLTOFF&#39; after expression<br>
&gt; /var/folders/zz/zzzivhrRnAmviuee++2ZO++-7KU/-Tmp-//ccVkj3hf.s:608:junk `@GOTOFF&#39; after expression<br>
&gt; (many more of the same thing)<br>
&gt; make: *** [bla.o] Error 1<br>
&gt;<br>
&gt; I tried restarting my computer thinking there might be temporary files that would be deleted, but I got the same error. Has anyone else had a similar problem and found a solution?<br>
&gt;<br>
&gt; Thanks,<br>
&gt; Brandt<br>
&gt;<br>
&gt; _______________________________________________<br>
&gt; mpich-discuss mailing list<br>
&gt; <a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>
&gt; <a href="https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss" target="_blank">https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss</a><br>
<br>
<br>
<br>
------------------------------<br>
<br>
Message: 2<br>
Date: Thu, 10 Feb 2011 13:08:22 -0600<br>
From: Rajeev Thakur &lt;<a href="mailto:thakur@mcs.anl.gov">thakur@mcs.anl.gov</a>&gt;<br>
Subject: Re: [mpich-discuss] problem when installing MPICH2<br>
To: <a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>
Message-ID: &lt;<a href="mailto:3241C92E-E89E-46C6-B9E2-D62A9DE54962@mcs.anl.gov">3241C92E-E89E-46C6-B9E2-D62A9DE54962@mcs.anl.gov</a>&gt;<br>
Content-Type: text/plain; charset=us-ascii<br>
<br>
Make sure there is no firewall preventing the two machines from communicating with each other.<br>
<br>
Rajeev<br>
<br>
On Feb 10, 2011, at 9:06 AM, Faiza Khali wrote:<br>
<br>
&gt; Hello;<br>
&gt; My name is Bouamra. I have Installing the Mpich2-1.3.2 package on my Computers; But I have a problem when executing the MPI. I have 2 Pcs Dell Dual core (OPTIPLEX 380). I send you the message when I execute the mpiexec. Can you Help me?<br>


&gt; Best Regards<br>
&gt;<br>
&gt; &lt;mpich2 message error.odt&gt;_______________________________________________<br>
&gt; mpich-discuss mailing list<br>
&gt; <a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>
&gt; <a href="https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss" target="_blank">https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss</a><br>
<br>
<br>
<br>
------------------------------<br>
<br>
Message: 3<br>
Date: Fri, 11 Feb 2011 09:59:38 +0800<br>
From: Koh Voon Li &lt;<a href="mailto:kohvoonli@gmail.com">kohvoonli@gmail.com</a>&gt;<br>
Subject: Re: [mpich-discuss] MPICH 2 on Window 7 home premium<br>
To: Jayesh Krishna &lt;<a href="mailto:jayesh@mcs.anl.gov">jayesh@mcs.anl.gov</a>&gt;<br>
Cc: <a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>
Message-ID:<br>
        &lt;<a href="mailto:AANLkTinTncomqtajazbuhmSN7a8YjXLoVG1Jpxq6zm03@mail.gmail.com">AANLkTinTncomqtajazbuhmSN7a8YjXLoVG1Jpxq6zm03@mail.gmail.com</a>&gt;<br>
Content-Type: text/plain; charset=&quot;iso-8859-1&quot;<br>
<br>
Yes. I able registered on both machine. But when I tried to just launch<br>
simply command I got error message as stated below:<br>
<br>
C:\&gt;mpiexec -hosts 2 WIN7-PC 1 user-PC 1 &quot;c:\program<br>
files\fds\fds5\bin\fds5_mpi<br>
_win_64.exe&quot;<br>
abort: Unable to connect to user-PC<br>
<br>
For your information, I have turned off both Window firewall. But still<br>
failed to launch any job.<br>
<br>
On Thu, Feb 10, 2011 at 11:52 PM, Jayesh Krishna &lt;<a href="mailto:jayesh@mcs.anl.gov">jayesh@mcs.anl.gov</a>&gt; wrote:<br>
<br>
&gt; Hi,<br>
&gt;  Is the username/password valid on the second machine (Do you have the same<br>
&gt; Windows username/password on the second machine ? )? If so, you should be<br>
&gt; able to run your job. Are you able to run your job now ?<br>
&gt;  Registration of username/password is local to the machine. MPICH2 does not<br>
&gt; automatically register the same username on all the nodes. If you would like<br>
&gt; to register username/password on each machine you should register the<br>
&gt; credentials on each (Type &quot;mpiexec -register&quot; on each). However, to launch<br>
&gt; your job you need to have the username/password registered only on the<br>
&gt; machine/node where you launch your job.<br>
&gt;  Let us know the results.<br>
&gt;<br>
&gt; Regards,<br>
&gt; Jayesh<br>
&gt;<br>
&gt; ----- Original Message -----<br>
&gt; From: &quot;Koh Voon Li&quot; &lt;<a href="mailto:kohvoonli@gmail.com">kohvoonli@gmail.com</a>&gt;<br>
&gt; To: &quot;Jayesh Krishna&quot; &lt;<a href="mailto:jayesh@mcs.anl.gov">jayesh@mcs.anl.gov</a>&gt;<br>
&gt; Sent: Thursday, February 10, 2011 9:30:16 AM<br>
&gt; Subject: Re: MPICH 2 on Window 7 home premium<br>
&gt;<br>
&gt; Hi,<br>
&gt;<br>
&gt; Thanks for the reply. I was able to registered 2 username on 1 of my<br>
&gt; computer, but I got error message on my 2nd computer when I try to validate<br>
&gt; user on it.<br>
&gt;<br>
&gt; Here is the error message.<br>
&gt; FAIL: Unable to read the credentials from the registry.<br>
&gt;<br>
&gt; Thanks,<br>
&gt;<br>
&gt; Regards,<br>
&gt; KOH<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; On Thu, Feb 10, 2011 at 10:10 PM, Jayesh Krishna &lt; <a href="mailto:jayesh@mcs.anl.gov">jayesh@mcs.anl.gov</a> &gt;<br>
&gt; wrote:<br>
&gt;<br>
&gt;<br>
&gt; Hi,<br>
&gt;<br>
&gt;<br>
&gt; &gt;&gt; Credentials for USER-PC\WIN 7 rejected connecting to user-PC<br>
&gt; &gt;&gt; Aborting: Unable to connect to user-PC<br>
&gt;<br>
&gt; From the error message it looks like you haven&#39;t registered a valid<br>
&gt; username/password with mpiexec. Please register a valid Windows<br>
&gt; username/password with mpiexec using the &quot;-register&quot; option (Type &quot;mpiexec<br>
&gt; -register&quot; at the command prompt and mpiexec will prompt you for the<br>
&gt; username/password). Once the registration is complete validate it using the<br>
&gt; &quot;-validate&quot; option (Type &quot;mpiexec -validate&quot; at the command prompt). If you<br>
&gt; have registered a valid Windows username/password the validate option should<br>
&gt; return SUCCESS.<br>
&gt; Let us know the results.<br>
&gt;<br>
&gt; Regards,<br>
&gt; Jayesh<br>
&gt;<br>
&gt;<br>
&gt; ----- Original Message -----<br>
&gt; From: &quot;Koh Voon Li&quot; &lt; <a href="mailto:kohvoonli@gmail.com">kohvoonli@gmail.com</a> &gt;<br>
&gt;<br>
&gt; To: <a href="mailto:jayesh@mcs.anl.gov">jayesh@mcs.anl.gov</a><br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; Sent: Thursday, February 10, 2011 2:59:35 AM<br>
&gt; Subject: Fwd: MPICH 2 on Window 7 home premium<br>
&gt;<br>
&gt;<br>
&gt; Hi Jayesh,<br>
&gt;<br>
&gt; Sorry for bothering. Attached here is the smpd log in debug mode.<br>
&gt; Million Thanks.<br>
&gt;<br>
&gt;<br>
&gt; Regards,<br>
&gt; KOH<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; ---------- Forwarded message ----------<br>
&gt; From: Koh Voon Li &lt; <a href="mailto:kohvoonli@gmail.com">kohvoonli@gmail.com</a> &gt;<br>
&gt; Date: Thu, Feb 10, 2011 at 3:30 PM<br>
&gt; Subject: MPICH 2 on Window 7 home premium<br>
&gt; To: <a href="mailto:jayesh@mcs.anl.gov">jayesh@mcs.anl.gov</a><br>
&gt;<br>
&gt;<br>
&gt; Hi Jayesh,<br>
&gt;<br>
&gt;<br>
&gt; I am trying to running parallel FDS (Fire Dynamic Simulator) via 2 PC by<br>
&gt; using a config file<br>
&gt;<br>
&gt;<br>
&gt; here is my config file<br>
&gt;<br>
&gt; exe &quot;C:\Program Files\FDS\FDS5\bin\fds5_mpi_win_64.exe&quot; &quot;ParadigmV4-13.fds&quot;<br>
&gt; wdir &quot;\\USER-PC\Project\Paradigm\&quot;<br>
&gt; hosts<br>
&gt; user-PC 6<br>
&gt; WIN7-PC 6<br>
&gt;<br>
&gt;<br>
&gt; This is the error message I got from the command prompt.<br>
&gt;<br>
&gt; C:\&gt;mpiexec -file config.txt<br>
&gt; Credentials for USER-PC\WIN 7 rejected connecting to user-PC<br>
&gt; Aborting: Unable to connect to user-PC<br>
&gt;<br>
&gt;<br>
&gt; I used a cross over cable to connect both PCs and I think my setting for<br>
&gt; the IP address is correct as I can ping each other computer in the command<br>
&gt; prompt.<br>
&gt; I tried to turned off both firewall but it failed.<br>
&gt; Thanks,<br>
&gt;<br>
&gt;<br>
&gt; Regards,<br>
&gt; Koh<br>
&gt;<br>
&gt;<br>
&gt;<br>
-------------- next part --------------<br>
An HTML attachment was scrubbed...<br>
URL: &lt;<a href="http://lists.mcs.anl.gov/pipermail/mpich-discuss/attachments/20110211/bf620fe6/attachment-0001.htm" target="_blank">http://lists.mcs.anl.gov/pipermail/mpich-discuss/attachments/20110211/bf620fe6/attachment-0001.htm</a>&gt;<br>


<br>
------------------------------<br>
<br>
Message: 4<br>
Date: Thu, 10 Feb 2011 18:41:59 -0800<br>
From: Yauheni Zelenko &lt;<a href="mailto:zelenko@cadence.com">zelenko@cadence.com</a>&gt;<br>
Subject: Re: [mpich-discuss] Problem with spawning child with same<br>
        executable name<br>
To: &quot;<a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a>&quot; &lt;<a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a>&gt;<br>
Message-ID:<br>
        &lt;<a href="mailto:E990625543463A44A740F9148BB8C1E6077A6FE388@MAILSJ3.global.cadence.com">E990625543463A44A740F9148BB8C1E6077A6FE388@MAILSJ3.global.cadence.com</a>&gt;<br>
<br>
Content-Type: text/plain; charset=&quot;us-ascii&quot;<br>
<br>
Hi, Pavan!<br>
<br>
I added some debugging output with timestamps.<br>
<br>
New set of children spawned after previous set of children call MPI_Finalize. However all processes exited only after mater terminated.<br>
<br>
I definitely could lead to more resource usage in supposed program usage since children still some amount of system resources.<br>
<br>
Also I&#39;m not sure that at this stage Hydra will have enough information to launch new child processes on freed hosts.<br>
<br>
Eugene.<br>
________________________________________<br>
From: Pavan Balaji [<a href="mailto:balaji@mcs.anl.gov">balaji@mcs.anl.gov</a>]<br>
Sent: Wednesday, February 09, 2011 2:31 PM<br>
To: Yauheni Zelenko<br>
Cc: <a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>
Subject: Re: [mpich-discuss] Problem with spawning child with same executable name<br>
<br>
So the first set of spawned processes have terminated before the next set is started, is it?<br>
<br>
Pavan Balaji @ iPhone<br>
(Big fingers. Small email.)<br>
<br>
On Feb 9, 2011, at 2:20 PM, Yauheni Zelenko &lt;<a href="mailto:zelenko@cadence.com">zelenko@cadence.com</a>&gt; wrote:<br>
<br>
&gt; But there is still living process on host1. I think accounting fact this will be more correct Hydra behaviour.<br>
&gt;<br>
&gt; Eugene.<br>
&gt; ________________________________________<br>
&gt; From: Pavan Balaji [<a href="mailto:balaji@mcs.anl.gov">balaji@mcs.anl.gov</a>]<br>
&gt; Sent: Wednesday, February 09, 2011 2:11 PM<br>
&gt; To: <a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>
&gt; Cc: Yauheni Zelenko<br>
&gt; Subject: Re: [mpich-discuss] Problem with spawning child with same executable name<br>
&gt;<br>
&gt; On 02/09/2011 04:06 PM, Yauheni Zelenko wrote:<br>
&gt;&gt; Then I run program with Hydra: mpiexec -host &quot;host1:2,host2:2&quot;<br>
&gt;&gt;<br>
&gt;&gt; Master process is run on host1. At first spawn 1 child was run on<br>
&gt;&gt; host1 and 2 on host2, but on consequent spawns, 2 children was on<br>
&gt;&gt; host1 and 1 on host2.<br>
&gt;&gt;<br>
&gt;&gt; I think such resources allocation may create balancing problems and<br>
&gt;&gt; Hydra should not spawn children processes on hosts still in use.<br>
&gt;<br>
&gt; That sound correct to me. Hydra looks at the host list as:<br>
&gt;<br>
&gt; host1, host1, host2, host2, ..., [wrap around].<br>
&gt;<br>
&gt; The master process is launched on the first &quot;host1&quot;. When you spawn<br>
&gt; three processes the first time, it launches them on &quot;host1&quot;, &quot;host2&quot;,<br>
&gt; and &quot;host2&quot;. When you spawn three processes the second time, it launches<br>
&gt; them on &quot;host1&quot;, &quot;host1&quot;, &quot;host2&quot;. The next spawn of three processes<br>
&gt; will be &quot;host2&quot;, &quot;host1&quot;, &quot;host1&quot;, etc.<br>
&gt;<br>
&gt;  -- Pavan<br>
&gt;<br>
&gt; --<br>
&gt; Pavan Balaji<br>
&gt; <a href="http://www.mcs.anl.gov/~balaji" target="_blank">http://www.mcs.anl.gov/~balaji</a><br>
-------------- next part --------------<br>
A non-text attachment was scrubbed...<br>
Name: Spawn.c<br>
Type: application/octet-stream<br>
Size: 2696 bytes<br>
Desc: Spawn.c<br>
URL: &lt;<a href="http://lists.mcs.anl.gov/pipermail/mpich-discuss/attachments/20110210/65abc774/attachment-0001.obj" target="_blank">http://lists.mcs.anl.gov/pipermail/mpich-discuss/attachments/20110210/65abc774/attachment-0001.obj</a>&gt;<br>


<br>
------------------------------<br>
<br>
Message: 5<br>
Date: Fri, 11 Feb 2011 00:59:26 -0500<br>
From: Xiao Li &lt;<a href="mailto:shinelee.thewise@gmail.com">shinelee.thewise@gmail.com</a>&gt;<br>
Subject: [mpich-discuss] Strange MPI_Recv error<br>
To: <a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>
Message-ID:<br>
        &lt;AANLkTikDQLNX0ZLs7wCD5g0b7bWWhfJ_NW_e=<a href="mailto:cVv3hBC@mail.gmail.com">cVv3hBC@mail.gmail.com</a>&gt;<br>
Content-Type: text/plain; charset=&quot;iso-8859-1&quot;<br>
<br>
Hi,<br>
<br>
I use a small MPI program and get the following error.<br>
<br>
Fatal error in MPI_Recv: Other MPI error, error stack:<br>
&gt; MPI_Recv(186)........................: MPI_Recv(buf=0012FA20, count=1,<br>
&gt; MPI_INT,<br>
&gt; src=MPI_ANY_SOURCE, tag=5, MPI_COMM_WORLD, status=0012FA80) failed<br>
&gt; MPIDI_CH3I_Progress(335).............:<br>
&gt; MPID_nem_mpich2_blocking_recv(906)...:<br>
&gt; MPID_nem_newtcp_module_poll(37)......:<br>
&gt; MPID_nem_newtcp_module_connpoll(2655):<br>
&gt; gen_read_fail_handler(1145)..........: read from socket failed - The<br>
&gt; specified network name is no longer available.<br>
<br>
<br>
The code framework is something like this below.<br>
<br>
if rank == 0<br>
{<br>
  for iter=1 to N<br>
       MPI_Recv any<br>
       get proc rank from status<br>
       MPI_Send proc<br>
  end<br>
}<br>
else<br>
{<br>
       for iter=1 to N<br>
           MPI_Send to 0<br>
           MPI_Recv from 0<br>
           do some computation  here<br>
       end<br>
}<br>
<br>
I do check my code carefully. And I even rewrite the core computation code<br>
in a series way. Then I get no error.  Even more strange is that the code<br>
will crash at different for loop iteration. I suspect the MPI can not work<br>
in my network environment. The network is composed by four Windows XP<br>
machines with 100/mbps Ethernet network. Would you help me on this issue?<br>
<br>
cheers<br>
Xiao<br>
-------------- next part --------------<br>
An HTML attachment was scrubbed...<br>
URL: &lt;<a href="http://lists.mcs.anl.gov/pipermail/mpich-discuss/attachments/20110211/a2cafa3e/attachment.htm" target="_blank">http://lists.mcs.anl.gov/pipermail/mpich-discuss/attachments/20110211/a2cafa3e/attachment.htm</a>&gt;<br>


<br>
------------------------------<br>
<br>
Message: 6<br>
Date: Fri, 11 Feb 2011 01:14:49 -0500<br>
From: Xiao Li &lt;<a href="mailto:shinelee.thewise@gmail.com">shinelee.thewise@gmail.com</a>&gt;<br>
Subject: Re: [mpich-discuss] Strange MPI_Recv error<br>
To: <a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>
Message-ID:<br>
        &lt;AANLkTi=<a href="mailto:PpHN9Cput%2BpzQh0brA4ATP4yQ5TCFTre32yjJ@mail.gmail.com">PpHN9Cput+pzQh0brA4ATP4yQ5TCFTre32yjJ@mail.gmail.com</a>&gt;<br>
Content-Type: text/plain; charset=&quot;iso-8859-1&quot;<br>
<br>
PS:<br>
<br>
When the code error is reported at iteration n, if I restart the program at<br>
iteration n-1, then everything goes fine for several iteration rounds. Then,<br>
the error occurs again.<br>
<br>
On Fri, Feb 11, 2011 at 12:59 AM, Xiao Li &lt;<a href="mailto:shinelee.thewise@gmail.com">shinelee.thewise@gmail.com</a>&gt;wrote:<br>
<br>
&gt; Hi,<br>
&gt;<br>
&gt; I use a small MPI program and get the following error.<br>
&gt;<br>
&gt; Fatal error in MPI_Recv: Other MPI error, error stack:<br>
&gt;&gt; MPI_Recv(186)........................: MPI_Recv(buf=0012FA20, count=1,<br>
&gt;&gt; MPI_INT,<br>
&gt;&gt; src=MPI_ANY_SOURCE, tag=5, MPI_COMM_WORLD, status=0012FA80) failed<br>
&gt;&gt; MPIDI_CH3I_Progress(335).............:<br>
&gt;&gt; MPID_nem_mpich2_blocking_recv(906)...:<br>
&gt;&gt; MPID_nem_newtcp_module_poll(37)......:<br>
&gt;&gt; MPID_nem_newtcp_module_connpoll(2655):<br>
&gt;&gt; gen_read_fail_handler(1145)..........: read from socket failed - The<br>
&gt;&gt; specified network name is no longer available.<br>
&gt;<br>
&gt;<br>
&gt; The code framework is something like this below.<br>
&gt;<br>
&gt; if rank == 0<br>
&gt; {<br>
&gt;   for iter=1 to N<br>
&gt;        MPI_Recv any<br>
&gt;        get proc rank from status<br>
&gt;        MPI_Send proc<br>
&gt;   end<br>
&gt; }<br>
&gt; else<br>
&gt; {<br>
&gt;        for iter=1 to N<br>
&gt;            MPI_Send to 0<br>
&gt;            MPI_Recv from 0<br>
&gt;            do some computation  here<br>
&gt;        end<br>
&gt; }<br>
&gt;<br>
&gt; I do check my code carefully. And I even rewrite the core computation code<br>
&gt; in a series way. Then I get no error.  Even more strange is that the code<br>
&gt; will crash at different for loop iteration. I suspect the MPI can not work<br>
&gt; in my network environment. The network is composed by four Windows XP<br>
&gt; machines with 100/mbps Ethernet network. Would you help me on this issue?<br>
&gt;<br>
&gt; cheers<br>
&gt; Xiao<br>
&gt;<br>
&gt;<br>
-------------- next part --------------<br>
An HTML attachment was scrubbed...<br>
URL: &lt;<a href="http://lists.mcs.anl.gov/pipermail/mpich-discuss/attachments/20110211/9c14b206/attachment.htm" target="_blank">http://lists.mcs.anl.gov/pipermail/mpich-discuss/attachments/20110211/9c14b206/attachment.htm</a>&gt;<br>


<br>
------------------------------<br>
<br>
_______________________________________________<br>
mpich-discuss mailing list<br>
<a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>
<a href="https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss" target="_blank">https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss</a><br>
<br>
<br>
End of mpich-discuss Digest, Vol 29, Issue 29<br>
*********************************************<br>
</blockquote></div><br></div>