<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML><HEAD>
<META http-equiv=Content-Type content="text/html; charset=us-ascii">
<META content="MSHTML 6.00.6000.16674" name=GENERATOR></HEAD>
<BODY>
<DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN 
class=858455316-07082008>Hi,</SPAN></FONT></DIV>
<DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN 
class=858455316-07082008>&nbsp;Can you run cpi.exe (provided with MPICH2 in the 
examples directory) on all the nodes ?</SPAN></FONT></DIV>
<DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN 
class=858455316-07082008>&nbsp;Can you run a simple hello world program using 
all the nodes ?</SPAN></FONT></DIV>
<DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN 
class=858455316-07082008>&nbsp;Try running the programs with and without sharing 
(mapping network drive) the executable across nodes.</SPAN></FONT></DIV>
<DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN 
class=858455316-07082008></SPAN></FONT>&nbsp;</DIV>
<DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN 
class=858455316-07082008>/* ############ MPI Hello world ################ 
*/</SPAN></FONT></DIV>
<DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN 
class=858455316-07082008>#include &lt;stdio.h&gt;</SPAN></FONT></DIV>
<DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN 
class=858455316-07082008>#include "mpi.h"</SPAN></FONT></DIV>
<DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN 
class=858455316-07082008>int main(int argc, char *argv[]){</SPAN></FONT></DIV>
<DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN 
class=858455316-07082008>&nbsp;&nbsp;&nbsp; int rank;</SPAN></FONT></DIV>
<DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN 
class=858455316-07082008>&nbsp;&nbsp;&nbsp; MPI_Init(&amp;argc, 
&amp;argv);</SPAN></FONT></DIV>
<DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN 
class=858455316-07082008>&nbsp;&nbsp;&nbsp; MPI_Comm_rank(MPI_COMM_WORLD, 
&amp;rank);</SPAN></FONT></DIV>
<DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN 
class=858455316-07082008>&nbsp;&nbsp;&nbsp; printf("[%d] Hello world\n", 
rank);</SPAN></FONT></DIV>
<DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN 
class=858455316-07082008>&nbsp;&nbsp;&nbsp; MPI_Finalize();</SPAN></FONT></DIV>
<DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN 
class=858455316-07082008>}</SPAN></FONT></DIV>
<DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN 
class=858455316-07082008></SPAN></FONT>&nbsp;</DIV>
<DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN 
class=858455316-07082008></SPAN></FONT><FONT face=Arial color=#0000ff 
size=2><SPAN class=858455316-07082008><SPAN class=858455316-07082008>/* 
############ MPI Hello world ################ */</SPAN></SPAN></FONT></DIV>
<DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN 
class=858455316-07082008><SPAN 
class=858455316-07082008></SPAN></SPAN></FONT><FONT face=Arial color=#0000ff 
size=2><SPAN class=858455316-07082008><SPAN 
class=858455316-07082008></SPAN></SPAN></FONT><FONT face=Arial color=#0000ff 
size=2><SPAN class=858455316-07082008><SPAN 
class=858455316-07082008></SPAN></SPAN></FONT>&nbsp;</DIV>
<DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN 
class=858455316-07082008>Regards,</SPAN></FONT></DIV>
<DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN 
class=858455316-07082008>Jayesh</SPAN></FONT></DIV><BR>
<DIV class=OutlookMessageHeader lang=en-us dir=ltr align=left>
<HR tabIndex=-1>
<FONT face=Tahoma size=2><B>From:</B> warunapww@gmail.com 
[mailto:warunapww@gmail.com] <B>On Behalf Of </B>Waruna 
Ranasinghe<BR><B>Sent:</B> Thursday, August 07, 2008 11:36 AM<BR><B>To:</B> 
Jayesh Krishna<BR><B>Cc:</B> mpich-discuss@mcs.anl.gov<BR><B>Subject:</B> Re: 
[mpich-discuss] Cannot use the main node to run a process of the 
programme<BR></FONT><BR></DIV>
<DIV></DIV>
<DIV dir=ltr>Hi,<BR>I tried even mapping the drive as Jayesh mentioned, but the 
problem is still the same.<BR>If I run the programme only in the master node, 
then it will run. Otherwise if I use other nodes including master node to run 
the programme, the programme give the output but it won't exit (mpi finalize 
does not work or called)<BR><BR>Please help me to over come this 
issue.<BR><BR>Regards,<BR>Waruna Ranasinghe<BR><BR>
<DIV class=gmail_quote>2008/7/25 Jayesh Krishna <SPAN dir=ltr>&lt;<A 
href="mailto:jayesh@mcs.anl.gov">jayesh@mcs.anl.gov</A>&gt;</SPAN><BR>
<BLOCKQUOTE class=gmail_quote 
style="PADDING-LEFT: 1ex; MARGIN: 0pt 0pt 0pt 0.8ex; BORDER-LEFT: rgb(204,204,204) 1px solid">
  <DIV>
  <DIV dir=ltr align=left><FONT face=Arial color=#0000ff 
  size=2><SPAN>Hi,</SPAN></FONT></DIV>
  <DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN>&nbsp;You 
  should be able to use all the nodes (with MPICH2 installed) for running your 
  job (i.e., You should be able to use the main node to run your MPI 
  processes).</SPAN></FONT></DIV>
  <DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN>&nbsp;If 
  you are using a shared drive to run your program you should map the drive on 
  all the nodes using the "-map" option of mpiexec (see the windows developer's 
  guide, available at <A 
  href="http://www.mcs.anl.gov/research/projects/mpich2/documentation/index.php?s=docs" 
  target=_blank>http://www.mcs.anl.gov/research/projects/mpich2/documentation/index.php?s=docs</A>, 
  for details)</SPAN></FONT></DIV>
  <DIV dir=ltr align=left><FONT face=Arial color=#0000ff 
  size=2><SPAN></SPAN></FONT>&nbsp;</DIV>
  <DIV dir=ltr align=left><FONT face=Arial color=#0000ff 
  size=2><SPAN>Regards,</SPAN></FONT></DIV>
  <DIV dir=ltr align=left><FONT face=Arial color=#0000ff 
  size=2><SPAN>Jayesh</SPAN></FONT></DIV><BR>
  <DIV lang=en-us dir=ltr align=left>
  <HR>
  <FONT face=Tahoma size=2><B>From:</B> <A 
  href="mailto:owner-mpich-discuss@mcs.anl.gov" 
  target=_blank>owner-mpich-discuss@mcs.anl.gov</A> [mailto:<A 
  href="mailto:owner-mpich-discuss@mcs.anl.gov" 
  target=_blank>owner-mpich-discuss@mcs.anl.gov</A>] <B>On Behalf Of </B>Waruna 
  Ranasinghe<BR><B>Sent:</B> Friday, July 25, 2008 3:06 AM<BR><B>To:</B> <A 
  href="mailto:mpich-discuss@mcs.anl.gov" 
  target=_blank>mpich-discuss@mcs.anl.gov</A><BR><B>Subject:</B> [mpich-discuss] 
  Cannot use the main node to run a process of the 
programme<BR></FONT><BR></DIV>
  <DIV>
  <DIV></DIV>
  <DIV class=Wj3C7c>
  <DIV></DIV>
  <DIV dir=ltr>Hi all,<BR><BR>I'm using MPICH2 in Windows.<BR>I can run my 
  programme without errors if I don't use the machine in which I execute the 
  command (Main node).<BR><BR>mpiexec -channel ssm -n 3 -exitcodes -machinefile 
  "c:\Program Files\MPICH2\bin\hosts.txt" -wdir //<A 
  href="http://10.8.102.27/ClusterShared" 
  target=_blank>10.8.102.27/ClusterShared</A> GBMTest<BR><BR>If I use the main 
  node also to execute one of the 3 processes, then it gives the error below. 
  But it prints the output I wanted too. then it gives the error.<BR>I wanted to 
  know whether this is an issue with my programme(GBMTest) or I cant use the 
  main node to run the process.<BR>In the machinefile I have included three 
  machines. <BR><A href="http://10.8.102.28" target=_blank>10.8.102.28</A><BR><A 
  href="http://10.8.102.30" target=_blank>10.8.102.30</A><BR><A 
  href="http://10.8.102.27" target=_blank>10.8.102.27</A> (main 
  node)<BR><BR>This works fine if I remove the main node and add another node 
  instead.<BR><BR>this is the 
  error.<BR>////////////////////////////////////////////////////////////////////////////////////<BR>Fatal 
  error in MPI_Finalize: Other MPI error, error 
  stack:<BR>MPI_Finalize(255)............: MPI_Finalize 
  failed<BR>MPI_Finalize(154)............:<BR>MPID_Finalize(94)............:<BR>MPI_Barrier(406).............: 
  MPI_Barrier(comm=0x44000002) 
  failed<BR>MPIR_Barrier(77).............:<BR>MPIC_Sendrecv(120)...........:<BR>MPID_Isend(103)..............: 
  failure occurred while attempting to send an eage<BR>r 
  message<BR>MPIDI_CH3_iSend(168).........:<BR>MPIDI_CH3I_Sock_connect(1191): 
  [ch3:sock] rank 1 unable to connect to rank 2 usi<BR>ng business card 
  &lt;port=1179 description=cse-365237834578 ifname=<A href="http://10.8.102.27" 
  target=_blank>10.8.102.27</A> shm_<BR>host=cse-365237834578 
  shm_queue=376D692D-A683-4917-BF58-13BD35D071E8 shm_pid=284<BR>0 
  &gt;<BR>MPIDU_Sock_post_connect(1228): unable to connect to cse-365237834578 
  on port 117<BR>9, exhausted all endpoints (errno 
  -1)<BR>MPIDU_Sock_post_connect(1244): gethostbyname failed, The requested name 
  is valid<BR>&nbsp;and was found in the database, but it does not have the 
  correct associated data<BR>&nbsp;being resolved for. (errno 11004)<BR>job 
  aborted:<BR>rank: node: exit code[: error message]<BR>0: <A 
  href="http://10.8.102.28" target=_blank>10.8.102.28</A>: 1<BR>1: <A 
  href="http://10.8.102.30" target=_blank>10.8.102.30</A>: 1: Fatal error in 
  MPI_Finalize: Other MPI error, error stack:<BR>MPI_Finalize(255)............: 
  MPI_Finalize 
  failed<BR>MPI_Finalize(154)............:<BR>MPID_Finalize(94)............:<BR>MPI_Barrier(406).............: 
  MPI_Barrier(comm=0x44000002) 
  failed<BR>MPIR_Barrier(77).............:<BR>MPIC_Sendrecv(120)...........:<BR>MPID_Isend(103)..............: 
  failure occurred while attempting to send an eage<BR>r 
  message<BR>MPIDI_CH3_iSend(168).........:<BR>MPIDI_CH3I_Sock_connect(1191): 
  [ch3:sock] rank 1 unable to connect to rank 2 usi<BR>ng business card 
  &lt;port=1179 description=cse-365237834578 ifname=<A href="http://10.8.102.27" 
  target=_blank>10.8.102.27</A> shm_<BR>host=cse-365237834578 
  shm_queue=376D692D-A683-4917-BF58-13BD35D071E8 shm_pid=284<BR>0 
  &gt;<BR>MPIDU_Sock_post_connect(1228): unable to connect to cse-365237834578 
  on port 117<BR>9, exhausted all endpoints (errno 
  -1)<BR>MPIDU_Sock_post_connect(1244): gethostbyname failed, The requested name 
  is valid<BR>&nbsp;and was found in the database, but it does not have the 
  correct associated data<BR>&nbsp;being resolved for. (errno 11004)<BR>2: <A 
  href="http://10.8.102.27" target=_blank>10.8.102.27</A>: 
  1<BR></DIV></DIV></DIV></DIV></BLOCKQUOTE></DIV><BR></DIV></BODY></HTML>