<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML><HEAD><TITLE>RE: [mpich-discuss] mpiexec kills the remote login shell</TITLE>
<META http-equiv=Content-Type content="text/html; charset=us-ascii">
<META content="MSHTML 6.00.6000.16735" name=GENERATOR></HEAD>
<BODY>
<DIV dir=ltr align=left><SPAN class=880505814-04022009><FONT face=Arial 
color=#0000ff size=2>I meant Korebot... :)</FONT></SPAN></DIV><BR>
<DIV class=OutlookMessageHeader lang=en-us dir=ltr align=left>
<HR tabIndex=-1>
<FONT face=Tahoma size=2><B>From:</B> mpich-discuss-bounces@mcs.anl.gov 
[mailto:mpich-discuss-bounces@mcs.anl.gov] <B>On Behalf Of </B>Jayesh 
Krishna<BR><B>Sent:</B> Wednesday, February 04, 2009 8:56 AM<BR><B>To:</B> 
'Yu-Cheng Chou'<BR><B>Cc:</B> mpich-discuss@mcs.anl.gov<BR><B>Subject:</B> Re: 
[mpich-discuss] mpiexec kills the remote login shell<BR></FONT><BR></DIV>
<DIV></DIV>
<DIV dir=ltr align=left><SPAN class=192584614-04022009><FONT face=Arial 
color=#0000ff size=2>Hi,</FONT></SPAN></DIV>
<DIV dir=ltr align=left><SPAN class=192584614-04022009><FONT face=Arial 
color=#0000ff size=2>&nbsp; The mpiexec output shows the following error when 
running hellow,</FONT></SPAN></DIV>
<DIV dir=ltr align=left><SPAN class=192584614-04022009><FONT face=Arial 
color=#0000ff size=2>==================</FONT></SPAN></DIV>
<DIV dir=ltr align=left><SPAN class=192584614-04022009><SPAN lang=EN>
<P><FONT face=Arial><FONT color=#0000ff><FONT size=2>Unable to exec 'hello' on 
korebot<SPAN class=192584614-04022009> <SPAN lang=EN></P>
<P>Error 2 - No such file or directory</P>
<P><SPAN class=192584614-04022009><FONT face=Arial color=#0000ff 
size=2>==================</FONT></SPAN></P></SPAN></SPAN></FONT></FONT></FONT></SPAN></SPAN></DIV>
<DIV dir=ltr align=left><SPAN class=192584614-04022009><FONT face=Arial 
color=#0000ff size=2>&nbsp; Please provide the debug output of smpd (smpd 
-d&nbsp;2&gt;&amp;1 | tee&nbsp;smpd.out)&nbsp;along with mpiexec (mpiexec 
-verbose -n 2 ./hellow&nbsp;2&gt;&amp;1 | 
tee&nbsp;mpiexec.out).</FONT></SPAN></DIV>
<DIV dir=ltr align=left><SPAN class=192584614-04022009><FONT face=Arial 
color=#0000ff size=2></FONT></SPAN>&nbsp;</DIV>
<DIV dir=ltr align=left><SPAN class=192584614-04022009><FONT face=Arial 
color=#0000ff size=2>#&nbsp; Can you run simple C programs (without using 
mpiexec)&nbsp;on Korbet ?</FONT></SPAN></DIV>
<DIV dir=ltr align=left><SPAN class=192584614-04022009><FONT face=Arial 
color=#0000ff size=2>#&nbsp; Is the ssh connection aborted when you run non-MPI 
programs (mpiexec -n 2 hostname)&nbsp;?</FONT></SPAN></DIV>
<DIV dir=ltr align=left><SPAN class=192584614-04022009><FONT face=Arial 
color=#0000ff size=2>#&nbsp; Can you send us your ".smpd" config file 
?</FONT></SPAN></DIV>
<DIV dir=ltr align=left><SPAN class=192584614-04022009><FONT face=Arial 
color=#0000ff size=2>#&nbsp; Did you&nbsp;modify the MPICH2 code to run on 
Korbet (Please send us your configure command &amp; any env settings set to 
configure/make MPICH2)? </FONT></SPAN></DIV>
<DIV dir=ltr align=left><SPAN class=192584614-04022009></SPAN>&nbsp;</DIV>
<DIV dir=ltr align=left><SPAN class=192584614-04022009><FONT face=Arial 
color=#0000ff size=2>Regards,</FONT></SPAN></DIV>
<DIV dir=ltr align=left><SPAN class=192584614-04022009><FONT face=Arial 
color=#0000ff size=2>Jayesh</FONT></SPAN></DIV>
<DIV dir=ltr align=left><SPAN class=192584614-04022009></SPAN>&nbsp;</DIV>
<DIV dir=ltr align=left>
<HR tabIndex=-1>
</DIV>
<DIV dir=ltr align=left><FONT face=Tahoma size=2><B>From:</B> 
mpich-discuss-bounces@mcs.anl.gov [mailto:mpich-discuss-bounces@mcs.anl.gov] 
<B>On Behalf Of </B>Jayesh Krishna<BR><B>Sent:</B> Wednesday, February 04, 2009 
8:41 AM<BR><B>To:</B> 'Yu-Cheng Chou'<BR><B>Cc:</B> 
mpich-discuss@mcs.anl.gov<BR><B>Subject:</B> Re: [mpich-discuss] mpiexec kills 
the remote login shell<BR></FONT><BR></DIV>
<DIV></DIV><!-- Converted from text/plain format -->
<P><FONT size=2>&nbsp;Hi,<BR>&nbsp; I will take a look at the debug logs and get 
back to you. Meanwhile, can you run simple C programs without using mpiexec on 
Korbet ?<BR>&nbsp; MPICH2 currently does not support heterogeneous systems (So 
you won't be able to run your MPI job across ARM &amp; other 
architectures).<BR><BR>Regards,<BR>Jayesh<BR><BR>-----Original 
Message-----<BR>From: Yu-Cheng Chou [<A 
href="mailto:cycchou@ucdavis.edu">mailto:cycchou@ucdavis.edu</A>]<BR>Sent: 
Tuesday, February 03, 2009 7:52 PM<BR>To: Jayesh Krishna<BR>Cc: 
mpich-discuss@mcs.anl.gov<BR>Subject: Re: [mpich-discuss] mpiexec kills the 
remote login shell<BR><BR>&gt; # Can you run non-MPI programs using mpiexec 
(mpiexec -n 2 hostname) ?<BR>Yes.<BR><BR>&gt; # Can you compile and run the 
hello world program (examples/hellow.c)<BR>&gt; provided with MPICH2 (mpiexec -n 
2 ./hellow)?<BR>Yes.<BR><BR>&gt; # How did you start smpd (the command used to 
start smpd) ? How did<BR>&gt; you run your MPI job (the command used to run your 
job)?<BR>I have a ".smpd" file containing one line of information, which is 
"phrase=123".<BR>Thus, I started smpd using "smpd -s".<BR>Then I used "mpiexec 
-n 1 hellow" to run hellow on Korebot.<BR><BR>&gt; # How did you find that 
mpiexec kills the sshd process (We typically<BR>&gt; ssh to unix machines and 
run mpiexec without any problems) ?<BR>I logged in Korebot with two 
terminals.<BR>&gt;From #1 terminal, I checked all the processes running on 
Korebot.<BR>&gt;From #2 terminal, I started smpd and run hellow using the 
commands mentioned above.<BR>After hellow was finished, the connection to 
Korebot via #2 terminal was closed.<BR>&gt;From #1 terminal, I knew that the 
sshd process associated with #2 terminal was gone.<BR><BR>&gt;&nbsp; Can you run 
smpd/mpiexec in debug mode and provide us with the<BR>&gt; outputs (smpd -d / 
mpiexec -n 2 -verbose hostname) ?<BR>The first attached text file is the output 
from running hellow in mpiexec's verbose mode.<BR><BR><BR>There is another 
issue.<BR>This time, I used two machines. One is Korebot as mentioned above, and 
the other is a laptop running Ubuntu Linux OS.<BR>I started smpd with the same 
".smpd" file and command as mentioned above both on Korebot and the lap 
top.<BR>There is a machine file called "hostfile" on Korebot. The file contains 
the following information about the name of the two 
machines.<BR><BR>korebot<BR>shrimp<BR><BR>Then from Korebot, I ran cpi using the 
following command.<BR><BR>mpiexec -machinefile ./hostfile -verbose -n 2 
cpi<BR><BR><BR>But the value of pi is a huge number. I think it is related to 
"double type variables" being transferred between processes running on an 
ARM-based Linux and a general Linux machines.<BR><BR>The second attached text 
file is the output from running cpi in mpiexec's verbose 
mode.<BR><BR><BR>&gt;<BR>&gt; I am cross-compiling mpich2-1.0.8 with smpd for 
Khepera III mobile robot.<BR>&gt;<BR>&gt; This mobile robot has a Korebot board 
which is an ARM-based computer<BR>&gt; with a Linux operating 
system.<BR>&gt;<BR>&gt; The cross-compilation was fine.<BR>&gt;<BR>&gt; Firstly, 
I logged in to Korebot through ssh.<BR>&gt; Secondly, I started smpd.<BR>&gt; 
Thirdly, I ran mpiexec to execute an MPI program (cpi) that comes with<BR>&gt; 
the package.<BR>&gt;<BR>&gt; The result was correct, but when mpiexec was 
finished, the ssh<BR>&gt; connection to the Korebot was closed.<BR>&gt; I found 
that mpiexec kills the sshd process through which I was<BR>&gt; remotely 
connected to Korebot.<BR>&gt;<BR>&gt; I've been looking for the cause, but still 
have not found any clues.<BR>&gt;<BR>&gt; Could you give me any ideas to solve 
this problem?<BR>&gt;<BR>&gt; Thank you,<BR>&gt;<BR>&gt; 
Yu-Cheng<BR>&gt;<BR></FONT></P></BODY></HTML>