<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML><HEAD><TITLE>RE: [mpich-discuss] mpiexec kills the remote login shell</TITLE>
<META http-equiv=Content-Type content="text/html; charset=us-ascii">
<META content="MSHTML 6.00.6000.16735" name=GENERATOR></HEAD>
<BODY>
<DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN 
class=921291219-04022009>Hi,</SPAN></FONT></DIV>
<DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN 
class=921291219-04022009>&nbsp;Can you try running (without mpiexec) a simple C 
program with exit(-1) on Korebot ?</SPAN></FONT></DIV>
<DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN 
class=921291219-04022009></SPAN></FONT>&nbsp;</DIV>
<DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN 
class=921291219-04022009>========================================</SPAN></FONT></DIV>
<DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN 
class=921291219-04022009>#include &lt;stdlib.h&gt;</SPAN></FONT></DIV>
<DIV><FONT face=Arial color=#0000ff size=2><SPAN class=921291219-04022009>int 
main(int argc, char *argv[])<BR>{<BR>&nbsp;&nbsp;&nbsp; exit(-1);<BR>}<BR><FONT 
face=Arial color=#0000ff size=2><SPAN 
class=921291219-04022009>========================================</SPAN></FONT></SPAN></FONT></DIV>
<DIV><FONT face=Arial color=#0000ff size=2><SPAN class=921291219-04022009><FONT 
face=Arial color=#0000ff size=2><SPAN 
class=921291219-04022009></SPAN></FONT></SPAN></FONT>&nbsp;</DIV>
<DIV><FONT face=Arial color=#0000ff size=2><SPAN class=921291219-04022009><FONT 
face=Arial color=#0000ff size=2><SPAN 
class=921291219-04022009>Regards,</SPAN></FONT></SPAN></FONT></DIV>
<DIV><FONT face=Arial color=#0000ff size=2><SPAN class=921291219-04022009><FONT 
face=Arial color=#0000ff size=2><SPAN 
class=921291219-04022009>Jayesh</SPAN></FONT></DIV></SPAN></FONT><BR>
<DIV class=OutlookMessageHeader lang=en-us dir=ltr align=left>
<HR tabIndex=-1>
<FONT face=Tahoma size=2><B>From:</B> mpich-discuss-bounces@mcs.anl.gov 
[mailto:mpich-discuss-bounces@mcs.anl.gov] <B>On Behalf Of </B>Jayesh 
Krishna<BR><B>Sent:</B> Wednesday, February 04, 2009 1:04 PM<BR><B>To:</B> 
'Yu-Cheng Chou'<BR><B>Cc:</B> mpich-discuss@mcs.anl.gov<BR><B>Subject:</B> Re: 
[mpich-discuss] mpiexec kills the remote login shell<BR></FONT><BR></DIV>
<DIV></DIV><!-- Converted from text/plain format -->
<P><FONT size=2>&nbsp;Hi,<BR>&nbsp; Can you also attach the corresponding smpd 
debug output ?<BR><BR>Regards,<BR>Jayesh<BR><BR>-----Original 
Message-----<BR>From: Yu-Cheng Chou [<A 
href="mailto:cycchou@ucdavis.edu">mailto:cycchou@ucdavis.edu</A>]<BR>Sent: 
Wednesday, February 04, 2009 1:02 PM<BR>To: Jayesh Krishna<BR>Cc: 
mpich-discuss@mcs.anl.gov<BR>Subject: Re: [mpich-discuss] mpiexec kills the 
remote login shell<BR><BR>Hi,<BR><BR>Firstly, the previously attached mpiexec 
verbose output is a wrong one.<BR>I've attached the correct one to this 
email.<BR><BR>Secondly, I want to point out that as long as mpiexec is initiated 
from Korebot to run a program, no matter it's a MPI or non-MPI program, no 
matter the program can be found or not, as soon as mpiexec is finished, the ssh 
connection to Korebot will be gone.<BR><BR>Thank you<BR><BR><BR>&gt; 
Hi,<BR>&gt;&nbsp;&nbsp; The mpiexec output shows the following error when 
running hellow,<BR>&gt; ==================<BR>&gt;<BR>&gt; Unable to exec 
'hello' on korebot<BR>&gt;<BR>&gt; Error 2 - No such file or 
directory<BR>&gt;<BR>&gt; ==================<BR>&gt;<BR>&gt;&nbsp;&nbsp; Please 
provide the debug output of smpd (smpd -d 2&gt;&amp;1 | tee<BR>&gt; smpd.out) 
along with mpiexec (mpiexec -verbose -n 2 ./hellow 2&gt;&amp;1 |<BR>&gt; tee 
mpiexec.out).<BR>&gt;<BR>&gt; #&nbsp; Can you run simple C programs (without 
using mpiexec) on Korbet ?<BR>&gt; #&nbsp; Is the ssh connection aborted when 
you run non-MPI programs<BR>&gt; (mpiexec -n 2<BR>&gt; hostname) ?<BR>&gt; 
#&nbsp; Can you send us your ".smpd" config file ?<BR>&gt; #&nbsp; Did you 
modify the MPICH2 code to run on Korbet (Please send us<BR>&gt; your configure 
command &amp; any env settings set to configure/make MPICH2)?<BR>&gt;<BR>&gt; 
Regards,<BR>&gt; Jayesh<BR>&gt;<BR>&gt; ________________________________<BR>&gt; 
From: mpich-discuss-bounces@mcs.anl.gov<BR>&gt; [<A 
href="mailto:mpich-discuss-bounces@mcs.anl.gov">mailto:mpich-discuss-bounces@mcs.anl.gov</A>] 
On Behalf Of Jayesh Krishna<BR>&gt; Sent: Wednesday, February 04, 2009 8:41 
AM<BR>&gt; To: 'Yu-Cheng Chou'<BR>&gt; Cc: mpich-discuss@mcs.anl.gov<BR>&gt; 
Subject: Re: [mpich-discuss] mpiexec kills the remote login 
shell<BR>&gt;<BR>&gt;&nbsp; Hi,<BR>&gt;&nbsp;&nbsp; I will take a look at the 
debug logs and get back to you. Meanwhile,<BR>&gt; can you run simple C programs 
without using mpiexec on Korbet ?<BR>&gt;&nbsp;&nbsp; MPICH2 currently does not 
support heterogeneous systems (So you<BR>&gt; won't be able to run your MPI job 
across ARM &amp; other architectures).<BR>&gt;<BR>&gt; Regards,<BR>&gt; 
Jayesh<BR>&gt;<BR>&gt; -----Original Message-----<BR>&gt; From: Yu-Cheng Chou 
[<A href="mailto:cycchou@ucdavis.edu">mailto:cycchou@ucdavis.edu</A>]<BR>&gt; 
Sent: Tuesday, February 03, 2009 7:52 PM<BR>&gt; To: Jayesh Krishna<BR>&gt; Cc: 
mpich-discuss@mcs.anl.gov<BR>&gt; Subject: Re: [mpich-discuss] mpiexec kills the 
remote login shell<BR>&gt;<BR>&gt;&gt; # Can you run non-MPI programs using 
mpiexec (mpiexec -n 2 hostname) ?<BR>&gt; Yes.<BR>&gt;<BR>&gt;&gt; # Can you 
compile and run the hello world program (examples/hellow.c)<BR>&gt;&gt; provided 
with MPICH2 (mpiexec -n 2 ./hellow)?<BR>&gt; Yes.<BR>&gt;<BR>&gt;&gt; # How did 
you start smpd (the command used to start smpd) ? How did<BR>&gt;&gt; you run 
your MPI job (the command used to run your job)?<BR>&gt; I have a ".smpd" file 
containing one line of information, which is<BR>&gt; "phrase=123".<BR>&gt; Thus, 
I started smpd using "smpd -s".<BR>&gt; Then I used "mpiexec -n 1 hellow" to run 
hellow on Korebot.<BR>&gt;<BR>&gt;&gt; # How did you find that mpiexec kills the 
sshd process (We typically<BR>&gt;&gt; ssh to unix machines and run mpiexec 
without any problems) ?<BR>&gt; I logged in Korebot with two terminals.<BR>&gt; 
&gt;From #1 terminal, I checked all the processes running on Korebot.<BR>&gt; 
&gt;From #2 terminal, I started smpd and run hellow using the commands<BR>&gt; 
mentioned above.<BR>&gt; After hellow was finished, the connection to Korebot 
via #2 terminal<BR>&gt; was closed.<BR>&gt; &gt;From #1 terminal, I knew that 
the sshd process associated with #2<BR>&gt; &gt;terminal<BR>&gt; was 
gone.<BR>&gt;<BR>&gt;&gt;&nbsp; Can you run smpd/mpiexec in debug mode and 
provide us with the<BR>&gt;&gt; outputs (smpd -d / mpiexec -n 2 -verbose 
hostname) ?<BR>&gt; The first attached text file is the output from running 
hellow in<BR>&gt; mpiexec's verbose mode.<BR>&gt;<BR>&gt;<BR>&gt; There is 
another issue.<BR>&gt; This time, I used two machines. One is Korebot as 
mentioned above, and<BR>&gt; the other is a laptop running Ubuntu Linux 
OS.<BR>&gt; I started smpd with the same ".smpd" file and command as 
mentioned<BR>&gt; above both on Korebot and the lap top.<BR>&gt; There is a 
machine file called "hostfile" on Korebot. The file<BR>&gt; contains the 
following information about the name of the two machines.<BR>&gt;<BR>&gt; 
korebot<BR>&gt; shrimp<BR>&gt;<BR>&gt; Then from Korebot, I ran cpi using the 
following command.<BR>&gt;<BR>&gt; mpiexec -machinefile ./hostfile -verbose -n 2 
cpi<BR>&gt;<BR>&gt;<BR>&gt; But the value of pi is a huge number. I think it is 
related to "double<BR>&gt; type variables" being transferred between processes 
running on an<BR>&gt; ARM-based Linux and a general Linux 
machines.<BR>&gt;<BR>&gt; The second attached text file is the output from 
running cpi in<BR>&gt; mpiexec's verbose 
mode.<BR>&gt;<BR>&gt;<BR>&gt;&gt;<BR>&gt;&gt; I am cross-compiling mpich2-1.0.8 
with smpd for Khepera III mobile robot.<BR>&gt;&gt;<BR>&gt;&gt; This mobile 
robot has a Korebot board which is an ARM-based computer<BR>&gt;&gt; with a 
Linux operating system.<BR>&gt;&gt;<BR>&gt;&gt; The cross-compilation was 
fine.<BR>&gt;&gt;<BR>&gt;&gt; Firstly, I logged in to Korebot through 
ssh.<BR>&gt;&gt; Secondly, I started smpd.<BR>&gt;&gt; Thirdly, I ran mpiexec to 
execute an MPI program (cpi) that comes<BR>&gt;&gt; with the 
package.<BR>&gt;&gt;<BR>&gt;&gt; The result was correct, but when mpiexec was 
finished, the ssh<BR>&gt;&gt; connection to the Korebot was closed.<BR>&gt;&gt; 
I found that mpiexec kills the sshd process through which I was<BR>&gt;&gt; 
remotely connected to Korebot.<BR>&gt;&gt;<BR>&gt;&gt; I've been looking for the 
cause, but still have not found any clues.<BR>&gt;&gt;<BR>&gt;&gt; Could you 
give me any ideas to solve this problem?<BR>&gt;&gt;<BR>&gt;&gt; Thank 
you,<BR>&gt;&gt;<BR>&gt;&gt; 
Yu-Cheng<BR>&gt;&gt;<BR>&gt;<BR></FONT></P></BODY></HTML>