<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN">
<HTML>
<HEAD>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=us-ascii">
<META NAME="Generator" CONTENT="MS Exchange Server version 6.5.7036.0">
<TITLE>RE: [mpich-discuss] SMPD, Problem launching when using -host</TITLE>
</HEAD>
<BODY>
<!-- Converted from text/plain format -->

<P><FONT SIZE=2>&nbsp;Hi,<BR>
&nbsp; It is recommended that you use the &quot;-path&quot; option available with mpiexec to specify the path to the executable.<BR>
<BR>
Regards,<BR>
Jayesh<BR>
<BR>
-----Original Message-----<BR>
From: James S Perrin [<A HREF="mailto:james.s.perrin@manchester.ac.uk">mailto:james.s.perrin@manchester.ac.uk</A>]<BR>
Sent: Friday, October 10, 2008 4:57 AM<BR>
To: Jayesh Krishna<BR>
Cc: mpich-discuss@mcs.anl.gov<BR>
Subject: Re: [mpich-discuss] SMPD, Problem launching when using -host<BR>
<BR>
Hi,<BR>
<BR>
I have found the reason why my executable is failing to start, however I<BR>
&nbsp; think -host is not behaving as it should or at least the documentation needs clarifying.<BR>
<BR>
I guessed that using -host was somehow changing the executable's environment and so it is failing to start correctly because it couldn't find a dll.<BR>
<BR>
On windows the PATH variable should be made up of the system wide settings and the user specific additions:<BR>
<BR>
ie echo %PATH% =&gt; &lt;system settings&gt;;&lt;user settings&gt;<BR>
<BR>
The user settings are required to launch the process. When I launch as<BR>
follows:<BR>
<BR>
mpiexec -localroot -n 1 master : -n 1 slave<BR>
<BR>
both get the path setting as above, however if I use<BR>
<BR>
mpiexec -localroot -n 1 master : -host roobarb -n 1 slave<BR>
<BR>
process 1 has PATH=&lt;system settings&gt;;&lt;user settings&gt; but process 2 has PATH=&lt;system settings&gt; only<BR>
<BR>
I have no idea why the following works but it does, if I add -host roobarb to the process 1 process 2 now gets the full PATH variable<BR>
<BR>
mpiexec -localroot -host roobarb -n 1 master : -host roobarb -n 1 slave<BR>
<BR>
Final permutation, if I now don't specify -localroot both processes only get the only the system settings for PATH:<BR>
<BR>
mpiexec -host roobarb -n 1 master : -host roobarb -n 1 slave<BR>
<BR>
In summary using -host only the system path settings are used and not the user specific settings. Is this a security feature or a non-iteractive login issue c.f bash under linux the .bashrc is not executed for processes started remotely?<BR>
<BR>
A little extra testing confirmed that when process gets both the system and user path settings it is getting this from the current cmd shell.<BR>
<BR>
The solution is to either make sure paths are added to the system path variable or launch via a script that sets up the environment for each processes though I would have like to avoid this if possible. The first is a pain for development and the later a pain for user installations.<BR>
<BR>
FYI I was examining the PATH variable using:<BR>
<BR>
mpiexec -l -host roobarb -n 1 env : -host roobarb -n 1 env | grep \]PATH=<BR>
<BR>
I have the UNIX commands env and grep in my PATH.<BR>
<BR>
Regards<BR>
James<BR>
<BR>
Jayesh Krishna wrote:<BR>
&gt;&nbsp; Hi,<BR>
&gt;&nbsp;&nbsp; Can you send us the debug output of mpiexec and smpd ? Please follow<BR>
&gt; the instructions below to send us the debug output,<BR>
&gt;<BR>
&gt; # Stop any instances of smpd using the command, smpd -stop # Start<BR>
&gt; smpd in the debug mode using the command, smpd -d # Run a non-MPI<BR>
&gt; program with mpiexec in the verbose mode using the command, mpiexec<BR>
&gt; -verbose -n 1 hostname : -host IPADDRESS_OF_roobarb -n<BR>
&gt; 1 hostname<BR>
&gt;<BR>
&gt; # Run an MPI program (cpi.exe provided with MPICH2) with mpiexec in<BR>
&gt; the verbose mode using the command, mpiexec -verbose -n 1 cpi.exe :<BR>
&gt; -host IPADDRESS_OF_roobarb -n 1 cpi.exe<BR>
&gt;<BR>
&gt; # Send us the debug/verbose outputs of mpiexec and smpd.<BR>
&gt;<BR>
&gt;&nbsp;&nbsp; Let us know the results.<BR>
&gt;<BR>
&gt; Regards,<BR>
&gt; Jayesh<BR>
&gt;<BR>
&gt; -----Original Message-----<BR>
&gt; From: owner-mpich-discuss@mcs.anl.gov<BR>
&gt; [<A HREF="mailto:owner-mpich-discuss@mcs.anl.gov">mailto:owner-mpich-discuss@mcs.anl.gov</A>] On Behalf Of James S Perrin<BR>
&gt; Sent: Tuesday, October 07, 2008 5:25 AM<BR>
&gt; Cc: mpich-discuss@mcs.anl.gov<BR>
&gt; Subject: Re: [mpich-discuss] SMPD, Problem launching when using -host<BR>
&gt;<BR>
&gt; Hi,<BR>
&gt;<BR>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; No I get the same error if I use the ipaddress.<BR>
&gt;<BR>
&gt; Regards<BR>
&gt; James<BR>
&gt;<BR>
&gt;<BR>
&gt; Jayesh Krishna wrote:<BR>
&gt;&nbsp; &gt;&nbsp; Hi,<BR>
&gt;&nbsp; &gt;&nbsp;&nbsp; Does it work if you specify the ipaddress of the machine instead of<BR>
&gt;&nbsp; &gt; hostname (mpiexec -n 1 master : -host IPADDRESS_OF_roobarb -n 1 slave) ?<BR>
&gt;&nbsp; &gt;<BR>
&gt;&nbsp; &gt; Regards,<BR>
&gt;&nbsp; &gt; Jayesh<BR>
&gt;&nbsp; &gt;<BR>
&gt;&nbsp; &gt; -----Original Message-----<BR>
&gt;&nbsp; &gt; From: James S Perrin [<A HREF="mailto:james.s.perrin@manchester.ac.uk">mailto:james.s.perrin@manchester.ac.uk</A>]<BR>
&gt;&nbsp; &gt; Sent: Monday, October 06, 2008 5:18 AM&nbsp; &gt; To: Jayesh Krishna&nbsp; &gt; Cc:<BR>
&gt; mpich-discuss@mcs.anl.gov&nbsp; &gt; Subject: Re: [mpich-discuss] SMPD,<BR>
&gt; Problem launching when using -host&nbsp; &gt;&nbsp; &gt; Hi,&nbsp; &gt;&nbsp; &gt; Jayesh Krishna<BR>
&gt; wrote:<BR>
&gt;&nbsp; &gt;&nbsp; &gt;&nbsp; Hi,<BR>
&gt;&nbsp; &gt;&nbsp; &gt;<BR>
&gt;&nbsp; &gt;&nbsp; &gt;&nbsp; &gt;&gt; mpiexec -n 1 -host roobarb master : -n 1 slave<BR>
&gt;&nbsp; &gt;&nbsp; &gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; The command above(&quot;-host&quot; option specified for only one<BR>
&gt;&nbsp; &gt;&nbsp; &gt; executable) works for me. What is the error message that you get&nbsp;<BR>
&gt; &gt;&nbsp; &gt; (Provide us with the snapshot of your command and the error<BR>
&gt; output. It&nbsp; &gt; &gt; would also help us if you provide more details - Is<BR>
&gt; roobarb a remote&nbsp; &gt; &gt; machine ? etc) ?<BR>
&gt;&nbsp; &gt;<BR>
&gt;&nbsp; &gt; The error is:<BR>
&gt;&nbsp; &gt;<BR>
&gt;&nbsp; &gt; [0] PMI_Init failed: FAIL - init called when another process has&nbsp; &gt;<BR>
&gt; exited without calling init Fatal error in MPI_Init_thread: Other MPI&nbsp;<BR>
&gt; &gt; error, error stack:<BR>
&gt;&nbsp; &gt; MPIR_Init_thread(294): Initialization failed&nbsp; &gt;<BR>
&gt; MPID_Init(82)........: channel initialization failed&nbsp; &gt;<BR>
&gt; MPID_Init(333).......: PMI_Init returned -1unable to read the cmd&nbsp; &gt;<BR>
&gt; header on the pmi context, generic socket failure, error stack:<BR>
&gt;&nbsp; &gt; MPIDU_Sock_wait(2603): The specified network name is no longer&nbsp; &gt;<BR>
&gt; available. (errno 64).<BR>
&gt;&nbsp; &gt;<BR>
&gt;&nbsp; &gt; job aborted:<BR>
&gt;&nbsp; &gt; rank: node: exit code[: error message]&nbsp; &gt; 0: ROOBARB: 3: Fatal<BR>
&gt; error in MPI_Init_thread: Other MPI error, error<BR>
&gt; stack:<BR>
&gt;&nbsp; &gt; MPIR_Init_thread(294): Initialization failed&nbsp; &gt;<BR>
&gt; MPID_Init(82)........: channel initialization failed&nbsp; &gt;<BR>
&gt; MPID_Init(333).......: PMI_Init returned -1&nbsp; &gt; 1: roobarb: -1073741515&nbsp;<BR>
&gt; &gt;&nbsp; &gt; The second process is not starting for some reason.<BR>
&gt;&nbsp; &gt;<BR>
&gt;&nbsp; &gt; roobarb happens to be the local machine in this case but the<BR>
&gt; problem&nbsp; &gt; also occurs on a cluster.<BR>
&gt;&nbsp; &gt;<BR>
&gt;&nbsp; &gt; It will launch correctly if I use:<BR>
&gt;&nbsp; &gt;<BR>
&gt;&nbsp; &gt; mpiexec -n 1 master : -n 1 slave - SUCCESS&nbsp; &gt;&nbsp; &gt; which should be no<BR>
&gt; different from:<BR>
&gt;&nbsp; &gt;<BR>
&gt;&nbsp; &gt; mpiexec -n 1 master : -host roobarb -n 1 slave - FAILS&nbsp; &gt;&nbsp; &gt; when<BR>
&gt; everything is running on roobarb.<BR>
&gt;&nbsp; &gt;<BR>
&gt;&nbsp; &gt;&nbsp; &gt;&nbsp; &gt;&gt; mpiexec -localroot -n 1 roobarb master : -host roobarb -n 1&nbsp;<BR>
&gt; &gt; slave&nbsp; &gt;<BR>
&gt;&nbsp; &gt;&nbsp; &gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; When using the &quot;-localroot&quot; option you should not specify the<BR>
&gt;&nbsp; &gt;&nbsp; &gt; hostname for the 1st executable. The command should be,&nbsp; &gt;&nbsp; &gt;&nbsp;<BR>
&gt; &gt;&gt;&nbsp; &gt; mpiexec -localroot -n 1 master : -host roobarb -n 1 slave&nbsp; &gt;&nbsp; &gt;<BR>
&gt; sorry typo I meant if would work I used:<BR>
&gt;&nbsp; &gt;<BR>
&gt;&nbsp; &gt; mpiexec -localroot -host roobarb -n 1&nbsp; master : -host roobarb -n 1&nbsp;<BR>
&gt; &gt; slave&nbsp; &gt;&nbsp; &gt; Regards&nbsp; &gt; James&nbsp; &gt;&nbsp; &gt;&nbsp; &gt;&nbsp; &gt;&nbsp; &gt; -----Original<BR>
&gt; Message-----&nbsp; &gt;&nbsp; &gt; From: owner-mpich-discuss@mcs.anl.gov&nbsp; &gt;&nbsp; &gt;<BR>
&gt; [<A HREF="mailto:owner-mpich-discuss@mcs.anl.gov">mailto:owner-mpich-discuss@mcs.anl.gov</A>] On Behalf Of James S Perrin&nbsp;<BR>
&gt; &gt; &gt; Sent: Friday, October 03, 2008 12:13 PM&nbsp; &gt; To: mpich&nbsp; &gt; Subject:<BR>
&gt;&nbsp; &gt; [mpich-discuss] SMPD, Problem launching when using -host&nbsp; &gt;&nbsp; &gt; Hi,<BR>
&gt;&nbsp; &gt;&nbsp; &gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Processes fail to start if -host is used for only some but not<BR>
&gt;&nbsp; &gt;&nbsp; &gt; all processes when launching. ie the machines that some<BR>
&gt; processes&nbsp; &gt; &gt; launch on is left up to the smpd to allocate.<BR>
&gt;&nbsp; &gt;&nbsp; &gt;<BR>
&gt;&nbsp; &gt;&nbsp; &gt; eg<BR>
&gt;&nbsp; &gt;&nbsp; &gt;<BR>
&gt;&nbsp; &gt;&nbsp; &gt; mpiexec -n 1 -host roobarb master : -n 1 slave&nbsp; &gt;&nbsp; &gt; when&nbsp; &gt;<BR>
&gt; -localroot is used the following fails unless -host is also&nbsp; &gt;&nbsp; &gt;<BR>
&gt; specified for the master.<BR>
&gt;&nbsp; &gt;&nbsp; &gt;<BR>
&gt;&nbsp; &gt;&nbsp; &gt; mpiexc -localroot -n 1 roobarb master : -host roobarb -n 1 slave&nbsp;<BR>
&gt; &gt;&nbsp; &gt; &gt; Using MPICH2 1.0.7 on WinXP ia32.<BR>
&gt;&nbsp; &gt;&nbsp; &gt;<BR>
&gt;&nbsp; &gt;&nbsp; &gt; Regards<BR>
&gt;&nbsp; &gt;&nbsp; &gt; James<BR>
&gt;&nbsp; &gt;&nbsp; &gt; --<BR>
&gt;&nbsp; &gt;&nbsp; &gt;<BR>
&gt; ------------------------------------------------------------------------<BR>
&gt;&nbsp; &gt;&nbsp; &gt;&nbsp;&nbsp;&nbsp; James S. Perrin<BR>
&gt;&nbsp; &gt;&nbsp; &gt;&nbsp;&nbsp;&nbsp; Visualization<BR>
&gt;&nbsp; &gt;&nbsp; &gt;<BR>
&gt;&nbsp; &gt;&nbsp; &gt;&nbsp;&nbsp;&nbsp; Research Computing Services<BR>
&gt;&nbsp; &gt;&nbsp; &gt;&nbsp;&nbsp;&nbsp; The University of Manchester<BR>
&gt;&nbsp; &gt;&nbsp; &gt;&nbsp;&nbsp;&nbsp; Kilburn Building, Oxford Road<BR>
&gt;&nbsp; &gt;&nbsp; &gt;&nbsp;&nbsp;&nbsp; Manchester, M13 9PL<BR>
&gt;&nbsp; &gt;&nbsp; &gt;<BR>
&gt;&nbsp; &gt;&nbsp; &gt;&nbsp;&nbsp;&nbsp; t: +44 (0) 161 275 6945<BR>
&gt;&nbsp; &gt;&nbsp; &gt;&nbsp;&nbsp;&nbsp; e: james.perrin@manchester.ac.uk<BR>
&gt;&nbsp; &gt;&nbsp; &gt;&nbsp;&nbsp;&nbsp; w: www.manchester.ac.uk/researchcomputing<BR>
&gt;&nbsp; &gt;&nbsp; &gt;<BR>
&gt; ------------------------------------------------------------------------<BR>
&gt;&nbsp; &gt;&nbsp; &gt;&nbsp;&nbsp; &quot;The test of intellect is the refusal to belabour the obvious&quot;<BR>
&gt;&nbsp; &gt;&nbsp; &gt;&nbsp;&nbsp; - Alfred Bester<BR>
&gt;&nbsp; &gt;&nbsp; &gt;<BR>
&gt;&nbsp; &gt;<BR>
&gt; ----------------------------------------------------------------------<BR>
&gt;&nbsp; &gt;&nbsp; &gt; --<BR>
&gt;&nbsp; &gt;&nbsp; &gt;<BR>
&gt;&nbsp; &gt;<BR>
&gt;&nbsp; &gt; --<BR>
&gt;&nbsp; &gt; ------------------------------------------------------------------------<BR>
&gt;&nbsp; &gt;&nbsp;&nbsp;&nbsp; James S. Perrin<BR>
&gt;&nbsp; &gt;&nbsp;&nbsp;&nbsp; Visualization<BR>
&gt;&nbsp; &gt;<BR>
&gt;&nbsp; &gt;&nbsp;&nbsp;&nbsp; Research Computing Services<BR>
&gt;&nbsp; &gt;&nbsp;&nbsp;&nbsp; The University of Manchester<BR>
&gt;&nbsp; &gt;&nbsp;&nbsp;&nbsp; Kilburn Building, Oxford Road<BR>
&gt;&nbsp; &gt;&nbsp;&nbsp;&nbsp; Manchester, M13 9PL<BR>
&gt;&nbsp; &gt;<BR>
&gt;&nbsp; &gt;&nbsp;&nbsp;&nbsp; t: +44 (0) 161 275 6945<BR>
&gt;&nbsp; &gt;&nbsp;&nbsp;&nbsp; e: james.perrin@manchester.ac.uk<BR>
&gt;&nbsp; &gt;&nbsp;&nbsp;&nbsp; w: www.manchester.ac.uk/researchcomputing<BR>
&gt;&nbsp; &gt; ------------------------------------------------------------------------<BR>
&gt;&nbsp; &gt;&nbsp;&nbsp; &quot;The test of intellect is the refusal to belabour the obvious&quot;<BR>
&gt;&nbsp; &gt;&nbsp;&nbsp; - Alfred Bester<BR>
&gt;&nbsp; &gt;<BR>
&gt; ----------------------------------------------------------------------<BR>
&gt;&nbsp; &gt; --<BR>
&gt;&nbsp; &gt;<BR>
&gt;<BR>
&gt; --<BR>
&gt; ------------------------------------------------------------------------<BR>
&gt;&nbsp;&nbsp;&nbsp; James S. Perrin<BR>
&gt;&nbsp;&nbsp;&nbsp; Visualization<BR>
&gt;<BR>
&gt;&nbsp;&nbsp;&nbsp; Research Computing Services<BR>
&gt;&nbsp;&nbsp;&nbsp; The University of Manchester<BR>
&gt;&nbsp;&nbsp;&nbsp; Kilburn Building, Oxford Road<BR>
&gt;&nbsp;&nbsp;&nbsp; Manchester, M13 9PL<BR>
&gt;<BR>
&gt;&nbsp;&nbsp;&nbsp; t: +44 (0) 161 275 6945<BR>
&gt;&nbsp;&nbsp;&nbsp; e: james.perrin@manchester.ac.uk<BR>
&gt;&nbsp;&nbsp;&nbsp; w: www.manchester.ac.uk/researchcomputing<BR>
&gt; ------------------------------------------------------------------------<BR>
&gt;&nbsp;&nbsp; &quot;The test of intellect is the refusal to belabour the obvious&quot;<BR>
&gt;&nbsp;&nbsp; - Alfred Bester<BR>
&gt; ----------------------------------------------------------------------<BR>
&gt; --<BR>
&gt;<BR>
<BR>
--<BR>
------------------------------------------------------------------------<BR>
&nbsp;&nbsp; James S. Perrin<BR>
&nbsp;&nbsp; Visualization<BR>
<BR>
&nbsp;&nbsp; Research Computing Services<BR>
&nbsp;&nbsp; The University of Manchester<BR>
&nbsp;&nbsp; Kilburn Building, Oxford Road<BR>
&nbsp;&nbsp; Manchester, M13 9PL<BR>
<BR>
&nbsp;&nbsp; t: +44 (0) 161 275 6945<BR>
&nbsp;&nbsp; e: james.perrin@manchester.ac.uk<BR>
&nbsp;&nbsp; w: www.manchester.ac.uk/researchcomputing<BR>
------------------------------------------------------------------------<BR>
&nbsp; &quot;The test of intellect is the refusal to belabour the obvious&quot;<BR>
&nbsp; - Alfred Bester<BR>
------------------------------------------------------------------------<BR>
<BR>
</FONT>
</P>

</BODY>
</HTML>