Ok, I have tried to recompile MPICH2 with following options. I cannot recompile the &#39;global version&#39;, so I have tried to install it in my home dir and would update the PATH accordingly. But compiling is failing at the &#39;configure&#39; step with following error:<br>
<br>command: ./configure --prefix=/data1/visitor/cgaurik/mympi/ --with-pmi=slurm --with-pm=no<br>End part of the output:<br>RUNNING CONFIGURE FOR THE SLURM PMI<br>checking for make... make<br>checking whether clock skew breaks make... no<br>
checking whether make supports include... yes<br>checking whether make allows comments in actions... yes<br>checking for virtual path format... VPATH<br>checking whether make sets CFLAGS... yes<br>checking for gcc... gcc<br>
checking for C compiler default output file name... a.out<br>checking whether the C compiler works... yes<br>checking whether we are cross compiling... no<br>checking for suffix of executables...<br>checking for suffix of object files... o<br>
checking whether we are using the GNU C compiler... yes<br>checking whether gcc accepts -g... yes<br>checking for gcc option to accept ANSI C... none needed<br>checking how to run the C preprocessor... gcc -E<br>checking for slurm/pmi.h... no<br>
configure: error: could not find slurm/pmi.h.  Configure aborted<br>configure: error: Configure of src/pmi/slurm failed!<br><br clear="all"><br>Gauri.<br>---------<br>
<br><br><div class="gmail_quote"><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><div><div class="h5"><br>
&gt; &gt; &gt; Message: 4<br>
&gt; &gt; &gt; Date: Mon, 23 Feb 2009 23:38:06 -0600<br>
&gt; &gt; &gt; From: &quot;Rajeev Thakur&quot; &lt;<a href="mailto:thakur@mcs.anl.gov">thakur@mcs.anl.gov</a>&gt;<br>
&gt; &gt; &gt; Subject: Re: [mpich-discuss] HP-XC 3000 cluster issues<br>
&gt; &gt; &gt; To: &lt;<a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a>&gt;<br>
&gt; &gt; &gt; Message-ID: &lt;72376B2D10EC43F9A0A433C960F951B6@thakurlaptop&gt;<br>
&gt; &gt; &gt; Content-Type: text/plain; charset=&quot;us-ascii&quot;<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; To run MPICH2 with SLURM, configure with the options<br>
&gt; &gt; &gt; &quot;--with-pmi=slurm<br>
&gt; &gt; &gt; --with-pm=no&quot; as described in the MPICH2 README file. Also see<br>
&gt; the<br>
&gt; &gt; &gt; instructions on how to run MPICH2 with SLURM at<br>
&gt; &gt; &gt; <a href="https://computing.llnl.gov/linux/slurm/quickstart.html" target="_blank">https://computing.llnl.gov/linux/slurm/quickstart.html</a> .<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; Rajeev<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt;  _____<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; From: <a href="mailto:mpich-discuss-bounces@mcs.anl.gov">mpich-discuss-bounces@mcs.anl.gov</a><br>
&gt; &gt; &gt; [mailto:<a href="mailto:mpich-discuss-bounces@mcs.anl.gov">mpich-discuss-bounces@mcs.anl.gov</a>] On Behalf Of Gauri<br>
&gt; &gt; &gt; Kulkarni<br>
&gt; &gt; &gt; Sent: Monday, February 23, 2009 11:19 PM<br>
&gt; &gt; &gt; To: <a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>
&gt; &gt; &gt; Subject: [mpich-discuss] HP-XC 3000 cluster issues<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; Hi,<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; I am a newbie to the MPI in general. Currently in our institute,<br>
&gt; we<br>
&gt; &gt; &gt; have a<br>
&gt; &gt; &gt; cluster of 16nodes-8processors. It is an HP-XC 3000 cluster which<br>
&gt; &gt; &gt; basically<br>
&gt; &gt; &gt; means, it&#39;s quite proprietary. It has its own MPI implementation<br>
&gt; -<br>
&gt; &gt; &gt; HP-MPI -<br>
&gt; &gt; &gt; in which, the parallelization is managed by SLURM (Simple Linux<br>
&gt; &gt; &gt; Utility for<br>
&gt; &gt; &gt; Resource Management). There is also a batch job scheduler - LSF<br>
&gt; (Load<br>
&gt; &gt; &gt; Sharing Facility) which works in tandem with SLURM to parallelize<br>
&gt; the<br>
&gt; &gt; &gt; batch<br>
&gt; &gt; &gt; jobs. We have installed both MPICH and MPICH2 and are testing it,<br>
&gt; but<br>
&gt; &gt; &gt; we are<br>
&gt; &gt; &gt; running into compatibility issues. For a simple helloworld.c<br>
&gt; program:<br>
&gt; &gt; &gt; 1. For HPMPI: Compiled with mpicc of this implemetation and<br>
&gt; executed<br>
&gt; &gt; &gt; with<br>
&gt; &gt; &gt; its mpirun: mpirun -np 4 helloworld works correctly. For batch<br>
&gt; &gt; &gt; scheduling,<br>
&gt; &gt; &gt; we need to isse &quot;bsub -n4 [other options] mpirun -srun helloworld&quot;<br>
&gt; and<br>
&gt; &gt; &gt; it<br>
&gt; &gt; &gt; runs fine too. &quot;srun&quot; is SLURM utility that parallelizes the<br>
&gt; jobs.<br>
&gt; &gt; &gt; 2. For MPICH and mPICH2: Again, compiled with mpicc of these<br>
&gt; &gt; &gt; respective<br>
&gt; &gt; &gt; implemetations and executed with their own mpirun:<br>
&gt; &gt; &gt;    i) mpirun -np 4 helloword : Works.<br>
&gt; &gt; &gt;   ii) mpirun -np 15 helloworld: The parallelization is limited to<br>
&gt; just<br>
&gt; &gt; &gt; a<br>
&gt; &gt; &gt; single node - that is 8 processes run first on 8 processors of a<br>
&gt; &gt; &gt; single node<br>
&gt; &gt; &gt; and then remaining ones.<br>
&gt; &gt; &gt;  iii) bsub -n4 [options] mpirun -srun hellowrold: Job terminated.<br>
&gt; &gt; &gt; srun<br>
&gt; &gt; &gt; option not recognized.<br>
&gt; &gt; &gt;   iv) bsub [options] mpirun -np 4 helloworld: Works<br>
&gt; &gt; &gt;   V) bsub [options] mpirun -np 15 helloworld: (Same as iii)<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; Anybody aware of HP cluster issues with MPICH? Am I<br>
&gt; misinterpreting?<br>
&gt; &gt; &gt; Any<br>
&gt; &gt; &gt; help is appreciated.<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; Gauri.<br>
&gt; &gt; &gt; ---------<br>
&gt; &gt;<br>
</div></div></blockquote></div><br>