Hi Reuti<br><br>Thanks for your reply. I forgot to mention in my previous message, but I had tried adding a Parallel Environment in SGE using qconf -ap. I did the following,<br><span class="Apple-style-span" style="font-family: Tahoma,arial,helvetica,serif; font-size: small; line-height: normal;"><span class="Apple-style-span" style="font-family: 굴림; font-size: 12px; line-height: 18px;"><span class="Apple-style-span" style="font-family: Tahoma,arial,helvetica,serif; font-size: small; line-height: normal;"><font class="Apple-style-span" color="#000000"><font class="Apple-style-span" color="#333333"><span style="font-size: 10pt;"><br>
qconf -Ap mpich</span></font></font></span></span></span><font class="Apple-style-span" color="#000000"><span style="font-size: 10pt;"><br><br>and then edited the pe file to,<br><br>p</span><span style="font-size: 10pt;">e_name            mpich</span></font><font class="Apple-style-span" color="#000000"><span style="font-size: 10pt;"><br>
slots              999</span></font><font class="Apple-style-span" color="#000000"><span style="font-size: 10pt;"><br>user_lists         NONE</span></font><font class="Apple-style-span" color="#000000"><span style="font-size: 10pt;"><br>
xuser_lists        NONE</span></font><font class="Apple-style-span" color="#000000"><span style="font-size: 10pt;"><br>start_proc_args    NONE</span></font><font class="Apple-style-span" color="#000000"><span style="font-size: 10pt;"><br>
stop_proc_args    NONE</span></font><font class="Apple-style-span" color="#000000"><span style="font-size: 10pt;"><br>allocation_rule    $fill_up</span></font><font class="Apple-style-span" color="#000000"><span style="font-size: 10pt;"><br>
control_slaves     TRUE</span></font><font class="Apple-style-span" color="#000000"><span style="font-size: 10pt;"><br>job_is_first_task  FALSE</span></font><font class="Apple-style-span" color="#000000"><span style="font-size: 10pt;"><br>
urgency_slots      min</span></font><font class="Apple-style-span" color="#000000"><span style="font-size: 10pt;"><br>accounting_summary FALSE</span></font><br><br>This did not work. However, here I don&#39;t see how SGE would know where to look for mpich2/ hydra. I do see a mpi directory in the $SGE_ROOT directory, where there is rocks-mpich.template file that reads the following<br>
<br>pe_name          mpich<br>slots            9999<br>user_lists       NONE<br>xuser_lists      NONE<br>start_proc_args  /opt/gridengine/mpi/startmpi.sh -catch_rsh $pe_hostfile<br>stop_proc_args   /opt/gridengine/mpi/stopmpi.sh<br>
allocation_rule  $fill_up<br>control_slaves   TRUE<br>job_is_first_task FALSE<br>urgency_slots     min<br>accounting_summary TRUE<br><br>Does SGE need re-configuration after the mpich2 install?<br><br>Thanks in advance!<br>
<br>Regards<br>Tilak<br><br><div class="gmail_quote"><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Message: 6<br>
Date: Tue, 12 Jul 2011 13:19:18 +0200<br>
From: Reuti &lt;<a href="mailto:reuti@staff.uni-marburg.de">reuti@staff.uni-marburg.de</a>&gt;<br>
Subject: Re: [mpich-discuss] mpich2 does not work with SGE<br>
To: <a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>
Message-ID:<br>
        &lt;<a href="mailto:8768BE3D-BE2D-498C-98A6-D3A72F397291@staff.uni-marburg.de">8768BE3D-BE2D-498C-98A6-D3A72F397291@staff.uni-marburg.de</a>&gt;<br>
Content-Type: text/plain; charset=us-ascii<br>
<br>
Hi,<br>
<br>
Am 12.07.2011 um 13:03 schrieb tilakraj dattaram:<br>
<br>
&gt; We have a rocks cluster with 10 nodes, with sun grid engine installed and running. I then installed the most recent version of mpich2 (1.4) on the master and compute nodes. However, we are unable to run parallel jobs through SGE (we can submit serial jobs without a problem). I am a sge newbie, and most of the installation that we have done is by reading step-by-step tutorials on the web.<br>

&gt;<br>
&gt; The mpich2 manual says that hydra is the default process manager for mpich2, and I have checked that the mpiexec command points to mpiexec.hydra. Also, which mpicc, which mpiexec point to the desired location of mpich2. I understand that in this version of mpich2, hydra should be integrated with SGE by default. But maybe I am missing something here.<br>

&gt;<br>
&gt; We are able to run parallel jobs using command line by specifying a host file (e.g, mpiexec -f hostfile -np 16 ./a.out), but would like the resource manager to take care of allocating resources on the cluster.<br>
<br>
it&#39;s necessary to set up a so called parallel environment (i.e. a PE) in SGE and request it during the job submission. Then a plain mpirun without any hostfile or -np specification will do, as all is directly delivered by SGE. If all is set up in a proper way, you could even switch off `rsh` and `ssh` inside the cluster completely, as SGE&#39;s internal startup mechanism is used then to start processes on other nodes. In fact, disabling or limiting `ssh` to admin staff is a good way to check whether your parallel application has a tight integration into the queuingsystem where all slave processes are accounted also correctly and under full SGE control for a delition by `qdel`.<br>

<br>
For SGE there is also a mailing list: <a href="http://gridengine.org/mailman/listinfo/users" target="_blank">http://gridengine.org/mailman/listinfo/users</a><br>
<br>
-- Reuti<br>
<br>
<br>
<br>
<br>
------------------------------<br>
<br>
_______________________________________________<br>
mpich-discuss mailing list<br>
<a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>
<a href="https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss" target="_blank">https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss</a><br>
<br>
<br>
End of mpich-discuss Digest, Vol 34, Issue 15<br>
*********************************************<br>
</blockquote></div><br>