<html dir="ltr">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<style id="owaParaStyle" type="text/css">P {margin-top:0;margin-bottom:0;}</style>
</head>
<body ocsi="0" fpstyle="1">
<div style="direction: ltr;font-family: Tahoma;color: #000000;font-size: 10pt;"><br>
<div>Hello,<br>
<br>
Pavan, thank you so much for creating a ticket to include this <br>
support to Hydra. I really appreciate it.<br>
<br>
Ju, thank you very much for your suggestion. We currently use <br>
a variant of SGE as our job scheduler. However,&nbsp; when we suspend<br>
an MPICH2/Hydra job, the master process and the slave processes<br>
that are on the same host as the master get suspended, but the <br>
slave processes on other hosts continue to run (they do not get<br>
suspended). If someone is aware of a way to get SGE to suspend all<br>
processes properly in such a case, I would appreciate hearing how <br>
that is done.<br>
<br>
Thank you very much again!<br>
Shan-Ho<br>
<br>
<div style="font-family: Tahoma; font-size: 13px;">----------------------------------------------------<br>
Shan-Ho Tsai<br>
University of Georgia, Athens GA<br>
<br>
</div>
</div>
<div style="font-family: Times New Roman; color: rgb(0, 0, 0); font-size: 16px;">
<hr tabindex="-1">
<div style="direction: ltr;" id="divRpF34781"><font face="Tahoma" size="2" color="#000000"><b>From:</b> mpich-discuss-bounces@mcs.anl.gov [mpich-discuss-bounces@mcs.anl.gov] on behalf of Ju JiaJia [jujj603@gmail.com]<br>
<b>Sent:</b> Friday, May 04, 2012 9:37 PM<br>
<b>To:</b> mpich-discuss@mcs.anl.gov<br>
<b>Subject:</b> Re: [mpich-discuss] Suspend jobs that use MPICH2 with Hydra<br>
</font><br>
</div>
<div></div>
<div>I think you can use a resource manager and scheduler to do this, like torque &#43; maui. You can suspend and resume jobs.<br>
<br>
<div class="gmail_quote">On Sat, May 5, 2012 at 8:46 AM, Pavan Balaji <span dir="ltr">
&lt;<a href="mailto:balaji@mcs.anl.gov" target="_blank">balaji@mcs.anl.gov</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0px 0px 0px 0.8ex; padding-left: 1ex;">
Hello,<br>
<br>
We don't support this right now. &nbsp;I've created a ticket for it.<br>
<br>
<a href="https://trac.mcs.anl.gov/projects/mpich2/ticket/1627" target="_blank">https://trac.mcs.anl.gov/<u></u>projects/mpich2/ticket/1627</a><br>
<br>
Please add yourself to the cc list of this ticket, if you'd like to be informed about updates on this issue.<br>
<br>
&nbsp;-- Pavan
<div class="HOEnZb">
<div class="h5"><br>
<br>
On 05/04/2012 12:54 PM, Shan-ho Tsai wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0px 0px 0px 0.8ex; padding-left: 1ex;">
Hello all,<br>
We have mpich2 1.4.1p1 installed on a RHEL5 cluster<br>
and sometimes have the need to suspend all jobs clusterwide.<br>
<br>
Is there a way to suspend MPICH2 jobs that use Hydra, in<br>
such a way that the master process and all slave process<br>
(on multiple nodes) get properly suspended?<br>
<br>
If there is a way to do this, what is the procedure? Is there<br>
a signal that we could send to mpiexec?<br>
<br>
I tried sending a SIGSTOP to mpiexec, but only mpiexec<br>
got suspended, the actual a.out processes continued to run.<br>
<br>
I really appreciate any suggestions.<br>
thank you,<br>
Shan-Ho<br>
<br>
------------------------------<u></u>----------------------<br>
Shan-Ho Tsai<br>
University of Georgia, Athens GA<br>
<br>
<br>
<br>
______________________________<u></u>_________________<br>
mpich-discuss mailing list &nbsp; &nbsp; <a href="mailto:mpich-discuss@mcs.anl.gov" target="_blank">
mpich-discuss@mcs.anl.gov</a><br>
To manage subscription options or unsubscribe:<br>
<a href="https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss" target="_blank">https://lists.mcs.anl.gov/<u></u>mailman/listinfo/mpich-discuss</a><br>
</blockquote>
<br>
</div>
</div>
<span class="HOEnZb"><font color="#888888">-- <br>
Pavan Balaji<br>
<a href="http://www.mcs.anl.gov/~balaji" target="_blank">http://www.mcs.anl.gov/~balaji</a></font></span>
<div class="HOEnZb">
<div class="h5"><br>
______________________________<u></u>_________________<br>
mpich-discuss mailing list &nbsp; &nbsp; <a href="mailto:mpich-discuss@mcs.anl.gov" target="_blank">
mpich-discuss@mcs.anl.gov</a><br>
To manage subscription options or unsubscribe:<br>
<a href="https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss" target="_blank">https://lists.mcs.anl.gov/<u></u>mailman/listinfo/mpich-discuss</a><br>
</div>
</div>
</blockquote>
</div>
<br>
</div>
</div>
</div>
</body>
</html>