Hi Darius,<div><br></div><div>I works after applying the patch !!</div><div>The mpiexec process terminates gracefully with hanging at the end.</div><div><br></div><div>Thank you for fixing this problem.</div><div><br><br><div class="gmail_quote">
On Tue, Oct 19, 2010 at 4:57 PM, Darius Buntinas <span dir="ltr">&lt;<a href="mailto:buntinas@mcs.anl.gov">buntinas@mcs.anl.gov</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">
<br>
It looks like I fixed the problem.  If you want to try it, you can get a patch here <a href="https://trac.mcs.anl.gov/projects/mpich2/changeset/7344" target="_blank">https://trac.mcs.anl.gov/projects/mpich2/changeset/7344</a> (there&#39;s a link to download the patch at the bottom of the page) or you can get a snapshot tomorrow from <a href="http://www.mcs.anl.gov/research/projects/mpich2/downloads/tarballs/nightly/trunk/" target="_blank">http://www.mcs.anl.gov/research/projects/mpich2/downloads/tarballs/nightly/trunk/</a><br>

<br>
Please let us know how this works for you.<br>
<br>
Thanks,<br>
<font color="#888888">-d<br>
</font><div><div></div><div class="h5"><br>
On Oct 12, 2010, at 9:52 AM, Darius Buntinas wrote:<br>
<br>
&gt;<br>
&gt; I can reproduce this, and I&#39;m looking into it.<br>
&gt;<br>
&gt; Thanks,<br>
&gt; -d<br>
&gt;<br>
&gt; On Oct 10, 2010, at 12:40 PM, Pavan Balaji wrote:<br>
&gt;<br>
&gt;&gt; On 10/10/2010 12:19 PM, kishor kharbas wrote:<br>
&gt;&gt;&gt; 1 That exactly was the problem, I re-compiled my program and it works,<br>
&gt;&gt;&gt; except for one issue,<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt;   After restarting the parallel process from the checkpoint file, the<br>
&gt;&gt;&gt; mpiexec process hangs and does not terminate at all.<br>
&gt;&gt;&gt;   The spawned process hover around in &lt;defunct&gt; state. After I stop<br>
&gt;&gt;&gt; mpiexec myself, these error messages are displayed,<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; /  ^C[mpiexec@opt09] connection to proxy terminated unexpectedly/<br>
&gt;&gt;&gt; /  Ctrl-C caught... cleaning up processes/<br>
&gt;&gt;&gt; /  [press Ctrl-C again to force abort]/<br>
&gt;&gt;&gt; /  APPLICATION TERMINATED WITH THE EXIT STRING: Hangup (signal 1)/<br>
&gt;&gt;<br>
&gt;&gt; I&#39;ll let Darius reply to this part.<br>
&gt;<br>
<br>
_______________________________________________<br>
mpich-discuss mailing list<br>
<a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>
<a href="https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss" target="_blank">https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss</a><br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br><i>Kishor Kharbas</i><br><i style="font-family:times new roman,serif">MS Student<br>Department of Computer Science<br>NC State University</i><i style="font-family:times new roman,serif"><br>
Raleigh, NC 27606</i><br>
</div>