Thank you Pavan and Darius for your help.<br><br>I am in the process of running MPI application with check-pointing, but I am facing a problem in running the application(without checkpoint) at the first place. I tried running the application on 2 processing nodes with default HYDRA process manager.<br>

<br>Command : $: ../bin/mpiexec -np 2 ./mpiexample<br>(host file has domain names for 2 hosts) <br><br>The error shown is - <br>   
<i>Fatal error in MPI_Send: Other MPI error, error stack:<br>   MPI_Send(174).................</i><i>....: MPI_Send(buf=0x7fff379fabb8, count=1, MPI_INT, dest=1, tag=0, MPI_COMM_WORLD) failed<br>   MPIDI_CH3I_Progress(165)......</i><i>....: <br>

  
MPID_nem_mpich2_blocking_recv(</i><i>895): <br>   MPID_nem_tcp_connpoll(1714)...</i><i>....: Communication error</i><br><br>Can you please suggest how can I find the cause for this error.<br><br>Thanks,<br>Kishor<br><div class="gmail_quote">


On Wed, Jul 14, 2010 at 2:03 PM, Darius Buntinas <span dir="ltr">&lt;<a href="mailto:buntinas@mcs.anl.gov" target="_blank">buntinas@mcs.anl.gov</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">



Here&#39;s a wiki page that has some info on building it and running applications.  Let me know if you have trouble with this.<br>
<br>
<a href="http://wiki.mcs.anl.gov/mpich2/index.php/Checkpointing" target="_blank">http://wiki.mcs.anl.gov/mpich2/index.php/Checkpointing</a><br>
<font color="#888888"><br>
-d<br>
</font><div><div></div><div><br>
On Jul 13, 2010, at 9:37 AM, kishor kharbas wrote:<br>
<br>
&gt; Hi,<br>
&gt;<br>
&gt; Does the beta version - mpich2-1.3a2 have support for BLCR ?<br>
&gt; If so where can I find guidelines regarding usage of the functionality, if could not find it in the user guide document included with the above version.<br>
&gt;<br>
&gt;<br>
&gt; Thanks,<br>
&gt; Kishor<br>
&gt; On Mon, Jul 12, 2010 at 11:14 AM, Darius Buntinas &lt;<a href="mailto:buntinas@mcs.anl.gov" target="_blank">buntinas@mcs.anl.gov</a>&gt; wrote:<br>
&gt;<br>
&gt; The next release of MPICH2 (1.3) will include checkpointing support using BLCR.  You can try the beta release that&#39;s available under &#39;downloads&#39; on the MPICH2 website:<br>
&gt;<br>
&gt;    <a href="http://www.mcs.anl.gov/research/projects/mpich2/" target="_blank">http://www.mcs.anl.gov/research/projects/mpich2/</a><br>
&gt;<br>
&gt; You&#39;ll need to install BLCR version 0.8.2 (which is currently the latest version).<br>
&gt;<br>
&gt; -d<br>
&gt;<br>
&gt; On Jul 12, 2010, at 9:05 AM, kishor kharbas wrote:<br>
&gt;<br>
&gt; &gt; Hello,<br>
&gt; &gt;<br>
&gt; &gt; I would like to know whether there are any plans for including Berkeley lab checkpoint restart(BLCR) in MPICH2 runtime environment.<br>
&gt; &gt;<br>
&gt; &gt; Thanks,<br>
&gt; &gt; Kishor Kharbas<br>
&gt; &gt; MS Student<br>
&gt; &gt; Department of Computer Science<br>
&gt; &gt; NC State University<br>
&gt; &gt; Raleigh, NC 27606<br>
&gt; &gt; _______________________________________________<br>
&gt; &gt; mpich-discuss mailing list<br>
&gt; &gt; <a href="mailto:mpich-discuss@mcs.anl.gov" target="_blank">mpich-discuss@mcs.anl.gov</a><br>
&gt; &gt; <a href="https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss" target="_blank">https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss</a><br>
&gt;<br>
&gt; _______________________________________________<br>
&gt; mpich-discuss mailing list<br>
&gt; <a href="mailto:mpich-discuss@mcs.anl.gov" target="_blank">mpich-discuss@mcs.anl.gov</a><br>
&gt; <a href="https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss" target="_blank">https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss</a><br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; --<br>
&gt; MS Student<br>
&gt; Department of Computer Science<br>
&gt; NC State University<br>
&gt; Raleigh, NC 27606<br>
&gt; _______________________________________________<br>
&gt; mpich-discuss mailing list<br>
&gt; <a href="mailto:mpich-discuss@mcs.anl.gov" target="_blank">mpich-discuss@mcs.anl.gov</a><br>
&gt; <a href="https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss" target="_blank">https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss</a><br>
<br>
_______________________________________________<br>
mpich-discuss mailing list<br>
<a href="mailto:mpich-discuss@mcs.anl.gov" target="_blank">mpich-discuss@mcs.anl.gov</a><br>
<a href="https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss" target="_blank">https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss</a><br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br>MS Student<br>Department of Computer Science<br>NC State University<br>Raleigh, NC 27606<br>