Hi Darius,<br><br>OK. Thank you for answer my email.<br><br>And how about MPICH-1.2.1.p1? The more stable version one..<br>Do I need to install BLCR first for this version?<br><br>Since 1.2.p1 have a support for BLCR too, which version do you suggest to work with BLCR package, 1.2.1.p1 or 1.3a2 ?<br>
<br>Thank you very much,<br><br>Bagus<br><br><div class="gmail_quote"><br><br><br>On Tue, May 11, 2010 at 4:17 AM, Darius Buntinas <span dir="ltr">&lt;<a href="mailto:buntinas@mcs.anl.gov">buntinas@mcs.anl.gov</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">Hi Bagus,<br>
<br>
Sorry, I haven&#39;t written up the documentation on this yet.  You&#39;ll need to install BLCR, and configure mpich2 with the following configure options:<br>
<br>
--with-hydra-ckpointlib=blcr --enable-checkpointing<br>
<br>
If you didn&#39;t install BLCR in a standard system location (e.g., if you installed it in your home directory), then you&#39;ll need to specify the install location using the --with-blcr= configure option as well.  Also, make sure that your LD_LIBRARY_PATH is set correctly if necessary.<br>

<br>
Once you configure and make, you&#39;ll need to make sure the BLCR kernel modules are loaded on each machine.  Use the -ckpoint-interval option for mpiexec to specify how often to take checkpoints.  You&#39;ll also need to specify the location where the checkpoint files should be written using the -ckpoint-prefix option (make sure the directory exists).<br>

<br>
To restart from a checkpoint specify the same number of processes as the original run and the -ckpoint-prefix option, but leave off the name of the executable.<br>
<br>
Let us know how this works for you.  Remember that you&#39;re using a beta version, so you might still encounter some bugs.<br>
<br>
-d<div><div></div><div class="h5"><br>
<br></div></div></blockquote></div>