<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN">
<HTML>
<HEAD>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=us-ascii">
<META NAME="Generator" CONTENT="MS Exchange Server version 6.5.7651.59">
<TITLE>Error handler</TITLE>
</HEAD>
<BODY>
<!-- Converted from text/rtf format -->

<P><FONT SIZE=2 FACE="Arial">I am new to MPICH, and I have a lot of questions about error handling, but I will start with just one easy one.</FONT>
</P>

<P><FONT SIZE=2 FACE="Arial">I am up and running with MPICH and C++ on Red Hat Enterprise 4. I have a fairly simple application where the master process divides the work and sends it out to each of the workers. The workers do their part of the work independently, and then the master assembles the results into a report.</FONT></P>

<P><FONT SIZE=2 FACE="Arial">Eventually, I will want to be able handle failures in the worker processes by resubmitting the work to another worker to try to get my job complete. For now, I would like to just catch the error and report the problem in my application output.</FONT></P>

<P><FONT SIZE=2 FACE="Arial">When I run the application and have one of my workers exit, it &quot;caused collective abort of all ranks.&quot; At this point, I replaced the default error handler with ERRORS_THROW_EXCEPTIONS error handler, but I still get the same results. My MPICH initialization looks like:</FONT></P>

<P><FONT SIZE=2 FACE="Arial">MPI::Init( argC, argV );</FONT>

<BR><FONT SIZE=2 FACE="Arial">MPI::COMM_WORLD.Set_errhandler( MPI::ERRORS_THROW_EXCEPTIONS );</FONT>
</P>

<P><FONT SIZE=2 FACE="Arial">I have also tried:</FONT>
</P>

<P><FONT SIZE=2 FACE="Arial">MPI_Errhandler_set( MPI_COMM_WORLD, MPI::ERRORS_THROW_EXCEPTIONS ); </FONT>
</P>

<P><FONT SIZE=2 FACE="Arial">with the same results.</FONT>
</P>

<P><FONT SIZE=2 FACE="Arial">All I want to do right now is to catch the error, add the error to my results and exit cleanly. </FONT>
</P>

<P><FONT SIZE=2 FACE="Arial">What might I be doing wrong here? (I suppose that I could be testing this incorrectly.)</FONT>

<BR><FONT SIZE=2 FACE="Arial">Is there a way to force MPICH to generate errors for testing?</FONT>
</P>

<P><FONT SIZE=2 FACE="Arial">Is there some documentation or articles about error handling with MPICH that might answer some of my other questions?</FONT>
</P>

<P><FONT SIZE=2 FACE="Arial">Thanks,</FONT>
</P>

<P><FONT SIZE=2 FACE="Arial">David</FONT>
</P>
<BR>

</BODY>
</HTML>