<div dir="ltr">Barry,<br>Sorry, I must have missed this -- I really ought to make a better filter for catching email like this.<div>I think using NaNs is an excellent solution, in fact, I was proposing it a few months ago here :-)</div><div><a href="http://lists.mcs.anl.gov/pipermail/petsc-dev/2015-February/016958.html">http://lists.mcs.anl.gov/pipermail/petsc-dev/2015-February/016958.html</a><br></div><div>It ensures that the error is collective (the norm reduction will ensure every rank gets a NaN), </div><div>the "error condition" is cleared automatically on the next MatMult, etc.</div><div>I'm all for it.</div><div>Should I put it in?</div><div><br></div><div>Dmitry.</div></div><br><div class="gmail_quote">On Wed, Apr 29, 2015 at 8:26 PM Barry Smith <<a href="mailto:bsmith@mcs.anl.gov">bsmith@mcs.anl.gov</a>> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><br>
  Dmitry,<br>
<br>
    I haven't heard back from you on this. Any thoughts?<br>
<br>
  Barry<br>
<br>
> On Apr 20, 2015, at 6:23 PM, Barry Smith <<a href="mailto:bsmith@mcs.anl.gov" target="_blank">bsmith@mcs.anl.gov</a>> wrote:<br>
><br>
><br>
>  Dmitry,<br>
><br>
>   Rather than introducing another whole complexity of flags for indicating domain errors in user functions just do the following.<br>
><br>
>   1) just stick a Nan into the functions result<br>
>   2) remove the VecValidValues() at the END of routines like MatMult()<br>
>   3) when Nan or Inf pop up in Krylov methods (which will happen within VecNorm or VecDot() and thus we get free collective knowledge of the problem even if it happened on only one node), generate the appropriate KSP_DIVERGED_NANORINF. This is already handled sometimes (most of the time?), for example in KSPSolve_CG is code<br>
> ierr = VecXDot(Z,R,&beta);CHKERRQ(ierr);         /*  beta <- z'*r       */<br>
>    if (PetscIsInfOrNanScalar(beta)) {<br>
>      if (ksp->errorifnotconverged) SETERRQ(PetscObjectComm((PetscObject)ksp),PETSC_ERR_NOT_CONVERGED,"KSPSolve has not converged due to Nan or Inf inner product");<br>
>      else {<br>
>        ksp->reason = KSP_DIVERGED_NANORINF;<br>
>        PetscFunctionReturn(0);<br>
>      }<br>
>    }<br>
><br>
>   4) SNES already handles failed to converge KSP and<br>
>   5 ) TS already handles failed to converged SNES; by, for example, cutting the timestep.<br>
><br>
>  Barry<br>
><br>
><br>
<br>
</blockquote></div>