<div dir="ltr">On Sat, Aug 3, 2013 at 4:22 AM, Jin, Shuangshuang <span dir="ltr"><<a href="mailto:Shuangshuang.Jin@pnnl.gov" target="_blank">Shuangshuang.Jin@pnnl.gov</a>></span> wrote:<br><div class="gmail_extra"><div class="gmail_quote">
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">






<div>
<font face="Calibri, sans-serif">
<div>Hello, </div>
<div> </div>
<div>     My code solves a linear system AX=B using superlu_dist in PETSc, and use some of X’s data to solve a DAE problem. I get a very wild error:</div>
<div> </div>
<div>     When I use less than 8 processors to run the code, it runs just fine with correct results. When I use greater than 8 processors, such as 16 or 32 processors, I’ll get an error and a lot of generated core.##### files. </div>

<div><font face="Times New Roman, serif"> </font></div>
<div>[0]PETSC ERROR: --------------------- Error Message ------------------------------------</div>
<div>[0]PETSC ERROR:   !</div>
<div>[0]PETSC ERROR: TSStep has failed due to DIVERGED_NONLINEAR_SOLVE, increase -ts_max_snes_failures or make negative to attempt recovery!</div>
<div>[0]PETSC ERROR: ------------------------------------------------------------------------</div>
<div>[0]PETSC ERROR: Petsc Development GIT revision: a0a914e661bf6402b8edabe0f5a2dad46323f69f  GIT Date: 2013-06-05 14:18:39 -0500</div>
<div>[0]PETSC ERROR: See docs/changes/index.html for recent updates.</div>
<div>[0]PETSC ERROR: See docs/faq.html for hints about trouble shooting.</div>
<div>[0]PETSC ERROR: See docs/index.html for manual pages.</div>
<div>[0]PETSC ERROR: ------------------------------------------------------------------------</div>
<div>[0]PETSC ERROR: dynSim on a arch-complex named node0055.local by d3m956 Fri Aug  2 11:56:10 2013</div>
<div>[0]PETSC ERROR: Libraries linked from /pic/projects/ds/petsc-dev.6.06.13/arch-complex/lib</div>
<div>[0]PETSC ERROR: Configure run at Fri Jul 26 14:32:37 2013</div>
<div>[0]PETSC ERROR: Configure options --with-scalar-type=complex --with-clanguage=C++ PETSC_ARCH=arch-complex --with-fortran-kernels=generic --download-superlu_dist --download-mumps --download-scalapack --download-parmetis --download-metis --download-elemental
--with-debugging=0</div>
<div>[0]PETSC ERROR: ------------------------------------------------------------------------</div>
<div>[0]PETSC ERROR: TSStep() line 2515 in /pic/projects/ds/petsc-dev.6.06.13/src/ts/interface/ts.c</div>
<div>[0]PETSC ERROR: TSSolve() line 2632 in /pic/projects/ds/petsc-dev.6.06.13/src/ts/interface/ts.c</div>
<div>[0]PETSC ERROR: simu() line 566 in "unknowndirectory/"simulation.C</div>
<div>[0]PETSC ERROR: runSimulation() line 99 in "unknowndirectory/"dynSim.h</div>
<div>[node0055:32539] *** Process received signal ***</div>
<div>[node0055:32535] *** Process received signal ***</div>
<div>[node0055:32535] Signal: Aborted (6)</div>
<div>[node0055:32535] Signal code:  (24153104)</div>
<div>[node0055:32534] *** Process received signal ***</div>
<div>[node0055:32534] Signal: Aborted (6)</div>
<div>[node0055:32534] Signal code:  (24199552)</div>
<div>[node0055:32539] Signal: Aborted (6)</div>
<div>[node0055:32539] Signal code:  (24157648)</div>
<div>[node0055:32537] *** Process received signal ***</div>
<div>[node0055:32537] Signal: Aborted (6)</div>
<div>[node0055:32537] Signal code:  (24546704)</div>
<div>[node0055:32538] *** Process received signal ***</div>
<div><font face="Times New Roman, serif"> </font></div>
<div style="text-indent:9pt">The Error Message from PETSc pointed out that “TSStep has failed due to DIVERGED_NONLINEAR_SOLVE, increase -ts_max_snes_failures or make negative to attempt recovery!”, but I think it’s because the superlu_dist computed an all
“nan” X as I printed it out. </div>
<div style="text-indent:9pt"><font face="Times New Roman, serif"> </font></div>
<div style="text-indent:9pt">However, I don’t understand why using 8 or 16 processors should make such a difference.</div></font></div></blockquote><div><br></div><div>It sounds like you are computing a NaN somewhere, possibly your residual evaluation. However, we should</div>
<div>catch this when we evaluate the norm. Please turn on debugging in your build.</div><div><br></div><div>   Matt</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div><font face="Calibri, sans-serif">
<div style="text-indent:9pt">Can anyone give me some help for the trouble shooting?</div>
<div style="text-indent:9pt"><font face="Times New Roman, serif"> </font></div>
<div>Thanks,</div>
<div>Shuangshuang</div>
<div><font face="Times New Roman, serif"> </font></div>
</font>
</div>

</blockquote></div><br><br clear="all"><div><br></div>-- <br>What most experimenters take for granted before they begin their experiments is infinitely more interesting than any results to which their experiments lead.<br>
-- Norbert Wiener
</div></div>