On Wed, Jan 25, 2012 at 6:52 AM, Dominik Szczerba <span dir="ltr">&lt;<a href="mailto:dominik@itis.ethz.ch">dominik@itis.ethz.ch</a>&gt;</span> wrote:<br><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
&gt; The error is inside of METIS and this is just a bare assert, so there isn&#39;t<br>
&gt; information regarding whether they think this is the result of invalid input<br>
&gt; or a METIS bug. Get the full stack trace so we can determine where this is<br>
&gt; happening, METIS is a partitioner, so it&#39;s not normally called as part<br>
&gt; of assembling a matrix.<br>
<br>
I have built both petsc and my app in debug mode, unfortunately, I do<br>
not get any trace, only the below message, followed by assertions from<br>
parmetis. Is there any other way to increase verbosity / find out<br>
where it is triggered?<br></blockquote><div><br></div><div>asserts are a terrible debugging tool. You need to either use a debugger, or output</div><div>the matrix in a form that the ParMetis people can use and debug with.</div>
<div><br></div><div>    Matt</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Dominik<br>
<br>
<br>
_pmiu_daemon(SIGCHLD): [NID 00098] [c1-0c2s1n2] [Wed Jan 25 13:35:59<br>
2012] PE RANK 36 exit signal Aborted<br>
_pmiu_daemon(SIGCHLD): [NID 00062] [c0-0c1s0n0] [Wed Jan 25 13:35:58<br>
2012] PE RANK 20 exit signal Aborted<br>
_pmiu_daemon(SIGCHLD): [NID 00130] [c1-0c1s1n0] [Wed Jan 25 13:35:58<br>
2012] PE RANK 48 exit signal Aborted<br>
_pmiu_daemon(SIGCHLD): [NID 00099] [c1-0c2s1n3] [Wed Jan 25 13:35:59<br>
2012] PE RANK 37 exit signal Aborted<br>
_pmiu_daemon(SIGCHLD): [NID 00055] [c0-0c1s4n1] [Wed Jan 25 13:35:58<br>
2012] PE RANK 15 exit signal Aborted<br>
_pmiu_daemon(SIGCHLD): [NID 00026] [c0-0c0s2n2] [Wed Jan 25 13:35:58<br>
2012] PE RANK 4 exit signal Aborted<br>
_pmiu_daemon(SIGCHLD): [NID 00058] [c0-0c1s2n0] [Wed Jan 25 13:35:58<br>
2012] PE RANK 16 exit signal Aborted<br>
_pmiu_daemon(SIGCHLD): [NID 00073] [c0-0c2s4n1] [Wed Jan 25 13:35:58<br>
2012] PE RANK 27 exit signal Aborted<br>
_pmiu_daemon(SIGCHLD): [NID 00159] [c1-0c1s0n3] [Wed Jan 25 13:35:58<br>
2012] PE RANK 55 exit signal Aborted<br>
_pmiu_daemon(SIGCHLD): [NID 00066] [c0-0c2s1n0] [Wed Jan 25 13:35:59<br>
2012] PE RANK 24 exit signal Aborted<br>
_pmiu_daemon(SIGCHLD): [NID 00156] [c1-0c1s1n2] [Wed Jan 25 13:35:58<br>
2012] PE RANK 52 exit signal Aborted<br>
_pmiu_daemon(SIGCHLD): [NID 00029] [c0-0c0s1n3] [Wed Jan 25 13:35:58<br>
2012] PE RANK 7 exit signal Aborted<br>
_pmiu_daemon(SIGCHLD): [NID 00040] [c0-0c1s4n2] [Wed Jan 25 13:35:58<br>
2012] PE RANK 12 exit signal Aborted<br>
_pmiu_daemon(SIGCHLD): [NID 00105] [c1-0c2s4n3] [Wed Jan 25 13:35:58<br>
2012] PE RANK 39 exit signal Aborted<br>
_pmiu_daemon(SIGCHLD): [NID 00129] [c1-0c1s0n1] [Wed Jan 25 13:35:58<br>
2012] PE RANK 47 exit signal Aborted<br>
[NID 00055] 2012-01-25 13:35:58 Apid 478353: initiated application termination<br>
_pmiu_daemon(SIGCHLD): [NID 00067] [c0-0c2s1n1] [Wed Jan 25 13:35:58<br>
2012] PE RANK 25 exit signal Aborted<br>
_pmiu_daemon(SIGCHLD): [NID 00041] [c0-0c1s4n3] [Wed Jan 25 13:35:58<br>
2012] PE RANK 13 exit signal Aborted<br>
_pmiu_daemon(SIGCHLD): [NID 00157] [c1-0c1s1n3] [Wed Jan 25 13:35:58<br>
2012] PE RANK 53 exit signal Aborted<br>
_pmiu_daemon(SIGCHLD): [NID 00127] [c1-0c2s0n1] [Wed Jan 25 13:35:58<br>
2012] PE RANK 45 exit signal Aborted<br>
_pmiu_daemon(SIGCHLD): [NID 00093] [c0-0c2s1n3] [Wed Jan 25 13:35:58<br>
2012] PE RANK 31 exit signal Aborted<br>
_pmiu_daemon(SIGCHLD): [NID 00065] [c0-0c2s0n1] [Wed Jan 25 13:35:58<br>
2012] PE RANK 23 exit signal Aborted<br>
_pmiu_daemon(SIGCHLD): [NID 00063] [c0-0c1s0n1] [Wed Jan 25 13:35:58<br>
2012] PE RANK 21 exit signal Aborted<br>
_pmiu_daemon(SIGCHLD): [NID 00033] [c0-0c1s0n3] [Wed Jan 25 13:35:58<br>
2012] PE RANK 9 exit signal Aborted<br>
_pmiu_daemon(SIGCHLD): [NID 00032] [c0-0c1s0n2] [Wed Jan 25 13:35:58<br>
2012] PE RANK 8 exit signal Aborted<br>
_pmiu_daemon(SIGCHLD): [NID 00161] [c1-0c0s0n3] [Wed Jan 25 13:35:58<br>
2012] PE RANK 57 exit signal Aborted<br>
_pmiu_daemon(SIGCHLD): [NID 00086] [c0-0c2s4n2] [Wed Jan 25 13:35:58<br>
2012] PE RANK 28 exit signal Aborted<br>
_pmiu_daemon(SIGCHLD): [NID 00160] [c1-0c0s0n2] [Wed Jan 25 13:35:58<br>
2012] PE RANK 56 exit signal Aborted<br>
Command exited with non-zero status 137<br>
</blockquote></div><br><br clear="all"><div><br></div>-- <br>What most experimenters take for granted before they begin their experiments is infinitely more interesting than any results to which their experiments lead.<br>
-- Norbert Wiener<br>