<div dir="ltr"><div dir="ltr"><br></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Sun, Sep 29, 2019 at 1:30 AM Michael Wick via petsc-maint <<a href="mailto:petsc-maint@mcs.anl.gov">petsc-maint@mcs.anl.gov</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div dir="ltr"><div>Thank you all for the reply.<br></div><div><br></div><div>I am trying to get the backtrace. However, the code hangs totally randomly, and it hangs only when I run large simulations (e.g. 72 CPUs for this one). I am trying very hard to get the error message.<br></div><div><br></div><div>So far, I can pin-point that the issue is related with hypre, and a static build of the petsc library. Switching to a dynamic build works fine so far. Also, using a naked gmres works. Does anyone have similar issues before? <br></div></div></div></blockquote><div><br></div><div>I've never heard of a problem like this. You might try deleting your architectured directory (a make clean essentially) and reconfigure.</div><div><br></div><div>If dynamic builds work is there any reason not to just do that and move on?</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div dir="ltr"><div></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Sat, Sep 28, 2019 at 6:28 AM Stefano Zampini <<a href="mailto:stefano.zampini@gmail.com" target="_blank">stefano.zampini@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="auto">In my experience, an hanging execution may results from seterrq being called with the wrong communicator. Anyway, it would be useful to get the output of -log_trace . <div dir="auto"><br></div><div dir="auto">Also, does it hang when -pc_type none is specified?</div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">Il Sab 28 Set 2019, 16:22 Zhang, Junchao via petsc-users <<a href="mailto:petsc-users@mcs.anl.gov" target="_blank">petsc-users@mcs.anl.gov</a>> ha scritto:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">



<div>
<div dir="ltr">Does it hang with  2 or 4 processes? Which PETSc version do you use (using the latest is easier for us to debug)?  Did you configure PETSc with --with-debugging=yes COPTFLAGS="-O0 -g"  CXXOPTFLAGS="-O0 -g" 
<div>After attaching gdb to one process, you can use bt  to see its stack trace.<br>
<div><br clear="all">
<div>
<div dir="ltr">
<div dir="ltr">--Junchao Zhang</div>
</div>
</div>
<br>
</div>
</div>
</div>
<br>
<div class="gmail_quote">
<div dir="ltr" class="gmail_attr">On Sat, Sep 28, 2019 at 5:33 AM Michael Wick <<a href="mailto:michael.wick.1980@gmail.com" rel="noreferrer" target="_blank">michael.wick.1980@gmail.com</a>> wrote:<br>
</div>
<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
<div dir="ltr">
<div>I attached a debugger to my run. The code just hangs without throwing an error message, interestingly. I uses 72 processors. I turned on the ksp monitor. And I can see it hangs either at the beginning or the end of KSP iteration. I also uses valgrind to
 debug my code on my local machine, which does not detect any issue. I uses fgmres + fieldsplit, which is really a standard option.</div>
<div><br>
</div>
<div>Do you have any suggestions to do?<br>
</div>
</div>
<br>
<div class="gmail_quote">
<div dir="ltr" class="gmail_attr">On Fri, Sep 27, 2019 at 8:17 PM Zhang, Junchao <<a href="mailto:jczhang@mcs.anl.gov" rel="noreferrer" target="_blank">jczhang@mcs.anl.gov</a>> wrote:<br>
</div>
<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
<div>
<div dir="ltr">How many MPI ranks did you use? If it is done on your desktop, you can just attach a debugger to a MPI process to see what is going on.
<div><br clear="all">
<div>
<div dir="ltr">
<div dir="ltr">--Junchao Zhang</div>
</div>
</div>
<br>
</div>
</div>
<br>
<div class="gmail_quote">
<div dir="ltr" class="gmail_attr">On Fri, Sep 27, 2019 at 4:24 PM Michael Wick via petsc-maint <<a href="mailto:petsc-maint@mcs.anl.gov" rel="noreferrer" target="_blank">petsc-maint@mcs.anl.gov</a>> wrote:<br>
</div>
<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
<div dir="ltr">
<div>Hi PETSc:</div>
<div><br>
</div>
<div>I have been experiencing a code stagnation at certain KSP iterations. This happens rather randomly, which means the code may stop at the middle of a KSP solve and hangs there.</div>
<div><br>
</div>
<div>I have used valgrind and detect nothing. I just wonder if you have any suggestions.</div>
<div><br>
</div>
<div>Thanks!!!</div>
<div>M<br>
</div>
</div>
</blockquote>
</div>
</div>
</blockquote>
</div>
</blockquote>
</div>
</div>

</blockquote></div>
</blockquote></div></div>
</blockquote></div></div>