<div dir="ltr">Thanks, Barry,<div><br></div><div>I also was wondering why this happens randomly? Any explanations? If this is something in PETSc, that should happen always?</div><div><br></div><div>Thanks,</div><div><br></div><div>Fande Kong,</div></div><div class="gmail_extra"><br><div class="gmail_quote">On Fri, Nov 27, 2015 at 1:20 PM, Barry Smith <span dir="ltr"><<a href="mailto:bsmith@mcs.anl.gov" target="_blank">bsmith@mcs.anl.gov</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><br>
  Edit PETSC_ARCH/include/petscconf.h and add<br>
<br>
#if !defined(PETSC_MISSING_SIGTRAP)<br>
#define PETSC_MISSING_SIGTRAP<br>
#endif<br>
<br>
then do<br>
<br>
make gnumake<br>
<br>
It is possible that they system you are using uses SIGTRAP in managing the IO; by making the change above you are telling PETSc to ignore SIGTRAPS.   Let us know how this works out.<br>
<br>
   Barry<br>
<div><div class="h5"><br>
<br>
> On Nov 27, 2015, at 1:05 PM, Fande Kong <<a href="mailto:fdkong.jd@gmail.com">fdkong.jd@gmail.com</a>> wrote:<br>
><br>
> Hi all,<br>
><br>
> I implemented a parallel IO based on the Vec and IS which uses HDF5. I am testing this loader on a supercomputer. I occasionally (not always) encounter the following errors (using 8192 cores):<br>
><br>
> [7689]PETSC ERROR: ------------------------------------------------------------------------<br>
> [7689]PETSC ERROR: Caught signal number 5 TRAP<br>
> [7689]PETSC ERROR: Try option -start_in_debugger or -on_error_attach_debugger<br>
> [7689]PETSC ERROR: or see <a href="http://www.mcs.anl.gov/petsc/documentation/faq.html#valgrind" rel="noreferrer" target="_blank">http://www.mcs.anl.gov/petsc/documentation/faq.html#valgrind</a><br>
> [7689]PETSC ERROR: or try <a href="http://valgrind.org" rel="noreferrer" target="_blank">http://valgrind.org</a> on GNU/linux and Apple Mac OS X to find memory corruption errors<br>
> [7689]PETSC ERROR: configure using --with-debugging=yes, recompile, link, and run<br>
> [7689]PETSC ERROR: to get more information on the crash.<br>
> [7689]PETSC ERROR: --------------------- Error Message --------------------------------------------------------------<br>
> [7689]PETSC ERROR: Signal received<br>
> [7689]PETSC ERROR: See <a href="http://www.mcs.anl.gov/petsc/documentation/faq.html" rel="noreferrer" target="_blank">http://www.mcs.anl.gov/petsc/documentation/faq.html</a> for trouble shooting.<br>
> [7689]PETSC ERROR: Petsc Release Version 3.6.2, unknown<br>
> [7689]PETSC ERROR: ./fsi on a arch-linux2-cxx-opt named ys6103 by fandek Fri Nov 27 11:26:30 2015<br>
> [7689]PETSC ERROR: Configure options --with-clanguage=cxx --with-shared-libraries=1 --download-fblaslapack=1 --with-mpi=1 --download-parmetis=1 --download-metis=1 --with-netcdf=1 --download-exodusii=1 --with-hdf5-dir=/glade/apps/opt/hdf5-mpi/1.8.12/intel/12.1.5 --with-debugging=no --with-c2html=0 --with-64-bit-indices=1<br>
> [7689]PETSC ERROR: #1 User provided function() line 0 in  unknown file<br>
> Abort(59) on node 7689 (rank 7689 in comm 1140850688): application called MPI_Abort(MPI_COMM_WORLD, 59) - process 7689<br>
> ERROR: 0031-300  Forcing all remote tasks to exit due to exit code 1 in task 7689<br>
><br>
> Make and configure logs are attached.<br>
><br>
> Thanks,<br>
><br>
> Fande Kong,<br>
><br>
</div></div>> <configure_log><make_log><br>
<br>
</blockquote></div><br></div>