<div dir="ltr">Thanks, i was able to find the bug and correct it, it is working now,<div><br></div><div>I was calling a wrong DM for some DA,</div><div><br></div><div>Regards,</div></div><div class="gmail_extra"><br><div class="gmail_quote">On Tue, Aug 14, 2018 at 2:13 PM, Jed Brown <span dir="ltr"><<a href="mailto:jed@jedbrown.org" target="_blank">jed@jedbrown.org</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span class="">Manuel Valera <<a href="mailto:mvalera-w@sdsu.edu">mvalera-w@sdsu.edu</a>> writes:<br>
<br>
> Thanks Jed,<br>
><br>
> I got the attached, it looks is coming from one of my routines<br>
> CorrectU4Pressure.F90, what other information can i get from this log?<br>
<br>
</span>If you compile with debug info (COPTFLAGS=-g FOPTFLAGS=-g) you'll be<br>
able to see the source line that's causing this error.<br>
<div><div class="h5"><br>
> Thanks,<br>
><br>
> On Tue, Aug 14, 2018 at 12:57 PM, Jed Brown <<a href="mailto:jed@jedbrown.org">jed@jedbrown.org</a>> wrote:<br>
><br>
>> Manuel Valera <<a href="mailto:mvalera-w@sdsu.edu">mvalera-w@sdsu.edu</a>> writes:<br>
>><br>
>> > Hello everyone,<br>
>> ><br>
>> > I am working on running part of my code in a GPU, recently i was able to<br>
>> > run the whole model using one P100 GPU and one processor with good timing<br>
>> > but using  --with-debugging=1 as configure argument,<br>
>> ><br>
>> > With this in mind i compiled PETSc in a separate folder with the same<br>
>> exact<br>
>> > flags except for --with-debugging=no instead to do some profiling, but<br>
>> this<br>
>> > was enough to give segfault as an error after running the code, it looks<br>
>> > the error happens just after solving the linear system,<br>
>> ><br>
>> > Any idea on why this may be happening?<br>
>><br>
>> Run in a debugger and send a stack trace.<br>
>><br>
>> > My configure options:<br>
>> ><br>
>> >  ./configure PETSC_ARCH=cuda  --with-mpi-dir=/usr/lib64/<wbr>openmpi<br>
>> > --COPTFLAGS='-O2' --CXXOPTFLAGS='-O2' --FOPTFLAGS='-O2'<br>
>> > --with-shared-libraries=1 --with-debugging=no --with-cuda=1<br>
>> > --CUDAFLAGS=-arch=sm_60  --with-blaslapack-dir=/usr/<wbr>lib64<br>
>> > --download-viennacl<br>
>> ><br>
>> > My running arguments:<br>
>> ><br>
>> > mpirun -n 1 ./gcmLEP tc=TestCases/LockRelease/LE_<wbr>401x6x101/<br>
>> jid=cuda_dt0.1<br>
>> > -dm_vec_type viennacl -dm_mat_type aijviennacl -pc_type saviennacl<br>
>> > -log_view<br>
>> ><br>
>> > Thanks.<br>
>><br>
</div></div>> Starting program: /usr/scratch/valera/ParGCCOM/.<wbr>/gcmLEP tc=TestCases/LockRelease/LE_<wbr>401x6x101/ jid=cuda_test -dm_vec_type viennacl -dm_mat_type aijviennacl -ksp_type cg -pc_type saviennacl<br>
> [Thread debugging using libthread_db enabled]<br>
> Using host libthread_db library "/usr/lib64/libthread_db.so.1"<wbr>.<br>
> [New Thread 0x2aaac83b5700 (LWP 171597)]<br>
> [New Thread 0x2aaac93d2700 (LWP 171600)]<br>
> [New Thread 0x2aaac95e3700 (LWP 171604)]<br>
> [New Thread 0x2aaacbcc1700 (LWP 171612)]<br>
> [New Thread 0x2aaad6cee700 (LWP 171613)]<br>
><br>
> Program received signal SIGSEGV, Segmentation fault.<br>
> 0x0000000000415730 in correct4pressure_ ()<br>
> Missing separate debuginfos, use: debuginfo-install blas-3.4.2-8.el7.x86_64 cyrus-sasl-lib-2.1.26-20.el7_<wbr>2.x86_64 glibc-2.17-196.el7_4.2.x86_64 hdf5-1.8.12-7.el7.x86_64 hwloc-libs-1.7-5.el7.x86_64 infinipath-psm-3.3-0.<wbr>g6f42cdb1bb8.2.el7.x86_64 keyutils-libs-1.5.8-3.el7.x86_<wbr>64 krb5-libs-1.13.2-12.el7_2.x86_<wbr>64 lapack-3.4.2-8.el7.x86_64 libX11-1.6.5-1.el7.x86_64 libXau-1.0.8-2.1.el7.x86_64 libcom_err-1.42.9-7.el7.x86_64 libcurl-7.29.0-25.el7.centos.<wbr>x86_64 libcxgb3-1.3.1-8.el7.x86_64 libcxgb4-1.3.5-3.el7.x86_64 libfabric-1.1.0-2.el7.x86_64 libgcc-4.8.5-16.el7_4.1.x86_64 libgfortran-4.8.5-16.el7_4.1.<wbr>x86_64 libibumad-1.3.10.2-1.el7.x86_<wbr>64 libibverbs-1.1.8-8.el7.x86_64 libidn-1.28-4.el7.x86_64 libipathverbs-1.3-2.el7.x86_64 libjpeg-turbo-1.2.90-5.el7.<wbr>x86_64 libmlx4-1.0.6-5.el7.x86_64 libmlx5-1.0.2-1.el7.x86_64 libmthca-1.0.6-13.el7.x86_64 libnes-1.1.4-2.el7.x86_64 libnl3-3.2.28-4.el7.x86_64 libpciaccess-0.13.4-2.el7.x86_<wbr>64 libquadmath-4.8.5-16.el7_4.1.<wbr>x86_64 librdmacm-1.0.21-1.el7.x86_64 libselinux-2.2.2-6.el7.x86_64 libssh2-1.4.3-10.el7_2.1.x86_<wbr>64 libstdc++-4.8.5-16.el7_4.1.<wbr>x86_64 libxcb-1.12-1.el7.x86_64 libxml2-2.9.1-6.el7_2.2.x86_64 netcdf-4.3.3.1-5.el7.x86_64 netcdf-fortran-4.2-16.el7.x86_<wbr>64 nspr-4.11.0-1.el7_2.x86_64 nss-3.21.0-9.el7_2.x86_64 nss-softokn-freebl-3.16.2.3-<wbr>14.2.el7_2.x86_64 nss-util-3.21.0-2.2.el7_2.x86_<wbr>64 numactl-libs-2.0.9-6.el7_2.<wbr>x86_64 openldap-2.4.40-9.el7_2.x86_64 openmpi-1.10.0-10.el7.x86_64 opensm-libs-3.3.19-1.el7.x86_<wbr>64 openssl-libs-1.0.1e-51.el7_2.<wbr>4.x86_64 pcre-8.32-15.el7.x86_64 xz-libs-5.1.2-12alpha.el7.x86_<wbr>64 zlib-1.2.7-15.el7.x86_64<br>
> #0  0x0000000000415730 in correct4pressure_ ()<br>
> #1  0x00000000004aaf28 in MAIN__ ()<br>
> #2  0x0000000000404327 in main ()<br>
> Continuing.<br>
> [Thread 0x2aaad6cee700 (LWP 171613) exited]<br>
> [Thread 0x2aaacbcc1700 (LWP 171612) exited]<br>
> [Thread 0x2aaac95e3700 (LWP 171604) exited]<br>
> [Thread 0x2aaac93d2700 (LWP 171600) exited]<br>
> [Thread 0x2aaaaaae9340 (LWP 171593) exited]<br>
> [Inferior 1 (process 171593) exited with code 073]<br>
</blockquote></div><br></div>