<div dir="ltr">MPICH folks confirmed it's an MPICH problem and an issue is created at <a href="https://github.com/pmodels/mpich/issues/6843">https://github.com/pmodels/mpich/issues/6843</a><div><br clear="all"><div><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr">--Junchao Zhang</div></div></div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Tue, Dec 12, 2023 at 7:53 PM Junchao Zhang <<a href="mailto:junchao.zhang@gmail.com">junchao.zhang@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr">I was able to reproduce it.  Let me ask MPICH developers.<div><br clear="all"><div><div dir="ltr" class="gmail_signature"><div dir="ltr">--Junchao Zhang</div></div></div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Tue, Dec 12, 2023 at 3:06 PM Randall Mackie <<a href="mailto:rlmackie862@gmail.com" target="_blank">rlmackie862@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div>It now seems to me that petsc+mpich is no longer valgrind clean, or I am doing something wrong.<div><br></div><div>A simple program:</div><div><br></div><div><br></div><div><div style="margin:0in;font-size:11pt;font-family:Calibri,sans-serif">Program test<u></u><u></u></div><div style="margin:0in;font-size:11pt;font-family:Calibri,sans-serif"><u></u> <u></u></div><div style="margin:0in;font-size:11pt;font-family:Calibri,sans-serif">#include "petsc/finclude/petscsys.h"<u></u><u></u></div><div style="margin:0in;font-size:11pt;font-family:Calibri,sans-serif">  use petscsys<u></u><u></u></div><div style="margin:0in;font-size:11pt;font-family:Calibri,sans-serif"><u></u> <u></u></div><div style="margin:0in;font-size:11pt;font-family:Calibri,sans-serif">  PetscInt :: ierr<u></u><u></u></div><div style="margin:0in;font-size:11pt;font-family:Calibri,sans-serif"><u></u> <u></u></div><div style="margin:0in;font-size:11pt;font-family:Calibri,sans-serif">  call PetscInitialize(PETSC_NULL_CHARACTER,ierr)<u></u><u></u></div><div style="margin:0in;font-size:11pt;font-family:Calibri,sans-serif">  call PetscFinalize(ierr)</div><div style="margin:0in;font-size:11pt;font-family:Calibri,sans-serif"><u></u> <u></u></div><div style="margin:0in;font-size:11pt;font-family:Calibri,sans-serif">end program test</div></div><div style="margin:0in;font-size:11pt;font-family:Calibri,sans-serif"><br></div><div style="margin:0in;font-size:11pt;font-family:Calibri,sans-serif"><br></div><div style="margin:0in;font-size:11pt;font-family:Calibri,sans-serif">PETSc compiled in debug mode, complex scalars, and download-mpich, when run with valgrind generates errors like these:</div><div style="margin:0in;font-size:11pt;font-family:Calibri,sans-serif"><br></div><div style="margin:0in;font-size:11pt;font-family:Calibri,sans-serif"><div style="margin:0in;font-size:11pt">==3997== Syscall param writev(vector[...]) points to uninitialised byte(s)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    at 0x8C31867: writev (writev.c:26)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x9C20DE4: MPL_large_writev (mpl_sock.c:31)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x9BF1050: MPIDI_CH3I_Sock_writev (sock.c:2689)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x9BF9812: MPIDI_CH3_iStartMsgv (ch3_istartmsgv.c:92)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x9BA7790: MPIDI_CH3_EagerContigSend (ch3u_eager.c:191)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x9BCA7EC: MPID_Send (mpid_send.c:132)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x9BCAC64: MPID_Send_coll (mpid_send.c:206)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x9A2AC7C: MPIC_Send (helper_fns.c:126)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x993A645: MPIR_Bcast_intra_binomial (bcast_intra_binomial.c:146)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x99FF64A: MPIR_Bcast_allcomm_auto (mpir_coll.c:323)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x99FFC06: MPIR_Bcast_impl (mpir_coll.c:420)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x99FCF86: MPID_Bcast (mpid_coll.h:30)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x99FFE13: MPIR_Bcast (mpir_coll.c:465)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x974A513: internal_Bcast (bcast.c:93)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x974A72B: PMPI_Bcast (bcast.c:143)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x4B8D6DB: PETScParseFortranArgs_Private (zstart.c:182)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x4B8DDFA: PetscInitFortran_Private (zstart.c:200)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x4B34931: PetscInitialize_Common (pinit.c:974)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x4B8E8C7: petscinitializef_ (zstart.c:284)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x4959434: __petscsys_MOD_petscinitializenohelp (petscsysmod.F90:374)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==  Address 0x1ffeffcac0 is on thread 1's stack<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==  in frame #4, created by MPIDI_CH3_EagerContigSend (ch3u_eager.c:160)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==  Uninitialised value was created by a stack allocation<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    at 0x9BA7601: MPIDI_CH3_EagerContigSend (ch3u_eager.c:160)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==<u></u><u></u></div><div style="margin:0in;font-size:11pt"><u></u> <u></u></div><div style="margin:0in;font-size:11pt">==3997== Syscall param write(buf) points to uninitialised byte(s)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    at 0x8C2B697: write (write.c:26)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x9BF0F1D: MPIDI_CH3I_Sock_write (sock.c:2614)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x9BF7AAE: MPIDI_CH3_iStartMsg (ch3_istartmsg.c:68)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x9BA7A27: MPIDI_CH3_EagerContigShortSend (ch3u_eager.c:262)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x9BCA766: MPID_Send (mpid_send.c:119)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x9BCAC64: MPID_Send_coll (mpid_send.c:206)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x9A2AC7C: MPIC_Send (helper_fns.c:126)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x993A645: MPIR_Bcast_intra_binomial (bcast_intra_binomial.c:146)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x99FF64A: MPIR_Bcast_allcomm_auto (mpir_coll.c:323)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x99FFC06: MPIR_Bcast_impl (mpir_coll.c:420)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x99FCF86: MPID_Bcast (mpid_coll.h:30)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x99FFE13: MPIR_Bcast (mpir_coll.c:465)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x974A513: internal_Bcast (bcast.c:93)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x974A72B: PMPI_Bcast (bcast.c:143)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x4DB95A2: PetscOptionsGetenv (pdisplay.c:61)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x4E0D745: PetscStrreplace (str.c:572)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x4AC8DEA: PetscOptionsFilename (options.c:416)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x4ACF0B5: PetscOptionsInsertFile (options.c:632)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x4AD3CB5: PetscOptionsInsert (options.c:861)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    by 0x4B8E0EF: PetscInitFortran_Private (zstart.c:206)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==  Address 0x1ffeff7998 is on thread 1's stack<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==  in frame #3, created by MPIDI_CH3_EagerContigShortSend (ch3u_eager.c:223)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==  Uninitialised value was created by a stack allocation<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==    at 0x9BA788F: MPIDI_CH3_EagerContigShortSend (ch3u_eager.c:223)<u></u><u></u></div><div style="margin:0in;font-size:11pt">==3997==</div><div style="margin:0in;font-size:11pt"><br></div><div style="margin:0in;font-size:11pt">Is this a known issue or am I doing something wrong?</div><div style="margin:0in;font-size:11pt"><br></div><div style="margin:0in;font-size:11pt">Thanks, Randy</div></div></div></blockquote></div>
</blockquote></div>