<html><head><meta http-equiv="content-type" content="text/html; charset=utf-8"></head><body style="overflow-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;"><br><div><br><blockquote type="cite"><div>On 4 Mar 2023, at 2:51 PM, Zongze Yang <yangzongze@gmail.com> wrote:</div><br class="Apple-interchange-newline"><div><meta charset="UTF-8"><br class="Apple-interchange-newline"><br style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: 400; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none;"><div class="gmail_quote" style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: 400; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none;"><div dir="ltr" class="gmail_attr">On Sat, 4 Mar 2023 at 21:37, Pierre Jolivet <<a href="mailto:pierre@joliv.et">pierre@joliv.et</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin: 0px 0px 0px 0.8ex; border-left-width: 1px; border-left-style: solid; border-left-color: rgb(204, 204, 204); padding-left: 1ex;"><br><br>> On 4 Mar 2023, at 2:30 PM, Zongze Yang <<a href="mailto:yangzongze@gmail.com" target="_blank">yangzongze@gmail.com</a>> wrote:<br>><span class="Apple-converted-space"> </span><br>> Hi,<span class="Apple-converted-space"> </span><br>><span class="Apple-converted-space"> </span><br>> I am writing to seek your advice regarding a problem I encountered while using multigrid to solve a certain issue.<br>> I am currently using multigrid with the coarse problem solved by PCLU. However, the PC failed randomly with the error below (the value of INFO(2) may differ):<br>> ```shell<br>> [ 0] Error reported by MUMPS in numerical factorization phase: INFOG(1)=-9, INFO(2)=36<br>> ```<br>><span class="Apple-converted-space"> </span><br>> Upon checking the documentation of MUMPS, I discovered that increasing the value of ICNTL(14) may help resolve the issue. Specifically, I set the option -mat_mumps_icntl_14 to a higher value (such as 40), and the error seemed to disappear after I set the value of ICNTL(14) to 80. However, I am still curious as to why MUMPS failed randomly in the first place.<br>><span class="Apple-converted-space"> </span><br>> Upon further inspection, I found that the number of nonzeros of the PETSc matrix and the MUMPS matrix were different every time I ran the code. I am now left with the following questions:<br>><span class="Apple-converted-space"> </span><br>> 1. What could be causing the number of nonzeros of the MUMPS matrix to change every time I run the code?<br><br>Is the Mat being fed to MUMPS distributed on a communicator of size greater than one?<br>If yes, then, depending on the pivoting and the renumbering, you may get non-deterministic results.<br></blockquote><div> </div><div>Hi, Pierre,</div><div>Thank you for your prompt reply. Yes, the size of the communicator is greater than one. </div><div>Even if the size of the communicator is equal, are the results still non-deterministic?</div></div></div></blockquote><div><br></div><div>In the most general case, yes.</div><br><blockquote type="cite"><div><div class="gmail_quote" style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: 400; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none;"><div> Can I assume the Mat being fed to MUMPS is the same in this case?</div></div></div></blockquote><div><br></div><div>Are you doing algebraic or geometric multigrid?</div><div>Are the prolongation operators computed by Firedrake or by PETSc, e.g., through GAMG?<br></div><div>If it’s the latter, I believe the Mat being fed to MUMPS should always be the same.</div><div>If it’s the former, you’ll have to ask the Firedrake people if there may be non-determinism in the coarsening process.</div><br><blockquote type="cite"><div><div class="gmail_quote" style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: 400; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none;"><div>Is the pivoting and renumbering all done by MUMPS other than PETSc?</div></div></div></blockquote><div><br></div><div>You could provide your own numbering, but by default, this is outsourced to MUMPS indeed, which will itself outsourced this to METIS, AMD, etc.</div><div><br></div><div>Thanks,</div><div>Pierre</div><div><br></div><blockquote type="cite"><div><div class="gmail_quote" style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: 400; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none;"><blockquote class="gmail_quote" style="margin: 0px 0px 0px 0.8ex; border-left-width: 1px; border-left-style: solid; border-left-color: rgb(204, 204, 204); padding-left: 1ex;"><br>> 2. Why is the number of nonzeros of the MUMPS matrix significantly greater than that of the PETSc matrix (as seen in the output of ksp_view, 115025949 vs 7346177)?<br><br>Exact factorizations introduce fill-in.<br>The number of nonzeros you are seeing for MUMPS is the number of nonzeros in the factors.<br><br>> 3. Is it possible that the varying number of nonzeros of the MUMPS matrix is the cause of the random failure?<br><br>Yes, MUMPS uses dynamic scheduling, which will depend on numerical pivoting, and which may generate factors with different number of nonzeros.<br></blockquote><div><br></div><div>Got it. Thank you for your clear explanation.</div><div>Zongze </div><div><br></div><blockquote class="gmail_quote" style="margin: 0px 0px 0px 0.8ex; border-left-width: 1px; border-left-style: solid; border-left-color: rgb(204, 204, 204); padding-left: 1ex;"><br>Thanks,<br>Pierre</blockquote><blockquote class="gmail_quote" style="margin: 0px 0px 0px 0.8ex; border-left-width: 1px; border-left-style: solid; border-left-color: rgb(204, 204, 204); padding-left: 1ex;"><br>> I have attached a test example written in Firedrake. The output of `ksp_view` after running the code twice is included below for your reference.<br>> In the output, the number of nonzeros of the MUMPS matrix was 115025949 and 115377847, respectively, while that of the PETSc matrix was only 7346177.<br>><span class="Apple-converted-space"> </span><br>> ```shell<br>> (complex-int32-mkl) $ mpiexec -n 32 python test_mumps.py -ksp_view ::ascii_info_detail | grep -A3 "type: "<br>>   type: preonly<br>>   maximum iterations=10000, initial guess is zero<br>>   tolerances:  relative=1e-05, absolute=1e-50, divergence=10000.<br>>   left preconditioning<br>> --<br>>   type: lu<br>>     out-of-place factorization<br>>     tolerance for zero pivot 2.22045e-14<br>>     matrix ordering: external<br>> --<br>>           type: mumps<br>>           rows=1050625, cols=1050625<br>>           package used to perform factorization: mumps<br>>           total: nonzeros=115025949, allocated nonzeros=115025949<br>> --<br>>     type: mpiaij<br>>     rows=1050625, cols=1050625<br>>     total: nonzeros=7346177, allocated nonzeros=7346177<br>>     total number of mallocs used during MatSetValues calls=0<br>> (complex-int32-mkl) $ mpiexec -n 32 python test_mumps.py -ksp_view ::ascii_info_detail | grep -A3 "type: "<br>>   type: preonly<br>>   maximum iterations=10000, initial guess is zero<br>>   tolerances:  relative=1e-05, absolute=1e-50, divergence=10000.<br>>   left preconditioning<br>> --<br>>   type: lu<br>>     out-of-place factorization<br>>     tolerance for zero pivot 2.22045e-14<br>>     matrix ordering: external<br>> --<br>>           type: mumps<br>>           rows=1050625, cols=1050625<br>>           package used to perform factorization: mumps<br>>           total: nonzeros=115377847, allocated nonzeros=115377847<br>> --<br>>     type: mpiaij<br>>     rows=1050625, cols=1050625<br>>     total: nonzeros=7346177, allocated nonzeros=7346177<br>>     total number of mallocs used during MatSetValues calls=0<br>> ```<br>><span class="Apple-converted-space"> </span><br>> I would greatly appreciate any insights you may have on this matter. Thank you in advance for your time and assistance.<br>><span class="Apple-converted-space"> </span><br>> Best wishes,<br>> Zongze<br>> <test_mumps.py></blockquote></div></div></blockquote></div><br></body></html>