<div dir="ltr"><div dir="ltr">On Mon, Dec 13, 2021 at 8:35 AM Karthikeyan Chockalingam - STFC UKRI <<a href="mailto:karthikeyan.chockalingam@stfc.ac.uk">karthikeyan.chockalingam@stfc.ac.uk</a>> wrote:<br></div><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">





<div lang="EN-GB" style="overflow-wrap: break-word;">
<div class="gmail-m_8389355040632503580WordSection1">
<p class="MsoNormal"><span>Thanks Matt. Couple of weeks back you mentioned<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Menlo">“</span><span style="font-size:10pt;font-family:Menlo;color:black">There are many unstructured grid examples, e.g. SNES ex13, ex17, ex56. The solver can run on
 the GPU, but the vector/matrix FEM assembly does not. I am working on that now.”<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u> <u></u></span></p>
<p class="MsoNormal"><span>I am able to run other examples in ksp/tutorials on gpus.</span></p></div></div></blockquote><div><br></div><div>How do you do this, meaning how do you tell another example to run on a GPU?</div><div><br></div><div>  Thanks,</div><div><br></div><div>     Matt</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div lang="EN-GB" style="overflow-wrap: break-word;"><div class="gmail-m_8389355040632503580WordSection1"><p class="MsoNormal"><span> I complied ex56 in snes/tutorials no differently. The only difference being I didn’t specify _dm_vec_type and _dm_vec_type (as you mentioned
 they are not assembled on gpus anyways plus I am working on an unstructured grid thought _dm is not right type for this problem). I was hoping to see gpu flops recorded for KSPSolve, which I didn’t.
<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u> <u></u></span></p>
<p class="MsoNormal"><span>Okay, I will wait for Mark to comment.<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u> <u></u></span></p>
<p class="MsoNormal"><span>Kind regards,<u></u><u></u></span></p>
<p class="MsoNormal"><span>Karthik.<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u> <u></u></span></p>
<div style="border-right:none;border-bottom:none;border-left:none;border-top:1pt solid rgb(181,196,223);padding:3pt 0cm 0cm">
<p class="MsoNormal"><b><span style="font-size:12pt;color:black">From: </span></b><span style="font-size:12pt;color:black">Matthew Knepley <<a href="mailto:knepley@gmail.com" target="_blank">knepley@gmail.com</a>><br>
<b>Date: </b>Monday, 13 December 2021 at 13:17<br>
<b>To: </b>"Chockalingam, Karthikeyan (STFC,DL,HC)" <<a href="mailto:karthikeyan.chockalingam@stfc.ac.uk" target="_blank">karthikeyan.chockalingam@stfc.ac.uk</a>><br>
<b>Cc: </b>Mark Adams <<a href="mailto:mfadams@lbl.gov" target="_blank">mfadams@lbl.gov</a>>, "<a href="mailto:petsc-users@mcs.anl.gov" target="_blank">petsc-users@mcs.anl.gov</a>" <<a href="mailto:petsc-users@mcs.anl.gov" target="_blank">petsc-users@mcs.anl.gov</a>><br>
<b>Subject: </b>Re: [petsc-users] Unstructured mesh<u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<div>
<p class="MsoNormal">On Mon, Dec 13, 2021 at 7:15 AM Karthikeyan Chockalingam - STFC UKRI <<a href="mailto:karthikeyan.chockalingam@stfc.ac.uk" target="_blank">karthikeyan.chockalingam@stfc.ac.uk</a>> wrote:<u></u><u></u></p>
</div>
<div>
<blockquote style="border-top:none;border-right:none;border-bottom:none;border-left:1pt solid rgb(204,204,204);padding:0cm 0cm 0cm 6pt;margin-left:4.8pt;margin-right:0cm">
<div>
<div>
<p class="gmail-m_8389355040632503580gmail-m4613828314074599431p1"><span class="gmail-m_8389355040632503580gmail-m4613828314074599431apple-converted-space"><span style="font-size:10pt">Thank you. I was able to confirm both the below options produced the same mesh</span></span><u></u><u></u></p>
<p class="gmail-m_8389355040632503580gmail-m4613828314074599431p1"><span class="gmail-m_8389355040632503580gmail-m4613828314074599431apple-converted-space"><span style="font-size:10pt"> </span></span><u></u><u></u></p>
<p class="gmail-m_8389355040632503580gmail-m4613828314074599431p1"><span class="gmail-m_8389355040632503580gmail-m4613828314074599431apple-converted-space"><span style="font-size:10pt"> </span></span><span class="gmail-m_8389355040632503580gmail-m4613828314074599431s1"><span style="font-size:10pt">./ex56 -cells 2,2,1 -max_conv_its 2</span></span><u></u><u></u></p>
<p class="gmail-m_8389355040632503580gmail-m4613828314074599431p1"><span class="gmail-m_8389355040632503580gmail-m4613828314074599431s1"><span style="font-size:10pt">./ex56 -cells 4,4,2 -max_conv_its 1</span></span><u></u><u></u></p>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal">Good <u></u><u></u></p>
</div>
<blockquote style="border-top:none;border-right:none;border-bottom:none;border-left:1pt solid rgb(204,204,204);padding:0cm 0cm 0cm 6pt;margin-left:4.8pt;margin-right:0cm">
<div>
<div>
<p class="gmail-m_8389355040632503580gmail-m4613828314074599431p1"><span class="gmail-m_8389355040632503580gmail-m4613828314074599431s1"><span style="font-size:10pt">But I didn’t get how is
</span></span><span style="font-size:10pt">-cells i,j,k <1,1,1><span class="gmail-m_8389355040632503580gmail-m4613828314074599431s1"> is related to the number of MPI processes.</span></span><u></u><u></u></p>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal">It is not. The number of processes is specified independently using 'mpiexec -n <p>' or when using the test system NP=<p>. <u></u><u></u></p>
</div>
<blockquote style="border-top:none;border-right:none;border-bottom:none;border-left:1pt solid rgb(204,204,204);padding:0cm 0cm 0cm 6pt;margin-left:4.8pt;margin-right:0cm">
<div>
<div>
<p class="gmail-m_8389355040632503580gmail-m4613828314074599431msolistparagraph" style="margin-left:54pt">
<span class="gmail-m_8389355040632503580gmail-m4613828314074599431s1"><span style="font-size:10pt;font-family:Menlo">(i)</span></span><span class="gmail-m_8389355040632503580gmail-m4613828314074599431s1"><span style="font-size:7pt;font-family:"Times New Roman",serif">    
</span></span><span style="font-size:10pt;font-family:Menlo">Say I start with -cells 1,1,1 -max_conv its<span class="gmail-m_8389355040632503580gmail-m4613828314074599431s1"> 7; that would eventually leave all refinement on level 7 running on 1 MPI process?</span></span><u></u><u></u></p>
<p class="gmail-m_8389355040632503580gmail-m4613828314074599431msolistparagraph" style="margin-left:54pt">
<span style="font-size:10pt;font-family:Menlo">(ii)</span><span style="font-size:7pt;font-family:"Times New Roman",serif">   
</span><span style="font-size:10pt;font-family:Menlo">Say I start with -cells 2,2,1 -max_conv its<span class="gmail-m_8389355040632503580gmail-m4613828314074599431s1"> n</span>; is it recommended to run on 4 MPI processes?</span><u></u><u></u></p>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal">No, those options do not influence the number of processes.<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
<blockquote style="border-top:none;border-right:none;border-bottom:none;border-left:1pt solid rgb(204,204,204);padding:0cm 0cm 0cm 6pt;margin-left:4.8pt;margin-right:0cm">
<div>
<div>
<p class="MsoNormal">I am running ex56 on gpu; I am looking at KSPSolve (or any other event) but no gpu flops are recorded in the -log_view?<u></u><u></u></p>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">I do not think you are running on the GPU then. Mark can comment, but we usually specify GPU execution using the Vec and Mat types<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">through -dm_vec_type and -dm_mat_type.<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">  Thanks,<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">     Matt<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
<blockquote style="border-top:none;border-right:none;border-bottom:none;border-left:1pt solid rgb(204,204,204);padding:0cm 0cm 0cm 6pt;margin-left:4.8pt;margin-right:0cm">
<div>
<div>
<p class="MsoNormal">For your reference I used the below flags:<u></u><u></u></p>
<p class="gmail-m_8389355040632503580gmail-m4613828314074599431p1"><span class="gmail-m_8389355040632503580gmail-m4613828314074599431s1"><span style="font-size:10pt">./ex56 -cells 1,1,1 -max_conv_its 3 -lx 1. -alpha .01 -petscspace_degree 1 -ksp_type cg -ksp_monitor -ksp_rtol 1.e-8 -pc_type asm -snes_monitor
 -use_mat_nearnullspace true -snes_rtol 1.e-10 -ex56_dm_view -log_view</span></span><u></u><u></u></p>
<p class="MsoNormal"> <u></u><u></u></p>
<p class="MsoNormal">Kind regards,<u></u><u></u></p>
<p class="MsoNormal">Karthik.<u></u><u></u></p>
<p class="MsoNormal"> <u></u><u></u></p>
<p class="MsoNormal"> <u></u><u></u></p>
<div style="border-right:none;border-bottom:none;border-left:none;border-top:1pt solid rgb(181,196,223);padding:3pt 0cm 0cm">
<p class="MsoNormal"><b><span style="font-size:12pt;color:black">From:
</span></b><span style="font-size:12pt;color:black">Mark Adams <<a href="mailto:mfadams@lbl.gov" target="_blank">mfadams@lbl.gov</a>><br>
<b>Date: </b>Sunday, 12 December 2021 at 23:00<br>
<b>To: </b>"Chockalingam, Karthikeyan (STFC,DL,HC)" <<a href="mailto:karthikeyan.chockalingam@stfc.ac.uk" target="_blank">karthikeyan.chockalingam@stfc.ac.uk</a>><br>
<b>Cc: </b>Matthew Knepley <<a href="mailto:knepley@gmail.com" target="_blank">knepley@gmail.com</a>>, "<a href="mailto:petsc-users@mcs.anl.gov" target="_blank">petsc-users@mcs.anl.gov</a>" <<a href="mailto:petsc-users@mcs.anl.gov" target="_blank">petsc-users@mcs.anl.gov</a>><br>
<b>Subject: </b>Re: [petsc-users] Unstructured mesh</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
<div>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
<p class="MsoNormal"> <u></u><u></u></p>
<div>
<div>
<p class="MsoNormal">On Sun, Dec 12, 2021 at 3:19 PM Karthikeyan Chockalingam - STFC UKRI <<a href="mailto:karthikeyan.chockalingam@stfc.ac.uk" target="_blank">karthikeyan.chockalingam@stfc.ac.uk</a>>
 wrote:<u></u><u></u></p>
</div>
<blockquote style="border-top:none;border-right:none;border-bottom:none;border-left:1pt solid rgb(204,204,204);padding:0cm 0cm 0cm 6pt;margin:5pt 0cm 5pt 4.8pt">
<div>
<div>
<p class="MsoNormal">Thank for your response that was helpful. I have a couple of questions:<u></u><u></u></p>
<p class="MsoNormal"> <u></u><u></u></p>
<p style="margin-left:54pt">(i)<span style="font-size:7pt;font-family:"Times New Roman",serif">                 
</span>How can I control the level of refinement? I tried to pass the flag “-ex56_dm_refine 0” but that didn’t stop the refinement from 8 giving 32 cubes.<u></u><u></u></p>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">I answered this question recently but ex56 clobbers ex56_dm_refine in the convergence loop. I have an MR that prints a warning if you provide a ex56_dm_refine. <u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">* snes/ex56 runs a convergence study and confusingly sets the options manually, thus erasing your -ex56_dm_refine.<u></u><u></u></p>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">* To refine, use -max_conv_its N <3>, this sets the number of steps of refinement. That is, the length of the convergence study<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">* You can adjust where it starts from with -cells i,j,k <1,1,1><u></u><u></u></p>
</div>
<div>
<div>
<p class="MsoNormal">You do want to set this if you have multiple MPI processes so that the size of this mesh is the number of processes. That way it starts with one cell per process and refines from
 there.<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
</div>
</div>
<blockquote style="border-top:none;border-right:none;border-bottom:none;border-left:1pt solid rgb(204,204,204);padding:0cm 0cm 0cm 6pt;margin:5pt 0cm 5pt 4.8pt">
<div>
<div>
<p style="margin-left:54pt">(ii)<span style="font-size:7pt;font-family:"Times New Roman",serif">               
</span>What does -cell 2,2,1 correspond to? <u></u><u></u></p>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">The initial mesh or mesh_0. The convergence test uniformly refines this mesh. So if you want to refine this twice you could use -cells 8,8,4<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
<blockquote style="border-top:none;border-right:none;border-bottom:none;border-left:1pt solid rgb(204,204,204);padding:0cm 0cm 0cm 6pt;margin:5pt 0cm 5pt 4.8pt">
<div>
<div>
<p style="margin-left:54pt">How can I determine the total number of dofs? <u></u>
<u></u></p>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal">Unfortunately, that is not printed but you can calculate from the initial cell grid, the order of the element and the refinement in each iteration of the convergence tests.<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
<blockquote style="border-top:none;border-right:none;border-bottom:none;border-left:1pt solid rgb(204,204,204);padding:0cm 0cm 0cm 6pt;margin:5pt 0cm 5pt 4.8pt">
<div>
<div>
<p style="margin-left:54pt">So that I can perform a scaling study by changing the input of the flag -cells.<u></u><u></u></p>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">You can and the convergence test gives you data for a strong speedup study in one run. Each solve is put in its own "stage" of the output and you want to look at KSPSolve lines
 in the log_view output. <u></u><u></u></p>
</div>
</div>
</div>
</div>
<p><span style="font-size:6pt">This email and any attachments are intended solely for the use of the named recipients. If you are not the intended recipient you must not use, disclose, copy or distribute this email or any of its attachments and should notify
 the sender immediately and delete this email from your system. UK Research and Innovation (UKRI) has taken every reasonable precaution to minimise risk of this email or any attachments containing viruses or malware but the recipient should carry out its own
 virus and malware checks before opening the attachments. UKRI does not accept any liability for any losses or damages which the recipient may sustain due to presence of any viruses. </span><u></u><u></u></p>
</div>
</blockquote>
</div>
<p class="MsoNormal"><br clear="all">
<u></u><u></u></p>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<p class="MsoNormal">-- <u></u><u></u></p>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<p class="MsoNormal">What most experimenters take for granted before they begin their experiments is infinitely more interesting than any results to which their experiments lead.<br>
-- Norbert Wiener<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><a href="http://www.cse.buffalo.edu/~knepley/" target="_blank">https://www.cse.buffalo.edu/~knepley/</a><u></u><u></u></p>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>

</blockquote></div><br clear="all"><div><br></div>-- <br><div dir="ltr" class="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div>What most experimenters take for granted before they begin their experiments is infinitely more interesting than any results to which their experiments lead.<br>-- Norbert Wiener</div><div><br></div><div><a href="http://www.cse.buffalo.edu/~knepley/" target="_blank">https://www.cse.buffalo.edu/~knepley/</a><br></div></div></div></div></div></div></div></div>