<div dir="ltr">Nvidias's NSight with 2D Q3 and bs=10. (attached).<div><br></div><div>I am using LU in serial.</div><div><br></div><div>I copied MatSetValues_SeqAIJ into a .cu file and made some minor adjustments.</div><div><br></div><div>I am getting the indices from Matt's DMPlexMatGetClosureIndices and the matrix is from DMPlex. I also use GPU direct solvers sometimes and will want that in the future. All and all I figure AIJ is a safer bet, but maybe BAIJ is an option.</div><div><br></div><div>Matt: Could I use BAIJ with Plex?</div><div><br></div><div>Thanks,</div><div>Mark</div><div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Wed, May 27, 2020 at 6:14 PM Jed Brown <<a href="mailto:jed@jedbrown.org">jed@jedbrown.org</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">What did you profile to determine that expanding indices is significant?<br>
<br>
matsetvaluesblocked4_ was made specially for PETSc-FUN3D with BAIJ matrices.<br>
<br>
I take it you can't use BAIJ because you use GAMG?<br>
<br>
Mark Adams <<a href="mailto:mfadams@lbl.gov" target="_blank">mfadams@lbl.gov</a>> writes:<br>
<br>
> Is there a Mat AIJSeq method For MatSetValuesBlocked,<br>
> like matsetvaluesblocked4_ that is not hardwired for bs=4?<br>
</blockquote></div>