<div dir="ltr">Hi PETSc-developers, <div><br></div><div><div>Does PETSc currently provide (either native or third party support) for MatSolve that can be performed entirely on a GPU given a factored matrix? i.e. a direct solver that would store the factors L and U on the device and use the GPU to solve the linear system. It does not matter if the GPU is not used for the factorization as we intend to solve the same linear system for 100s of iterations and thus try to prevent GPU->CPU transfers for the MatSolve phase. </div><div><br></div><div>Currently, I've built PETSc@main (commit 9c433d, 10/03) with superlu-dist@develop, both of which are configured with CUDA. With this, I'm seeing that each call to PCApply/MatSolve involves one GPU->CPU transfer. Is it possible to avoid this?</div><div><div><br></div><div dir="ltr" data-smartmail="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div style="font-family:Calibri,Arial,Helvetica,sans-serif;font-size:12pt;color:rgb(0,0,0)"></div>

<div></div>

Thank You,<br>
<div dir="ltr">
<div dir="ltr">
<div>
<div dir="ltr">
<div>
<div dir="ltr">
<div style="font-size:12.8px">Sajid Ali (he/him) | Research Associate<br>
</div>
<div style="font-size:12.8px">Scientific Computing Division<br>
</div>
<div style="font-size:12.8px">Fermi National Accelerator Laboratory<br>
</div>
<span style="font-size:12.8px"><a href="http://s-sajid-ali.github.io" target="_blank">s-sajid-ali.github.io</a></span></div>
</div>
</div>
</div>
</div>
</div></div></div></div></div></div></div></div></div></div>