<div dir="ltr"><div>Hi,</div><div><br></div><div>I'm trying to accelerate a shift-invert eigensolve with GPU, but the computation seems to be spending a lot of its time in the CPU.  Looking at the output with "-log_view -log_view_gpu_time" I see that MatLUFactorNum is not using the GPU (GPU Mflops/s is 0), and is taking the majority of the computation time. Is LU factorization on the GPU supported? I am currently applying the command line options "-vec_type cuda -mat_type aijcusparse", please let me know if there are other options I can apply to accelerate the LU factorization as well. I tried digging through the documentation but couldn't find a clear answer.<br></div><div><br></div><div>Thanks in advance!<br></div><div><br></div><div>Kind regards,</div><div>Greg KM<br></div><div><br><span class="gmail_signature_prefix">-- </span><br><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><b>Gregory D. Kahanamoku-Meyer</b><div>PhD Candidate</div><div>quantum computing | cryptography | high-performance computing</div><div>Department of Physics</div><div>University of California at Berkeley</div><div><a href="https://gregdmeyer.github.io/" target="_blank">personal website</a><br></div></div></div></div></div>