Hi,<div><br></div><div>I am working on integrating the new GPU based vectors and matrices into FEniCS. Now, I&#39;m looking at the possibility for getting some speedup during finite element assembly, specifically when inserting the local element matrix into the global element matrix. In that regard, I have a few questions I hope you can help me out with:</div>



<div><br></div><div>- When calling MatSetValues with a MATSEQAIJCUSP matrix as parameter, what exactly is it that happens? As far as I can see, MatSetValues is not implemented for GPU based matrices, neither is the mat-&gt;ops-&gt;setvalues set to point at any function for this Mat type. </div>



<div><br></div><div>- Is it such that matrices are assembled in their entirety on the CPU, and then copied over to the GPU (after calling MatAssemblyBegin)? Or are values copied over to the GPU each time you call MatSetValues?</div>


<div><br></div><div>- Can we expect to see any speedup from using MatSetValuesBatch over MatSetValues, or is the batch version simply a utility function? This question goes for both CPU- and GPU-based matrices.</div><div>

<br></div><div>Thanks,</div><div><br></div><div>Fredrik V</div>