<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">On Fri, Oct 24, 2014 at 4:23 AM, Florian Lindner <span dir="ltr"><<a href="mailto:mailinglists@xgm.de" target="_blank">mailinglists@xgm.de</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">Hello,<br>
<br>
I am redoing an radial basis function interpolation algorithm using petsc in our software.<br>
<br>
Using basis function with compact carrier is blazingly fast. These basis function result in sparse matrices.<br>
<br>
  ierr = MatSetType(matrixC, MATSBAIJ); CHKERRV(ierr); // create symmetric, block sparse matrix.<br>
  ierr = MatSetSizes(matrixC, PETSC_DECIDE, PETSC_DECIDE, n, n); CHKERRV(ierr);<br>
  ierr = MatSetOption(matrixC, MAT_SYMMETRY_ETERNAL, PETSC_TRUE); CHKERRV(ierr);<br>
  ierr = MatSetUp(matrixC); CHKERRV(ierr);<br>
<br>
  ierr = MatSetType(matrixA, MATAIJ); CHKERRV(ierr); // create sparse matrix.<br>
  ierr = MatSetSizes(matrixA, PETSC_DECIDE, PETSC_DECIDE, outputSize, n); CHKERRV(ierr);<br>
  ierr = MatSetUp(matrixA); CHKERRV(ierr);<br>
<br>
Benchmark is a direct dense matrix / LU decomposition, a rather naive implementation. The code runs sequentially, using PETSC_COMM_SELF.<br>
<br>
Using the matrix creation code above it's about 10 or 20 times faster, still without preallocation. During matrix assembly, which involves looping over rows and then over columns I collect all columns in an array and set each row using MatSetValues.<br>
<br>
Since the user can select the basis function for the RBF at runtime, my code is not aware if it's a compact carrier or not, thus it don't know if it results in sparse or dense matrices. Basis functions that produce dense matrices make the petsc code more then 50 time slower.<br>
<br>
Running the code with n = 503 (mesh size of 500 + polynom) it takes about 16 seconds, with 32% filling matrix A, 15% filling matrix C and 51% doing KSPSolve of matrix C (A is not KSPSolved). (dense matrices)<br>
<br>
If I just preallocate a practically dense matrix:<br>
<br>
  ierr = MatSeqAIJSetPreallocation(matrixA, n, NULL); CHKERRV(ierr);<br>
<br>
runtime changes to 10 seconds, with 0% (zero) percent spent with filling matrix A. (KSPSolve 76%, Matrix C: 22%). For the sparse case it's that way still a lot faster then before, though slower then without preallocation.<br>
<br>
However, trying to preallocate C, which is of type MATSBAIJ fails for me:<br>
<br>
  ierr = MatSeqSBAIJSetPreallocation(_matrixC.matrix, n, n, NULL);<br>
<br>
results in:<br>
<br>
  [0]PETSC ERROR: Arguments are incompatible<br>
  [0]PETSC ERROR: Cannot change block size 1 to 503<br>
<br>
What would you advise me to do here? How can I make the KSPSolve faster when it is a dense matrix?<br>
<br>
I could guess the preallocation. Create a list of possible basis functions and if they produce sparse or dense matrices. Preallocate full or select MATDENSE type for dense matrices.<br></blockquote><div><br></div><div>1) You should be preallocating all sparse matrices. It is much much much faster. Just run through your loop</div><div>     twice.</div><div><br></div><div>2) I would look at your basis and decide whether to use dense or sparse. A densely preallocated sparse matrix is</div><div>     much slower than a dense matrix.</div><div><br></div><div>3) You can also look at what we did in</div><div><br></div><div>  <a href="http://arxiv.org/abs/0909.5413">http://arxiv.org/abs/0909.5413</a></div><div><br></div><div>  Thanks,</div><div><br></div><div>     Matt</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
Any ideas?<br>
<br>
Thanks a lot,<br>
Florian<br>
<br>
</blockquote></div><br><br clear="all"><div><br></div>-- <br>What most experimenters take for granted before they begin their experiments is infinitely more interesting than any results to which their experiments lead.<br>-- Norbert Wiener
</div></div>