<div dir="ltr"><div><div><div>ok,<br><br></div><div>so considering performance on MIC<br></div><div><br></div>can the library MAGMA be used as an alternate to Viennacl for PETSc or FEniCS?<br><br><a href="http://www.nics.tennessee.edu/files/pdf/hpcss/04_03_LinearAlgebraPar.pdf">http://www.nics.tennessee.edu/files/pdf/hpcss/04_03_LinearAlgebraPar.pdf</a> (from slide 37 onwards)<br>
<br></div>MAGMA seems to have sparse version which i think <span dir="ltr" id=":xz">is doing all that any sparse non linear solver can do..   MAGMA-sparse..<br><br></span></div><span dir="ltr" id=":xz">will this be helpful in using with MIC<br>
</span></div><div class="gmail_extra"><br clear="all"><div><div dir="ltr"><div><font color="#444444"><b>with regards..</b></font></div><div><font color="#444444"><b><br></b></font></div><font color="#444444"><b>M. Sai Rajeswar</b></font><div>
<font color="#444444"><b>M-tech  Computer Technology</b></font></div><div><font color="#444444"><b>IIT Delhi<br>----------------------------------Cogito Ergo Sum---------<br></b></font></div></div></div>
<br><br><div class="gmail_quote">On Wed, Jun 11, 2014 at 8:34 PM, Karl Rupp <span dir="ltr"><<a href="mailto:rupp@iue.tuwien.ac.at" target="_blank">rupp@iue.tuwien.ac.at</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Hi,<br>
<br>
>    Im a masters student from Indian Institute of Technology delhi. Im<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
working on PETSc.. for performance, which is my area of interest. Can<br>
you please help me in knowing 'How to run PETSc on MIC' .    That would<br>
be of great help to me.<br>
</blockquote>
<br>
my experience is that 'performance' and 'MIC' for bandwidth-limited operations don't go together. Regardless, you can use ViennaCL by building via<br>
 --download-viennacl<br>
for using the MIC via OpenCL, but you are usually much better off with a proper multi-socket CPU node.<br>
<br>
Feel free to have a look at my recent slides from the Intl. OpenCL Workshop here:<br>
<a href="http://iwocl.org/wp-content/uploads/iwocl-2014-tech-presentation-Karl-Rupp.pdf" target="_blank">http://iwocl.org/wp-content/<u></u>uploads/iwocl-2014-tech-<u></u>presentation-Karl-Rupp.pdf</a><br>
PDF page 32 shows that in the OpenCL case one achieves only up to 20% of peak bandwidth for 1900 different kernel configurations even for simple kernels such as vector copy, vector addition, dot products, or dense matrix-vector products. With some tricks one can probably get 30%, but that's it.<br>

<br>
PETSc does not provide any 'native' OpenMP execution on MIC for similar reasons.<br>
<br>
Best regards,<br>
Karli<br>
<br>
</blockquote></div><br></div>