<div dir="ltr">On Mon, Sep 9, 2013 at 6:55 AM, Karl Rupp <span dir="ltr"><<a href="mailto:rupp@mcs.anl.gov" target="_blank">rupp@mcs.anl.gov</a>></span> wrote:<br><div class="gmail_extra"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div class="im"><br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
I liked<br>
<br>
<a href="http://arxiv.org/abs/1307.6209" target="_blank">http://arxiv.org/abs/1307.6209</a><br>
<br>
which seems to show that modified ELLPACK can be good for<br>
multicore as well as manycore. The sad part of course is that no<br>
mention of parallel is made.<br>
</blockquote>
<br></div>
I still have to go over it in detail, yet the performance numbers they get look reasonable. This was also confirmed by some folks I met in Lausanne two weeks back. The only drawback is that their kernels use all these low-level intrinsics, which is a pain when it comes to portable code and productivity.<br>
</blockquote><div><br></div><div>My understanding was that only the Phi kernels required intrinsics, yet another reason never to run on the Phi.</div><div><br></div><div>   Matt</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

Best regards,<br>
Karli<br></blockquote></div><div><br></div>-- <br>What most experimenters take for granted before they begin their experiments is infinitely more interesting than any results to which their experiments lead.<br>-- Norbert Wiener
</div></div>