<div dir="ltr">On Tue, Sep 24, 2013 at 8:11 AM, Karl Rupp <span dir="ltr"><<a href="mailto:rupp@mcs.anl.gov" target="_blank">rupp@mcs.anl.gov</a>></span> wrote:<br><div class="gmail_extra"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
Hi Matt,<div class="im"><br>
<br>
<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
Here I believe strongly that we need tests. Nathan assured me that<br>
nothing is faster on the GPU than sort+reduce-by-key since<br>
they are highly optimized. I think they will be hard to beat, and the<br>
initial timings I had say that this is the case. I am willing to be<br>
wrong, but I am not willing to overengineer based on supposition.<br>
</blockquote>
<br></div>
Fair enough. Is a brute-force implementation for P1 elements sufficient as a baseline for discussion?<br></blockquote><div><br></div><div>src//ksp/ksp/examples/tutorials/ex4.c<br></div><div><br></div><div>   Matt</div><div>
 </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
Best regards,<br>
Karli<br>
</blockquote></div><br><br clear="all"><div><br></div>-- <br>What most experimenters take for granted before they begin their experiments is infinitely more interesting than any results to which their experiments lead.<br>
-- Norbert Wiener
</div></div>