The K20 sounds like it will be priced at around $3200, which makes this card cheaper than the NVIDIA offering.  Plus, the floating point throughput really isn't the sticking point for PETSc-based applications that are memory bound.  Also consider that 3 GB of memory to split up the work hundreds of ways is a little on the small side.  8GB is a little more reasonable.<br>

<br>Then add on top of this the fact that you could simply recompile PETSc, run it natively on the card, and still run it on your CPU's as MPMD.  All in all this seems like a big win for portable, maintainable code that can take advantage of an accelerator.<br>

<br>Regards,<br>John<br><div class="gmail_extra"><br><br><div class="gmail_quote">On Mon, Nov 12, 2012 at 7:06 PM, Karl Rupp <span dir="ltr"><<a href="mailto:rupp@mcs.anl.gov" target="_blank">rupp@mcs.anl.gov</a>></span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Thanks for the link.<br>
<br>
In terms of raw numbers, $2,649 for 320 GB/sec and 8 GB of memory is quite a lot compared to the $500 of a Radeon HD 7970 GHz Edition at 288 GB/sec and 3 GB memory. My hope is that Xeon Phi can do better than GPUs in kernels requiring frequent global synchronizations, e.g. ILU-substitutions.<br>


<br>
Best regards,<br>
Karli<br>
</blockquote></div><br></div>