<div dir="ltr"><div class="gmail_extra"><br><div class="gmail_quote">On Tue, Feb 12, 2013 at 7:43 PM, Karl Rupp <span dir="ltr"><<a href="mailto:rupp@mcs.anl.gov" target="_blank">rupp@mcs.anl.gov</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div id=":2l7">Tim was referring to the cross-over at >10k...</div></blockquote><div><br></div><div style>Okay, but 10k is more than an order of magnitude away from a crossover with MIC.</div>
<div>  </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div id=":2l7"><div class="im"></div>
Almost-all (OpenCL, CUDA). Native mode ought to be the exception, but it's the OpenMP overhead which limits then. Single-core on the MIC is not really an option either...<br>
<br>
It would be interesting to play with a pthreads-threadpool implementation on the MIC to see how much performance can really be obtained for smallish problems.</div></blockquote></div><br>Yup, I'd like to experiment with this. Do you have a device on a convenient development machine?</div>
</div>