<div class="gmail_quote">On Thu, Nov 24, 2011 at 16:26, Matthew Knepley <span dir="ltr"><<a href="mailto:knepley@gmail.com">knepley@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">
<div id=":vn">This is one great reason that vectorization works and pthreads is crap. I am not totally sold on the thread block system, but<div>it looks like genius compared to pthreads. I would start there.</div></div></blockquote>
</div><br><div>Suppose you had a higher level way to describe data movement (across shared and distributed memory) between invocation of CUDA/OpenCL kernels. How far would that get you?</div>