Karl,<div><br></div><div>Could you get me an account as well?</div><div>I'm at INL right now and we are trying to build libmesh with petsc on a mic.</div><div>Building petsc turns out to be pretty straightforward, but libmesh is another story.</div>

<div>libmesh can use tbb to parallelize FEM assembly, and I'm curious to see how that performs.</div><div><br></div><div>Thanks.</div><div>Dmitry.</div><div><br><br><div class="gmail_quote">On Fri, Dec 14, 2012 at 2:49 PM, Karl Rupp <span dir="ltr"><<a href="mailto:rupp@mcs.anl.gov" target="_blank">rupp@mcs.anl.gov</a>></span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi guys,<br>
<br>
today I got a gentle introduction into our testing machine equipped with two Intel MICs. They are still beta, yet I could run some simple kernels in native mode. As an example, without any modification of existing OpenMP code for vector addition in double precision of 3e6 elements, I got the following timings:<br>


<br>
-- Native mode, i.e. all code executed on MIC --<br>
Single core time: 0.642 sec<br>
All-core time:    0.011 sec<br>
<br>
For offloaded execution (CPU <-> MIC, just like with GPUs), additional pragmas are required, I haven't tried that yet.<br>
<br>
For comparison, the same code on the CPU (Sandy Bridge, 8x2 cores, 2.6 GHz) takes 0.060 sec without OpenMP and 0.030 sec with OpenMP. Thus, the conclusion is that one *really* needs to get all cores on the MIC busy in order to get the full memory bandwidth. Thus, a plain 'just recompile for MIC and you get good performance' won't work for most applications in practice, simply because the serial performance is so limited.<br>


<br>
@Shri: It would be interesting to give pthreads a try, particularly how it compares with OpenMP. I'll be out of the lab until the beginning of January, but I can help you with getting an account and getting started.<br>


<br>
Btw: I just got a call regarding Altera hardware, we might have chances to get our fingers on their OpenCL-enabled hardware.<br>
<br>
Best regards,<br>
Karli<br>
<br>
<br>
</blockquote></div><br><br clear="all"><div><br></div>-- <br><div>Dmitry Karpeev, Ph.D.</div><div>Assistant Computational Mathematician</div><div>Mathematics and Computer Science</div><div>Argonne National Laboratory</div>

<div>Argonne, Illinois, USA</div><div>and</div><div>Fellow</div><div>Computation Institute</div><div>University of Chicago</div><div>5735 S. Ellis Avenue</div><div>Chicago, IL 60637</div><div>-----------------------</div>

<div>Phone: 630-252-1229</div><div>Fax:   630-252-5986</div><br>
</div>