<div class="gmail_quote">On Tue, Mar 15, 2011 at 22:30, Robert Ellis <span dir="ltr">&lt;<a href="mailto:Robert.Ellis@geosoft.com">Robert.Ellis@geosoft.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">
Regardless of setting the number of threads for MKL or OMP, the MKL performance was worse than simply using --download-f-blas-lapack=1.</blockquote></div><br><div>Interesting. Does this statement include using just one thread, perhaps with a non-threaded MKL? Also, when you used threading, were you putting an MPI process on every core or were you making sure that you had enough cores for num_mpi_processes * num_mkl_threads?</div>