<div dir="ltr"><div><div><div>see attached patch files.  The Intel C compiler does not recognize "-align array32byte -align zcommons", so you will have to deal with that in makenek.inc and makefile.template.<br></div>
Also see comments prefixed with DSK in mxm_std.patch<br><br></div>Hope this helps.<br><br></div>Dan<br></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Sat, Aug 17, 2013 at 10:16 AM,  <span dir="ltr"><<a href="mailto:nek5000-users@lists.mcs.anl.gov" target="_blank">nek5000-users@lists.mcs.anl.gov</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><br>
Hi Dan,<br>
<br>
Great to hear!<br>
<br>
If you want to send the flags we could incorporate them<br>
into makenek.<br>
<br>
Thanks!<br>
<br>
Paul<br>
<br>
<br>
On Sat, 17 Aug 2013, <a href="mailto:nek5000-users@lists.mcs.anl.gov" target="_blank">nek5000-users@lists.mcs.anl.<u></u>gov</a> wrote:<br>
<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Hello,<br>
<br>
I have been playing with compiler flags and directives to see if I can<br>
improve the time-to-solution of the turbChannel example.  I have had some<br>
success and would like to give back to the community.  What is the best<br>
procedure for doing this?<br>
<br>
I'm using the Intel-13.1.3.192 compiler on a Sandybridge Xeon.<br>
<br>
baseline timing for 1000 iterations on 8 cpu is<br>
total time   443.08s<br>
<br>
With a few compiler directives and optimization flags I got it down to<br>
total time   304.52s<br>
<br>
Dan<br>
<br>
</blockquote>
______________________________<u></u>_________________<br>
Nek5000-users mailing list<br>
<a href="mailto:Nek5000-users@lists.mcs.anl.gov" target="_blank">Nek5000-users@lists.mcs.anl.<u></u>gov</a><br>
<a href="https://lists.mcs.anl.gov/mailman/listinfo/nek5000-users" target="_blank">https://lists.mcs.anl.gov/<u></u>mailman/listinfo/nek5000-users</a><br>
</blockquote></div><br></div>