<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">On Thu, Mar 30, 2017 at 3:05 AM, Jose E. Roman <span dir="ltr"><<a href="mailto:jroman@dsic.upv.es" target="_blank">jroman@dsic.upv.es</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span class=""><br>
> El 30 mar 2017, a las 9:27, Toon Weyens <<a href="mailto:toon.weyens@gmail.com">toon.weyens@gmail.com</a>> escribió:<br>
><br>
> Hi, thanks for the answer.<br>
><br>
> I use MUMPS as a PC. The options -ksp_converged_reason, -ksp_monitor_true_residual and -ksp_view  are not used.<br>
><br>
> The difference between the log_view outputs of running a simple solution with 1, 2, 3 or 4 MPI procs is attached (debug version).<br>
><br>
> I can see that with 2 procs it takes about 22 seconds, versus 7 seconds for 1 proc. For 3 and 4 the situation is worse: 29 and 37 seconds.<br>
><br>
> Looks like the difference is mainly in the BVmult and especially in the BVorthogonalize routines:<br>
><br>
> BVmult takes 1, 6.5, 10 or even a whopping 17 seconds for the different number of proceses<br>
> BVorthogonalize takes 1, 4, 6, 10.<br>
><br>
> Calculating the preconditioner does not take more time for different number of proceses, and applying it only slightly increases. So it cannot be mumps' fault...<br>
><br>
> Does this makes sense? Is there any way to improve this?<br>
><br>
> Thanks!<br>
<br>
</span>Cannot trust performance data in a debug build:<br></blockquote><div><br></div><div>Yes, you should definitely make another build configured using --with-debugging=no.</div><div><br></div><div>What do you get for STREAMS on this machine</div><div><br></div><div>  make streams NP=4</div><div><br></div><div>From this data, it looks like you have already saturated the bandwidth at 2 procs.</div><div><br></div><div>  Thanks,</div><div><br></div><div>    Matt</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<br>
      ##############################<wbr>############################<br>
      #                                                        #<br>
      #                          WARNING!!!                    #<br>
      #                                                        #<br>
      #   This code was compiled with a debugging option,      #<br>
      #   To get timing results run ./configure                #<br>
      #   using --with-debugging=no, the performance will      #<br>
      #   be generally two or three times faster.              #<br>
      #                                                        #<br>
      ##############################<wbr>############################<br>
<br>
<br>
<br>
</blockquote></div><br><br clear="all"><div><br></div>-- <br><div class="gmail_signature" data-smartmail="gmail_signature">What most experimenters take for granted before they begin their experiments is infinitely more interesting than any results to which their experiments lead.<br>-- Norbert Wiener</div>
</div></div>