<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">On Wed, May 3, 2017 at 1:24 PM, Kong, Fande <span dir="ltr"><<a href="mailto:fande.kong@inl.gov" target="_blank">fande.kong@inl.gov</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div><div>Hi,<br><br></div>I am using the current master branch. The log_view gives me the summary as follows, and the "WARNING" box repeats three times. Are we intending to do so?<br></div></div></blockquote><div><br></div><div>Yep, Barry is Really Freaking Serious@ that you should not interpret these numbers without optimization on.</div><div><br></div><div>   Matt</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div></div><div>Thanks,<br></div><div><br></div>Fande,<br><br><div><br>******************************<wbr>******************************<wbr>******************************<wbr>******************************<br>***             WIDEN YOUR WINDOW TO 120 CHARACTERS.  Use 'enscript -r -fCourier9' to print this document            ***<br>******************************<wbr>******************************<wbr>******************************<wbr>******************************<br><br>------------------------------<wbr>---------------- PETSc Performance Summary: ------------------------------<wbr>----------------<br><br><br><br>      ##############################<wbr>############################<br>      #                             <wbr>                           #<br>      #                          WARNING!!!                    #<br>      #                             <wbr>                           #<br>      #   This code was compiled with a debugging option,      #<br>      #   To get timing results run ./configure                #<br>      #   using --with-debugging=no, the performance will      #<br>      #   be generally two or three times faster.              #<br>      #                             <wbr>                           #<br>      ##############################<wbr>############################<br><br><br>./ex29 on a arch-darwin-c-debug-master named FN604208 with 1 processor, by kongf Wed May  3 12:28:23 2017<br>Using Petsc Development GIT revision: v3.7.6-3529-g76c7fe0  GIT Date: 2017-05-03 08:46:23 -0500<br><br>                         Max       Max/Min        Avg      Total <br>Time (sec):           1.350e-02      1.00000   1.350e-02<br>Objects:              4.100e+01      1.00000   4.100e+01<br>Flop:                 3.040e+02      1.00000   3.040e+02  3.040e+02<br>Flop/sec:            2.251e+04      1.00000   2.251e+04  2.251e+04<br>Memory:               1.576e+05      1.00000              1.576e+05<br>MPI Messages:         0.000e+00      0.00000   0.000e+00  0.000e+00<br>MPI Message Lengths:  0.000e+00      0.00000   0.000e+00  0.000e+00<br>MPI Reductions:       0.000e+00      0.00000<br><br>Flop counting convention: 1 flop = 1 real number operation of type (multiply/divide/add/subtract)<br>                            e.g., VecAXPY() for real vectors of length N --> 2N flop<br>                            and VecAXPY() for complex vectors of length N --> 8N flop<br><br>Summary of Stages:   ----- Time ------  ----- Flop -----  --- Messages ---  -- Message Lengths --  -- Reductions --<br>                        Avg     %Total     Avg     %Total   counts   %Total     Avg         %Total   counts   %Total <br> 0:      Main Stage: 1.3483e-02  99.8%  3.0400e+02 100.0%  0.000e+00   0.0%  0.000e+00        0.0%  0.000e+00   0.0% <br><br>------------------------------<wbr>------------------------------<wbr>------------------------------<wbr>------------------------------<br>See the 'Profiling' chapter of the users' manual for details on interpreting output.<br>Phase summary info:<br>   Count: number of times phase was executed<br>   Time and Flop: Max - maximum over all processors<br>                   Ratio - ratio of maximum to minimum over all processors<br>   Mess: number of messages sent<br>   Avg. len: average message length (bytes)<br>   Reduct: number of global reductions<br>   Global: entire computation<br>   Stage: stages of a computation. Set stages with PetscLogStagePush() and PetscLogStagePop().<br>      %T - percent time in this phase         %F - percent flop in this phase<br>      %M - percent messages in this phase     %L - percent message lengths in this phase<br>      %R - percent reductions in this phase<br>   Total Mflop/s: 10e-6 * (sum of flop over all processors)/(max time over all processors)<br>------------------------------<wbr>------------------------------<wbr>------------------------------<wbr>------------------------------<br><br><br>      ##############################<wbr>############################<br>      #                             <wbr>                           #<br>      #                          WARNING!!!                    #<br>      #                             <wbr>                           #<br>      #   This code was compiled with a debugging option,      #<br>      #   To get timing results run ./configure                #<br>      #   using --with-debugging=no, the performance will      #<br>      #   be generally two or three times faster.              #<br>      #                             <wbr>                           #<br>      ##############################<wbr>############################<br><br><br>Event                Count      Time (sec)     Flop                          <wbr>   --- Global ---  --- Stage ---   Total<br>                   Max Ratio  Max     Ratio   Max  Ratio  Mess   Avg len Reduct  %T %F %M %L %R  %T %F %M %L %R Mflop/s<br>------------------------------<wbr>------------------------------<wbr>------------------------------<wbr>------------------------------<br><br>--- Event Stage 0: Main Stage<br><br>KSPGMRESOrthog         1 1.0 1.3617e-04 1.0 3.50e+01 1.0 0.0e+00 0.0e+00 0.0e+00  1 12  0  0  0   1 12  0  0  0     0<br>KSPSetUp               1 1.0 4.1097e-04 1.0 0.00e+00 0.0 0.0e+00 0.0e+00 0.0e+00  3  0  0  0  0   3  0  0  0  0     0<br>KSPSolve               1 1.0 1.4596e-03 1.0 2.85e+02 1.0 0.0e+00 0.0e+00 0.0e+00 11 94  0  0  0  11 94  0  0  0     0<br>VecMDot                1 1.0 1.7958e-05 1.0 1.70e+01 1.0 0.0e+00 0.0e+00 0.0e+00  0  6  0  0  0   0  6  0  0  0     1<br>VecNorm                2 1.0 1.9152e-05 1.0 3.40e+01 1.0 0.0e+00 0.0e+00 0.0e+00  0 11  0  0  0   0 11  0  0  0     2<br>VecScale               1 1.0 4.4771e-05 1.0 9.00e+00 1.0 0.0e+00 0.0e+00 0.0e+00  0  3  0  0  0   0  3  0  0  0     0<br>VecCopy                1 1.0 1.2218e-05 1.0 0.00e+00 0.0 0.0e+00 0.0e+00 0.0e+00  0  0  0  0  0   0  0  0  0  0     0<br>VecSet                10 1.0 7.3789e-05 1.0 0.00e+00 0.0 0.0e+00 0.0e+00 0.0e+00  1  0  0  0  0   1  0  0  0  0     0<br>VecAXPY                1 1.0 6.3397e-05 1.0 1.80e+01 1.0 0.0e+00 0.0e+00 0.0e+00  0  6  0  0  0   0  6  0  0  0     0<br>VecMAXPY               2 1.0 4.8989e-05 1.0 3.60e+01 1.0 0.0e+00 0.0e+00 0.0e+00  0 12  0  0  0   0 12  0  0  0     1<br>VecAssemblyBegin       2 1.0 7.5148e-06 1.0 0.00e+00 0.0 0.0e+00 0.0e+00 0.0e+00  0  0  0  0  0   0  0  0  0  0     0<br>VecAssemblyEnd         2 1.0 7.5093e-06 1.0 0.00e+00 0.0 0.0e+00 0.0e+00 0.0e+00  0  0  0  0  0   0  0  0  0  0     0<br>VecNormalize           2 1.0 9.5865e-05 1.0 4.30e+01 1.0 0.0e+00 0.0e+00 0.0e+00  1 14  0  0  0   1 14  0  0  0     0<br>MatMult                1 1.0 1.3781e-05 1.0 5.70e+01 1.0 0.0e+00 0.0e+00 0.0e+00  0 19  0  0  0   0 19  0  0  0     4<br>MatSolve               2 1.0 7.4019e-04 1.0 1.14e+02 1.0 0.0e+00 0.0e+00 0.0e+00  5 38  0  0  0   5 38  0  0  0     0<br>MatLUFactorNum         1 1.0 2.8001e-05 1.0 1.90e+01 1.0 0.0e+00 0.0e+00 0.0e+00  0  6  0  0  0   0  6  0  0  0     1<br>MatILUFactorSym        1 1.0 9.1556e-05 1.0 0.00e+00 0.0 0.0e+00 0.0e+00 0.0e+00  1  0  0  0  0   1  0  0  0  0     0<br>MatAssemblyBegin       2 1.0 7.7938e-06 1.0 0.00e+00 0.0 0.0e+00 0.0e+00 0.0e+00  0  0  0  0  0   0  0  0  0  0     0<br>MatAssemblyEnd         2 1.0 4.5131e-05 1.0 0.00e+00 0.0 0.0e+00 0.0e+00 0.0e+00  0  0  0  0  0   0  0  0  0  0     0<br>MatGetRowIJ            1 1.0 4.0429e-06 1.0 0.00e+00 0.0 0.0e+00 0.0e+00 0.0e+00  0  0  0  0  0   0  0  0  0  0     0<br>MatGetOrdering         1 1.0 1.7907e-04 1.0 0.00e+00 0.0 0.0e+00 0.0e+00 0.0e+00  1  0  0  0  0   1  0  0  0  0     0<br>PCSetUp                1 1.0 5.8597e-04 1.0 1.90e+01 1.0 0.0e+00 0.0e+00 0.0e+00  4  6  0  0  0   4  6  0  0  0     0<br>PCApply                2 1.0 7.8497e-04 1.0 1.14e+02 1.0 0.0e+00 0.0e+00 0.0e+00  6 38  0  0  0   6 38  0  0  0     0<br>------------------------------<wbr>------------------------------<wbr>------------------------------<wbr>------------------------------<br><br>Memory usage is given in bytes:<br><br>Object Type          Creations   Destructions     Memory  Descendants' Mem.<br>Reports information only for process 0.<br><br>--- Event Stage 0: Main Stage<br><br>       Krylov Solver     1              1        18408     0.<br>     DMKSP interface     1              1          648     0.<br>              Vector    12             12        19224     0.<br>      Vector Scatter     2              2         1312     0.<br>              Matrix     2              2         7380     0.<br>    Distributed Mesh     3              3        14960     0.<br>           Index Set     7              7         5632     0.<br>   IS L to G Mapping     2              2         1368     0.<br>Star Forest Bipartite Graph     6              6         4864     0.<br>     Discrete System     3              3         2596     0.<br>      Preconditioner     1              1         1000     0.<br>              Viewer     1              0            0     0.<br>==============================<wbr>==============================<wbr>==============================<wbr>==============================<br>Average time to get PetscTime(): 4.50294e-08<br>#PETSc Option Table entries:<br>-log_view<br>#End of PETSc Option Table entries<br>Compiled without FORTRAN kernels<br>Compiled with full precision matrices (default)<br>sizeof(short) 2 sizeof(int) 4 sizeof(long) 8 sizeof(void*) 8 sizeof(PetscScalar) 8 sizeof(PetscInt) 4<br>Configure options: --download-hypre=1 --with-ssl=0 --with-debugging=yes --with-pic=1 --with-shared-libraries=1 --with-cc=mpicc --with-cxx=mpicxx --with-fc=mpif90 --download-fblaslapack=1 --download-metis=1 --download-parmetis=1 --download-superlu_dist=1 --download-scalapack=1 --download-mumps=1 CC=mpicc CXX=mpicxx FC=mpif90 F77=mpif77 F90=mpif90 CFLAGS="-fPIC -fopenmp" CXXFLAGS="-fPIC -fopenmp" FFLAGS="-fPIC -fopenmp" FCFLAGS="-fPIC -fopenmp" F90FLAGS="-fPIC -fopenmp" F77FLAGS="-fPIC -fopenmp" PETSC_ARCH=arch-darwin-c-<wbr>debug-master<br>------------------------------<wbr>-----------<br>Libraries compiled on Wed May  3 11:04:44 2017 on FN604208 <br>Machine characteristics: Darwin-15.5.0-x86_64-i386-<wbr>64bit<br>Using PETSc directory: /Users/kongf/projects/petsc<br>Using PETSc arch: arch-darwin-c-debug-master<br>------------------------------<wbr>-----------<br><br>Using C compiler: mpicc -fPIC -fopenmp   -g3  ${COPTFLAGS} ${CFLAGS}<br>Using Fortran compiler: mpif90 -fPIC -fopenmp  -g   ${FOPTFLAGS} ${FFLAGS} <br>------------------------------<wbr>-----------<br><br>Using include paths: -I/Users/kongf/projects/petsc/<wbr>arch-darwin-c-debug-master/<wbr>include -I/Users/kongf/projects/petsc/<wbr>include -I/Users/kongf/projects/petsc/<wbr>include -I/Users/kongf/projects/petsc/<wbr>arch-darwin-c-debug-master/<wbr>include -I/opt/X11/include<br>------------------------------<wbr>-----------<br><br>Using C linker: mpicc<br>Using Fortran linker: mpif90<br>Using libraries: -Wl,-rpath,/Users/kongf/<wbr>projects/petsc/arch-darwin-c-<wbr>debug-master/lib -L/Users/kongf/projects/petsc/<wbr>arch-darwin-c-debug-master/lib -lpetsc -Wl,-rpath,/Users/kongf/<wbr>projects/petsc/arch-darwin-c-<wbr>debug-master/lib -L/Users/kongf/projects/petsc/<wbr>arch-darwin-c-debug-master/lib -Wl,-rpath,/opt/X11/lib -L/opt/X11/lib -Wl,-rpath,/opt/moose/mpich/<wbr>mpich-3.2/clang-opt/lib -L/opt/moose/mpich/mpich-3.2/<wbr>clang-opt/lib -Wl,-rpath,/opt/moose/llvm-3.<wbr>9.0/lib -L/opt/moose/llvm-3.9.0/lib -Wl,-rpath,/opt/moose/llvm-3.<wbr>9.0/lib/clang/3.9.0/lib/darwin -L/opt/moose/llvm-3.9.0/lib/<wbr>clang/3.9.0/lib/darwin -Wl,-rpath,/opt/moose/gcc-6.2.<wbr>0/lib/gcc/x86_64-apple-<wbr>darwin15.6.0/6.2.0 -L/opt/moose/gcc-6.2.0/lib/<wbr>gcc/x86_64-apple-darwin15.6.0/<wbr>6.2.0 -Wl,-rpath,/opt/moose/gcc-6.2.<wbr>0/lib -L/opt/moose/gcc-6.2.0/lib -Wl,-rpath,/opt/moose/llvm-3.<wbr>9.0/bin/../lib/clang/3.9.0/<wbr>lib/darwin -L/opt/moose/llvm-3.9.0/bin/..<wbr>/lib/clang/3.9.0/lib/darwin -lsuperlu_dist -lHYPRE -lcmumps -ldmumps -lsmumps -lzmumps -lmumps_common -lpord -lscalapack -lflapack -lfblas -lparmetis -lmetis -lX11 -lclang_rt.osx -lmpifort -lgfortran -lgomp -lgcc_ext.10.5 -lquadmath -lm -lclang_rt.osx -lmpicxx -lc++ -lclang_rt.osx -ldl -lmpi -lpmpi -lomp -lSystem -lclang_rt.osx -ldl<br>------------------------------<wbr>-----------<br><br><br><br>      ##############################<wbr>############################<br>      #                             <wbr>                           #<br>      #                          WARNING!!!                    #<br>      #                             <wbr>                           #<br>      #   This code was compiled with a debugging option,      #<br>      #   To get timing results run ./configure                #<br>      #   using --with-debugging=no, the performance will      #<br>      #   be generally two or three times faster.              #<br>      #                             <wbr>                           #<br>      ##############################<wbr>############################<br><br><br></div></div>
</blockquote></div><br><br clear="all"><div><br></div>-- <br><div class="gmail_signature" data-smartmail="gmail_signature">What most experimenters take for granted before they begin their experiments is infinitely more interesting than any results to which their experiments lead.<br>-- Norbert Wiener</div>
</div></div>