<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">

<html>

<head>

  <meta content="text/html;charset=ISO-8859-1" http-equiv="Content-Type">

</head>

<body bgcolor="#ffffff" text="#000000">

Hi,<br>

<br>

I just tested the ex2f.F example, changing m and n to 600. Here's the

result for 1, 2 and 4 processors. Interestingly, MatAssemblyBegin,

MatGetOrdering and KSPSetup have ratios &gt;&gt;1. The time taken seems

to be faster as the processor increases, although speedup is not 1:1. I

thought that this example should scale well, shouldn't it? Is there

something wrong with my installation then?<br>

<br>

Thank you.<br>

<br>

<b>1 processor:</b><br>

<br>

Norm of error 0.3371E+01 iterations&nbsp; 1153<br>

************************************************************************************************************************<br>

***&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; WIDEN YOUR WINDOW TO 120 CHARACTERS.&nbsp; Use 'enscript -r

-fCourier9' to print this document&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ***<br>

************************************************************************************************************************<br>

<br>

---------------------------------------------- PETSc Performance

Summary: ----------------------------------------------<br>

<br>

./a.out on a atlas3-mp named atlas3-c58 with 1 processor, by g0306332

Wed Apr 16 10:03:12 2008<br>

Using Petsc Release Version 2.3.3, Patch 8, Fri Nov 16 17:03:40 CST

2007 HG revision: 414581156e67e55c761739b0deb119f7590d0f4b<br>

<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Max&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Max/Min&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Avg&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Total <br>

Time (sec):&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1.222e+02&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1.00000&nbsp;&nbsp; 1.222e+02 <br>

Objects:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 4.400e+01&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1.00000&nbsp;&nbsp; 4.400e+01 <br>

Flops:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 3.547e+10&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1.00000&nbsp;&nbsp; 3.547e+10&nbsp; 3.547e+10<br>

Flops/sec:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2.903e+08&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1.00000&nbsp;&nbsp; 2.903e+08&nbsp; 2.903e+08<br>

MPI Messages:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0.000e+00&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0.00000&nbsp;&nbsp; 0.000e+00&nbsp; 0.000e+00<br>

MPI Message Lengths:&nbsp; 0.000e+00&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0.00000&nbsp;&nbsp; 0.000e+00&nbsp; 0.000e+00<br>

MPI Reductions:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2.349e+03&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1.00000<br>

<br>

Flop counting convention: 1 flop = 1 real number operation of type

(multiply/divide/add/subtract) <br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; e.g., VecAXPY() for real vectors of length

N --&gt; 2N flops<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; and VecAXPY() for complex vectors of length

N --&gt; 8N flops&nbsp; <br>

<br>

Summary of Stages:&nbsp;&nbsp; ----- Time ------&nbsp; ----- Flops -----&nbsp; --- Messages

---&nbsp; -- Message Lengths --&nbsp; -- Reductions --<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Avg&nbsp;&nbsp;&nbsp;&nbsp; %Total&nbsp;&nbsp;&nbsp;&nbsp; Avg&nbsp;&nbsp;&nbsp;&nbsp; %Total&nbsp;&nbsp; counts&nbsp;&nbsp;

%Total&nbsp;&nbsp;&nbsp;&nbsp; Avg&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; %Total&nbsp;&nbsp; counts&nbsp;&nbsp; %Total <br>

&nbsp;0:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Main Stage: 1.2216e+02 100.0%&nbsp; 3.5466e+10 100.0%&nbsp; 0.000e+00&nbsp;&nbsp;

0.0%&nbsp; 0.000e+00&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0.0%&nbsp; 2.349e+03 100.0% <br>

<br>

------------------------------------------------------------------------------------------------------------------------<br>

See the 'Profiling' chapter of the users' manual for details on

interpreting output.<br>

Phase summary info:<br>

&nbsp;&nbsp; Count: number of times phase was executed<br>

&nbsp;&nbsp; Time and Flops/sec: Max - maximum over all processors<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Ratio - ratio of maximum to minimum over all

processors<br>

&nbsp;&nbsp; Mess: number of messages sent<br>

&nbsp;&nbsp; Avg. len: average message length<br>

&nbsp;&nbsp; Reduct: number of global reductions<br>

&nbsp;&nbsp; Global: entire computation<br>

&nbsp;&nbsp; Stage: stages of a computation. Set stages with PetscLogStagePush()

and PetscLogStagePop().<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; %T - percent time in this phase&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; %F - percent flops in

this phase<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; %M - percent messages in this phase&nbsp;&nbsp;&nbsp;&nbsp; %L - percent message

lengths in this phase<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; %R - percent reductions in this phase<br>

&nbsp;&nbsp; Total Mflop/s: 10e-6 * (sum of flops over all processors)/(max time

over all processors)<br>

------------------------------------------------------------------------------------------------------------------------<br>

<br>

<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ##########################################################<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; WARNING!!!&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #&nbsp;&nbsp; This code was run without the PreLoadBegin()&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #&nbsp;&nbsp; macros. To get timing results we always recommend&nbsp;&nbsp;&nbsp; #<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #&nbsp;&nbsp; preloading. otherwise timing numbers may be&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #&nbsp;&nbsp; meaningless.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ##########################################################<br>

<br>

Event&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Count&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Time (sec)&nbsp;&nbsp;&nbsp;&nbsp;

Flops/sec&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; --- Global ---&nbsp; --- Stage ---&nbsp;&nbsp; Total<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Max Ratio&nbsp; Max&nbsp;&nbsp;&nbsp;&nbsp; Ratio&nbsp;&nbsp; Max&nbsp; Ratio&nbsp; Mess&nbsp;&nbsp; Avg

len Reduct&nbsp; %T %F %M %L %R&nbsp; %T %F %M %L %R Mflop/s<br>

------------------------------------------------------------------------------------------------------------------------<br>

<br>

--- Event Stage 0: Main Stage<br>

<br>

MatMult&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1192 1.0 1.6115e+01 1.0 2.39e+08 1.0 0.0e+00

0.0e+00 0.0e+00 13 11&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 13 11&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 239<br>

MatSolve&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1192 1.0 3.1017e+01 1.0 1.24e+08 1.0 0.0e+00

0.0e+00 0.0e+00 25 11&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 25 11&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 124<br>

MatLUFactorNum&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1 1.0 3.6166e-02 1.0 8.94e+07 1.0 0.0e+00

0.0e+00 0.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp; 89<br>

MatILUFactorSym&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1 1.0 1.9690e-01 1.0 0.00e+00 0.0 0.0e+00

0.0e+00 1.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

MatAssemblyBegin&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1 1.0 1.9073e-06 1.0 0.00e+00 0.0 0.0e+00

0.0e+00 0.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

MatAssemblyEnd&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1 1.0 2.6258e-02 1.0 0.00e+00 0.0 0.0e+00

0.0e+00 0.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

MatGetRowIJ&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1 1.0 1.9073e-06 1.0 0.00e+00 0.0 0.0e+00

0.0e+00 0.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

MatGetOrdering&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1 1.0 5.4259e-03 1.0 0.00e+00 0.0 0.0e+00

0.0e+00 2.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

VecMDot&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1153 1.0 3.2664e+01 1.0 3.92e+08 1.0 0.0e+00

0.0e+00 1.2e+03 27 36&nbsp; 0&nbsp; 0 49&nbsp; 27 36&nbsp; 0&nbsp; 0 49&nbsp;&nbsp; 392<br>

VecNorm&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1193 1.0 2.0344e+00 1.0 4.22e+08 1.0 0.0e+00

0.0e+00 1.2e+03&nbsp; 2&nbsp; 2&nbsp; 0&nbsp; 0 51&nbsp;&nbsp; 2&nbsp; 2&nbsp; 0&nbsp; 0 51&nbsp;&nbsp; 422<br>

VecScale&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1192 1.0 6.9107e-01 1.0 6.21e+08 1.0 0.0e+00

0.0e+00 0.0e+00&nbsp; 1&nbsp; 1&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 1&nbsp; 1&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 621<br>

VecCopy&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 39 1.0 3.4571e-01 1.0 0.00e+00 0.0 0.0e+00

0.0e+00 0.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

VecSet&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 41 1.0 1.1397e-01 1.0 0.00e+00 0.0 0.0e+00

0.0e+00 0.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

VecAXPY&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 78 1.0 6.9354e-01 1.0 8.10e+07 1.0 0.0e+00

0.0e+00 0.0e+00&nbsp; 1&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 1&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp; 81<br>

VecMAXPY&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1192 1.0 3.7492e+01 1.0 3.63e+08 1.0 0.0e+00

0.0e+00 0.0e+00 31 38&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 31 38&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 363<br>

VecNormalize&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1192 1.0 2.7284e+00 1.0 4.72e+08 1.0 0.0e+00

0.0e+00 1.2e+03&nbsp; 2&nbsp; 4&nbsp; 0&nbsp; 0 51&nbsp;&nbsp; 2&nbsp; 4&nbsp; 0&nbsp; 0 51&nbsp;&nbsp; 472<br>

KSPGMRESOrthog&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1153 1.0 6.7939e+01 1.0 3.76e+08 1.0 0.0e+00

0.0e+00 1.2e+03 56 72&nbsp; 0&nbsp; 0 49&nbsp; 56 72&nbsp; 0&nbsp; 0 49&nbsp;&nbsp; 376<br>

KSPSetup&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1 1.0 1.1651e-02 1.0 0.00e+00 0.0 0.0e+00

0.0e+00 0.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

KSPSolve&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1 1.0 1.2159e+02 1.0 2.92e+08 1.0 0.0e+00

0.0e+00 2.3e+03100100&nbsp; 0&nbsp; 0100 100100&nbsp; 0&nbsp; 0100&nbsp;&nbsp; 292<br>

PCSetUp&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1 1.0 2.3852e-01 1.0 1.36e+07 1.0 0.0e+00

0.0e+00 3.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp; 14<br>

PCApply&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1192 1.0 3.1021e+01 1.0 1.24e+08 1.0 0.0e+00

0.0e+00 0.0e+00 25 11&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 25 11&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 124<br>

------------------------------------------------------------------------------------------------------------------------<br>

<br>

Memory usage is given in bytes:<br>

<br>

Object Type&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Creations&nbsp;&nbsp; Destructions&nbsp;&nbsp; Memory&nbsp; Descendants'

Mem.<br>

<br>

--- Event Stage 0: Main Stage<br>

<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Matrix&nbsp;&nbsp;&nbsp;&nbsp; 2&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2&nbsp;&nbsp; 54691212&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Index Set&nbsp;&nbsp;&nbsp;&nbsp; 3&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 3&nbsp;&nbsp;&nbsp; 4321032&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Vec&nbsp;&nbsp;&nbsp; 37&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 37&nbsp; 103708408&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Krylov Solver&nbsp;&nbsp;&nbsp;&nbsp; 1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 17216&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Preconditioner&nbsp;&nbsp;&nbsp;&nbsp; 1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 168&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

========================================================================================================================<br>

Average time to get PetscTime(): 1.90735e-07<br>

OptionTable: -log_summary<br>

Compiled without FORTRAN kernels<br>

Compiled with full precision matrices (default)<br>

sizeof(short) 2 sizeof(int) 4 sizeof(long) 8 sizeof(void*) 8

sizeof(PetscScalar) 8<br>

Configure run at: Tue Jan&nbsp; 8 22:22:08 2008<br>

Configure options: --with-memcmp-ok --sizeof_char=1 --sizeof_void_p=8

--sizeof_short=2 --sizeof_int=4 --sizeof_long=8 --sizeof_long_long=8

--sizeof_float=4 --sizeof_double=8 --bits_per_byte=8

--sizeof_MPI_Comm=4 --sizeof_MPI_Fint=4 --with-vendor-compilers=intel

--with-x=0 --with-hypre-dir=/home/enduser/g0306332/lib/hypre

--with-debugging=0 --with-batch=1 --with-mpi-shared=0

--with-mpi-include=/usr/local/topspin/mpi/mpich/include

--with-mpi-lib=/usr/local/topspin/mpi/mpich/lib/libmpich.a

--with-mpirun=/usr/local/topspin/mpi/mpich/bin/mpirun

--with-blas-lapack-dir=/opt/intel/cmkl/8.1.1/lib/em64t --with-shared=0<br>

-----------------------------------------<br>

Libraries compiled on Tue Jan&nbsp; 8 22:34:13 SGT 2008 on atlas3-c01<br>

Machine characteristics: Linux atlas3-c01 2.6.9-42.ELsmp #1 SMP Wed Jul

12 23:32:02 EDT 2006 x86_64 x86_64 x86_64 GNU/Linux<br>

Using PETSc directory: /nfs/home/enduser/g0306332/petsc-2.3.3-p8<br>

Using PETSc arch: atlas3-mpi<br>

-----------------------------------------<br>

85.53user 1.22system 2:02.65elapsed 70%CPU (0avgtext+0avgdata

0maxresident)k<br>

0inputs+0outputs (16major+46429minor)pagefaults 0swaps<br>

Job&nbsp; /usr/lsf62/bin/mvapich_wrapper time ./a.out -log_summary<br>

<br>

<br>

<b>2 processors:</b><br>

<br>

Norm of error 0.3231E+01 iterations&nbsp; 1177<br>

************************************************************************************************************************<br>

***&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; WIDEN YOUR WINDOW TO 120 CHARACTERS.&nbsp; Use 'enscript -r

-fCourier9' to print this document&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ***<br>

************************************************************************************************************************<br>

<br>

---------------------------------------------- PETSc Performance

Summary: ----------------------------------------------<br>

<br>

./a.out on a atlas3-mp named atlas3-c58 with 2 processors, by g0306332

Wed Apr 16 09:48:37 2008<br>

Using Petsc Release Version 2.3.3, Patch 8, Fri Nov 16 17:03:40 CST

2007 HG revision: 414581156e67e55c761739b0deb119f7590d0f4b<br>

<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Max&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Max/Min&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Avg&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Total<br>

Time (sec):&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1.034e+02&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1.00000&nbsp;&nbsp; 1.034e+02<br>

Objects:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 5.500e+01&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1.00000&nbsp;&nbsp; 5.500e+01<br>

Flops:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1.812e+10&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1.00000&nbsp;&nbsp; 1.812e+10&nbsp; 3.625e+10<br>

Flops/sec:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1.752e+08&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1.00000&nbsp;&nbsp; 1.752e+08&nbsp; 3.504e+08<br>

MPI Messages:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1.218e+03&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1.00000&nbsp;&nbsp; 1.218e+03&nbsp; 2.436e+03<br>

MPI Message Lengths:&nbsp; 5.844e+06&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1.00000&nbsp;&nbsp; 4.798e+03&nbsp; 1.169e+07<br>

MPI Reductions:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1.204e+03&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1.00000<br>

<br>

Flop counting convention: 1 flop = 1 real number operation of type

(multiply/divide/add/subtract)<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; e.g., VecAXPY() for real vectors of length

N --&gt; 2N flops<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; and VecAXPY() for complex vectors of length

N --&gt; 8N flops<br>

<br>

Summary of Stages:&nbsp;&nbsp; ----- Time ------&nbsp; ----- Flops -----&nbsp; --- Messages

---&nbsp; -- Message Lengths --&nbsp; -- Reductions --<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Avg&nbsp;&nbsp;&nbsp;&nbsp; %Total&nbsp;&nbsp;&nbsp;&nbsp; Avg&nbsp;&nbsp;&nbsp;&nbsp; %Total&nbsp;&nbsp; counts&nbsp;&nbsp;

%Total&nbsp;&nbsp;&nbsp;&nbsp; Avg&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; %Total&nbsp;&nbsp; counts&nbsp;&nbsp; %Total<br>

&nbsp;0:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Main Stage: 1.0344e+02 100.0%&nbsp; 3.6250e+10 100.0%&nbsp; 2.436e+03

100.0%&nbsp; 4.798e+03&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 100.0%&nbsp; 2.407e+03 100.0%<br>

<br>

------------------------------------------------------------------------------------------------------------------------<br>

See the 'Profiling' chapter of the users' manual for details on

interpreting output.<br>

Phase summary info:<br>

&nbsp;&nbsp; Count: number of times phase was executed<br>

&nbsp;&nbsp; Time and Flops/sec: Max - maximum over all processors<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Ratio - ratio of maximum to minimum over all

processors<br>

&nbsp;&nbsp; Mess: number of messages sent<br>

&nbsp;&nbsp; Avg. len: average message length<br>

&nbsp;&nbsp; Reduct: number of global reductions<br>

&nbsp;&nbsp; Global: entire computation<br>

&nbsp;&nbsp; Stage: stages of a computation. Set stages with PetscLogStagePush()

and PetscLogStagePop().<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; %T - percent time in this phase&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; %F - percent flops in

this phase<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; %M - percent messages in this phase&nbsp;&nbsp;&nbsp;&nbsp; %L - percent message

lengths in this phase<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; %R - percent reductions in this phase<br>

&nbsp;&nbsp; Total Mflop/s: 10e-6 * (sum of flops over all processors)/(max time

over all processors)<br>

------------------------------------------------------------------------------------------------------------------------<br>

<br>

<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ##########################################################<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; WARNING!!!&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #&nbsp;&nbsp; This code was run without the PreLoadBegin()&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #&nbsp;&nbsp; macros. To get timing results we always recommend&nbsp;&nbsp;&nbsp; #<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #&nbsp;&nbsp; preloading. otherwise timing numbers may be&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #&nbsp;&nbsp; meaningless.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ##########################################################<br>

<br>

Event&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Count&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Time (sec)&nbsp;&nbsp;&nbsp;&nbsp;

Flops/sec&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; --- Global ---&nbsp; --- Stage ---&nbsp;&nbsp; Total<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Max Ratio&nbsp; Max&nbsp;&nbsp;&nbsp;&nbsp; Ratio&nbsp;&nbsp; Max&nbsp; Ratio&nbsp; Mess&nbsp;&nbsp; Avg

len Reduct&nbsp; %T %F %M %L %R&nbsp; %T %F %M %L %R Mflop/s<br>

------------------------------------------------------------------------------------------------------------------------<br>

<br>

--- Event Stage 0: Main Stage<br>

<br>

MatMult&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1217 1.0 1.2502e+01 1.2 1.88e+08 1.2 2.4e+03

4.8e+03 0.0e+00 11 11100100&nbsp; 0&nbsp; 11 11100100&nbsp; 0&nbsp;&nbsp; 315<br>

MatSolve&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1217 1.0 2.1088e+01 1.2 1.10e+08 1.2 0.0e+00

0.0e+00 0.0e+00 19 11&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 19 11&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 187<br>

MatLUFactorNum&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1 1.0 8.2862e-02 2.9 5.58e+07 2.9 0.0e+00

0.0e+00 0.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp; 39<br>

MatILUFactorSym&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1 1.0 3.3310e-02 1.5 0.00e+00 0.0 0.0e+00

0.0e+00 1.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

<b>MatAssemblyBegin&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1 1.0 1.5567e-011854.8 0.00e+00 0.0 0.0e+00

0.0e+00 2.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0</b><br>

MatAssemblyEnd&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1 1.0 1.0352e-01 1.0 0.00e+00 0.0 2.0e+00

2.4e+03 7.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

MatGetRowIJ&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1 1.0 3.0994e-06 1.0 0.00e+00 0.0 0.0e+00

0.0e+00 0.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

<b>MatGetOrdering&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1 1.0 5.0953e-0210.7 0.00e+00 0.0 0.0e+00

0.0e+00 2.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0</b><br>

VecMDot&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1177 1.0 4.0427e+01 1.1 1.85e+08 1.1 0.0e+00

0.0e+00 1.2e+03 37 36&nbsp; 0&nbsp; 0 49&nbsp; 37 36&nbsp; 0&nbsp; 0 49&nbsp;&nbsp; 323<br>

VecNorm&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1218 1.0 1.5475e+01 1.9 5.25e+07 1.9 0.0e+00

0.0e+00 1.2e+03 12&nbsp; 2&nbsp; 0&nbsp; 0 51&nbsp; 12&nbsp; 2&nbsp; 0&nbsp; 0 51&nbsp;&nbsp;&nbsp; 57<br>

VecScale&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1217 1.0 5.7866e-01 1.0 3.97e+08 1.0 0.0e+00

0.0e+00 0.0e+00&nbsp; 1&nbsp; 1&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 1&nbsp; 1&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 757<br>

VecCopy&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 40 1.0 6.6697e-02 1.6 0.00e+00 0.0 0.0e+00

0.0e+00 0.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

VecSet&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1259 1.0 1.5276e+00 1.1 0.00e+00 0.0 0.0e+00

0.0e+00 0.0e+00&nbsp; 1&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 1&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

VecAXPY&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 80 1.0 2.1163e-01 2.4 3.21e+08 2.4 0.0e+00

0.0e+00 0.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 272<br>

VecMAXPY&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1217 1.0 2.2980e+01 1.4 4.28e+08 1.4 0.0e+00

0.0e+00 0.0e+00 19 38&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 19 38&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 606<br>

VecScatterBegin&nbsp;&nbsp;&nbsp;&nbsp; 1217 1.0 3.6620e-02 1.4 0.00e+00 0.0 2.4e+03

4.8e+03 0.0e+00&nbsp; 0&nbsp; 0100100&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0100100&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

VecScatterEnd&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1217 1.0 8.1980e-01 1.7 0.00e+00 0.0 0.0e+00

0.0e+00 0.0e+00&nbsp; 1&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 1&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

VecNormalize&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1217 1.0 1.6030e+01 1.8 7.36e+07 1.8 0.0e+00

0.0e+00 1.2e+03 12&nbsp; 4&nbsp; 0&nbsp; 0 51&nbsp; 12&nbsp; 4&nbsp; 0&nbsp; 0 51&nbsp;&nbsp;&nbsp; 82<br>

KSPGMRESOrthog&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1177 1.0 5.7248e+01 1.0 2.35e+08 1.0 0.0e+00

0.0e+00 1.2e+03 55 72&nbsp; 0&nbsp; 0 49&nbsp; 55 72&nbsp; 0&nbsp; 0 49&nbsp;&nbsp; 457<br>

<b>KSPSetup&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2 1.0 1.0363e-0110.5 0.00e+00 0.0 0.0e+00

0.0e+00 0.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0</b><br>

KSPSolve&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1 1.0 1.0289e+02 1.0 1.76e+08 1.0 2.4e+03

4.8e+03 2.4e+03 99100100100100&nbsp; 99100100100100&nbsp;&nbsp; 352<br>

PCSetUp&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2 1.0 1.5685e-01 2.3 2.40e+07 2.3 0.0e+00

0.0e+00 3.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp; 21<br>

PCSetUpOnBlocks&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1 1.0 1.5668e-01 2.3 2.41e+07 2.3 0.0e+00

0.0e+00 3.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp; 21<br>

PCApply&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1217 1.0 2.2625e+01 1.2 1.02e+08 1.2 0.0e+00

0.0e+00 0.0e+00 20 11&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 20 11&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 174<br>

------------------------------------------------------------------------------------------------------------------------<br>

<br>

Memory usage is given in bytes:<br>

<br>

Object Type&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Creations&nbsp;&nbsp; Destructions&nbsp;&nbsp; Memory&nbsp; Descendants'

Mem.<br>

<br>

--- Event Stage 0: Main Stage<br>

<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Matrix&nbsp;&nbsp;&nbsp;&nbsp; 4&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 4&nbsp;&nbsp; 34540820&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Index Set&nbsp;&nbsp;&nbsp;&nbsp; 5&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 5&nbsp;&nbsp;&nbsp; 2164120&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Vec&nbsp;&nbsp;&nbsp; 41&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 41&nbsp;&nbsp; 53315992&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Vec Scatter&nbsp;&nbsp;&nbsp;&nbsp; 1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Krylov Solver&nbsp;&nbsp;&nbsp;&nbsp; 2&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 17216&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Preconditioner&nbsp;&nbsp;&nbsp;&nbsp; 2&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 256&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

========================================================================================================================<br>

Average time to get PetscTime(): 1.90735e-07<br>

Average time for MPI_Barrier(): 8.10623e-07<br>

Average time for zero size MPI_Send(): 2.98023e-06<br>

OptionTable: -log_summary<br>

Compiled without FORTRAN kernels<br>

Compiled with full precision matrices (default)<br>

sizeof(short) 2 sizeof(int) 4 sizeof(long) 8 sizeof(void*) 8

sizeof(PetscScalar) 8<br>

Configure run at: Tue Jan&nbsp; 8 22:22:08 2008<br>

<br>

42.64user 0.28system 1:08.08elapsed 63%CPU (0avgtext+0avgdata

0maxresident)k<br>

0inputs+0outputs (18major+28609minor)pagefaults 0swaps<br>

1:08.08elapsed 99%CPU (0avgtext+0avgdata 0maxresident)k<br>

0inputs+0outputs (18major+23666minor)pagefaults 0swaps<br>

<br>

<br>

<b>4 processors:</b><br>

<br>

Norm of error 0.3090E+01 iterations&nbsp;&nbsp; 937<br>

63.17user 0.05system 1:04.31elapsed 98%CPU (0avgtext+0avgdata

0maxresident)k<br>

0inputs+0outputs (16major+13520minor)pagefaults 0swaps<br>

53.13user 0.06system 1:04.31elapsed 82%CPU (0avgtext+0avgdata

0maxresident)k<br>

0inputs+0outputs (15major+13414minor)pagefaults 0swaps<br>

58.55user 0.23system 1:04.31elapsed 91%CPU (0avgtext+0avgdata

0maxresident)k<br>

0inputs+0outputs (17major+18383minor)pagefaults 0swaps<br>

20.36user 0.67system 1:04.33elapsed 32%CPU (0avgtext+0avgdata

0maxresident)k<br>

0inputs+0outputs (14major+18392minor)pagefaults 0swaps<br>

Job&nbsp; /usr/lsf62/bin/mvapich_wrapper time ./a.out -log_summary<br>

<br>

<br>

<br>

************************************************************************************************************************<br>

***&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; WIDEN YOUR WINDOW TO 120 CHARACTERS.&nbsp; Use 'enscript -r

-fCourier9' to print this document&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ***<br>

************************************************************************************************************************<br>

<br>

---------------------------------------------- PETSc Performance

Summary: ----------------------------------------------<br>

<br>

./a.out on a atlas3-mp named atlas3-c45 with 4 processors, by g0306332

Wed Apr 16 09:55:16 2008<br>

Using Petsc Release Version 2.3.3, Patch 8, Fri Nov 16 17:03:40 CST

2007 HG revision: 414581156e67e55c761739b0deb119f7590d0f4b<br>

<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Max&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Max/Min&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Avg&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Total<br>

Time (sec):&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 6.374e+01&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1.00001&nbsp;&nbsp; 6.374e+01<br>

Objects:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 5.500e+01&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1.00000&nbsp;&nbsp; 5.500e+01<br>

Flops:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 7.209e+09&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1.00016&nbsp;&nbsp; 7.208e+09&nbsp; 2.883e+10<br>

Flops/sec:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1.131e+08&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1.00017&nbsp;&nbsp; 1.131e+08&nbsp; 4.524e+08<br>

MPI Messages:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1.940e+03&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2.00000&nbsp;&nbsp; 1.455e+03&nbsp; 5.820e+03<br>

MPI Message Lengths:&nbsp; 9.307e+06&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2.00000&nbsp;&nbsp; 4.798e+03&nbsp; 2.792e+07<br>

MPI Reductions:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 4.798e+02&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1.00000<br>

<br>

Flop counting convention: 1 flop = 1 real number operation of type

(multiply/divide/add/subtract)<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; e.g., VecAXPY() for real vectors of length

N --&gt; 2N flops<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; and VecAXPY() for complex vectors of length

N --&gt; 8N flops<br>

<br>

Summary of Stages:&nbsp;&nbsp; ----- Time ------&nbsp; ----- Flops -----&nbsp; --- Messages

---&nbsp; -- Message Lengths --&nbsp; -- Reductions --<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Avg&nbsp;&nbsp;&nbsp;&nbsp; %Total&nbsp;&nbsp;&nbsp;&nbsp; Avg&nbsp;&nbsp;&nbsp;&nbsp; %Total&nbsp;&nbsp; counts&nbsp;&nbsp;

%Total&nbsp;&nbsp;&nbsp;&nbsp; Avg&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; %Total&nbsp;&nbsp; counts&nbsp;&nbsp; %Total<br>

&nbsp;0:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Main Stage: 6.3737e+01 100.0%&nbsp; 2.8832e+10 100.0%&nbsp; 5.820e+03

100.0%&nbsp; 4.798e+03&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 100.0%&nbsp; 1.919e+03 100.0%<br>

<br>

------------------------------------------------------------------------------------------------------------------------<br>

See the 'Profiling' chapter of the users' manual for details on

interpreting output.<br>

Phase summary info:<br>

&nbsp;&nbsp; Count: number of times phase was executed<br>

&nbsp;&nbsp; Time and Flops/sec: Max - maximum over all processors<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Ratio - ratio of maximum to minimum over all

processors<br>

&nbsp;&nbsp; Mess: number of messages sent<br>

&nbsp;&nbsp; Avg. len: average message length<br>

&nbsp;&nbsp; Reduct: number of global reductions<br>

&nbsp;&nbsp; Global: entire computation<br>

&nbsp;&nbsp; Stage: stages of a computation. Set stages with PetscLogStagePush()

and PetscLogStagePop().<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; %T - percent time in this phase&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; %F - percent flops in

this phase<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; %M - percent messages in this phase&nbsp;&nbsp;&nbsp;&nbsp; %L - percent message

lengths in this phase<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; %R - percent reductions in this phase<br>

&nbsp;&nbsp; Total Mflop/s: 10e-6 * (sum of flops over all processors)/(max time

over all processors)<br>

------------------------------------------------------------------------------------------------------------------------<br>

<br>

<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ##########################################################<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; WARNING!!!&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #&nbsp;&nbsp; This code was run without the PreLoadBegin()&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #&nbsp;&nbsp; macros. To get timing results we always recommend&nbsp;&nbsp;&nbsp; #<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #&nbsp;&nbsp; preloading. otherwise timing numbers may be&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #&nbsp;&nbsp; meaningless.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ##########################################################<br>

<br>

<br>

Event&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Count&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Time (sec)&nbsp;&nbsp;&nbsp;&nbsp;

Flops/sec&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; --- Global ---&nbsp; --- Stage ---&nbsp;&nbsp; Total<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Max Ratio&nbsp; Max&nbsp;&nbsp;&nbsp;&nbsp; Ratio&nbsp;&nbsp; Max&nbsp; Ratio&nbsp; Mess&nbsp;&nbsp; Avg

len Reduct&nbsp; %T %F %M %L %R&nbsp; %T %F %M %L %R Mflop/s<br>

------------------------------------------------------------------------------------------------------------------------<br>

<br>

--- Event Stage 0: Main Stage<br>

<br>

MatMult&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 969 1.0 9.7564e+00 3.6 2.87e+08 3.6 5.8e+03

4.8e+03 0.0e+00&nbsp; 8 11100100&nbsp; 0&nbsp;&nbsp; 8 11100100&nbsp; 0&nbsp;&nbsp; 321<br>

MatSolve&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 969 1.0 1.4244e+01 3.3 1.79e+08 3.3 0.0e+00

0.0e+00 0.0e+00 11 11&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 11 11&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 220<br>

MatLUFactorNum&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1 1.0 5.2070e-02 6.2 9.63e+07 6.2 0.0e+00

0.0e+00 0.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp; 62<br>

MatILUFactorSym&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1 1.0 1.7911e-02 2.3 0.00e+00 0.0 0.0e+00

0.0e+00 1.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

<b>MatAssemblyBegin&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1 1.0 2.1741e-01164.3 0.00e+00 0.0 0.0e+00

0.0e+00 2.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0</b><br>

MatAssemblyEnd&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1 1.0 3.5663e-02 1.0 0.00e+00 0.0 6.0e+00

2.4e+03 7.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

MatGetRowIJ&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1 1.0 2.1458e-06 1.1 0.00e+00 0.0 0.0e+00

0.0e+00 0.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

MatGetOrdering&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1 1.0 1.2779e-03 1.2 0.00e+00 0.0 0.0e+00

0.0e+00 2.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

VecMDot&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 937 1.0 3.5634e+01 2.1 1.52e+08 2.1 0.0e+00

0.0e+00 9.4e+02 48 36&nbsp; 0&nbsp; 0 49&nbsp; 48 36&nbsp; 0&nbsp; 0 49&nbsp;&nbsp; 292<br>

VecNorm&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 970 1.0 1.4387e+01 2.9 3.55e+07 2.9 0.0e+00

0.0e+00 9.7e+02 18&nbsp; 2&nbsp; 0&nbsp; 0 51&nbsp; 18&nbsp; 2&nbsp; 0&nbsp; 0 51&nbsp;&nbsp;&nbsp; 49<br>

VecScale&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 969 1.0 1.5714e-01 2.1 1.14e+09 2.1 0.0e+00

0.0e+00 0.0e+00&nbsp; 0&nbsp; 1&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 1&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 2220<br>

VecCopy&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 32 1.0 1.8988e-02 1.2 0.00e+00 0.0 0.0e+00

0.0e+00 0.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

VecSet&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1003 1.0 1.1690e+00 3.8 0.00e+00 0.0 0.0e+00

0.0e+00 0.0e+00&nbsp; 1&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 1&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

VecAXPY&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 64 1.0 2.1091e-02 1.1 6.07e+08 1.1 0.0e+00

0.0e+00 0.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 2185<br>

VecMAXPY&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 969 1.0 1.4823e+01 3.4 6.26e+08 3.4 0.0e+00

0.0e+00 0.0e+00 11 38&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 11 38&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 747<br>

VecScatterBegin&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 969 1.0 2.3238e-02 2.1 0.00e+00 0.0 5.8e+03

4.8e+03 0.0e+00&nbsp; 0&nbsp; 0100100&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0100100&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

<b>VecScatterEnd&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 969 1.0 1.4613e+0083.6 0.00e+00 0.0 0.0e+00

0.0e+00 0.0e+00&nbsp; 1&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 1&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0</b><br>

VecNormalize&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 969 1.0 1.4468e+01 2.8 5.15e+07 2.8 0.0e+00

0.0e+00 9.7e+02 18&nbsp; 4&nbsp; 0&nbsp; 0 50&nbsp; 18&nbsp; 4&nbsp; 0&nbsp; 0 50&nbsp;&nbsp;&nbsp; 72<br>

KSPGMRESOrthog&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 937 1.0 3.9924e+01 1.3 1.68e+08 1.3 0.0e+00

0.0e+00 9.4e+02 59 72&nbsp; 0&nbsp; 0 49&nbsp; 59 72&nbsp; 0&nbsp; 0 49&nbsp;&nbsp; 521<br>

<b>KSPSetup&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2 1.0 2.6190e-02 8.6 0.00e+00 0.0 0.0e+00

0.0e+00 0.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0</b><br>

KSPSolve&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1 1.0 6.2496e+01 1.0 1.15e+08 1.0 5.8e+03

4.8e+03 1.9e+03 98100100100 99&nbsp; 98100100100 99&nbsp;&nbsp; 461<br>

PCSetUp&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2 1.0 7.1320e-02 4.1 4.59e+07 4.1 0.0e+00

0.0e+00 3.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp; 45<br>

PCSetUpOnBlocks&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1 1.0 7.1230e-02 4.1 4.62e+07 4.1 0.0e+00

0.0e+00 3.0e+00&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp;&nbsp; 45<br>

PCApply&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 969 1.0 1.5379e+01 3.3 1.66e+08 3.3 0.0e+00

0.0e+00 0.0e+00 12 11&nbsp; 0&nbsp; 0&nbsp; 0&nbsp; 12 11&nbsp; 0&nbsp; 0&nbsp; 0&nbsp;&nbsp; 203<br>

------------------------------------------------------------------------------------------------------------------------<br>

<br>

Memory usage is given in bytes:<br>

<br>

Object Type&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Creations&nbsp;&nbsp; Destructions&nbsp;&nbsp; Memory&nbsp; Descendants'

Mem.<br>

<br>

--- Event Stage 0: Main Stage<br>

<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Matrix&nbsp;&nbsp;&nbsp;&nbsp; 4&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 4&nbsp;&nbsp; 17264420&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Index Set&nbsp;&nbsp;&nbsp;&nbsp; 5&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 5&nbsp;&nbsp;&nbsp; 1084120&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Vec&nbsp;&nbsp;&nbsp; 41&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 41&nbsp;&nbsp; 26675992&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Vec Scatter&nbsp;&nbsp;&nbsp;&nbsp; 1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Krylov Solver&nbsp;&nbsp;&nbsp;&nbsp; 2&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 17216&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Preconditioner&nbsp;&nbsp;&nbsp;&nbsp; 2&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 256&nbsp;&nbsp;&nbsp;&nbsp; 0<br>

========================================================================================================================<br>

Average time to get PetscTime(): 1.90735e-07<br>

Average time for MPI_Barrier(): 6.00815e-06<br>

Average time for zero size MPI_Send(): 5.42402e-05<br>

OptionTable: -log_summary<br>

Compiled without FORTRAN kernels<br>

Compiled with full precision matrices (default)<br>

sizeof(short) 2 sizeof(int) 4 sizeof(long) 8 sizeof(void*) 8

sizeof(PetscScalar) 8<br>

Configure run at: Tue Jan&nbsp; 8 22:22:08 2008<br>

<br>

<br>

<br>

Matthew Knepley wrote:

<blockquote

 cite="mid:a9f269830804151033q61b860d4x4e1cf09bcdf1024c@mail.gmail.com"

 type="cite">

  <pre wrap="">The convergence here is jsut horrendous. Have you tried using LU to check

your implementation? All the time is in the solve right now. I would first

try a direct method (at least on a small problem) and then try to understand

the convergence behavior. MUMPS can actually scale very well for big problems.

  Matt

  </pre>

  <br>

  <pre wrap=""><!---->

  </pre>

</blockquote>

</body>

</html>