<html>
  <head>
    <meta content="text/html; charset=ISO-8859-1"
      http-equiv="Content-Type">
  </head>
  <body bgcolor="#FFFFFF" text="#000000">
    Matt/Barry<br>
    <br>
    My intention was to make sure that the code is bug free and since
    PETSc was pre-installed on the cluster with various compilers it was
    easier to test quickly rather than build all combinations myself.
    Performance is of absolutely no concern.<br>
    <br>
    Things were working fine with 3.1 but recently the OS (Cray Linux
    Env) was upgraded and so was PETSc (to 3.2).<br>
    <br>
    Matt<br>
    <br>
    I am attaching entire output.<br>
    <br>
    Tabrez<br>
    <br>
    ---<br>
    <br>
    stali@krakenpf2:~/meshes&gt; which xterm<br>
    /usr/bin/xterm<br>
    stali@krakenpf2:~/meshes&gt; aprun -n 1 ./defmod -f
    2d_point_load_dyn_abc.inp -on_error_attach_debugger<br>
    &nbsp;Reading input ...<br>
    &nbsp;Reading mesh data ...<br>
    &nbsp;Forming [K] ...<br>
    &nbsp;Forming [M] &amp; [M]^-1 ...<br>
    &nbsp;Applying constraints ...<br>
    &nbsp;Forming RHS ...<br>
    &nbsp;Setting up solver ...<br>
    &nbsp;Solving ...<br>
    &nbsp; Time Step 0<br>
    [0]PETSC ERROR:
    ------------------------------------------------------------------------<br>
    [0]PETSC ERROR: Caught signal number 11 SEGV: Segmentation
    Violation, probably memory access out of range<br>
    [0]PETSC ERROR: Try option -start_in_debugger or
    -on_error_attach_debugger<br>
    [0]PETSC ERROR: or see
    <a class="moz-txt-link-freetext" href="http://www.mcs.anl.gov/petsc/petsc-as/documentation/faq.html#valgrind">http://www.mcs.anl.gov/petsc/petsc-as/documentation/faq.html#valgrind</a>[0]PETSC
    ERROR: or try <a class="moz-txt-link-freetext" href="http://valgrind.org">http://valgrind.org</a> on GNU/linux and Apple Mac OS X to
    find memory corruption errors<br>
    [0]PETSC ERROR: configure using --with-debugging=yes, recompile,
    link, and run <br>
    [0]PETSC ERROR: to get more information on the crash.<br>
    [0]PETSC ERROR: User provided function() line 0 in unknown directory
    unknown file&nbsp; <br>
    [0]PETSC ERROR: PETSC: Attaching gdb to ./defmod of pid 26164 on
    display :0.0 on machine nid03538<br>
    Unable to start debugger in xterm: No such file or directory<br>
    aborting job:<br>
    application called MPI_Abort(MPI_COMM_WORLD, 0) - process 0<br>
    _pmii_daemon(SIGCHLD): [NID 03538] [c12-3c2s4n2] [Mon Apr&nbsp; 2
    22:50:09 2012] PE 0 exit signal Aborted<br>
    Application 134950 exit codes: 134<br>
    Application 134950 resources: utime ~1s, stime ~0s<br>
    <br>
    On 04/02/2012 09:04 PM, Matthew Knepley wrote:
    <blockquote
cite="mid:CAMYG4G=H_GPVjtWqwJQ=v4y18acj5W1Kwaf7k3pO6mVvB=-83Q@mail.gmail.com"
      type="cite">On Mon, Apr 2, 2012 at 8:57 PM, Barry Smith <span
        dir="ltr">&lt;<a moz-do-not-send="true"
          href="mailto:bsmith@mcs.anl.gov">bsmith@mcs.anl.gov</a>&gt;</span>
      wrote:<br>
      <div class="gmail_quote">
        <blockquote class="gmail_quote" style="margin:0 0 0
          .8ex;border-left:1px #ccc solid;padding-left:1ex">
          <div class="im"><br>
            On Apr 2, 2012, at 8:10 PM, Tabrez Ali wrote:<br>
            <br>
            &gt; Hello<br>
            &gt;<br>
            &gt; I am trying to debug a program using the switch
            '-on_error_attach_debugger' but &nbsp;the vendor/sysadmin built
            PETSc 3.2.00 is unable to start the debugger in xterm (see
            text below). But xterm is installed. What am I doing wrong?<br>
            &gt;<br>
            &gt; Btw the segfault happens during a call to MatMult but
            only with vendor/sysadmin supplied PETSc 3.2 with PGI and
            Intel compilers only and _not_ with CRAY or GNU compilers.<br>
            <br>
          </div>
          &nbsp; My advice, blow off "the vendor/sysadmin supplied PETSc 3.2"
          and just built it yourself so you can get real work done
          instead of trying to debug their mess. &nbsp; I promise the vendor
          one is not like a billion times faster or anything.</blockquote>
        <div><br>
        </div>
        <div>If you want to justify this to anyone (like a funder), just
          run both on ex5 for a large size and look at the flops on
          MatMult. That</div>
        <div>is probably your dominant cost (or your PC).</div>
        <div><br>
        </div>
        <div>&nbsp; &nbsp;Matt</div>
        <div>&nbsp;</div>
        <blockquote class="gmail_quote" style="margin:0 0 0
          .8ex;border-left:1px #ccc solid;padding-left:1ex"><span
            class="HOEnZb"><font color="#888888"><br>
              &nbsp; Barry<br>
            </font></span>
          <div class="HOEnZb">
            <div class="h5"><br>
              <br>
              <br>
              &gt;<br>
              &gt; I also dont get the segfault if I build PETSc 3.2-p7
              myself with PGI/Intel compilers.<br>
              &gt;<br>
              &gt; Any ideas on how to diagnose the problem?
              Unfortunately I cannot seem to run valgrind on this
              particular machine.<br>
              &gt;<br>
              &gt; Thanks in advance.<br>
              &gt;<br>
              &gt; Tabrez<br>
              &gt;<br>
              &gt; ---<br>
              &gt;<br>
              &gt; stali@krakenpf1:~/meshes&gt; which xterm<br>
              &gt; /usr/bin/xterm<br>
              &gt; stali@krakenpf1:~/meshes&gt; aprun -n 1 ./defmod -f
              2d_point_load_dyn_abc.inp -on_error_attach_debugger<br>
              &gt; ...<br>
              &gt; ...<br>
              &gt; ...<br>
              &gt; [0]PETSC ERROR:
              ------------------------------------------------------------------------<br>
              &gt; [0]PETSC ERROR: Caught signal number 11 SEGV:
              Segmentation Violation, probably memory access out of
              range<br>
              &gt; [0]PETSC ERROR: Try option -start_in_debugger or
              -on_error_attach_debugger<br>
              &gt; [0]PETSC ERROR: or see <a moz-do-not-send="true"
href="http://www.mcs.anl.gov/petsc/petsc-as/documentation/faq.html#valgrind[0]PETSC"
                target="_blank">http://www.mcs.anl.gov/petsc/petsc-as/documentation/faq.html#valgrind[0]PETSC</a>
              ERROR: or try <a moz-do-not-send="true"
                href="http://valgrind.org" target="_blank">http://valgrind.org</a>
              on GNU/linux and Apple Mac OS X to find memory corruption
              errors<br>
              &gt; [0]PETSC ERROR: configure using --with-debugging=yes,
              recompile, link, and run<br>
              &gt; [0]PETSC ERROR: to get more information on the crash.<br>
              &gt; [0]PETSC ERROR: User provided function() line 0 in
              unknown directory unknown file<br>
              &gt; [0]PETSC ERROR: PETSC: Attaching gdb to ./defmod of
              pid 32384 on display localhost:20.0 on machine nid10649<br>
              &gt; Unable to start debugger in xterm: No such file or
              directory<br>
              &gt; aborting job:<br>
              &gt; application called MPI_Abort(MPI_COMM_WORLD, 0) -
              process 0<br>
              &gt; _pmii_daemon(SIGCHLD): [NID 10649] [c23-3c0s6n1] [Mon
              Apr &nbsp;2 13:06:48 2012] PE 0 exit signal Aborted<br>
              &gt; Application 133198 exit codes: 134<br>
              &gt; Application 133198 resources: utime ~1s, stime ~0s<br>
              <br>
            </div>
          </div>
        </blockquote>
      </div>
      <br>
      <br clear="all">
      <div><br>
      </div>
      -- <br>
      What most experimenters take for granted before they begin their
      experiments is infinitely more interesting than any results to
      which their experiments lead.<br>
      -- Norbert Wiener<br>
    </blockquote>
    <br>
  </body>
</html>