On Wed, Oct 17, 2012 at 10:50 AM, Hong Zhang <span dir="ltr"><<a href="mailto:hzhang@mcs.anl.gov" target="_blank">hzhang@mcs.anl.gov</a>></span> wrote:<br><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

<div>Lately, we added a new implementation of MatTransposeMatMult() in petsc-dev</div>
<div>which is shown much faster than released MatTransposeMatMult().</div><div>You might give it a try by</div><div>1. install petsc-dev (see <a href="http://www.mcs.anl.gov/petsc/developers/index.html" target="_blank">http://www.mcs.anl.gov/petsc/developers/index.html</a>)</div>


<div>2. run your code with option '<span style="color:rgb(34,34,34);font-size:13px;font-family:'courier new',monospace">-mattransposematmult_</span><span style="color:rgb(34,34,34);font-size:13px;font-family:'courier new',monospace">viamatmatmult 1'</span></div>


<div><span style="color:rgb(34,34,34);font-size:13px;font-family:'courier new',monospace">Let us know what you get.</span></div></blockquote></div><div><br></div><div><div>For the time-being, this will only work with non-broken MPI datatypes.</div>
<div><br></div><div><a href="https://svn.open-mpi.org/trac/ompi/ticket/2656">https://svn.open-mpi.org/trac/ompi/ticket/2656</a></div><div><a href="https://svn.open-mpi.org/trac/ompi/ticket/1905">https://svn.open-mpi.org/trac/ompi/ticket/1905</a></div>
</div>