<div class="gmail_quote">On Tue, Jan 3, 2012 at 16:44, Jack Poulson <span dir="ltr"><<a href="mailto:jack.poulson@gmail.com">jack.poulson@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div id=":w4">It is possible, though unlikely that the BLAS dot could be faster than the BLAS nrm2, though I am skeptical. The reason is that the result of dnrm2 on a vector u is more stable than the square root of the inner product of u with itself via ddot, as it scales the temporary products of the norm to make the computation more accurate:<br>

<a href="http://www.netlib.org/blas/dnrm2.f" target="_blank">http://www.netlib.org/blas/dnrm2.f</a></div></blockquote><div><br></div><div>Ah, thanks for pointing this out.</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div id=":w4"><br><br>Thus, if you don't care about accuracy, then it is _possible_ that ddot would be faster, but i doubt it, and it is likely a bad idea to give up on some stability.</div></blockquote></div><br><div>
Agreed.</div>