<div class="gmail_quote">On Tue, Apr 24, 2012 at 15:36, William Gropp <span dir="ltr">&lt;<a href="mailto:wgropp@illinois.edu">wgropp@illinois.edu</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div id=":a4r">A lot of this had to do with wanting to make it possible for MPI_Accumulate to be executed entirely in hardware, respecting the various MPI one-sided operations and semantics, including the atomicity rules, and not requiring the execution of arbitrary user code.  This was not a concern for Reduce/Allreduce/Scan/Exscan/Reduce_scatter.</div>
</blockquote></div><br><div>Would it have been that problematic to run the built-in operations in hardware and do the others in software?</div>