Hi everybody:<br><br><br>   I wonder to most MPI codes, which is the performance bottleneck, the message latency or the B/W?<br><br> 
I am doing research to optimize the cache coherent shared memory architecture (CMP) to support message passing workloads more efficiently. I am trying to reduce the latency for message data, however later I
realized that maybe the B/W is the real bottleneck. I have heard the
comments that most well-written MPI codes  are not latency-sensitive
but B/W sensitive. If this is true,  instead of reducing the latency for single message, making sure large chunk of data transferring faster(larger B/W) is the right way to improve
performance.<br>
<br> Please feel free to give some comments about this. If someone farmilar with the well-written legacy MPI codes can give me some suggestions, I&#39;ll find it useful.<br><br>  Thank you in advance.<br><br>  Junli<br clear="all">
<br>-- <br>************************************************<br>Junli Gu--谷俊丽<br>Coordinate Science Lab<br>University of Illinois at Urbana-Champaign<br>************************************************<br>