<div dir="ltr">On Tue, Feb 12, 2013 at 6:06 PM, Tim Tautges <span dir="ltr"><<a href="mailto:tautges@mcs.anl.gov" target="_blank">tautges@mcs.anl.gov</a>></span> wrote:<br><div class="gmail_extra"><div class="gmail_quote">
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">I'm kind of surprised at the > 10k element crossover myself.  For the strong scaling cases, at high core counts, that's not terribly far from the number of DOFS per processor, is it?  I guess CPUs will be slower than the Xeon in most cases (BGx), or fewer (Titan), but still.<br>
</blockquote><div><br></div><div style>Which crossover are you referring to? The CPU versus GTX285 at about 20k dofs, but with only very small gains for another order of magnitude?</div><div style><br></div><div style>For 2D Laplace, we expect to see strong scaling peter out around a couple thousand dofs per core. It can go a little further on Blue Gene because the network is much faster and the cores are a bit slower.</div>
<div style><br></div><div style>Titan has a lot of (premium price) GPUs that you have to use to utilize the machine well, but it's unclear whether the architecture is delivering a science/dollars advantage, even if you ignore development costs to port and re-tune codes and the environment costs (it's more complicated to build and run, so it takes people longer to get running). I think the main justification is speculation about what future hardware will look like, not cost-effectiveness today.</div>
</div></div></div>