<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
  <meta content="text/html;charset=ISO-8859-1" http-equiv="Content-Type">
</head>
<body bgcolor="#ffffff" text="#000000">
<br>
<br>
Mihael Hategan wrote:
<blockquote cite="mid:1239297769.1717.27.camel@localhost" type="cite">
  <pre wrap="">On Thu, 2009-04-09 at 10:12 -0700, Ioan Raicu wrote:
  </pre>
  <blockquote type="cite">
    <blockquote type="cite">
      <pre wrap=""> 
      </pre>
    </blockquote>
    <pre wrap="">No workers sit idle, waiting for other workers to start. The resource 
allocation takes some amount of time to boot up the OS on each node, 
mount GPFS, start Falkon service, start Falkon workers, etc... see 
<a class="moz-txt-link-freetext" href="http://dev.globus.org/wiki/Image:Falkon-BGP-startup-time.jpg">http://dev.globus.org/wiki/Image:Falkon-BGP-startup-time.jpg</a>. Its true 
that there is some difference between the 1st worker starting, and the 
last worker starting, probably on the order of seconds to maybe minutes 
at the largest scale of 160K processors. If this is a concern, the idle 
time as the system starts up, you can start Swift before 100% of the 
system is operational. The system is partitioned in 64 node chunks, so, 
in theory, Swift could start as soon as 64 nodes are online. Although, 
this could also have its own problems.
    </pre>
  </blockquote>
  <pre wrap=""><!---->
This assumes a single site and exact knowledge of how to fit the
workload.
  </pre>
</blockquote>
Nope, its a single site if you want to start at the earliest possible
time, but once all nodes are started, it becomes a multi-site
allocation, where each site is a 64 node chunk of the allocation. <br>
<blockquote cite="mid:1239297769.1717.27.camel@localhost" type="cite">
  <pre wrap="">
I also assume this works when you have a reservation, otherwise you may
have better chances with smaller chunks.
  </pre>
</blockquote>
Up to 8K cores, we usually run without reservations. Beyond that, we do
get reservations. <br>
<blockquote cite="mid:1239297769.1717.27.camel@localhost" type="cite">
  <pre wrap="">

  </pre>
</blockquote>
<br>
<pre class="moz-signature" cols="72">-- 
===================================================
Ioan Raicu, Ph.D.
===================================================
Distributed Systems Laboratory
Computer Science Department
University of Chicago
1100 E. 58th Street, Ryerson Hall
Chicago, IL 60637
===================================================
Email: <a class="moz-txt-link-abbreviated" href="mailto:iraicu@cs.uchicago.edu">iraicu@cs.uchicago.edu</a>
Web:   <a class="moz-txt-link-freetext" href="http://www.cs.uchicago.edu/~iraicu">http://www.cs.uchicago.edu/~iraicu</a>
<a class="moz-txt-link-freetext" href="http://dev.globus.org/wiki/Incubator/Falkon">http://dev.globus.org/wiki/Incubator/Falkon</a>
<a class="moz-txt-link-freetext" href="http://dsl-wiki.cs.uchicago.edu/index.php/Main_Page">http://dsl-wiki.cs.uchicago.edu/index.php/Main_Page</a>
===================================================
===================================================
</pre>
</body>
</html>