log is on engage-submit<div>/home/hockyg/swift_logs/glassRunCavities-20100826-1718-7gi0dzs1.log<br><br><div class="gmail_quote">On Fri, Aug 27, 2010 at 12:35 AM, Glen Hocky <span dir="ltr"><<a href="mailto:hockyg@gmail.com">hockyg@gmail.com</a>></span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">Yes nominally the same error but it's not at the beginning but in the<br>
middle now for some reason. I think it's a mid-stated error message.<br>
I'll attach the log soon<br>
<div><div></div><div class="h5"><br>
On Aug 27, 2010, at 12:11 AM, Michael Wilde <<a href="mailto:wilde@mcs.anl.gov">wilde@mcs.anl.gov</a>> wrote:<br>
<br>
> Glen, I wonder if whats happening here is that Swift will retry and lazily run past *job* errors, but the error below (a mapping error) is maybe being treated as an error in Swift's interpretation of the script itself, and this causes an immediate halt to execution?<br>


><br>
> Can anyone confirm that this is whats happening, and if it is the expected behavior?<br>
><br>
> Also, Glen, 2 questions:<br>
><br>
> 1) Isn't the error below the one that was fixed by Mihael in a recent revision - the same one I looked at earlier in the week?<br>
><br>
> 2) Do you know what errors the "Failed but can retry:8" message is referring to?<br>
><br>
> Where is the log/run directory for this run?  How long did it take to get the 589 jobs finished?  It would be good to start plotting these large multi-site runs to get a sense of how the scheduler is doing.<br>
><br>
> - Mike<br>
><br>
><br>
> ----- "Glen Hocky" <<a href="mailto:hockyg@uchicago.edu">hockyg@uchicago.edu</a>> wrote:<br>
><br>
>> here's the result of my 13 site run that ran while i was out this<br>
>> evening. It did pretty well!<br>
>> but seems to have that problem of not quite lazy errors<br>
>> ........<br>
>> Progress: Submitting:3 Submitted:262 Active:147 Checking status:3<br>
>> Stage out:1 Finished successfully:586<br>
>> Progress: Submitting:3 Submitted:262 Active:144 Checking status:4<br>
>> Stage out:2 Finished successfully:587<br>
>> Progress: Submitting:3 Submitted:262 Active:142 Stage out:2 Finished<br>
>> successfully:587 Failed but can retry:6<br>
>> Progress: Submitting:3 Submitted:262 Active:140 Finished<br>
>> successfully:589 Failed but can retry:8<br>
>> Failed to transfer wrapper log from<br>
>> glassRunCavities-20100826-1718-7gi0dzs1/info/5 on<br>
>> <a href="http://UCHC_CBG_vdgateway.vcell.uchc.edu" target="_blank">UCHC_CBG_vdgateway.vcell.uchc.edu</a><br>
>> Execution failed:<br>
>> org.griphyn.vdl.mapping.InvalidPathException: Invalid path (..logfile)<br>
>> for org.griphyn.vdl.mapping.DataNode identifier<br>
>> <a href="mailto:tag%3Abenc@ci.uchicago.edu">tag:benc@ci.uchicago.edu</a><br>
>> ,2008:swift:dataset:20100826-1718-sznq1qr2:720000002968 type GlassOut<br>
>> with no value at dataset=modelOut path=[3][1][11] (not closed)<br>
><br>
> --<br>
> Michael Wilde<br>
> Computation Institute, University of Chicago<br>
> Mathematics and Computer Science Division<br>
> Argonne National Laboratory<br>
><br>
</div></div></blockquote></div><br></div>