Hi Mihael,<div><br></div><div>I could reproduce this timeout exception on OSG with catsn Swift jobs.</div><div><br></div><div>These are 100 jobs with a data size of 10MB each. So, 2000MB of data movement in all.</div><div>
<br></div><div>I tried with 1 worker running on a single OSG site. I tried three different OSG sites: Nebraska, UChicago and RENCI. </div><div><br></div><div>In each of these cases, I run into the following timeout after ~4 minutes of run (15-70 jobs complete during this period) . :</div>
<div><div><br></div><div>Timeout</div><div>org.globus.cog.karajan.workflow.service.TimeoutException: Handler(562, PUT): timed out receiving request. Last time 940817-011255.807, now: 120115-194100.072</div><div><span class="Apple-tab-span" style="white-space:pre">        </span>at org.globus.cog.karajan.workflow.service.handlers.RequestHandler.handleTimeout(RequestHandler.java:124)</div>
<div><span class="Apple-tab-span" style="white-space:pre">      </span>at org.globus.cog.karajan.workflow.service.channels.AbstractKarajanChannel.checkTimeouts(AbstractKarajanChannel.java:131)</div><div><span class="Apple-tab-span" style="white-space:pre">    </span>at org.globus.cog.karajan.workflow.service.channels.AbstractKarajanChannel.checkTimeouts(AbstractKarajanChannel.java:123)</div>
<div><span class="Apple-tab-span" style="white-space:pre">      </span>at org.globus.cog.karajan.workflow.service.channels.AbstractKarajanChannel$1.run(AbstractKarajanChannel.java:116)</div><div><span class="Apple-tab-span" style="white-space:pre">    </span>at java.util.TimerThread.mainLoop(Timer.java:512)</div>
<div><span class="Apple-tab-span" style="white-space:pre">      </span>at java.util.TimerThread.run(Timer.java:462)</div><div>Command(168, SUBMITJOB): handling reply timeout; sendReqTime=120115-193900.255, sendTime=120115-193900.255, now=120115-194100.416, channel=SC-null</div>
<div><br></div></div><div>This is followed by messages similar to the above last line but the progress of workflow halts.</div><div><br></div><div>Here is the tarball of the experiment: <a href="http://ci.uchicago.edu/~ketan/catsn-exp-formihael.tgz">http://ci.uchicago.edu/~ketan/catsn-exp-formihael.tgz</a></div>
<div><div><br></div><div>It contains a README which has the steps to run: basically start-service on localhost -> start worker on OSG site -> run swift</div><div><br></div><div>Regards,</div>-- <br>Ketan<br><br><br>

</div>