yeah, latest build works...i don't get a warning when specifying 1 job per node with 16way pe. <br><br><div class="gmail_quote">On Wed, Dec 21, 2011 at 11:54 PM, David Kelly <span dir="ltr"><<a href="mailto:davidk@ci.uchicago.edu">davidk@ci.uchicago.edu</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Sarah,<br>
<br>
Can you please give this another try? I believe it should work now with your original sites.xml.<br>
<div class="im"><br>
David<br>
<br>
----- Original Message -----<br>
> From: "Sarah Kenny" <<a href="mailto:skenny@uci.edu">skenny@uci.edu</a>><br>
> To: "Ketan Maheshwari" <<a href="mailto:ketancmaheshwari@gmail.com">ketancmaheshwari@gmail.com</a>><br>
> Cc: "Swift Devel" <<a href="mailto:swift-devel@ci.uchicago.edu">swift-devel@ci.uchicago.edu</a>>, "Swift User" <<a href="mailto:swift-user@ci.uchicago.edu">swift-user@ci.uchicago.edu</a>><br>

> Sent: Wednesday, December 21, 2011 4:50:48 PM<br>
> Subject: Re: [Swift-devel] [Swift-user] swift on ranger<br>
</div><div><div></div><div class="h5">> yr right ketan, if i change it to: <profile namespace="globus"<br>
> key="jobsPerNode">16</profile> the warning message goes away. however,<br>
> there are times i don't want to run 16 jobs per node...e.g. bcs a<br>
> single job needs all the available memory so even though the node has<br>
> 16 processors i can't actually use them all. so perhaps this is just a<br>
> scheduling issue with ranger/sge in that they don't want you to submit<br>
> a job that's going to leave processors idle? that seems a bit<br>
> restrictive though...<br>
><br>
><br>
> On Wed, Dec 21, 2011 at 7:58 AM, Ketan Maheshwari <<br>
> <a href="mailto:ketancmaheshwari@gmail.com">ketancmaheshwari@gmail.com</a> > wrote:<br>
><br>
><br>
> Sarah,<br>
><br>
> I checked my sites.xml. The only difference between yours and mine<br>
> being the value of jobspernode which is 16 in my case. I have had this<br>
> value in other multiples of 16 which has worked fine for me.<br>
><br>
><br>
><br>
><br>
><br>
><br>
> On Wed, Dec 21, 2011 at 6:57 AM, Sarah Kenny < <a href="mailto:skenny@uci.edu">skenny@uci.edu</a> > wrote:<br>
><br>
><br>
><br>
><br>
><br>
> getting this when submitting to ranger with both the latest and our<br>
> previous version of swift (swift-r5259 cog-r3313)<br>
><br>
> Final status: time: Wed, 21 Dec 2011 04:49:15 -0800 Finished<br>
> successfully:100<br>
> The following warnings have occurred:<br>
> 1.<br>
> org.globus.cog.abstraction.impl.common.task.TaskSubmissionException:<br>
> Cannot submit job: Could not submit job (qsub reported an exit code of<br>
> 1).<br>
> --------------------------------------------------------------------------<br>
> Welcome to TACC's Ranger System, an NSF XD Resource<br>
> ----------------------------------------------------------------------------><br>
> Checking that you specified -V...--> Checking that you specified a<br>
> time limit...--> Checking that you specified a queue...--> Setting<br>
> project...--> Checking that you specified a parallel environment...--><br>
> Checking that you specified a valid parallel environment name...--><br>
> Checking that the minimum and maximum PE counts are the same...--><br>
> Checking that the number of PEs requested is<br>
> valid...------------------> Rejecting job <------------------Your slot<br>
> (or core) request is not a multiple of 16.Syntax: -pe <pe_name><br>
> <n>where <n> is a multiple of<br>
> 16.-----------------------------------------------------<br>
> Unable to run job: JSV rejected job.Exiting.<br>
><br>
> at<br>
> org.globus.cog.abstraction.impl.scheduler.common.AbstractJobSubmissionTaskHandler.submit(AbstractJobSubmissionTaskHandler.java:63)<br>
> at<br>
> org.globus.cog.abstraction.impl.common.AbstractTaskHandler.submit(AbstractTaskHandler.java:45)<br>
> at<br>
> org.globus.cog.abstraction.impl.common.task.ExecutionTaskHandler.submit(ExecutionTaskHandler.java:57)<br>
> at<br>
> org.globus.cog.abstraction.coaster.service.job.manager.LocalQueueProcessor.run(LocalQueueProcessor.java:40)<br>
> Caused by:<br>
> org.globus.cog.abstraction.impl.scheduler.common.ProcessException:<br>
> Could not submit job (qsub reported an exit code of 1).<br>
> --------------------------------------------------------------------------<br>
> Welcome to TACC's Ranger System, an NSF XD Resource<br>
> ----------------------------------------------------------------------------><br>
> Checking that you specified -V...--> Checking that you specified a<br>
> time limit...--> Checking that you specified a queue...--> Setting<br>
> project...--> Checking that you specified a parallel environment...--><br>
> Checking that you specified a valid parallel environment name...--><br>
> Checking that the minimum and maximum PE counts are the same...--><br>
> Checking that the number of PEs requested is<br>
> valid...------------------> Rejecting job <------------------Your slot<br>
> (or core) request is not a multiple of 16.Syntax: -pe <pe_name><br>
> <n>where <n> is a multiple of<br>
> 16.-----------------------------------------------------<br>
> Unable to run job: JSV rejected job.Exiting.<br>
><br>
> at<br>
> org.globus.cog.abstraction.impl.scheduler.common.AbstractExecutor.start(AbstractExecutor.java:108)<br>
> at<br>
> org.globus.cog.abstraction.impl.scheduler.common.AbstractJobSubmissionTaskHandler.submit(AbstractJobSubmissionTaskHandler.java:53)<br>
> ... 3 more<br>
><br>
> ################### sites file<br>
><br>
> <config><br>
> <pool handle="RANGER"><br>
> <execution provider="coaster" jobManager="gt2:SGE" url="<br>
> <a href="http://gatekeeper.ranger.tacc.teragrid.org" target="_blank">gatekeeper.ranger.tacc.teragrid.org</a> "/><br>
> <filesystem provider="gsiftp" url="gsiftp://<br>
</div></div>> <a href="http://gridftp.ranger.tacc.teragrid.org" target="_blank">gridftp.ranger.tacc.teragrid.org</a> "/><br>
<div><div></div><div class="h5">> <profile namespace="globus" key="maxtime">86400</profile><br>
> <profile namespace="globus" key="maxWallTime">02:00:00</profile><br>
> <profile namespace="globus" key="jobsPerNode">1</profile><br>
> <profile namespace="globus" key="nodeGranularity">64</profile><br>
> <profile namespace="globus" key="maxNodes">4096</profile><br>
> <profile namespace="globus" key="queue">normal</profile><br>
> <profile namespace="karajan" key="jobThrottle">1.28</profile><br>
> <profile namespace="globus" key="project">TG-DBS080004N</profile><br>
> <profile namespace="globus" key="pe">16way</profile><br>
> <profile namespace="karajan" key="initialScore">10000</profile><br>
> <workdirectory>/work/00043/tg457040/swiftwork</workdirectory><br>
> </pool><br>
> </config><br>
><br>
> same settings we've been using for a while, i'm not sure why this<br>
> seems to be popping up now, but it's rather consistent. all jobs are<br>
> finishing successfully, so it's rather confusing...any idea what i<br>
> might be missing here?<br>
><br>
> thanks<br>
> ~sk<br>
><br>
><br>
><br>
><br>
><br>
><br>
> _______________________________________________<br>
> Swift-devel mailing list<br>
> <a href="mailto:Swift-devel@ci.uchicago.edu">Swift-devel@ci.uchicago.edu</a><br>
> <a href="https://lists.ci.uchicago.edu/cgi-bin/mailman/listinfo/swift-devel" target="_blank">https://lists.ci.uchicago.edu/cgi-bin/mailman/listinfo/swift-devel</a><br>
><br>
><br>
><br>
><br>
> --<br>
> Ketan<br>
><br>
><br>
><br>
> _______________________________________________<br>
> Swift-user mailing list<br>
> <a href="mailto:Swift-user@ci.uchicago.edu">Swift-user@ci.uchicago.edu</a><br>
> <a href="https://lists.ci.uchicago.edu/cgi-bin/mailman/listinfo/swift-user" target="_blank">https://lists.ci.uchicago.edu/cgi-bin/mailman/listinfo/swift-user</a><br>
><br>
><br>
><br>
> --<br>
> Sarah Kenny<br>
> Programmer ~ Brain Circuits Laboratory ~ Rm 2224 Bio Sci III<br>
> University of California Irvine, Dept. of Neurology ~ <a href="tel:773-818-8300" value="+17738188300">773-818-8300</a><br>
><br>
><br>
> _______________________________________________<br>
> Swift-devel mailing list<br>
> <a href="mailto:Swift-devel@ci.uchicago.edu">Swift-devel@ci.uchicago.edu</a><br>
> <a href="https://lists.ci.uchicago.edu/cgi-bin/mailman/listinfo/swift-devel" target="_blank">https://lists.ci.uchicago.edu/cgi-bin/mailman/listinfo/swift-devel</a><br>
_______________________________________________<br>
Swift-user mailing list<br>
<a href="mailto:Swift-user@ci.uchicago.edu">Swift-user@ci.uchicago.edu</a><br>
<a href="https://lists.ci.uchicago.edu/cgi-bin/mailman/listinfo/swift-user" target="_blank">https://lists.ci.uchicago.edu/cgi-bin/mailman/listinfo/swift-user</a><br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br>Sarah Kenny<br>Programmer ~ Brain Circuits Laboratory ~ Rm 2224 Bio Sci III<br>University of California Irvine, Dept. of Neurology ~ 773-818-8300<br><br>