<div dir="ltr">Hi <span style="font-size:12.8000001907349px">Mihael,</span><div><span style="font-size:12.8000001907349px"><br></span></div><div><span style="font-size:12.8000001907349px">Sorry to bother you again.</span><br><div><span style="font-size:12.8000001907349px"><br></span></div><div><span style="font-size:12.8000001907349px">You were right, after configuring the port forwarding the script is able to connect.</span></div><div><span style="font-size:12.8000001907349px"><br></span></div><div><span style="font-size:12.8000001907349px">But i still get an error "</span><span style="font-size:12.8000001907349px">Checksum does not match</span><span style="font-size:12.8000001907349px">".</span></div><div><span style="font-size:12.8000001907349px"><br></span></div><div><span style="font-size:12.8000001907349px">Here goes the content of the </span><span style="font-size:12.8000001907349px">~/coaster-bootstrap-xxx.log file:</span></div><div><span style="font-size:12.8000001907349px"><br></span></div><div><div style><span style="font-size:12.8000001907349px">using plain mode</span></div><div style><span style="font-size:12.8000001907349px">BS: <a href="http://189.12.232.9:50006">http://189.12.232.9:50006</a></span></div><div style><span style="font-size:12.8000001907349px">which: no gmd5sum in (/opt/openmpi/bin:/usr/lib64/qt-3.3/bin:/usr/local/bin:/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/sbin:/opt/bio/ncbi/bin:/opt/bio/mpiblast/bin:/opt/bio/EMBOSS/bin:/opt/bio/clustalw/bin:/opt/bio/tcoffee/bin:/opt/bio/hmmer/bin:/opt/bio/phylip/exe:/opt/bio/mrbayes:/opt/bio/fasta:/opt/bio/glimmer/bin:/opt/bio/glimmer/scripts:/opt/bio/gromacs/bin:/opt/bio/gmap/bin:/opt/bio/tigr/bin:/opt/bio/autodocksuite/bin:/opt/bio/wgs/bin:/opt/eclipse:/opt/ganglia/bin:/opt/ganglia/sbin:/usr/java/latest/bin:/opt/maven/bin:/opt/pdsh/bin:/opt/rocks/bin:/opt/rocks/sbin:/opt/condor/bin:/opt/condor/sbin:/opt/gridengine/bin/linux-x64)</span></div><div style><span style="font-size:12.8000001907349px">Expected checksum: 9b7bd5a96a2912cf8d06d1a2fd891620</span></div><div style><span style="font-size:12.8000001907349px">Computed checksum: 9b7bd5a96a2912cf8d06d1a2fd891620</span></div><div style><span style="font-size:12.8000001907349px">JAVA=/usr/java/latest/bin/java</span></div><div style><span style="font-size:12.8000001907349px">plain /usr/java/latest/bin/java -Djava=/usr/java/latest/bin/java -Xmx64M -DGLOBUS_TCP_PORT_RANGE= -DX509_USER_PROXY=/home/igor/.globus/sshproxy-1344874142-1432003400 -DX509_CERT_DIR=/home/igor/.globus/sshCAcert-1344874142-1432003400.pem -DGLOBUS_HOSTNAME=<a href="http://cluster.mmc.ufjf.br">cluster.mmc.ufjf.br</a> -Duser.home=/home/igor -jar /tmp/bootstrap.xTzo3v <a href="http://189.12.232.9:50006">http://189.12.232.9:50006</a> <a href="https://189.12.232.9:50005">https://189.12.232.9:50005</a> 11100954039</span></div><div style><span style="font-size:12.8000001907349px">Failed to download cog-provider-coaster-0.3.jar: java.lang.RuntimeException: Checksum does not match.</span></div><div style="font-size:12.8000001907349px"><br></div><div style="font-size:12.8000001907349px"><br></div><div style="font-size:12.8000001907349px">Thanks,</div><div style="font-size:12.8000001907349px">Igor</div></div></div></div><div class="gmail_extra"><br><div class="gmail_quote">2015-05-04 18:52 GMT-03:00 Mihael Hategan <span dir="ltr"><<a href="mailto:hategan@mcs.anl.gov" target="_blank">hategan@mcs.anl.gov</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><br>
Hi,<br>
<br>
In most cases (globus, coasters), the service side (legion in this case)<br>
needs the ability to connect back to the client (your home connection).<br>
<br>
Correct me if I'm wrong, but you are on a DSL line, behind a router with<br>
NAT. If so, you must configure the router to forward some incoming<br>
connections to the actual machine from which you are running swift from.<br>
Typically this is done by configuring a certain port range forwarding on<br>
the router (Yadu suggested GLOBUS_TCP_PORT_RANGE=50000,51000, so that<br>
port range should be matched on the router).<br>
<br>
The gist of it is that swift starts a simple shell script on legion that<br>
downloads a small java app from the client side and launches it. Said<br>
shell script logs things into ~/coaster-bootstrap-xxx.log files. The<br>
contents of the bootstrap logs is probably very useful here.<br>
<br>
If all of that goes well, the aforementioned small java app downloads<br>
the full coaster service from the client and starts it. Once started,<br>
the coaster service connects back to Swift. The last two parts log their<br>
doings in ~/.globus/coasters/*.log. Those can be useful, too, if they<br>
exist.<br>
<br>
Mihael<br>
<div><div class="h5"><br>
On Mon, 2015-05-04 at 18:27 -0300, Igor Russo wrote:<br>
> Hi Yadu,<br>
><br>
> Yes, i can ssh from my laptop to the cluster directly.<br>
><br>
> The coaster-bootstrap-*.log files are created in the remote system.<br>
><br>
> I'm sending the log file attached.<br>
><br>
> Thanks,<br>
> Igor<br>
><br>
> 2015-05-04 16:57 GMT-03:00 Yadu Nand Babuji <<a href="mailto:yadunand@uchicago.edu">yadunand@uchicago.edu</a>>:<br>
><br>
> >  Hi Igor,<br>
> ><br>
> > Are you able to ssh from your machine to legion directly without entering<br>
> > passwords ?<br>
> > Could you please send us a tarball of the runNNN directories for a failing<br>
> > run ?<br>
> ><br>
> > I've put the following settings in my ~/.ssh/config on my laptop and setup<br>
> > ssh keys on<br>
> > both socrates and legion. This allows me to use "ssh <a href="http://legion.rc.ucl.ac.uk" target="_blank">legion.rc.ucl.ac.uk</a>"<br>
> > and connect.<br>
> ><br>
> > Host <a href="http://legion.rc.ucl.ac.uk" target="_blank">legion.rc.ucl.ac.uk</a><br>
> >     User YOUR_USERNAME<br>
> >     Hostname <a href="http://legion.rc.ucl.ac.uk" target="_blank">legion.rc.ucl.ac.uk</a><br>
> >     ProxyCommand ssh socrates -W %h:%p<br>
> ><br>
> > Host socrates<br>
> >     Hostname <a href="http://socrates.ucl.ac.uk" target="_blank">socrates.ucl.ac.uk</a><br>
> >     User YOUR_USERNAME<br>
> >     ForwardAgent yes<br>
> ><br>
> > Thanks,<br>
> > Yadu<br>
> ><br>
> ><br>
> ><br>
> > On 05/04/2015 07:51 AM, Igor Russo wrote:<br>
> ><br>
> > Hi Yadu,<br>
> ><br>
> >  Thanks again.<br>
> ><br>
> >  I tried your suggestion. Now i'm not getting the previous error, but the<br>
> > jobs aren't being submitted:<br>
> ><br>
> >  RunID: run001<br>
> > Progress: Seg, 04 Mai 2015 09:32:54-0300<br>
> > Progress: Seg, 04 Mai 2015 09:32:55-0300  Submitting:1<br>
> > Progress: Seg, 04 Mai 2015 09:33:25-0300  Submitting:1<br>
> > Progress: Seg, 04 Mai 2015 09:33:55-0300  Submitting:1<br>
> > Progress: Seg, 04 Mai 2015 09:34:25-0300  Submitting:1<br>
> > Progress: Seg, 04 Mai 2015 09:34:55-0300  Submitting:1<br>
> > Progress: Seg, 04 Mai 2015 09:35:25-0300  Submitting:1<br>
> > Progress: Seg, 04 Mai 2015 09:35:55-0300  Submitting:1<br>
> > Progress: Seg, 04 Mai 2015 09:36:25-0300  Submitting:1<br>
> ><br>
> >  In the the log file, i notice the following errors:<br>
> ><br>
> >  2015-05-04 09:24:06,223-0300 INFO  ServiceManager Service does not<br>
> > appear to be registered with this manager<br>
> > 2015-05-04 09:24:06,223-0300 INFO  ServiceManager Coaster service ended.<br>
> > Reason: null<br>
> ><br>
> >  Thanks,<br>
> >  Igor<br>
> ><br>
> ><br>
> > 2015-05-01 17:47 GMT-03:00 Yadu Nand Babuji <<a href="mailto:yadunand@uchicago.edu">yadunand@uchicago.edu</a>>:<br>
> ><br>
> >>  Hi Igor,<br>
> >><br>
> >>  The remote connection system requires that the local machine you run<br>
> >> the swift client on has<br>
> >> a public ip address. It looks like swift was not able to guess it and set<br>
> >> it to <a href="http://igor-ubuntu:51251" target="_blank">http://igor-ubuntu:51251</a><br>
> >><br>
> >>  Could you retry running part04 after doing the next step, and please<br>
> >> make sure your environment has<br>
> >> these variables set whenever you run swift to remote systems :<br>
> >>  export GLOBUS_HOSTNAME=<PUBLIC_IP_OF_YOUR_MACHINE><br>
> >> export GLOBUS_TCP_PORT_RANGE=50000,51000<br>
> >><br>
> >>  Thanks,<br>
> >> Yadu<br>
> >><br>
> >><br>
> >> On 05/01/2015 02:29 PM, Igor Russo wrote:<br>
> >><br>
> >>  Hi Yadu,<br>
> >><br>
> >>  Thank you very much!<br>
> >><br>
> >>  I changed the config file with the data from my cluster.<br>
> >><br>
> >>  When executing the 4th part of Swift-tutorial, i'm getting the<br>
> >> following error:<br>
> >> "Failed to download bootstrap jar from ..."<br>
> >><br>
> >><br>
> >><br>
> >> --------------------------------------------------------------------------------<br>
> >><br>
> >>  RunID: run031<br>
> >>  Progress: Sex, 01 Mai 2015 15:40:42-0300<br>
> >> Progress: Sex, 01 Mai 2015 15:40:43-0300  Submitting:1<br>
> >><br>
> >>  Execution failed:<br>
> >> Exception in sort:<br>
> >>     Arguments: [-n, unsorted.txt]<br>
> >>     Host: mmc<br>
> >>     Directory: p4-run031/jobs/s/sort-go28d68m<br>
> >>  exception @ swift-int-staging.k, line: 165<br>
> >> Caused by:<br>
> >>  exception @ swift-int-staging.k, line: 160<br>
> >> Caused by: null<br>
> >> Caused by:<br>
> >> org.globus.cog.abstraction.impl.common.task.TaskSubmissionException: Could<br>
> >> not submit job<br>
> >> Caused by:<br>
> >> org.globus.cog.abstraction.impl.common.task.TaskSubmissionException: Could<br>
> >> not start coaster service<br>
> >> Caused by:<br>
> >> org.globus.cog.abstraction.impl.common.task.TaskSubmissionException: Task<br>
> >> ended before registration was received.<br>
> >> Failed to download bootstrap jar from <a href="http://igor-ubuntu:51251" target="_blank">http://igor-ubuntu:51251</a><br>
> >><br>
> >>  k:assign @ swift.k, line: 174<br>
> >> Caused by: Exception in sort:<br>
> >>     Arguments: [-n, unsorted.txt]<br>
> >>     Host: mmc<br>
> >>     Directory: p4-run031/jobs/s/sort-go28d68m<br>
> >>  exception @ swift-int-staging.k, line: 165<br>
> >> Caused by:<br>
> >>  exception @ swift-int-staging.k, line: 160<br>
> >> Caused by: null<br>
> >> Caused by:<br>
> >> org.globus.cog.abstraction.impl.common.task.TaskSubmissionException: Could<br>
> >> not submit job<br>
> >> Caused by:<br>
> >> org.globus.cog.abstraction.impl.common.task.TaskSubmissionException: Could<br>
> >> not start coaster service<br>
> >> Caused by:<br>
> >> org.globus.cog.abstraction.impl.common.task.TaskSubmissionException: Task<br>
> >> ended before registration was received.<br>
> >> Failed to download bootstrap jar from <a href="http://igor-ubuntu:51251" target="_blank">http://igor-ubuntu:51251</a><br>
> >><br>
> >><br>
> >> --------------------------------------------------------------------------------<br>
> >><br>
> >>  Thanks,<br>
> >> Igor<br>
> >><br>
> >> 2015-05-01 13:47 GMT-03:00 Yadu Nand Babuji <<a href="mailto:yadunand@uchicago.edu">yadunand@uchicago.edu</a>>:<br>
> >><br>
> >>>  Hi Igor,<br>
> >>><br>
> >>> Swift does support SGE clusters, and you can refer to the swift-tutorial<br>
> >>> for sample code and configurations from this link:<br>
> >>> <a href="https://github.com/swift-lang/swift-tutorial" target="_blank">https://github.com/swift-lang/swift-tutorial</a><br>
> >>><br>
> >>> Here's a sample config from our test-suite for Godzilla, an SGE cluster<br>
> >>> at UChicago:<br>
> >>><br>
> >>> <a href="https://github.com/swift-lang/swift-k/blob/master/tests/sites/godzilla/swift.conf" target="_blank">https://github.com/swift-lang/swift-k/blob/master/tests/sites/godzilla/swift.conf</a><br>
> >>> You could modify and add this config to the swift.conf file in the<br>
> >>> swift-tutorial to run<br>
> >>> Swift on any machine and execute on a remote SGE cluster.<br>
> >>><br>
> >>> SGE is a widely used resource manager and most sites have differences in<br>
> >>> their setups that make each site unique. If you run into issues with the<br>
> >>> default<br>
> >>> swift package, and could provide help in figuring out specifics of your<br>
> >>> cluster, we<br>
> >>> will help you adapt the Swift SGE provider to support your cluster.<br>
> >>><br>
> >>> Thanks,<br>
> >>> Yadu<br>
> >>><br>
> >>><br>
> >>><br>
> >>> On 04/28/2015 05:09 PM, Igor Russo wrote:<br>
> >>><br>
> >>>  Hi All,<br>
> >>><br>
> >>>  It is possible to use Swift with a remote SGE/OGE cluster?<br>
> >>><br>
> >>>  Regards,<br>
> >>> Igor<br>
> >>><br>
> >>><br>
> >>>  _______________________________________________<br>
</div></div>> >>> Swift-user mailing listSwift-user@ci.uchicago.eduhttps://<a href="http://lists.ci.uchicago.edu/cgi-bin/mailman/listinfo/swift-user" target="_blank">lists.ci.uchicago.edu/cgi-bin/mailman/listinfo/swift-user</a><br>
<span class="">> >>><br>
> >>><br>
> >>><br>
> >>> _______________________________________________<br>
> >>> Swift-user mailing list<br>
> >>> <a href="mailto:Swift-user@ci.uchicago.edu">Swift-user@ci.uchicago.edu</a><br>
> >>> <a href="https://lists.ci.uchicago.edu/cgi-bin/mailman/listinfo/swift-user" target="_blank">https://lists.ci.uchicago.edu/cgi-bin/mailman/listinfo/swift-user</a><br>
> >>><br>
> >><br>
> >><br>
> >><br>
> >> _______________________________________________<br>
</span>> >> Swift-user mailing listSwift-user@ci.uchicago.eduhttps://<a href="http://lists.ci.uchicago.edu/cgi-bin/mailman/listinfo/swift-user" target="_blank">lists.ci.uchicago.edu/cgi-bin/mailman/listinfo/swift-user</a><br>
<span class="">> >><br>
> >><br>
> >><br>
> >> _______________________________________________<br>
> >> Swift-user mailing list<br>
> >> <a href="mailto:Swift-user@ci.uchicago.edu">Swift-user@ci.uchicago.edu</a><br>
> >> <a href="https://lists.ci.uchicago.edu/cgi-bin/mailman/listinfo/swift-user" target="_blank">https://lists.ci.uchicago.edu/cgi-bin/mailman/listinfo/swift-user</a><br>
> >><br>
> ><br>
> ><br>
> ><br>
> > _______________________________________________<br>
</span>> > Swift-user mailing listSwift-user@ci.uchicago.eduhttps://<a href="http://lists.ci.uchicago.edu/cgi-bin/mailman/listinfo/swift-user" target="_blank">lists.ci.uchicago.edu/cgi-bin/mailman/listinfo/swift-user</a><br>
<div class="HOEnZb"><div class="h5">> ><br>
> ><br>
> ><br>
> > _______________________________________________<br>
> > Swift-user mailing list<br>
> > <a href="mailto:Swift-user@ci.uchicago.edu">Swift-user@ci.uchicago.edu</a><br>
> > <a href="https://lists.ci.uchicago.edu/cgi-bin/mailman/listinfo/swift-user" target="_blank">https://lists.ci.uchicago.edu/cgi-bin/mailman/listinfo/swift-user</a><br>
> ><br>
> _______________________________________________<br>
> Swift-user mailing list<br>
> <a href="mailto:Swift-user@ci.uchicago.edu">Swift-user@ci.uchicago.edu</a><br>
> <a href="https://lists.ci.uchicago.edu/cgi-bin/mailman/listinfo/swift-user" target="_blank">https://lists.ci.uchicago.edu/cgi-bin/mailman/listinfo/swift-user</a><br>
<br>
<br>
<br>
</div></div></blockquote></div><br></div>