<HTML dir=ltr><HEAD><TITLE>RE: [Swift-user] errors in file transfer</TITLE>
<META http-equiv=Content-Type content="text/html; charset=unicode">
<META content="MSHTML 6.00.6000.16825" name=GENERATOR></HEAD>
<BODY>
<DIV id=idOWAReplyText68637 dir=ltr>
<DIV dir=ltr><FONT face=Arial color=#000000 size=2>Hi Mihael,</FONT></DIV>
<DIV dir=ltr><FONT face=Arial size=2></FONT> </DIV>
<DIV dir=ltr><FONT face=Arial size=2>When I do qstat, it shows the following line for all my jobs in the queue:</FONT></DIV>
<DIV dir=ltr><FONT face=Arial size=2></FONT> </DIV>
<DIV dir=ltr><FONT face=Arial size=2>937872.abem5              null             yuechen                0 Q(null) normal</FONT></DIV>
<DIV dir=ltr><FONT face=Arial size=2></FONT> </DIV>
<DIV dir=ltr><FONT face=Arial size=2>It looks like no job is running. </FONT></DIV>
<DIV dir=ltr><FONT face=Arial size=2></FONT> </DIV>
<DIV dir=ltr><FONT face=Arial size=2>I did the qstat -q. Should I use the following line instead in sites.xml for shorter Walltime?</FONT></DIV>
<DIV dir=ltr><FONT face=Arial size=2></FONT> </DIV>
<DIV dir=ltr><FONT face=Arial size=2><FONT face="Times New Roman"><profile namespace="globus" key="queue">debug</profile></FONT><BR></FONT></DIV>
<DIV dir=ltr><FONT face=Arial size=2>I will send email to <A href="mailto:help@teragrid.org">help@teragrid.org</A> about the Bigred certificate problem.</FONT></DIV>
<DIV dir=ltr><FONT face=Arial size=2></FONT> </DIV>
<DIV dir=ltr><FONT face=Arial size=2>Thanks!</FONT></DIV>
<DIV dir=ltr><FONT face=Arial size=2></FONT> </DIV>
<DIV dir=ltr><FONT face=Arial size=2>Chen, Yue</DIV></FONT>
<DIV dir=ltr><FONT face=Arial size=2></FONT> </DIV>
<DIV dir=ltr> </DIV></DIV>
<DIV dir=ltr><BR>
<HR tabIndex=-1>
<FONT face=Tahoma size=2><B>From:</B> Mihael Hategan [mailto:hategan@mcs.anl.gov]<BR><B>Sent:</B> Wed 4/29/2009 4:23 PM<BR><B>To:</B> Yue, Chen - BMD<BR><B>Cc:</B> swift user<BR><B>Subject:</B> RE: [Swift-user] errors in file transfer<BR></FONT><BR></DIV>
<DIV>
<P><FONT size=2>On Wed, 2009-04-29 at 16:06 -0500, Yue, Chen - BMD wrote:<BR>> Hi Mihael,<BR>> <BR>> I deleted the following line in my sites.xml file for NCSA_Abe and the<BR>> wrapper transfer warnings are gone.<BR>> <BR>> <profile namespace="globus" key="queue">fast</profile><BR>> <BR>> I can also find jobs queuing on Abe. However, after quite a while, no<BR>> job returned. I guess it is because I didn't set a priority and all<BR>> the jobs are waiting.<BR><BR>When you do qstat, are your jobs in a queued state?<BR><BR>>  Is there other way to set priority?<BR><BR>You should be able to specify the queue. The only problem is that you<BR>are specifying a queue that doesn't exist on Abe.<BR><BR>This is what I've found online:<BR><A href="http://www.ncsa.uiuc.edu/UserInfo/Resources/Hardware/Intel64Cluster/Doc/Jobs.html#Queues">http://www.ncsa.uiuc.edu/UserInfo/Resources/Hardware/Intel64Cluster/Doc/Jobs.html#Queues</A><BR><BR>You can also log in, and do a qstat -q, which will show the following:<BR>[hategan@honest2 ~]$ qstat -q<BR><BR>server: abem5.ncsa.uiuc.edu<BR><BR>Queue            Memory CPU Time Walltime Node  Run Que Lm  State<BR>---------------- ------ -------- -------- ----  --- --- --  -----<BR>normal             --      --    48:00:00   600  82 928 --   E R<BR>iacat2             --      --    241:00:0   --    0  20 --   E R<BR>indprio            --      --    48:00:00   600   0   0 --   E R<BR>long               --      --    168:00:0   600  13  15 --   E R<BR>iacat              --      --    241:00:0   --    0   0 --   E R<BR>industrial         --      --    336:00:0   600  14  32 --   E R<BR>lincoln            --      --    241:00:0   --    2   0 --   E R<BR>wide               --      --    48:00:00  1196   6 344 --   E R<BR>mlinglin           --      --    168:00:0   256   2   0 --   E R<BR>debug              --      --    00:30:00    16   0   4 --   E R<BR>fernsler           --      --    168:00:0    32   0   0 --   E R<BR>specreq            --      --    241:00:0   600   2   0 --   E R<BR>                                               ----- -----<BR>                                                 121  1343<BR><BR><BR>>  I will try again later.<BR>> <BR>> I then tested the IU BigRed with my application. Swift showed me the<BR>> following error and I don't know if this is because of my setting:<BR>> <BR>> Progress:  Selecting site:1019  Initializing site shared directory:4<BR>> Execution failed:<BR>>         Could not initialize shared directory on IU_BigRed<BR>> Caused by:<BR>>         org.globus.cog.abstraction.impl.file.FileResourceException:<BR>> Error communicating with the GridFTP server<BR>> Caused by:<BR>>         Server refused performing the request. Custom message: Server<BR>> refused GSSAPI authentication. (error code 1) [Nested exception<BR>> message:  Custom message: Unexpected reply: 530-globus_xio: Server<BR>> side credential failure<BR>> 530-globus_gsi_gssapi: Error with GSI credential<BR>> 530-globus_gsi_gssapi: Error with gss credential handle<BR>> 530-globus_credential: Error with credential: The host<BR>> credential: /etc/grid-security/hostcert.pem<BR>> 530-     with subject: /C=US/O=National Center for Supercomputing<BR>> Applications/CN=gridftp4.bigred.teragrid.iu.edu<BR>> 530-     has expired 4459 minutes ago.<BR>> 530-<BR>> 530 End.]<BR><BR>Bigred, it would seem, has an expired host certificate. This is a<BR>problem with the site. I would suggest seding an email to<BR>help@teragrid.org with the above message (from "Server refused<BR>performing the request" to "530 End.]").<BR><BR><BR></FONT></P></DIV><DIV> </DIV><br><br>This email is intended only for the use of the individual or entity to which it is addressed and may contain information that is privileged and confidential. If the reader of this email message is not the intended recipient, you are hereby notified that any dissemination, distribution, or copying of this communication is prohibited. If you have received this email in error, please notify the sender and destroy/delete all copies of the transmittal. Thank you.<br></BODY></HTML>