Thanks ralph , i have just make it run successfully . i did read about
the assumption of shared file system and duplication but i thought that
it was good enough to vi 2 identical .mpd.conf .<br>
<br>
Anyway , thanks to everybody.<br>
Tiep.<br><br><div><span class="gmail_quote">On 4/10/06, <b class="gmail_sendername">Ralph M. Butler</b> &lt;<a href="mailto:rbutler@mtsu.edu">rbutler@mtsu.edu</a>&gt; wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Yes this might be a bit difficult to pick up on.<br>The install guide discusses an assumption of shared file<br>systems, e.g. via NFS, or the need to copy files.<br>I can duplicate this problem only by having different secretwords
<br>on 2 machines.&nbsp;&nbsp;Perhaps you can simply copy one file to the other<br>to verify that the 2 secretwords are identical.<br><br>&gt; Date: Mon, 10 Apr 2006 05:47:35 +0700<br>&gt; From: Misora Itsumo &lt;<a href="mailto:mitsuru.adachi@gmail.com">
mitsuru.adachi@gmail.com</a>&gt;<br>&gt; To: Ralph Butler &lt;<a href="mailto:rbutler@mtsu.edu">rbutler@mtsu.edu</a>&gt;<br>&gt; Cc: <a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>&gt; Subject: Re: [MPICH] mpdboot error : fail to ping
<br>&gt;<br>&gt; ah , because i dont know whether secrets in both node must be similar or not<br>&gt; , i have already tried to make it the same , but it produced the same error.<br>&gt;<br>&gt; Thanks,<br>&gt; Tiep.<br>&gt;
<br>&gt; On 4/10/06, Misora Itsumo &lt;<a href="mailto:mitsuru.adachi@gmail.com">mitsuru.adachi@gmail.com</a>&gt; wrote:<br>&gt;&gt;<br>&gt;&gt;<br>&gt;&gt; yes , as ralph said , both my secretwords in two nodes are integer.
<br>&gt;&gt; i changed my secret and it didn't inform last error anymore,<br>&gt;&gt; but sadly , it produced new error<br>&gt;&gt;<br>&gt;&gt; in node hewonty i did<br>&gt;&gt; [hewonty@hewonty doc]$ mpd &amp;<br>&gt;&gt; [1] 4293
<br>&gt;&gt; [hewonty@hewonty doc]$ mpdtrace -l<br>&gt;&gt; hewonty.homelinux.org_32800 (<a href="http://192.168.2.2">192.168.2.2</a>)<br>&gt;&gt; [hewonty@hewonty doc]$ hewonty.homelinux.org_32800(handle_rhs_challenge_response 788): INVALID response in rhs response
<br>&gt;&gt; msg=:{'ifhn': '<a href="http://192.168.2.3">192.168.2.3</a>', 'cmd': 'challenge_response', 'port': 32774,<br>&gt;&gt; 'response': 'X\xc5\x8f\x9ccfS\x8e\xaa\r\xde6$Y+\x81'}:<br>&gt;&gt;<br>&gt;&gt; in node vm1
<br>&gt;&gt; [hewonty@vm1 ~]$ mpd -h hewonty -p 32800<br>&gt;&gt; vm1_32774 (connect_lhs 635): NOT OK to enter ring; one likely cause:<br>&gt;&gt; mismatched secretwords<br>&gt;&gt; vm1_32774 (enter_ring 566): lhs connect failed
<br>&gt;&gt; vm1_32774 (run 233): failed to enter ring<br>&gt;&gt;<br>&gt;&gt; ah for testing , my secret for hewonty is asdfghjkl1 , for vm1 is<br>&gt;&gt; qwertyuiop1<br>&gt;&gt;<br>&gt;&gt; Thanks,<br>&gt;&gt; Tiep.<br>
&gt;&gt;<br>&gt;&gt;<br>&gt;&gt; On 4/9/06, Ralph Butler &lt;<a href="mailto:rbutler@mtsu.edu">rbutler@mtsu.edu</a>&gt; wrote:<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; This seems to be a new bug.&nbsp;&nbsp;I do not want to ask your secretword,
<br>&gt;&gt;&gt; but will guess that it is an integer.&nbsp;&nbsp; If so,<br>&gt;&gt;&gt; please make it a non-integer.&nbsp;&nbsp;It's OK to have digits in there, but<br>&gt;&gt;&gt; not to have the secretword be all digits.<br>&gt;&gt;&gt; Let me know if this fixes the problem and I will fix it in mpd for
<br>&gt;&gt;&gt; the next release.<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; Thanks.<br>&gt;&gt;&gt; --ralph<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; On Apr 8, 2006, at 1:31 PM, Misora Itsumo wrote:<br>&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; i have already tried mpdcheck .
<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; [hewonty@hewonty ~]$ mpdcheck -s<br>&gt;&gt;&gt;&gt; server listening at INADDR_ANY on: hewonty 32775<br>&gt;&gt;&gt;&gt; server has conn on &lt;socket._socketobject object at 0xb7f7838c&gt; from
<br>&gt;&gt;&gt;&gt; (' <a href="http://192.168.2.3">192.168.2.3</a>', 56366)<br>&gt;&gt;&gt;&gt; server successfully recvd msg from client: hello_from_client_to_server<br>&gt;&gt;&gt;&gt; [hewonty@vm1 ~]$ mpdcheck -c hewonty 32775
<br>&gt;&gt;&gt;&gt; client successfully recvd ack from server: ack_from_server_to_client<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; [hewonty@vm1 ~]$ mpdcheck -s<br>&gt;&gt;&gt;&gt; server listening at INADDR_ANY on: vm1 32771
<br>&gt;&gt;&gt;&gt; server has conn on &lt;socket._socketobject object at 0xb7f5920c&gt; from<br>&gt;&gt;&gt;&gt; ('<a href="http://192.168.2.2">192.168.2.2</a> ', 33169)<br>&gt;&gt;&gt;&gt; server successfully recvd msg from client: hello_from_client_to_server
<br>&gt;&gt;&gt;&gt; [hewonty@hewonty ~]$ mpdcheck -c vm1 32771<br>&gt;&gt;&gt;&gt; client successfully recvd ack from server: ack_from_server_to_client<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; The next thing , i tried to run mpd by hand , but got error like
<br>&gt;&gt;&gt;&gt; the last post.<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; [hewonty@vm1 ~]$ mpd &amp;<br>&gt;&gt;&gt;&gt; [1] 2056<br>&gt;&gt;&gt;&gt; [hewonty@vm1 ~]$ mpdtrace -l<br>&gt;&gt;&gt;&gt; vm1_32772 ( <a href="http://192.168.2.3">
192.168.2.3</a>)<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; [hewonty@hewonty ~]$ mpd -h vm1 -p 32772<br>&gt;&gt;&gt;&gt; hewonty_32846: mpd_uncaught_except_tb handling:<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp; exceptions.TypeError
: sequence item 0: expected string, int found<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp; /usr/local/mpich2/bin/mpdlib.py&nbsp;&nbsp;627&nbsp;&nbsp;connect_lhs<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; response = md5new(''.join([self.secretword,msg<br>&gt;&gt;&gt;&gt; ['randnum']])).digest()
<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp; /usr/local/mpich2/bin/mpdlib.py&nbsp;&nbsp;564&nbsp;&nbsp;enter_ring<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; numTries=ntries)<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp; /usr/local/mpich2/bin/mpd&nbsp;&nbsp;231&nbsp;&nbsp;run<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rhsHandler=self.handle_rhs_input
)<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp; /usr/local/mpich2/bin/mpd&nbsp;&nbsp;1344&nbsp;&nbsp;?<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; mpd.run()<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; If i run mpd in hewonty first i got :<br>&gt;&gt;&gt;&gt; [hewonty@hewonty ~]$ mpd &amp;
<br>&gt;&gt;&gt;&gt; [1] 4051<br>&gt;&gt;&gt;&gt; [hewonty@hewonty ~]$ mpdtrace -l<br>&gt;&gt;&gt;&gt; hewonty_32781 (<a href="http://192.168.2.2">192.168.2.2</a>)<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; [hewonty@vm1 ~]$mpd -h hewonty -p 32781
<br>&gt;&gt;&gt;&gt; vm1_32776 (connect_lhs 621): invalid challenge from hewonty 32781: {}<br>&gt;&gt;&gt;&gt; vm1_32776 (enter_ring 566): lhs connect failed<br>&gt;&gt;&gt;&gt; vm1_32776 (run 233): failed to enter ring<br>
&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; and in hewonty i get the error<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; hewonty.homelinux.org_32781: mpd_uncaught_except_tb handling:<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp; exceptions.TypeError: sequence item 0: expected string, int found
<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp; /usr/local/mpich2/bin/mpdlib.py&nbsp;&nbsp;733<br>&gt;&gt;&gt;&gt; handle_ring_listener_connection<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; newsock.correctChallengeResponse = \<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp; /usr/local/mpich2/bin/mpdlib.py&nbsp;&nbsp;488&nbsp;&nbsp;handle_active_streams
<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; handler(stream,*args)<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp; /usr/local/mpich2/bin/mpd&nbsp;&nbsp;266&nbsp;&nbsp;runmainloop<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rv = self.streamHandler.handle_active_streams (timeout=8.0)<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp; /usr/local/mpich2/bin/mpd&nbsp;&nbsp;240&nbsp;&nbsp;run
<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; self.runmainloop()<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp; /usr/local/mpich2/bin/mpd&nbsp;&nbsp;1344&nbsp;&nbsp;?<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; mpd.run()<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt;
[1]+&nbsp;&nbsp;Exit
1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;mpd<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; Regards,<br>&gt;&gt;&gt;&gt; Tiep.<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; On 4/8/06, Rajeev Thakur &lt;<a href="mailto:thakur@mcs.anl.gov">
thakur@mcs.anl.gov</a>&gt; wrote:<br>&gt;&gt;&gt;&gt; Try running the mpdcheck troubleshooting utility as described in<br>&gt;&gt;&gt;&gt; the installer's guide.<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; Rajeev<br>&gt;&gt;&gt;&gt; From: 
<a href="mailto:owner-mpich-discuss@mcs.anl.gov">owner-mpich-discuss@mcs.anl.gov</a> [mailto:<a href="mailto:owner-mpich-">owner-mpich-</a><br>&gt;&gt;&gt;&gt; <a href="mailto:discuss@mcs.anl.gov">discuss@mcs.anl.gov</a>] On Behalf Of Misora Itsumo
<br>&gt;&gt;&gt;&gt; Sent: Friday, April 07, 2006 5:59 PM<br>&gt;&gt;&gt;&gt; To: <a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; Subject: [MPICH] mpdboot error : fail to ping
<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; Hi<br>&gt;&gt;&gt;&gt; i'm new to MPICH2 and i just installed mpich2 , but i can't make it<br>&gt;&gt;&gt;&gt; run on a set of machines.<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; i run mpich2 on 2 nodes&nbsp;&nbsp;, hostnames are hewonty and vm1.
<br>&gt;&gt;&gt;&gt; Here are some info<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; [hewonty@hewonty ~]$ cat mpd.hosts<br>&gt;&gt;&gt;&gt; hewonty<br>&gt;&gt;&gt;&gt; vm1<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; [hewonty@hewonty
 ~]$ cat /etc/hosts<br>&gt;&gt;&gt;&gt; <a href="http://127.0.0.1">127.0.0.1</a>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; localhost.localdomain&nbsp;&nbsp; localhost<br>&gt;&gt;&gt;&gt; <a href="http://192.168.2.2">192.168.2.2</a>&nbsp;&nbsp;&nbsp;&nbsp; <a href="http://hewonty.homelinux.org">
hewonty.homelinux.org</a>&nbsp;&nbsp; <a href="http://hewonty.vmnet1.org">hewonty.vmnet1.org</a><br>&gt;&gt;&gt;&gt; hewonty<br>&gt;&gt;&gt;&gt; <a href="http://192.168.2.3">192.168.2.3</a>&nbsp;&nbsp;&nbsp;&nbsp; <a href="http://vm1.hewonty.homelinux.org">
vm1.hewonty.homelinux.org</a>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; vm1<br>&gt;&gt;&gt;&gt; <a href="http://192.168.2.2">192.168.2.2</a>&nbsp;&nbsp;&nbsp;&nbsp; svn_server<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; [hewonty@hewonty ~]$ mpdboot -n 2 -f mpd.hosts<br>&gt;&gt;&gt;&gt; mpdboot_hewonty (handle_mpd_output 359): failed to ping mpd on
<br>&gt;&gt;&gt;&gt; hewonty; recvd output={}<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; i can ssh to hewonty or vm1.<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; I tried to run mannually by mpd and here are what i got<br>&gt;&gt;&gt;&gt;
<br>&gt;&gt;&gt;&gt; [hewonty@vm1 ~]$ mpd &amp;<br>&gt;&gt;&gt;&gt; [1] 2056<br>&gt;&gt;&gt;&gt; [hewonty@vm1 ~]$ mpdtrace -l<br>&gt;&gt;&gt;&gt; vm1_32772 (<a href="http://192.168.2.3">192.168.2.3</a>)<br>&gt;&gt;&gt;&gt;
<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; [hewonty@hewonty ~]$ mpd -h vm1 -p 32772<br>&gt;&gt;&gt;&gt; hewonty_32846: mpd_uncaught_except_tb handling:<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp; exceptions.TypeError: sequence item 0: expected string, int found
<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp; /usr/local/mpich2/bin/mpdlib.py&nbsp;&nbsp;627&nbsp;&nbsp;connect_lhs<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; response = md5new(''.join([ self.secretword,msg<br>&gt;&gt;&gt;&gt; ['randnum']])).digest()<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp; /usr/local/mpich2/bin/mpdlib.py&nbsp;&nbsp;564&nbsp;&nbsp;enter_ring
<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; numTries=ntries)<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp; /usr/local/mpich2/bin/mpd&nbsp;&nbsp;231&nbsp;&nbsp;run<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rhsHandler= self.handle_rhs_input)<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp; /usr/local/mpich2/bin/mpd&nbsp;&nbsp;1344&nbsp;&nbsp;?
<br>&gt;&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; mpd.run()<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; Thanks in advance.<br>&gt;&gt;&gt;&gt; Tiep<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;<br>&gt;&gt;&gt;<br>&gt;&gt;<br>&gt;<br></blockquote></div><br>