<HTML><BODY style="word-wrap: break-word; -khtml-nbsp-mode: space; -khtml-line-break: after-white-space; ">I'm having some troubles getting Mpich2-1.0.3 up and running on a three computer setup, one master two computation nodes.  I've seen a mailing archive of someone that seemed to have a similar problem, and they were able to correct it in some manner.  <DIV><BR class="khtml-block-placeholder"></DIV><DIV><A href="http://www-unix.mcs.anl.gov/web-mail-archive/lists/mpich-discuss/2006/04/msg00037.html">http://www-unix.mcs.anl.gov/web-mail-archive/lists/mpich-discuss/2006/04/msg00037.html </A></DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>It seemed to be a problem with the mpd being addressed to 127.0.0.1.  Not entirely sure if I'm in the same situation, but I am stuck on how to fix it.  I'm afraid that it is some sort of simple networking issue, but since this is my first venture into cluster computing everything is posing a challenge.<DIV><BR class="khtml-block-placeholder"></DIV><DIV>Things I'm able to do or have done:</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV><SPAN class="Apple-tab-span" style="white-space:pre">        </SPAN>ping between boxes</DIV><DIV><SPAN class="Apple-tab-span" style="white-space:pre">        </SPAN>ssh between boxes without password</DIV><DIV><SPAN class="Apple-tab-span" style="white-space:pre">        </SPAN>bring up an mpd on each box</DIV><DIV><SPAN class="Apple-tab-span" style="white-space:pre">        </SPAN>made the changes to mpd.py (commented two lines)</DIV><DIV><SPAN class="Apple-tab-span" style="white-space:pre">        </SPAN></DIV><DIV>Things I'm unable to do:</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV><SPAN class="Apple-tab-span" style="white-space:pre">        </SPAN>use mpdboot to bring up a ring of mpds</DIV><DIV><SPAN class="Apple-tab-span" style="white-space:pre">        </SPAN>manually start a server/client mpd on two machines(gives error along lines of unable to ping)</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>I don't receive any errors when running mpdcheck, but not the case when I run mpdcheck -f ~/Desktop/mpd.hosts -ssh</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>[cobalt@bhead home]$ mpdcheck -f ~/Desktop/mpd.hosts -ssh</DIV><DIV>** timed out waiting for client on b1.aero.nd.edu to produce output</DIV><DIV>client on b1.aero.nd.edu failed to access the server</DIV><DIV>here is the output:</DIV><DIV>Traceback (most recent call last):</DIV><DIV>  File "/home/cobalt/mpich2-install/bin/mpdcheck.py", line 103, in ?</DIV><DIV>    sock.connect((argv[argidx+1],int(argv[argidx+2])))  # note double parens</DIV><DIV>  File "&lt;string&gt;", line 1, in connect</DIV><DIV>socket.error: (113, 'No route to host')</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>And here is the output from mpdcheck -pc:</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>[cobalt@bhead home]$ mpdcheck -pc</DIV><DIV>--- print results of: gethostbyname_ex(gethostname())</DIV><DIV>('bhead.aero.nd.edu', ['bhead'], ['192.168.2.1'])</DIV><DIV>--- try to run /bin/hostname</DIV><DIV>bhead.aero.nd.edu</DIV><DIV>--- try to run uname -a</DIV><DIV>Linux bhead.aero.nd.edu 2.6.9-34.EL #1 Mon Mar 13 11:31:17 CST 2006 i686 i686 i386 GNU/Linux</DIV><DIV>--- try to print /etc/hosts</DIV><DIV># Do not remove the following line, or various programs</DIV><DIV># that require network functionality will fail.</DIV><DIV>192.168.2.102   b2.aero.nd.edu  b2</DIV><DIV>192.168.2.101   b1.aero.nd.edu  b1</DIV><DIV>192.168.2.1     bhead.aero.nd.edu       bhead</DIV><DIV>--- try to print /etc/resolv.conf</DIV><DIV>; generated by /sbin/dhclient-script</DIV><DIV>search aero.nd.edu</DIV><DIV>nameserver 192.168.2.1</DIV><DIV>--- try to run /sbin/ifconfig -a</DIV><DIV>eth0      Link encap:Ethernet  HWaddr 00:11:11:95:8F:63</DIV><DIV>          inet addr:192.168.2.1  Bcast:192.168.2.255  Mask:255.255.255.0</DIV><DIV>          inet6 addr: fe80::211:11ff:fe95:8f63/64 Scope:Link</DIV><DIV>          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1</DIV><DIV>          RX packets:263 errors:0 dropped:0 overruns:0 frame:0</DIV><DIV>          TX packets:293 errors:0 dropped:0 overruns:0 carrier:0</DIV><DIV>          collisions:0 txqueuelen:1000</DIV><DIV>          RX bytes:40718 (39.7 KiB)  TX bytes:39246 (38.3 KiB)</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>lo        Link encap:Local Loopback</DIV><DIV>          inet addr:127.0.0.1  Mask:255.0.0.0</DIV><DIV>          inet6 addr: ::1/128 Scope:Host</DIV><DIV>          UP LOOPBACK RUNNING  MTU:16436  Metric:1</DIV><DIV>          RX packets:1475 errors:0 dropped:0 overruns:0 frame:0</DIV><DIV>          TX packets:1475 errors:0 dropped:0 overruns:0 carrier:0</DIV><DIV>          collisions:0 txqueuelen:0</DIV><DIV>          RX bytes:2939426 (2.8 MiB)  TX bytes:2939426 (2.8 MiB)</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>sit0      Link encap:IPv6-in-IPv4</DIV><DIV>          NOARP  MTU:1480  Metric:1</DIV><DIV>          RX packets:0 errors:0 dropped:0 overruns:0 frame:0</DIV><DIV>          TX packets:0 errors:0 dropped:0 overruns:0 carrier:0</DIV><DIV>          collisions:0 txqueuelen:0</DIV><DIV>          RX bytes:0 (0.0 b)  TX bytes:0 (0.0 b)</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>--- try to print /etc/nsswitch.conf</DIV><DIV>#</DIV><DIV># /etc/nsswitch.conf</DIV><DIV>#</DIV><DIV># An example Name Service Switch config file. This file should be</DIV><DIV># sorted with the most-used services at the beginning.</DIV><DIV>#</DIV><DIV># The entry '[NOTFOUND=return]' means that the search for an</DIV><DIV># entry should stop if the search in the previous entry turned</DIV><DIV># up nothing. Note that if the search failed due to some other reason</DIV><DIV># (like no NIS server responding) then the search continues with the</DIV><DIV># next entry.</DIV><DIV>#</DIV><DIV># Legal entries are:</DIV><DIV>#</DIV><DIV>#       nis or yp               Use NIS (NIS version 2), also called YP</DIV><DIV>#       dns                     Use DNS (Domain Name Service)</DIV><DIV>#       files                   Use the local files</DIV><DIV>#       db                      Use the local database (.db) files</DIV><DIV>#       compat                  Use NIS on compat mode</DIV><DIV>#       hesiod                  Use Hesiod for user lookups</DIV><DIV>#       ldap                    Use LDAP (only if nss_ldap is installed)</DIV><DIV>#       nisplus or nis+         Use NIS+ (NIS version 3), unsupported</DIV><DIV>#       [NOTFOUND=return]       Stop searching if not found so far</DIV><DIV>#</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV># To use db, put the "db" in front of "files" for entries you want to be</DIV><DIV># looked up first in the databases</DIV><DIV>#</DIV><DIV># Example:</DIV><DIV>#passwd:    db files ldap nis</DIV><DIV>#shadow:    db files ldap nis</DIV><DIV>#group:     db files ldap nis</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>passwd:     files</DIV><DIV>shadow:     files</DIV><DIV>group:      files</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>#hosts:     db files ldap nis dns</DIV><DIV>hosts:      files dns</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV># Example - obey only what ldap tells us...</DIV><DIV>#services:  ldap [NOTFOUND=return] files</DIV><DIV>#networks:  ldap [NOTFOUND=return] files</DIV><DIV>#protocols: ldap [NOTFOUND=return] files</DIV><DIV>#rpc:       ldap [NOTFOUND=return] files</DIV><DIV>#ethers:    ldap [NOTFOUND=return] files</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>bootparams: files</DIV><DIV>ethers:     files</DIV><DIV>netmasks:   files</DIV><DIV>networks:   files</DIV><DIV>protocols:  files</DIV><DIV>rpc:        files</DIV><DIV>services:   files</DIV><DIV>netgroup:   files</DIV><DIV>publickey:  files</DIV><DIV>automount:  files</DIV><DIV>aliases:    files</DIV><DIV>[cobalt@bhead home]$</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>Thanks for your attention,</DIV></DIV><BR><DIV> <SPAN class="Apple-style-span" style="border-collapse: separate; border-spacing: 0px 0px; color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; text-align: auto; -khtml-text-decorations-in-effect: none; text-indent: 0px; -apple-text-size-adjust: auto; text-transform: none; orphans: 2; white-space: normal; widows: 2; word-spacing: 0px; "><SPAN class="Apple-style-span" style="border-collapse: separate; border-spacing: 0px 0px; color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; text-align: auto; -khtml-text-decorations-in-effect: none; text-indent: 0px; -apple-text-size-adjust: auto; text-transform: none; orphans: 2; white-space: normal; widows: 2; word-spacing: 0px; "><SPAN class="Apple-style-span" style="border-collapse: separate; border-spacing: 0px 0px; color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; text-align: auto; -khtml-text-decorations-in-effect: none; text-indent: 0px; -apple-text-size-adjust: auto; text-transform: none; orphans: 2; white-space: normal; widows: 2; word-spacing: 0px; "><DIV>Zach Ponder</DIV><DIV>Graduate Student</DIV><DIV>University of Notre Dame</DIV><DIV>Department of Aerospace and Mechanical Engineering</DIV><DIV><A href="mailto:zponder@nd.edu">zponder@nd.edu</A></DIV><BR class="Apple-interchange-newline"></SPAN></SPAN></SPAN> </DIV><BR></BODY></HTML>