Hi,<br><br>Sorry for the delay.<br>&gt;Can you ping from one to the other <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Yes, I was able to ssh into the other machine and try mpdcheck and the rest. Will try to figure out what the problem is.<br><br>In the mean-time, I have been trying to understand the progress engine by tracing a standard blocking mode send/recv program, on one machine. ( by using mpdboot -n 1). What exactly are the .i files in the directory /mpid/common/sock/poll for? <br>
I noticed that a function like &quot;MPIDU_Sock_post_readv&quot; is at :<br>1) src/mpid/common/sock/iocp/sock.c, which includes functions like &quot;WSARecv&quot;,which is a function to receive data from a socket in windows. ( I am working on a linux platform)<br>
2)/mpich-src/src/mpid/common/sock/poll/sock_post.i. <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Interestingly, I am not able to navigate through the macros and functions in this file,by using tags (Why? ) . So, I can only see that we are playing around with pointers to update the <span style="color: rgb(51, 51, 255);">pollinfo structure. <span style="color: rgb(51, 0, 51);">Where is this structure defined? The .i file does not include any .h file. I tried &quot;grep&quot; on the main dir to locate the definition, it didnt return anything useful.</span><br>
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;&nbsp; <span style="color: rgb(51, 0, 51);">Can someone point me to a wiki article or any documentation that gives some info on the .i files? </span><br style="color: rgb(51, 0, 51);"><br style="color: rgb(51, 0, 51);">
<span style="color: rgb(51, 0, 51);">Thanks,</span><br style="color: rgb(51, 0, 51);"><span style="color: rgb(51, 0, 51);">Krishna Chaitanya K </span><br></span><br><div class="gmail_quote">On Feb 15, 2008 3:22 PM, Dave Goodell &lt;<a href="mailto:goodell@mcs.anl.gov">goodell@mcs.anl.gov</a>&gt; wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">What evidence do you have that the two machines are able to see each<br>other on the network? &nbsp;Can you ping from one to the other (and vice<br>
versa)? &nbsp;What is the output of the &#39;route&#39; command on each of the hosts?<br><font color="#888888"><br>-Dave<br></font><div><div></div><div class="Wj3C7c"><br>On Feb 14, 2008, at 10:30 PM, Krishna Chaitanya wrote:<br>
<br>&gt; Hi,<br>&gt; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; Turns out that the settings in the /etc/hosts file on the<br>&gt; AMD machine was incorrect. So, mpdcheck -v -f mpd.hosts gives this :<br>&gt;<br>&gt; AMD machine : ( outwit )<br>&gt; kc@outwit:~$ mpdcheck -v -f mpd.hosts<br>
&gt; obtaining hostname via gethostname and getfqdn<br>&gt; gethostname gives &nbsp;outwit<br>&gt; getfqdn gives &nbsp;<a href="http://outwit.nitk.ac.in" target="_blank">outwit.nitk.ac.in</a><br>&gt; checking out unqualified hostname; make sure is not &quot;localhost&quot;, etc.<br>
&gt; checking out qualified hostname; make sure is not &quot;localhost&quot;, etc.<br>&gt; obtain IP addrs via qualified and unqualified hostnames; &nbsp;make sure<br>&gt; other than <a href="http://127.0.0.1" target="_blank">127.0.0.1</a><br>
&gt; gethostbyname_ex: &nbsp;(&#39;<a href="http://outwit.nitk.ac.in" target="_blank">outwit.nitk.ac.in</a>&#39;, [&#39;outwit&#39;], [&#39;<a href="http://172.16.54.54" target="_blank">172.16.54.54</a>&#39;])<br>&gt; gethostbyname_ex: &nbsp;(&#39;<a href="http://outwit.nitk.ac.in" target="_blank">outwit.nitk.ac.in</a>&#39;, [&#39;outwit&#39;], [&#39;<a href="http://172.16.54.54" target="_blank">172.16.54.54</a>&#39;])<br>
&gt; checking that IP addrs resolve to same host<br>&gt; now do some gethostbyaddr and gethostbyname_ex for machines in<br>&gt; hosts file<br>&gt; checking gethostbyXXX for unqualified zeus<br>&gt; gethostbyname_ex: &nbsp;(&#39;zeus&#39;, [], [&#39;<a href="http://172.16.54.71" target="_blank">172.16.54.71</a>&#39;])<br>
&gt; checking gethostbyXXX for qualified zeus<br>&gt; gethostbyname_ex: &nbsp;(&#39;zeus&#39;, [], [&#39;<a href="http://172.16.54.71" target="_blank">172.16.54.71</a>&#39;])<br>&gt;<br>&gt;<br>&gt; INTEL machine ( zeus )<br>&gt; kris.c1986@zeus ~]$ mpdcheck -v -f mpd.hosts<br>
&gt; obtaining hostname via gethostname and getfqdn<br>&gt; gethostname gives &nbsp;zeus<br>&gt; getfqdn gives &nbsp;<a href="http://zeus.nitk.ac.in" target="_blank">zeus.nitk.ac.in</a><br>&gt; checking out unqualified hostname; make sure is not &quot;localhost&quot;, etc.<br>
&gt; checking out qualified hostname; make sure is not &quot;localhost&quot;, etc.<br>&gt; obtain IP addrs via qualified and unqualified hostnames; &nbsp;make sure<br>&gt; other than <a href="http://127.0.0.1" target="_blank">127.0.0.1</a><br>
&gt; gethostbyname_ex: &nbsp;(&#39;<a href="http://zeus.nitk.ac.in" target="_blank">zeus.nitk.ac.in</a>&#39;, [&#39;zeus&#39;], [&#39;<a href="http://172.16.54.71" target="_blank">172.16.54.71</a>&#39;])<br>&gt; gethostbyname_ex: &nbsp;(&#39;<a href="http://zeus.nitk.ac.in" target="_blank">zeus.nitk.ac.in</a>&#39;, [&#39;zeus&#39;], [&#39;<a href="http://172.16.54.71" target="_blank">172.16.54.71</a>&#39;])<br>
&gt; checking that IP addrs resolve to same host<br>&gt; now do some gethostbyaddr and gethostbyname_ex for machines in<br>&gt; hosts file<br>&gt; checking gethostbyXXX for unqualified outwit<br>&gt; gethostbyname_ex: &nbsp;(&#39;outwit&#39;, [], [&#39;<a href="http://172.16.54.54" target="_blank">172.16.54.54</a>&#39;])<br>
&gt; checking gethostbyXXX for qualified outwit<br>&gt; gethostbyname_ex: &nbsp;(&#39;outwit&#39;, [], [&#39;<a href="http://172.16.54.54" target="_blank">172.16.54.54</a>&#39;])<br>&gt;<br>&gt; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;Seems to be ok. But I still get this error when I<br>
&gt; try mpdcheck -c on the AMD comp :<br>&gt; kc@outwit:~$ mpdcheck -c zeus 33737<br>&gt; Traceback (most recent call last):<br>&gt; &nbsp; File &quot;/home/kc/mpich-install/bin/mpdcheck&quot;, line 103, in &lt;module&gt;<br>
&gt; &nbsp; &nbsp; sock.connect((argv[argidx+1],int(argv[argidx+2]))) &nbsp;# note<br>&gt; double parens<br>&gt; &nbsp; File &quot;&lt;string&gt;&quot;, line 1, in connect<br>&gt; socket.error: (113, &#39;No route to host&#39;)<br>&gt;<br>&gt;<br>
&gt; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;The two machines are able to see each other on the<br>&gt; network. Cant exaplain why it complains that there is &quot;No route to<br>&gt; host&quot;<br>&gt;<br>&gt; Krishna Chaitanya K<br>&gt;<br>&gt;<br>
&gt; On Thu, Feb 14, 2008 at 2:50 PM, Rajeev Thakur &lt;<a href="mailto:thakur@mcs.anl.gov">thakur@mcs.anl.gov</a>&gt;<br>&gt; wrote:<br>&gt; The second test times out perhaps indicates that there might be a<br>&gt; firewall on the AMD machine. See the section A.3 of the<br>
&gt; installation guide.<br>&gt;<br>&gt; Rajeev<br>&gt;<br>&gt; From: Krishna Chaitanya [mailto:<a href="mailto:kris.c1986@gmail.com">kris.c1986@gmail.com</a>]<br>&gt; Sent: Thursday, February 14, 2008 11:41 AM<br>&gt; To: Rajeev Thakur<br>
&gt; Cc: <a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>&gt; Subject: Re: [MPICH] Problem setting up MPICH between a 32 bit<br>&gt; INTEL and a 32 bit AMD machine<br>&gt;<br>&gt; So, what is the error trying to convey? Googling for it, gave this.<br>
&gt; I have flushed the IPtables on both the machines and the firewalls<br>&gt; are de-activated. Could you please elaborate on what kind of<br>&gt; settings I need to look into?<br>&gt;<br>&gt; Thanks,<br>&gt; Krishna Chaitanya K<br>
&gt;<br>&gt; On Thu, Feb 14, 2008 at 10:58 PM, Rajeev Thakur<br>&gt; &lt;<a href="mailto:thakur@mcs.anl.gov">thakur@mcs.anl.gov</a>&gt; wrote:<br>&gt; It should be possible. mpdcheck is a tool to diagnose whether the<br>&gt; network configuration settings on the machines are ok or not, and<br>
&gt; whether a process on one machine can talk to a process on the<br>&gt; other. It looks like the settings need to be fixed in some way.<br>&gt;<br>&gt; Rajeev<br>&gt;<br>&gt; From: <a href="mailto:owner-mpich-discuss@mcs.anl.gov">owner-mpich-discuss@mcs.anl.gov</a> [mailto:<a href="mailto:owner-mpich-">owner-mpich-</a><br>
&gt; <a href="mailto:discuss@mcs.anl.gov">discuss@mcs.anl.gov</a>] On Behalf Of Krishna Chaitanya<br>&gt; Sent: Thursday, February 14, 2008 10:26 AM<br>&gt; To: <a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>
&gt; Subject: [MPICH] Problem setting up MPICH between a 32 bit INTEL<br>&gt; and a 32 bit AMD machine<br>&gt;<br>&gt; Hi,<br>&gt; &nbsp; &nbsp; &nbsp; &nbsp; In one of the previous posts, you had replied back saying<br>&gt; MPICH cannot be put to use between a 32 bit INTEL machine and a 64<br>
&gt; bit AMD machine. Is it possible to do so between an INTEL and an<br>&gt; AMD machine, both of them being 32 bit processors?<br>&gt; &nbsp; &nbsp; &nbsp; &nbsp; Anyway, on trying mpdcheck -f mpd.hosts on the 32 bit AMD,<br>&gt; I am getting the following error :<br>
&gt; &nbsp; &nbsp;ipaddr via uqn (<a href="http://208.67.216.130" target="_blank">208.67.216.130</a>) does not match via fqn<br>&gt; (<a href="http://208.69.32.130" target="_blank">208.69.32.130</a>)<br>&gt; &nbsp; &nbsp; &nbsp; &nbsp; And if I try the mpdcheck -s on the AMD node and mpdcheck -<br>
&gt; c on the INTEL node, the client times out. The test message gets<br>&gt; delivered with the client and server swapped.<br>&gt;<br>&gt; Thanks,<br>&gt; Krishna Chaitanya K<br>&gt;<br>&gt;<br>&gt;<br>&gt;<br>&gt;<br>&gt; --<br>
&gt; In the middle of difficulty, lies opportunity<br>&gt;<br>&gt;<br>&gt;<br>&gt; --<br>&gt; In the middle of difficulty, lies opportunity<br>&gt;<br>&gt;<br>&gt;<br>&gt; --<br>&gt; In the middle of difficulty, lies opportunity<br>
<br></div></div></blockquote></div><br><br clear="all"><br>-- <br>In the middle of difficulty, lies opportunity