<html>
<head>
<style>
.hmmessage P
{
margin:0px;
padding:0px
}
body.hmmessage
{
FONT-SIZE: 10pt;
FONT-FAMILY:Tahoma
}
</style>
</head>
<body class='hmmessage'><div style="text-align: left;"><br>a) I can ping the other machine from one machine without any problem.<br>b) Also tried by just specifying ipaddress of hosts in Config.txt and I got the same error message in my previous email.<br><br>The issue seems to be caused by the following setting at my end.<br>i)I got one machine name by using "nslookup ipaddress".(<font face="Arial">B001279FD7C60.il.bankofamerica.com)<br>ii)If I right click "My Computer"-&gt;Properties-&gt;Computer Name, I got the other name(</font><font face="Arial">B001279FD7C60.corp.bankofamerica.com).<br><br>I wrote a very simple C probelm which just does one thing: call gethostbyname. If I pass hostname from i), the call is successful, and if I pass hostname from ii), I got<br>exactly <span style="font-weight: bold;">the same</span> error message as the MPI error message.<br><br>What I don't understand is the following:&nbsp; even if I specify hostnames(full names) from i) in Config.txt, I still got <span style="font-weight: bold;">the same</span> error messages and from the error messages, it seems that<br>mpiexec does not honor the hostnames I specify in Config.txt, and instead it somehow uses hostnames from ii). Is it a bug in mpiexec?or a bad setting at my end? Or a combination <br>of the above two?<br><br>Thanks<br><br>Richard<br></font></div><br><blockquote><hr id="EC_stopSpelling">From: jayesh@mcs.anl.gov<br>To: xs_li@hotmail.com<br>CC: mpich-discuss@mcs.anl.gov<br>Subject: RE: [MPICH] MPI_Bcast hangs in Windows XP<br>Date: Mon, 10 Sep 2007 11:54:39 -0500<br><br>

<meta http-equiv="Content-Type" content="text/html; charset=unicode">
<meta name="Generator" content="Microsoft SafeHTML">

<style>
.ExternalClass .EC_hmmessage P
{padding-right:0px;padding-left:0px;padding-bottom:0px;padding-top:0px;}
.ExternalClass EC_BODY.hmmessage
{font-size:10pt;font-family:Tahoma;}
</style>



<div dir="ltr" align="left"><font color="#0000ff" face="Arial"><span class="EC_053195316-10092007">Hi,</span></font></div>
<div dir="ltr" align="left"><font color="#0000ff" face="Arial"><span class="EC_053195316-10092007">&nbsp;Also try to ping the hosts by specifying the 
hostname (ping &lt;hostname&gt;).</span></font></div>
<div dir="ltr" align="left"><font color="#0000ff" face="Arial"><span class="EC_053195316-10092007"></span></font>&nbsp;</div>
<div dir="ltr" align="left"><font color="#0000ff" face="Arial"><span class="EC_053195316-10092007">Regards,</span></font></div>
<div dir="ltr" align="left"><font color="#0000ff" face="Arial"><span class="EC_053195316-10092007">Jayesh</span></font></div><br>
<div class="EC_OutlookMessageHeader" dir="ltr" align="left" lang="en-us">
<hr>
<font face="Tahoma"><b>From:</b> owner-mpich-discuss@mcs.anl.gov 
[mailto:owner-mpich-discuss@mcs.anl.gov] <b>On Behalf Of </b>Jayesh 
Krishna<br><b>Sent:</b> Monday, September 10, 2007 9:39 AM<br><b>To:</b> 
'Richard Li'<br><b>Cc:</b> mpich-discuss@mcs.anl.gov<br><b>Subject:</b> RE: 
[MPICH] MPI_Bcast hangs in Windows XP<br></font><br></div>
<div></div>
<div dir="ltr" align="left"><span class="EC_744333714-10092007"><font color="#0000ff" face="Arial">Hi,</font></span></div>
<div dir="ltr" align="left"><span class="EC_744333714-10092007"><font color="#0000ff" face="Arial">&nbsp;It looks like some problem with the name resolution for the 
hostnames. Can you try one run by just specifying the ipaddress of the hosts in 
config.txt ?</font></span></div>
<div><font color="#0000ff" face="Arial"></font>&nbsp;</div>
<div><span class="EC_744333714-10092007"><font color="#0000ff" face="Arial">Regards,</font></span></div>
<div><span class="EC_744333714-10092007"><font color="#0000ff" face="Arial">Jayesh</font></span></div><br>
<div class="EC_OutlookMessageHeader" dir="ltr" align="left" lang="en-us">
<hr>
<font face="Tahoma"><b>From:</b> Richard Li [mailto:xs_li@hotmail.com] 
<br><b>Sent:</b> Friday, September 07, 2007 9:00 PM<br><b>To:</b> Jayesh 
Krishna<br><b>Cc:</b> mpich-discuss@mcs.anl.gov<br><b>Subject:</b> RE: [MPICH] 
MPI_Bcast hangs in Windows XP<br></font><br></div>
<div></div>
<div style="text-align: left;">Jayesh,<br><br>Thanks a lot for your 
info.<br><br>After a lot of trys, I was finally able to run cpi.exe across 
multiple hosts. It seems to have something to with the setting in my machine 
file. The following is the detail.<br><br>I use the following command to run 
cpi.exe:<br><br>mpiexec -n 2 -machinefile config.txt -channel ssm(or others) 
cpi.exe<br><br>a) If I have a config.txt file like the 
following:<br>&nbsp;&nbsp;&nbsp; host1name:1 -ifhn 
host1_ipaddress<br>&nbsp;&nbsp;&nbsp; host2name:2 -ifhn 
host2_ipaddress<br>&nbsp;&nbsp; Everything works fine(for all channels).<br>b) 
If I have a config.txt like the following:<br>&nbsp;&nbsp; 
host1name:1<br>&nbsp;&nbsp; host2:name:2<br>&nbsp;then, for sock channel, it 
hangs mpi_bcast. For auto and ssm, I got the following error message:<br>&nbsp; 
<br>
<div><font face="Arial">C:\public\bin&gt;mpiexec -n 2 -machinefile Config.txt 
-channel ssm&nbsp;<span class="EC_EC_588480822-07092007"> or auto 
</span>C:\public\bin\cpi.exe<br>Enter the number of intervals: (0 quits) 
100</font></div>
<div>&nbsp;</div>
<div><font face="Arial">job aborted:<br>rank: node: exit code[: error 
message]<br>0: B0016350B383E: 1: Fatal error in MPI_Bcast: Other MPI error, 
error stack:<br>MPI_Bcast(784).................: MPI_Bcast(buf=0012FE88, 
count=1, MPI_INT, root=0, MPI_COMM_WORLD) 
fai<br>led<br>MPIR_Bcast(230)................:<br>MPIC_Send(36)..................:<br>MPIDI_EagerContigSend(146).....: 
failure occurred while attempting to send an eager 
message<br>MPIDI_CH3_iStartMsgv(224)......:<br>MPIDI_CH3I_VC_post_connect(555): 
[ch3:sock] rank 0 unable to connect to rank 1 using business card 
&lt;po<br>rt=3872 description=B001279FD7C60.corp.bankofamerica.com 
ifname=171.188.32.154 shm_host=B001279FD7C60.<br>corp.bankofamerica.com 
shm_queue=39E4F281-FCC0-4f4a-B540-EDC8D517F065 shm_pid=2484 
&gt;<br>MPIDU_Sock_post_connect(1228)..: unable to connect to 
B001279FD7C60.corp.bankofamerica.com on port 387<br>2, exhausted all endpoints 
(errno -1)<br>MPIDU_Sock_post_connect(1244)..: gethostbyname failed, The 
requested name is valid and was found in th<br>e database, but it does not have 
the correct associated data being resolved for. (errno 11004)<br>1: 
B001279FD7C60: 1</font></div><br>I know this has something to do with my network 
setting, but just can't figure out why.<br><br>Any 
ideas?<br><br>Thanks<br><br>Richard<br><br></div><br><br><br>
<blockquote>
  <hr id="EC_EC_stopSpelling">
  From: jayesh@mcs.anl.gov<br>To: xs_li@hotmail.com<br>CC: 
  mpich-discuss@mcs.anl.gov<br>Subject: RE: [MPICH] MPI_Bcast hangs in Windows 
  XP<br>Date: Thu, 6 Sep 2007 09:25:36 -0500<br><br>
  
  <style>
.ExternalClass .EC_hmmessage P
{padding-right:0px;padding-left:0px;padding-bottom:0px;padding-top:0px;}
.ExternalClass EC_BODY.hmmessage
{font-size:10pt;font-family:Tahoma;}
</style>

  <div dir="ltr" align="left"><font color="#0000ff" face="Arial"><span class="EC_EC_837321314-06092007">Hi,</span></font></div>
  <div dir="ltr" align="left"><font color="#0000ff" face="Arial"><span class="EC_EC_837321314-06092007">&nbsp;The process manager (smpd) is responsible 
  for launching the MPI processes on the various machines and providing an MPI 
  processes information on how to communicate with other MPI 
  processes.</span></font></div>
  <div dir="ltr" align="left"><font color="#0000ff" face="Arial"><span class="EC_EC_837321314-06092007">&nbsp;The SMPD process manager listens (default 
  case)&nbsp;on port 8676 and then asks the client PM to connect to a new port. 
  So you should allow SMPD process manager (smpd.exe --- installed as a service 
  in windows) to communicate at all ports (This is the easiest way. However you 
  can also restrict the port range used by SMPD. Refer to the windows devloper's 
  guide available at <a href="http://www-unix.mcs.anl.gov/mpi/mpich/" target="_blank">http://www-unix.mcs.anl.gov/mpi/mpich/</a>&nbsp;for 
  details.)</span></font></div>
  <div><font color="#0000ff" face="Arial"><span class="EC_EC_837321314-06092007">&nbsp;Make sure that no firewall (1. Running on 
  the individual machines&nbsp;&nbsp; 2. OR on the network, filtering the 
  traffic btw the machines) is preventing the process managers &amp; the MPI 
  procs&nbsp;on the individual machines from contacting each 
  other.</span></font></div>
  <div><font color="#0000ff" face="Arial"><span class="EC_EC_837321314-06092007"></span></font>&nbsp;</div>
  <div><font color="#0000ff" face="Arial"><span class="EC_EC_837321314-06092007">(Note: 
  Since you do not know what changed in your network, it might help if you try 
  analyzing the network packets sent btw the machines using a packet sniffer 
  like Ethereal.)</span></font></div>
  <div><font color="#0000ff" face="Arial"><span class="EC_EC_837321314-06092007"></span></font>&nbsp;</div>
  <div><span class="EC_EC_837321314-06092007"><font color="#0000ff" face="Arial">Regards,</font></span></div>
  <div><span class="EC_EC_837321314-06092007"><font color="#0000ff" face="Arial">Jayesh</font></span></div><br>
  <div class="EC_EC_OutlookMessageHeader" dir="ltr" align="left" lang="en-us">
  <hr>
  <font face="Tahoma"><b>From:</b> owner-mpich-discuss@mcs.anl.gov 
  [mailto:owner-mpich-discuss@mcs.anl.gov] <b>On Behalf Of </b>Richard 
  Li<br><b>Sent:</b> Wednesday, September 05, 2007 8:21 PM<br><b>To:</b> 
  mpich-discuss@mcs.anl.gov<br><b>Subject:</b> [MPICH] MPI_Bcast hangs in 
  Windows XP<br></font><br></div>
  <div></div>
  <div style="text-align: left;"><font face="Arial">
  <div><span class="EC_EC_EC_618441420-17082007"><font face="Arial">Hi 
  there,</font></span></div>
  <div><span class="EC_EC_EC_618441420-17082007"></span>&nbsp;</div>
  <div><span class="EC_EC_EC_618441420-17082007"><font face="Arial">I am writing an 
  application in Windows XP/VC8 and am having problem with MPI_Bcast(). I am 
  working in corporate environment and suspect it may have something to do with 
  our security policies, however, I don't know exact which low-level operations 
  failed&nbsp;.&nbsp;</font></span></div>
  <div><span class="EC_EC_EC_618441420-17082007"></span>&nbsp;</div>
  <div><span class="EC_EC_EC_618441420-17082007"><font face="Arial">Here is the 
  symptom: my application (as well as cpi.exe example) works fine as long as 
  there is only one machine in the machine file, whether its local machine or 
  remote does not matter. It hangs at MPI_Bcast() when I have more than one 
  machine in MPI_COMM_WORLD. </font></span><font face="Arial"><span class="EC_EC_EC_618441420-17082007"><font face="Arial">I am using </font></span><font face="Arial">mpich2-1.0.5p2-win32-ia32.msi.</font></font></div>
  <div><span class="EC_EC_EC_618441420-17082007"></span>&nbsp;</div>
  <div><span class="EC_EC_EC_618441420-17082007"><font face="Arial">The same 
  application worked perfectly a year ago and there have been many security 
  policy changes since that time(as usual, all policies reduce our freedom). My 
  question is that what's the communication mechanism used in inter-node 
  communication. I tried nothing, auto, sock, ssm as communication channels and 
  had no luck.</font></span></div>
  <div><span class="EC_EC_EC_618441420-17082007"></span>&nbsp;</div>
  <div><span class="EC_EC_EC_618441420-17082007"><font face="Arial">Thanks for your 
  help.<br><br>Richard<br></font></span></div></font></div><br>
  <hr>
  Discover the new Windows Vista <a href="http://search.msn.com/results.aspx?q=windows+vista&amp;mkt=en-US&amp;form=QBRE" target="_blank">Learn more!</a> </blockquote><br>
<hr>
Make your little one a shining star! <a href="http://www.reallivemoms.com?ocid=TXT_TAGHM&amp;loc=us" target="_blank">Shine 
on!</a> 
</blockquote><br /><hr />Can you find the hidden words?  Take a break and play Seekadoo! <a href='http://club.live.com/seekadoo.aspx?icid=seek_wlmailtextlink' target='_new'>Play now!</a></body>
</html>