Why not using true systems ? i mean unix like ...<br>ist a shame use windows in clusters ...<br>in fact, for it is also put this 1/4 of system im my PC<br><br><div class="gmail_quote">2011/2/28 Jayesh Krishna <span dir="ltr">&lt;<a href="mailto:jayesh@mcs.anl.gov">jayesh@mcs.anl.gov</a>&gt;</span><br>
<blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">Hi,<br>
 The virtual machine setup is not something that we typically test at our test environment. I have created a ticket (<a href="https://trac.mcs.anl.gov/projects/mpich2/ticket/1445" target="_blank">https://trac.mcs.anl.gov/projects/mpich2/ticket/1445</a>) for the same. I will get to it when I have some free dev cycles.<br>

<div class="im"><br>
Regards,<br>
Jayesh<br>
<br>
----- Original Message -----<br>
From: &quot;Li Zuwei&quot; &lt;<a href="mailto:lzuwei@dso.org.sg">lzuwei@dso.org.sg</a>&gt;<br>
</div><div class="im">To: &quot;Jayesh Krishna&quot; &lt;<a href="mailto:jayesh@mcs.anl.gov">jayesh@mcs.anl.gov</a>&gt;<br>
</div><div class="im">Cc: <a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>
</div><div><div></div><div class="h5">Sent: Sunday, February 27, 2011 7:18:27 PM<br>
Subject: RE: [mpich-discuss] Problems with Barriers on MPICH2-1.3.2p1 on Windows        XP and Windows Server 2008<br>
<br>
<br>
<br>
Hi Jayesh,<br>
<br>
Firewalls are disabled on the machines. The machines are actually running on VMware ESX3.5 in a intel xeon server. They are physically housed together but logically separated by vmware. No problems with pinging the servers.<br>

<br>
Regards,<br>
Zuwei<br>
<br>
<br>
<br>
-----Original Message-----<br>
From: Jayesh Krishna [ mailto:<a href="mailto:jayesh@mcs.anl.gov">jayesh@mcs.anl.gov</a> ]<br>
Sent: Fri 2/25/2011 10:09 PM<br>
To: Li Zuwei<br>
Cc: <a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>
Subject: Re: [mpich-discuss] Problems with Barriers on MPICH2-1.3.2p1 on Windows XP and Windows Server 2008<br>
<br>
Hi,<br>
This could be a firewall issue. Did you turn off Windows firewall on both the machines ?<br>
<br>
Regards,<br>
jayesh<br>
<br>
----- Original Message -----<br>
From: &quot;Li Zuwei&quot; &lt;<a href="mailto:lzuwei@dso.org.sg">lzuwei@dso.org.sg</a>&gt;<br>
To: &quot;Jayesh Krishna&quot; &lt;<a href="mailto:jayesh@mcs.anl.gov">jayesh@mcs.anl.gov</a>&gt;<br>
Sent: Thursday, February 24, 2011 8:45:54 PM<br>
Subject: RE: [mpich-discuss] Problems with Barriers on MPICH2-1.3.2p1 on Windows XP and Windows Server 2008<br>
<br>
<br>
<br>
Hi,<br>
<br>
Thanks for the response, a similar problem occurred for cpi.exe, this time round it lies in MPI_Bcast, with same network errors. What puzzles me is the fact that I could run the program remotely on the other nodes through the<br>

&gt;mpiexec -host remote_node -n 4 cpi.exe<br>
<br>
On a program that uses purely Send and Recv commands, I didn&#39;t have problems running on multiple nodes using the machinefile.<br>
<br>
In the case of network error, are there any settings that I have to take note for windows? Such as DCOM settings, remote access etc. The users for the nodes are all administrators, so I presume there won&#39;t be any problems with remote file access and launch of programs.<br>

<br>
Regards,<br>
Zuwei<br>
<br>
<br>
<br>
-----Original Message-----<br>
From: Jayesh Krishna [ mailto:<a href="mailto:jayesh@mcs.anl.gov">jayesh@mcs.anl.gov</a> ]<br>
Sent: Fri 2/25/2011 12:59 AM<br>
To: <a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>
Cc: Li Zuwei<br>
Subject: Re: [mpich-discuss] Problems with Barriers on MPICH2-1.3.2p1 on Windows XP and Windows Server 2008<br>
<br>
Hi,<br>
&gt;From the error message it looks like a network connectivity issue (not related to MPI_Barrier()). Can you send us a test program that fails ?<br>
Can you run cpi.exe (c:\program files\MPICH2\examples\cpi.exe) across the nodes ?<br>
<br>
Regards,<br>
Jayesh<br>
<br>
----- Original Message -----<br>
From: &quot;Li Zuwei&quot; &lt;<a href="mailto:lzuwei@dso.org.sg">lzuwei@dso.org.sg</a>&gt;<br>
To: <a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>
Sent: Thursday, February 24, 2011 2:00:53 AM<br>
Subject: [mpich-discuss] Problems with Barriers on MPICH2-1.3.2p1 on Windows XP and Windows Server 2008<br>
<br>
<br>
Problems with Barriers on MPICH2-1.3.2p1 on Windows XP and Windows Server 2008<br>
<br>
Hi users,<br>
<br>
I have some issues with MPI_Barrier() on the MPICH2-1.3.2p1 build on Windows.<br>
On a single node, the operation works flawlessly, however when the program is scheduled to run on multiple nodes I get the following errors.<br>
<br>
mf.txt<br>
node0:1<br>
node1:1<br>
<br>
&gt;mpiexec -machinefile mf.txt -n 2 mpi_test.exe<br>
<br>
Fatal error in PMPI_Barrier: Other MPI error, error stack:<br>
PMPI_Barrier(425)...........................: MPI_Barrier(MPI_COMM_WORLD) failed<br>
MPIR_Barrier_impl(331)......................: Failure during collective<br>
MPIR_Barrier_impl(313)......................:<br>
MPIR_Barrier_intra(83)......................:<br>
MPIC_Sendrecv(192)..........................:<br>
MPIC_Wait(540)..............................:<br>
MPIDI_CH3I_Progress(353)....................:<br>
MPID_nem_mpich2_blocking_recv(905)..........:<br>
MPID_nem_newtcp_module_poll(37).............:<br>
MPID_nem_newtcp_module_connpoll(2655).......:<br>
gen_cnting_fail_handler(1738)...............: connect failed - the network location connot be reached. For information about network troubleshooting, see Windows Help.<br>
<br>
(errno 1231)<br>
<br>
job aborted:<br>
rank: node: exit code[: error message]<br>
0: node0: 123<br>
1: node1: 1: process 1 exited without calling finalize<br>
<br>
Additional Notes:<br>
When running against code without any MPI_Barrier calls, no problems with were encountered (ie: on multiple nodes send and recv). Based on that I presume my settings were correct and the problem might lie in the barrier implementation on windows.<br>

<br>
Any help to identify the problem here would be great.<br>
<br>
<br>
Regards,<br>
Zuwei<br>
<br>
<br>
_______________________________________________<br>
mpich-discuss mailing list<br>
<a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>
<a href="https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss" target="_blank">https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss</a><br>
<br>
_______________________________________________<br>
mpich-discuss mailing list<br>
<a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>
<a href="https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss" target="_blank">https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss</a><br>
</div></div></blockquote></div><br>