Hi<br><br>Thanks for getting back to me.<br><br>On my Solaris 10 box hostname mars I can ping all other machines. using ip address or hostnames.<br><br>On all other machines I can ping mars (Soloris 10 box)  by ip address only.<br>
<br>During configuration of the Solaris I allowed my server to offer a DHCP address to this Mars. And I did not register the name with my DNS server. If you believe this to be a problem I can configure it with a static address. <br>
<br>Thanks<br>Tim <br><br><br><br><br><br><div class="gmail_quote">On Thu, Jun 3, 2010 at 11:47 AM,  <span dir="ltr">&lt;<a href="mailto:jayesh@mcs.anl.gov">jayesh@mcs.anl.gov</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Hi,<br>
 Can you try pinging hosts from each other (From host1: ping host2, From host2: ping host1) and let us know the results ?<br>
<br>
Regards,<br>
Jayesh<br>
----- Original Message -----<br>
From: &quot;lhy stony&quot; &lt;<a href="mailto:lhy2008lx@gmail.com">lhy2008lx@gmail.com</a>&gt;<br>
To: <a href="mailto:jayesh@mcs.anl.gov">jayesh@mcs.anl.gov</a><br>
Sent: Wednesday, June 2, 2010 8:17:58 PM GMT -06:00 US/Canada Central<br>
Subject: Re: [mpich-discuss] Problem in using wmpiexec.exe in Windows XP<br>
<br>
<br>
<br>
Hi,<br>
I have already done what you said. The mpiexec command line is:<br>
mpiexec.exe -l -env -channel nemesis -hosts 2 rs dgj -noprompt C:\MPI\DataTransport.exe<br>
In my 100Mbps network, the result is:<br>
[1]Start time: (min:sec:msec)=(50:16:781)<br>
[0]Start time: (min:sec:msec)=(44:42:765)<br>
[0]End time: (min:sec:msec)=(44:47:937)<br>
[1]Time for Receiving Data in Process1 is: 5.164633!<br>
[1]Transmission Speed is :9.487605 M byte/s!<br>
[1]End time: (min:sec:msec)=(50:21:953)<br>
Everything goes well.<br>
<br>
In my 1Gbps network, the result is:<br>
[1]Start time: (min:sec:msec)=(3:19:890)<br>
[0]Start time: (min:sec:msec)=(57:46:31)<br>
[0]End time: (min:sec:msec)=(57:46:640)<br>
[1]Time for Receiving Data in Process1 is: 0.606684!<br>
[1]Transmission Speed is :80.766892 M byte/s!<br>
[1]End time: (min:sec:msec)=(3:20:500)<br>
<br>
However, before my program can print<br>
[1]Start time: (min:sec:msec)=(3:19:890)<br>
[0]Start time: (min:sec:msec)=(57:46:31)<br>
there are still some wating time. It seems that the program stopped for a while( about 30 seconds) before really started. I have no clue about why this happens.<br>
<br>
regards<br>
<br>
stonylhy<br>
<br>
<br>
2010/5/24 &lt; <a href="mailto:jayesh@mcs.anl.gov">jayesh@mcs.anl.gov</a> &gt;<br>
<br>
<br>
Hi,<br>
Did you try the nemesis channel (mpiexec -n 2 -channel nemesis MYPROGRAM.exe) ? What options are you using to run your job (Copy-paste the mpiexec command line in your email)?<br>
I have modified your code slightly to include time measurement for the entire process. Please compile/run the code below with the &quot;-l&quot; option for nemesis channel (mpiexec -l -n 2 -channel nemesis -machinefile mf.txt MYPROGRAM.exe)<br>

<br>
============================================================================<br>
#include &lt;stdio.h&gt;<br>
#include &lt;windows.h&gt;<br>
#include &quot;mpi.h&quot;<br>
<br>
void print_time(void ){<br>
SYSTEMTIME stime;<br>
<br>
ZeroMemory(&amp;stime, sizeof(SYSTEMTIME));<br>
GetSystemTime(&amp;stime);<br>
printf(&quot;\t(min:sec:msec)=(%d:%d:%d)\n&quot;, stime.wMinute, stime.wSecond, stime.wMilliseconds); fflush(stdout);<br>
}<br>
<br>
int main(int argc, char** argv)<br>
<br>
{<br>
int myid,numprocs;<br>
int namelen;<br>
char processor_name[MPI_MAX_PROCESSOR_NAME];<br>
/* Print the start time = Use &quot;-l&quot; option to print output based on the ranks */<br>
printf(&quot;Start time :&quot;); print_time();<br>
<br>
MPI_Init(&amp;argc,&amp;argv);<br>
MPI_Comm_rank(MPI_COMM_WORLD,&amp;myid);<br>
MPI_Comm_size(MPI_COMM_WORLD,&amp;numprocs);<br>
MPI_Get_processor_name(processor_name,&amp;namelen);<br>
<br>
double TimeStart, TimeEnd;<br>
int nWidth, nHeight;<br>
nWidth = 7000;<br>
nHeight = 7000;<br>
<br>
MPI_Request rRequest;<br>
MPI_Request rRequest1;<br>
BYTE *Data_Send ;<br>
BYTE *Data_Rec;<br>
<br>
BOOL bIfOver = FALSE;<br>
if ( myid == 0 )<br>
{<br>
<br>
Data_Send= new BYTE[ nHeight * nWidth];<br>
TimeStart = MPI_Wtime();<br>
<br>
//Send<br>
MPI_Isend( Data_Send, nHeight * nWidth, MPI_BYTE,<br>
1, 1, MPI_COMM_WORLD, &amp;rRequest1 );<br>
<br>
MPI_Status status1;<br>
MPI_Wait( &amp;rRequest1, &amp;status1 );<br>
TimeEnd = MPI_Wtime();<br>
delete Data_Send;<br>
<br>
}<br>
else<br>
{<br>
Data_Rec = new BYTE[ nHeight * nWidth];<br>
TimeStart = MPI_Wtime();<br>
MPI_Irecv( Data_Rec, nHeight * nWidth, MPI_BYTE,<br>
0, 1, MPI_COMM_WORLD, &amp;rRequest);<br>
<br>
MPI_Status status2;<br>
MPI_Wait( &amp;rRequest, &amp;status2 );<br>
TimeEnd = MPI_Wtime();<br>
printf( &quot;Time for Receiving Data in Process%d is: %f!\n&quot;, myid, TimeEnd - TimeStart );<br>
printf( &quot;Transmission Speed is :%f M byte/s!\n\n&quot;, nHeight * nWidth * sizeof(BYTE)/(TimeEnd - TimeStart) / 1000000.0 );<br>
<br>
delete Data_Rec;<br>
}<br>
MPI_Finalize();<br>
/* Print the start time = Use &quot;-l&quot; option to print output based on the ranks */<br>
printf(&quot;End time :&quot;); print_time();<br>
return TRUE;<br>
}<br>
============================================================================<br>
<br>
I would recommend running a benchmark program like the OSU bandwidth micro benchmark to measure the bandwidth ( <a href="http://mvapich.cse.ohio-state.edu/benchmarks/" target="_blank">http://mvapich.cse.ohio-state.edu/benchmarks/</a> - The benchmark does some warmup steps before measuring the bandwidth etc).<br>

Let us know the results.<br>
<br>
<br>
Regards,<br>
Jayesh<br>
----- Original Message -----<br>
From: &quot;lhy stony&quot; &lt; <a href="mailto:lhy2008lx@gmail.com">lhy2008lx@gmail.com</a> &gt;<br>
<br>
<br>
<br>
To: &quot;Jayesh Krishna&quot; &lt; <a href="mailto:jayesh@mcs.anl.gov">jayesh@mcs.anl.gov</a> &gt;<br>
Sent: Friday, May 21, 2010 2:08:36 AM GMT -06:00 US/Canada Central<br>
Subject: Re: [mpich-discuss] Problem in using wmpiexec.exe in Windows XP<br>
<br>
<br>
<br>
Hi,<br>
I changed the version of MPICH2 to 1.2.1p1 and I also tried run the program in command line, but problem still exists. I tested the &quot;initializing time &quot; of my 1Gbps network and I found that the time is about 30 seconds.<br>

To illustrate the problem, code of my simple program is given here.<br>
int _tmain(int argc, char** argv)<br>
{<br>
int myid,numprocs;<br>
int namelen;<br>
char processor_name[MPI_MAX_PROCESSOR_NAME];<br>
MPI_Init(&amp;argc,&amp;argv);<br>
MPI_Comm_rank(MPI_COMM_WORLD,&amp;myid);<br>
MPI_Comm_size(MPI_COMM_WORLD,&amp;numprocs);<br>
MPI_Get_processor_name(processor_name,&amp;namelen);<br>
<br>
double TimeStart, TimeEnd;<br>
int nWidth, nHeight;<br>
nWidth = 7000;<br>
nHeight = 7000;<br>
<br>
MPI_Request rRequest;<br>
MPI_Request rRequest1;<br>
BYTE *Data_Send ;<br>
BYTE *Data_Rec;<br>
<br>
BOOL bIfOver = FALSE;<br>
if ( myid == 0 )<br>
{<br>
TimeStart = MPI_Wtime();<br>
Data_Send= new BYTE[ nHeight * nWidth];<br>
//Send<br>
MPI_Isend( Data_Send, nHeight * nWidth, MPI_BYTE,<br>
1, 1, MPI_COMM_WORLD, &amp;rRequest1 );<br>
<br>
MPI_Status status1;<br>
MPI_Wait( &amp;rRequest1, &amp;status1 );<br>
TimeEnd = MPI_Wtime();<br>
delete Data_Send;<br>
<br>
}<br>
else<br>
{<br>
Data_Rec = new BYTE[ nHeight * nWidth];<br>
TimeStart = MPI_Wtime();<br>
MPI_Irecv( Data_Rec, nHeight * nWidth, MPI_BYTE,<br>
0, 1, MPI_COMM_WORLD, &amp;rRequest);<br>
<br>
MPI_Status status2;<br>
MPI_Wait( &amp;rRequest, &amp;status2 );<br>
TimeEnd = MPI_Wtime();<br>
printf( &quot;Time for Receiving Data in Process%d is: %f!\n&quot;, myid, TimeEnd - TimeStart );<br>
printf( &quot;Transmission Speed is :%f M byte/s!\n\n&quot;, nHeight * nWidth * sizeof(BYTE)/(TimeEnd - TimeStart) / 1000000.0 );<br>
<br>
delete Data_Rec;<br>
}<br>
MPI_Finalize();<br>
return TRUE;<br>
}<br>
<br>
The output is:<br>
Time for Receiving Data in Process1 is: 1.146748!<br>
Transmission Speed is :42.729512 M byte/s!<br>
<br>
But,by my stopwatch,I recorded the time from my beginning the program to output being printed out. It&#39;s almost 32 seconds!<br>
Therefore, I think that the &quot;initializing time &quot; of my 1Gbps network is about 30 seconds.<br>
Why? I&#39;m really confused.<br>
<br>
Besides, I have another question.<br>
When I increase the size of the sending data, the transmission speed decreases.<br>
For example, when I set nWidth = 5000; nHeight = 5000; the output is :<br>
Time for Receiving Data in Process1 is: 0.396994!<br>
Transmission Speed is :60.055994 M byte/s!<br>
<br>
but when I set nWidth = 20000; nHeight = 20000;<br>
Time for Receiving Data in Process1 is: 14.101276!<br>
Transmission Speed is :27.052142 M byte/s!<br>
Why does the transmission speed decreases?<br>
And I test the speed in my original 100Mbps network, the result shows that the speed keep unchanged.<br>
<br>
Regards<br>
<br>
stonylhy<br>
<br>
<br>
2010/5/21 Jayesh Krishna &lt; <a href="mailto:jayesh@mcs.anl.gov">jayesh@mcs.anl.gov</a> &gt;<br>
<br>
<br>
Hi,<br>
First of all, MPICH2 1.0.7 is old. You should upgrade to a newer version of MPICH2 ( <a href="http://www.mcs.anl.gov/research/projects/mpich2/downloads/index.php?s=downloads" target="_blank">http://www.mcs.anl.gov/research/projects/mpich2/downloads/index.php?s=downloads</a> ). I am still confused about the timings mentioned in your email. For example, how is the measurement of 10s different from that of 2s for the 1Gbps n/w.<br>

Can you also try submitting your job from the command line and see if it helps (mpiexec -n 2 -machinefile mf.txt MYMPIPGM.exe). The latest stable version of MPICH2 should also have the newer nemesis channel that you might want to try out (mpiexec -n 2 -channel nemesis -machinefile mf.txt MYMPIPGM.exe).<br>

<br>
<br>
Regards,<br>
Jayesh<br>
<br>
----- Original Message -----<br>
From: &quot;lhy stony&quot; &lt; <a href="mailto:lhy2008lx@gmail.com">lhy2008lx@gmail.com</a> &gt;<br>
<br>
<br>
<br>
To: <a href="mailto:jayesh@mcs.anl.gov">jayesh@mcs.anl.gov</a><br>
Sent: Thursday, May 20, 2010 10:51:37 AM GMT -06:00 US/Canada Central<br>
Subject: Re: [mpich-discuss] Problem in using wmpiexec.exe in Windows XP<br>
<br>
<br>
Hi, Jayesh<br>
The version of MPICH2 I am using is 1.0.7. I also change the number of the nodes and the other MPI programs, but problem still exists.<br>
In order to describe the problem clearly, an simpler experiment has been done.<br>
In this experiment, there are only two nodes working. One is to send an image of which size is 80M, and the other one is to receive the image. The receiving time will be recorded and printed. In my 100Mbps network, it costs nearly 10 seconds to complete the transmission and the printed time is just the same(10 seconds). In my 1Gbps network, it actually costs almost 10 seconds (maybe more) to complete the transmission but the printed time is less than 2 seconds, which is normal for a 1Gbps network.<br>

It seems that when the 1 Gbps network gets to work, it work normally( the printed time shows that the transmission speed is faster indeed), but it must spend some time to initialize. If so, aren&#39;t the 1Gbps network useless in MPI programs? I doubt whether I forget to set up some necessary configuration after I change the network.<br>

<br>
Thanks.<br>
<br>
Regards,<br>
stonylhy<br>
<br>
2010/5/20 &lt; <a href="mailto:jayesh@mcs.anl.gov">jayesh@mcs.anl.gov</a> &gt;<br>
<br>
<br>
Hi,<br>
Which version of MPICH2 are you using ? If I understand you correctly, are you saying that your MPI program takes the same amount of time with 100 &amp; 1Gbps n/ws but the MPI program launch environment (MPICH2 runtime initialization etc) takes more time with the 1Gbps n/w ?<br>

What is the time difference that you see with the two networks ?<br>
Did you change the number of processes running on the individual nodes when you changed your network (MPI processes running on the same node, MPI processes running across network etc)?<br>
Does running other MPI programs (eg: c:\program files\MPICH2\examples\cpi.exe) take more time with the 1Gbps network ?<br>
<br>
Regards,<br>
Jayesh<br>
<br>
<br>
<br>
----- Original Message -----<br>
From: &quot;lhy stony&quot; &lt; <a href="mailto:lhy2008lx@gmail.com">lhy2008lx@gmail.com</a> &gt;<br>
To: &quot;MPICH讨论&quot; &lt; <a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a> &gt;<br>
Sent: Wednesday, May 19, 2010 8:29:46 PM GMT -06:00 US/Canada Central<br>
Subject: [mpich-discuss] Problem in using wmpiexec.exe in Windows XP<br>
<br>
<br>
<br>
Hi, all<br>
I am using wmpiexec.exe to run my MPI program in windows xp. When I ran the program in a 100Mbps network, everything was OK. But after I improve my network to 1000Mbps, it seems that wmpiexec.exe cost more time to initialize, cause in the first a few seconds, the usage of CPU does not change much which is obviously abnormal according to my program.<br>

In my program, I use MPI_Wtime to calculate the processing time. The time that printed by my program is correct according to my program, but the actual processing time is much longer. I don&#39;t know why and how to fix it.<br>

Anyone can help me?<br>
_______________________________________________<br>
mpich-discuss mailing list<br>
<br>
<a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>
<a href="https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss" target="_blank">https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss</a><br>
<br>
<br>
<br>
_______________________________________________<br>
mpich-discuss mailing list<br>
<a href="mailto:mpich-discuss@mcs.anl.gov">mpich-discuss@mcs.anl.gov</a><br>
<a href="https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss" target="_blank">https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss</a><br>
</blockquote></div><br><br clear="all"><br>-- <br>The information contained in this E-mail message is privileged, confidential, and may be protected from disclosure; please be aware that any other use, printing, copying, disclosure or dissemination<br>
of this communication may be subject to legal restriction or sanction. If you think that you have received this E-mail message in error, please reply to the sender and delete it from your computer. Thank you.<br>