Hi Chong,<br><br>Yes, I&#39;m a student. In the truth who will use mpi is my teacher, who will run NAMD, for molecular dynamics. I was challenged about set it up this cluster and I had no knowledge about Linux before start it. Once it running now, I think that maybe I could go a bit more far. Theoretically my work is over, the machines are working well. But yet I would like to know how to extract the maximum performance of these computers, that have already proof that they are good ones, once we had utilized them already for run Gaussian 03 molecular calculations.<br>
<br>I wanted to know a bit more because I love computers and now I was introduced to this universe of clusters, I wanted to know a bit more. Just it. I&#39;m reading already the tips you gave me, even it is a bit complicated to extract the information I want from there. thanks a lot for your attention.<br>
<br>Ari.<br><br><div class="gmail_quote">2008/7/2 chong tan &lt;<a href="mailto:chong_guan_tan@yahoo.com">chong_guan_tan@yahoo.com</a>&gt;:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<table border="0" cellpadding="0" cellspacing="0"><tbody><tr><td style="font-family: inherit; font-style: inherit; font-variant: inherit; font-weight: inherit; font-size: inherit; line-height: inherit; font-size-adjust: inherit; font-stretch: inherit;" valign="top">
<p><br>Ari,</p>
<p>Are you a student ? Anyway, I like to point you to the answer of your problem:</p>
<p>mpiexec -help</p>
<p>&nbsp;</p>
<p>or &nbsp;look at your mpich2 packge, under www/www1, there is a mpiexec.html</p>
<p>&nbsp;</p>
<p>it is easier to give your the answer, but getting you to look for the answer is better.</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>stan</p>
<p><br>--- On <b>Wed, 7/2/08, Ariovaldo de Souza Junior <i>&lt;<a href="mailto:ariovaldojunior@gmail.com" target="_blank">ariovaldojunior@gmail.com</a>&gt;</i></b> wrote:<br></p>
<blockquote style="border-left: 2px solid rgb(16, 16, 255); padding-left: 5px; margin-left: 5px;">From: Ariovaldo de Souza Junior &lt;<a href="mailto:ariovaldojunior@gmail.com" target="_blank">ariovaldojunior@gmail.com</a>&gt;<br>
Subject: [mpich-discuss] core 2 quad and other multiple core processors<br>To: <a href="mailto:mpich-discuss@mcs.anl.gov" target="_blank">mpich-discuss@mcs.anl.gov</a><br>Date: Wednesday, July 2, 2008, 1:15 PM<div><div></div>
<div class="Wj3C7c"><br><br>
<div>Hello everybody!<br><br>I&#39;m really a newbie on clustering, so I have some, let&#39;s say, stupid questions. When I&#39;m starting a job like this &quot;mpiexec -l -n 6 ./cpi&quot; in my small cluster of (until now) 6 core 2 quad machines, I&#39;m sending 1 process to each node, right? Assuming that I&#39;m correct, each process will utilize only 1 core of each node? and how to make 1 process run utilizing the whole processing capacity of the processor, the 4 cores? is there a way to do this? or I&#39;ll always utilize just one processor for each process? if I change this submission to &quot;mpiexec -l -n 24 ./cpi&quot; then the same process will run 24 times, 4 times per node (maybe simultaneously) and one process per core, right?<br>
<br>I&#39;m asking all this because I think it is a bit strange to see the processing time increasing each time I put one more process to run, once in my mind it should be the contrary. I&#39;ll give some examples:<br><br>
mpiexec -n 1 ./cpi<br>wall
 clock time = 0.000579<br><br>mpiexec -n 2 ./cpi<br>wall clock time = 0.002442<br><br>mpiexec -n 3 ./cpi<br>wall clock time = 0.004568<br><br>mpiexec -n 4 ./cpi<br>wall clock time = 0.005150<br><br>mpiexec -n 5 ./cpi<br>
wall clock time = 0.008923<br><br>mpiexec -n 6 ./cpi<br>wall clock time = 0.009309<br><br>mpiexec -n 12 ./cpi<br>wall clock time = 0.019445<br><br>mpiexec -n 18 ./cpi<br>wall clock time = 0.032204<br><br>mpiexec -n 24 ./cpi<br>
wall clock time = 0.045413<br><br>mpiexec -n 48 ./cpi<br>wall clock time = 0.089815<br><br>mpiexec -n 96 ./cpi<br>wall clock time = 0.218894<br><br>mpiexec -n 192 ./cpi<br>wall clock time = 0.492870<br><br>So, as you all can see is that as more processes I add, more time it takes, what makes me think that mpi is performing this test 192 times in the end and due to this the time increased. Is that correct that mpi performed the same test 192? Or did it divide the process into 192 pieces, calculated and then gathered
 the results and mounted the output again? I really would like to understand this relationship processor # x process # x .<br><br>I have the feeling that my questions are a bit &quot;poor&quot; and really from a newbie, but the answer will help me on utilizing other programs that will need mpi to run.<br>
<br>Thanks to all!<br><br>Ari - UFAM - Brazil<br><br></div></div></div></blockquote></td></tr></tbody></table><br>



      </blockquote></div><br>