<html>
<head>
<style><!--
.hmmessage P
{
margin:0px;
padding:0px
}
body.hmmessage
{
font-size: 10pt;
font-family:Tahoma
}
--></style>
</head>
<body class='hmmessage'><div dir='ltr'>
I disabled the "ufw" and the error continue :-(<br><br>Miguel Angel<br><br><div>&gt; Date: Sat, 22 Oct 2011 16:47:57 -0500<br>&gt; From: balaji@mcs.anl.gov<br>&gt; To: mafga74@hotmail.com<br>&gt; CC: mpich-discuss@mcs.anl.gov<br>&gt; Subject: Re: [mpich-discuss] MPID_nem_tcp_connpoll(1826): Communication error with rank 0: Connection refused<br>&gt; <br>&gt; <br>&gt; [Please keep mpich-discuss cc'ed. I tend to ignore MPI question emails <br>&gt; sent directly to me.]<br>&gt; <br>&gt; Ubuntu does install a firewall automatically, AFAIK. You can check:<br>&gt; <br>&gt; % sudo ufw status<br>&gt; <br>&gt;   -- Pavan<br>&gt; <br>&gt; On 10/22/2011 04:38 PM, Miguel Angel Fernández wrote:<br>&gt; &gt; Unles Ubuntu installs a firewall automaticly, I don't understand what<br>&gt; &gt; can be the problem.<br>&gt; &gt;<br>&gt; &gt; Anyway, I'm going to install the WireShark (Ethereal) on Ubuntu. Maybe<br>&gt; &gt; this clarify the problem.<br>&gt; &gt;<br>&gt; &gt; Thanks<br>&gt; &gt; Miguel Angel<br>&gt; &gt;<br>&gt; &gt;  &gt; Date: Sat, 22 Oct 2011 16:20:43 -0500<br>&gt; &gt;  &gt; From: balaji@mcs.anl.gov<br>&gt; &gt;  &gt; To: mpich-discuss@mcs.anl.gov<br>&gt; &gt;  &gt; CC: mafga74@hotmail.com<br>&gt; &gt;  &gt; Subject: Re: [mpich-discuss] MPID_nem_tcp_connpoll(1826):<br>&gt; &gt; Communication error with rank 0: Connection refused<br>&gt; &gt;  &gt;<br>&gt; &gt;  &gt;<br>&gt; &gt;  &gt; It picks whichever port it can find. It's not fixed.<br>&gt; &gt;  &gt;<br>&gt; &gt;  &gt; This does look like a firewall problem. Most firewalls, keep the ssh<br>&gt; &gt;  &gt; port (22) open, so being able to do an ssh doesn't mean there's no<br>&gt; &gt; firewall.<br>&gt; &gt;  &gt;<br>&gt; &gt;  &gt; On 10/22/2011 03:46 PM, Miguel Angel Fernández wrote:<br>&gt; &gt;  &gt; &gt; Hi Rajeev<br>&gt; &gt;  &gt; &gt;<br>&gt; &gt;  &gt; &gt; Thanks for your response but there is no any firewall among them.<br>&gt; &gt;  &gt; &gt;<br>&gt; &gt;  &gt; &gt; mpi0 is Ubuntu<br>&gt; &gt;  &gt; &gt; mpi1 to mpi4 are Debian (minimun distribution without GUI)<br>&gt; &gt;  &gt; &gt;<br>&gt; &gt;  &gt; &gt; I am doing the conection among them with ssh and it is well configured<br>&gt; &gt;  &gt; &gt; and properly working, I tested it.<br>&gt; &gt;  &gt; &gt; I am thinking,...are you using a socket conettion to comunicate the<br>&gt; &gt;  &gt; &gt; diferent processes? This could be the problem in the Ubuntu one (mpi0).<br>&gt; &gt;  &gt; &gt; If this is the case, can you tell me the exactly socket you are using?<br>&gt; &gt;  &gt; &gt;<br>&gt; &gt;  &gt; &gt; Thanks<br>&gt; &gt;  &gt; &gt; Miguel Angel<br>&gt; &gt;  &gt; &gt;<br>&gt; &gt;  &gt; &gt;<br>&gt; &gt;  &gt; &gt; &gt; From: thakur@mcs.anl.gov<br>&gt; &gt;  &gt; &gt; &gt; Date: Sat, 22 Oct 2011 15:30:26 -0500<br>&gt; &gt;  &gt; &gt; &gt; To: mpich-discuss@mcs.anl.gov<br>&gt; &gt;  &gt; &gt; &gt; Subject: Re: [mpich-discuss] MPID_nem_tcp_connpoll(1826):<br>&gt; &gt;  &gt; &gt; Communication error with rank 0: Connection refused<br>&gt; &gt;  &gt; &gt; &gt;<br>&gt; &gt;  &gt; &gt; &gt; Make sure the 5 machines can communicate with each other, i.e., there<br>&gt; &gt;  &gt; &gt; is no firewall preventing connections.<br>&gt; &gt;  &gt; &gt; &gt;<br>&gt; &gt;  &gt; &gt; &gt; Rajeev<br>&gt; &gt;  &gt; &gt; &gt;<br>&gt; &gt;  &gt; &gt; &gt; On Oct 22, 2011, at 12:36 PM, Miguel Angel Fernández wrote:<br>&gt; &gt;  &gt; &gt; &gt;<br>&gt; &gt;  &gt; &gt; &gt; &gt; Hello everybody<br>&gt; &gt;  &gt; &gt; &gt; &gt;<br>&gt; &gt;  &gt; &gt; &gt; &gt; I'm trying to fix a problem that appear when I execute one of the<br>&gt; &gt;  &gt; &gt; mpich2 program examples.<br>&gt; &gt;  &gt; &gt; &gt; &gt; As you can see, if I execute a normal command there are no<br>&gt; &gt;  &gt; &gt; problems. The cluster work properly.<br>&gt; &gt;  &gt; &gt; &gt; &gt;<br>&gt; &gt;  &gt; &gt; &gt; &gt; mpi@mpi0:~$ mpiexec -f ./mpich2-install/machinefile -n 5 hostname<br>&gt; &gt;  &gt; &gt; &gt; &gt; mpi0<br>&gt; &gt;  &gt; &gt; &gt; &gt; mpi2<br>&gt; &gt;  &gt; &gt; &gt; &gt; mpi3<br>&gt; &gt;  &gt; &gt; &gt; &gt; mpi1<br>&gt; &gt;  &gt; &gt; &gt; &gt; mpi4<br>&gt; &gt;  &gt; &gt; &gt; &gt; mpi@mpi0:~$<br>&gt; &gt;  &gt; &gt; &gt; &gt;<br>&gt; &gt;  &gt; &gt; &gt; &gt; but when I try to execute the program, the results are something<br>&gt; &gt;  &gt; &gt; like this<br>&gt; &gt;  &gt; &gt; &gt; &gt;<br>&gt; &gt;  &gt; &gt; &gt; &gt; mpi@mpi0:~$ mpiexec -f ./mpich2-install/machinefile -n 5<br>&gt; &gt;  &gt; &gt; /home/mpi/mpich2-install/workspace/Prueba/Debug/Prueba<br>&gt; &gt;  &gt; &gt; &gt; &gt; Hello MPI World the original.<br>&gt; &gt;  &gt; &gt; &gt; &gt; Hello MPI World the original.<br>&gt; &gt;  &gt; &gt; &gt; &gt; Hello MPI World the original.<br>&gt; &gt;  &gt; &gt; &gt; &gt; Hello MPI World the original.<br>&gt; &gt;  &gt; &gt; &gt; &gt; Hello MPI World the original.<br>&gt; &gt;  &gt; &gt; &gt; &gt; From process 0: Num processes: 5<br>&gt; &gt;  &gt; &gt; &gt; &gt; Fatal error in MPI_Send: Other MPI error, error stack:<br>&gt; &gt;  &gt; &gt; &gt; &gt; MPI_Send(173)..............: MPI_Send(buf=0xbfcbe268, count=26,<br>&gt; &gt;  &gt; &gt; MPI_CHAR, dest=0, tag=0, MPI_COMM_WORLD) failed<br>&gt; &gt;  &gt; &gt; &gt; &gt; MPID_nem_tcp_connpoll(1826): Communication error with rank 0:<br>&gt; &gt;  &gt; &gt; Connection refused<br>&gt; &gt;  &gt; &gt; &gt; &gt; Fatal error in MPI_Send: Other MPI error, error stack:<br>&gt; &gt;  &gt; &gt; &gt; &gt; MPI_Send(173)..............: MPI_Send(buf=0xbfb32ca8, count=26,<br>&gt; &gt;  &gt; &gt; MPI_CHAR, dest=0, tag=0, MPI_COMM_WORLD) failed<br>&gt; &gt;  &gt; &gt; &gt; &gt; MPID_nem_tcp_connpoll(1826): Communication error with rank 0:<br>&gt; &gt;  &gt; &gt; Connection refused<br>&gt; &gt;  &gt; &gt; &gt; &gt; Fatal error in MPI_Send: Other MPI error, error stack:<br>&gt; &gt;  &gt; &gt; &gt; &gt; MPI_Send(173)..............: MPI_Send(buf=0xbfa49e98, count=26,<br>&gt; &gt;  &gt; &gt; MPI_CHAR, dest=0, tag=0, MPI_COMM_WORLD) failed<br>&gt; &gt;  &gt; &gt; &gt; &gt; MPID_nem_tcp_connpoll(1826): Communication error with rank 0:<br>&gt; &gt;  &gt; &gt; Connection refused<br>&gt; &gt;  &gt; &gt; &gt; &gt; Fatal error in MPI_Send: Other MPI error, error stack:<br>&gt; &gt;  &gt; &gt; &gt; &gt; MPI_Send(173)..............: MPI_Send(buf=0xbfa57538, count=26,<br>&gt; &gt;  &gt; &gt; MPI_CHAR, dest=0, tag=0, MPI_COMM_WORLD) failed<br>&gt; &gt;  &gt; &gt; &gt; &gt; MPID_nem_tcp_connpoll(1826): Communication error with rank 0:<br>&gt; &gt;  &gt; &gt; Connection refused<br>&gt; &gt;  &gt; &gt; &gt; &gt;<br>&gt; &gt;  &gt; &gt; &gt; &gt; Do you have any idea what can be the problem?<br>&gt; &gt;  &gt; &gt; &gt; &gt;<br>&gt; &gt;  &gt; &gt; &gt; &gt; Thank you in advance<br>&gt; &gt;  &gt; &gt; &gt; &gt; Miguel Angel<br>&gt; &gt;  &gt; &gt; &gt; &gt;<br>&gt; &gt;  &gt; &gt; &gt; &gt; _______________________________________________<br>&gt; &gt;  &gt; &gt; &gt; &gt; mpich-discuss mailing list mpich-discuss@mcs.anl.gov<br>&gt; &gt;  &gt; &gt; &gt; &gt; To manage subscription options or unsubscribe:<br>&gt; &gt;  &gt; &gt; &gt; &gt; https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss<br>&gt; &gt;  &gt; &gt; &gt;<br>&gt; &gt;  &gt; &gt; &gt; _______________________________________________<br>&gt; &gt;  &gt; &gt; &gt; mpich-discuss mailing list mpich-discuss@mcs.anl.gov<br>&gt; &gt;  &gt; &gt; &gt; To manage subscription options or unsubscribe:<br>&gt; &gt;  &gt; &gt; &gt; https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss<br>&gt; &gt;  &gt; &gt;<br>&gt; &gt;  &gt; &gt;<br>&gt; &gt;  &gt; &gt; _______________________________________________<br>&gt; &gt;  &gt; &gt; mpich-discuss mailing list mpich-discuss@mcs.anl.gov<br>&gt; &gt;  &gt; &gt; To manage subscription options or unsubscribe:<br>&gt; &gt;  &gt; &gt; https://lists.mcs.anl.gov/mailman/listinfo/mpich-discuss<br>&gt; &gt;  &gt;<br>&gt; &gt;  &gt; --<br>&gt; &gt;  &gt; Pavan Balaji<br>&gt; &gt;  &gt; http://www.mcs.anl.gov/~balaji<br>&gt; <br>&gt; -- <br>&gt; Pavan Balaji<br>&gt; http://www.mcs.anl.gov/~balaji<br></div>                                               </div></body>
</html>