<div dir="ltr"><div dir="ltr"><div><div>Hi Hong, <br><br></div>Thanks for the advice. I see that the example takes ~180 seconds to run but I can't see the DRAM vs MCDRAM info from Intel APS. I'll try to fix the profiling and get back with further questions. <br><br></div>Also, the intel-mpi manpages say that the use of tmi is now deprecated : <a href="https://software.intel.com/en-us/mpi-developer-guide-linux-fabrics-control" target="_blank">https://software.intel.com/en-us/mpi-developer-guide-linux-fabrics-control</a><br><div><br><br><div><div>Thank You,<br></div><div><div dir="ltr" class="m_-2369807753535191231gmail_signature"><div dir="ltr"><div style="font-size:12.8px">Sajid Ali<br></div><div style="font-size:12.8px">Applied Physics<br></div><div style="font-size:12.8px">Northwestern University</div></div></div></div></div></div></div></div>