<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<style type="text/css" style="display:none;"> P {margin-top:0;margin-bottom:0;} </style>
</head>
<body dir="ltr">
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);" class="elementToProof">
Hi Roland,</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);" class="elementToProof">
<br>
</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);" class="elementToProof">
The admins reinstalled openmpi and it now runs the hello script correctly.&nbsp; However, the Toolkit would still produce seg faults after srun.&nbsp; Switching to mvapich seems to have largely done the trick though, as the TOV job is now able to start executing.&nbsp; As
 long as there is only 1 MPI process (with however many threads), the TOV job runs to completion correctly.&nbsp; However, anytime there are multiple MPI processes, it crashes at the first time iteration:<br>
<br>
<i>INFO (TOVSolver): Done interpolation.</i>
<div><i>---------------------------------------------------------------------------</i></div>
<div><i>Iteration &nbsp; &nbsp; &nbsp;Time | &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;ADMBASE::alp | &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;HYDROBASE::rho</i></div>
<div><i>&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; | &nbsp; &nbsp; &nbsp;minimum &nbsp; &nbsp; &nbsp;maximum | &nbsp; &nbsp; &nbsp;minimum &nbsp; &nbsp; &nbsp;maximum</i></div>
<div><i>---------------------------------------------------------------------------</i></div>
<div><i>&nbsp; &nbsp; &nbsp; &nbsp; 0 &nbsp; &nbsp; 0.000 | &nbsp; &nbsp;0.6698612 &nbsp; &nbsp;0.9966374 | 1.000000e-10 &nbsp; &nbsp;0.0012800</i></div>
<div><i>Rank 1 with PID 3964893 received signal 11</i></div>
<div><i>Writing backtrace to static_tov/backtrace.1.txt</i></div>
<div><i>srun: error: c40: task 1: Segmentation fault (core dumped)</i></div>
</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
<br>
</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);" class="elementToProof">
The backtrace is attached, as well as the last portion of the output, and it looks like the issue is tied to Carpet.&nbsp; Are there some settings in the parameter file that need adjusting or setting to fix this?&nbsp; Or perhaps specific settings for the number of ranks
 and threads?<br>
</div>
<div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);" class="elementToProof">
<br>
</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);" class="elementToProof">
Thank you,</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);" class="elementToProof">
Jessica</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);" class="elementToProof">
<br>
</div>
<div id="Signature">
<div>
<div name="divtagdefaultwrapper" style="font-family:Calibri,Arial,Helvetica,sans-serif; font-size:; margin:0">
<div><b><br>
</b></div>
<b>Dr. Jessica S. Warren</b>
<div>Physics Lecturer</div>
<div>Indiana University Northwest</div>
<div>warrenjs@iun.edu</div>
</div>
<div>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif; font-size:12pt; color:rgb(0,0,0);">
<br>
<hr tabindex="-1" style="display:inline-block; width:98%;">
<b>From:</b> Roland Haas<br>
<b>Sent:</b> Thursday, August 11, 2022 8:32 AM<br>
<b>To:</b> Warren, Jessica Sawyer<br>
<b>Cc:</b> users@einsteintoolkit.org<br>
<b>Subject:</b> Re: [Users] [External] Re: Running with SLURM
<div><br>
</div>
</div>
<div class="BodyFragment"><font size="2"><span style="font-size:11pt;">
<div class="PlainText">Hello Jessica,<br>
<br>
If you get the same error from hello-world and from Cactus then it<br>
would seem that there is still something off with the MPI stack.<br>
<br>
The -lmpi_cxx option instructs the linker to link in C++ bindings for<br>
MPI though for just the hello world example, it being C code, this is<br>
not required and -lmpi alone is sufficient.<br>
<br>
I would see two options that would let you get running somewhat quickly:<br>
<br>
1. report your issues with OpenMPI and hello-world (including link to<br>
the source code on the web, and the exact command line to compile) to<br>
the admins and ask them for help<br>
<br>
1.5 instead of using gcc to compile for OpenMPI do use the MPI official<br>
compiler wrapper mpicc which would just be:<br>
<br>
mpicc -o hello hello.c<br>
<br>
that is you do not have to pass and library or inlcude options. If this<br>
fails, I would definitely talk to the admins.<br>
<br>
2. compile hello-world using mvapich. For this the easiest way is to<br>
make sure to load the mvapich module and then use the same compiler<br>
wrapper invication to compile:<br>
<br>
mpicc -o hello hello.c<br>
<br>
If 2 works then you can also compile the Einstein Toolkit with mvapich.<br>
You have to make sure to load the correct module before compiling the<br>
toolkit and then ExternalLibraries/MPI should figure out (from the<br>
mpicc wrapper) how to compile the toolkit. <br>
<br>
Yours,<br>
Roland<br>
<br>
<br>
&gt; Hi Roland,<br>
&gt; <br>
&gt; Thank you so much.&nbsp; The compute nodes are able to be used for<br>
&gt; compilation, and the directories match what is listed in<br>
&gt; make.MPI.defn.&nbsp; When doing the 'hello' example you linked to, it was<br>
&gt; unable to compile due to a linker error (/usr/bin/ld: cannot find<br>
&gt; -lmpi_cxx).&nbsp; I re-ran it in verbose mode and found the directory it<br>
&gt; was searching did exist and did have lmpi but not lmpi_cxx.&nbsp; The<br>
&gt; admins said they had had some issues installing openmpi (couldn't<br>
&gt; recall exactly what), and recommended mpavich (since that does have<br>
&gt; lmpicxx installed and is their preferred implementation).&nbsp; However,<br>
&gt; they reinstalled openmpi in an effort to get that to work and it did<br>
&gt; allow the 'hello' script to compile, but when executed it produced:<br>
&gt; <br>
&gt; --------------------------------------------------------------------------<br>
&gt; No OpenFabrics connection schemes reported that they were able to be<br>
&gt; used on a specific port.&nbsp; As such, the openib BTL (OpenFabrics<br>
&gt; support) will be disabled for this port.<br>
&gt; <br>
&gt;&nbsp;&nbsp; Local host:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; h1<br>
&gt;&nbsp;&nbsp; Local device:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; mlx5_0<br>
&gt;&nbsp;&nbsp; Local port:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1<br>
&gt;&nbsp;&nbsp; CPCs attempted:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rdmacm, udcm<br>
&gt; --------------------------------------------------------------------------<br>
&gt; Hello world from processor h1.quartz.uits.iu.edu, rank 0 out of 1<br>
&gt; processors<br>
&gt; <br>
&gt; Similarly, doing the TOV job via sbatch, after the srun command it<br>
&gt; gave the same OpenFabrics message (for each MPI rank) and then the<br>
&gt; same segmentation faults as before.&nbsp; I've contacted the admins about<br>
&gt; this and am waiting to hear back.&nbsp; Do you have any recommendations -<br>
&gt; perhaps it would be easier to try switching over to mvapich?&nbsp; If so,<br>
&gt; could you point me to some resources on how to reconfigure?<br>
&gt; <br>
&gt; Thank you,<br>
&gt; Jessica<br>
&gt; <br>
&gt; Dr. Jessica S. Warren<br>
&gt; Physics Lecturer<br>
&gt; Indiana University Northwest<br>
&gt; warrenjs@iun.edu<br>
&gt; ________________________________<br>
&gt; From: Roland Haas &lt;rhaas@illinois.edu&gt;<br>
&gt; Sent: Tuesday, August 9, 2022 9:48 AM<br>
&gt; To: Warren, Jessica Sawyer &lt;warrenjs@iun.edu&gt;<br>
&gt; Cc: users@einsteintoolkit.org &lt;users@einsteintoolkit.org&gt;<br>
&gt; Subject: [External] Re: [Users] Running with SLURM<br>
&gt; <br>
&gt; Hello Jessica,<br>
&gt; <br>
&gt; You may also find something useful in the setting up a new machine<br>
&gt; seminar presentation:<br>
&gt; <br>
&gt; <a href="https://urldefense.com/v3/__https://www.einsteintoolkit.org/seminars/2022_02_24/index.html__;!!DZ3fjg!9JAgxc4juluJwklwTQgJGsYLXJIzzdHOqX8rwuiuymRXLrFedDv4PXSatzu0HVAYDfBFpiYxw1_jUDmUew$" target="_blank" rel="noopener noreferrer" data-auth="NotApplicable">
https://urldefense.com/v3/__https://www.einsteintoolkit.org/seminars/2022_02_24/index.html__;!!DZ3fjg!9JAgxc4juluJwklwTQgJGsYLXJIzzdHOqX8rwuiuymRXLrFedDv4PXSatzu0HVAYDfBFpiYxw1_jUDmUew$</a>
<br>
&gt; <br>
&gt; Yours,<br>
&gt; Roland<br>
&gt; <br>
&gt; --<br>
&gt; My email is as private as my paper mail. I therefore support<br>
&gt; encrypting and signing email messages. Get my PGP key from<br>
&gt; <a href="https://urldefense.com/v3/__http://pgp.mit.edu__;!!DZ3fjg!9JAgxc4juluJwklwTQgJGsYLXJIzzdHOqX8rwuiuymRXLrFedDv4PXSatzu0HVAYDfBFpiYxw19et3mEyg$" target="_blank" rel="noopener noreferrer" data-auth="NotApplicable">
https://urldefense.com/v3/__http://pgp.mit.edu__;!!DZ3fjg!9JAgxc4juluJwklwTQgJGsYLXJIzzdHOqX8rwuiuymRXLrFedDv4PXSatzu0HVAYDfBFpiYxw19et3mEyg$</a><br>
&gt;&nbsp; .<br>
<br>
<br>
-- <br>
My email is as private as my paper mail. I therefore support encrypting<br>
and signing email messages. Get my PGP key from <a href="http://pgp.mit.edu" target="_blank" rel="noopener noreferrer" data-auth="NotApplicable">
http://pgp.mit.edu</a> .<br>
</div>
</span></font></div>
</div>
</div>
</div>
</div>
</body>
</html>