<html>#2670: Refinement prolongation: All points must have been received
<table style='border-spacing: 1ex 0pt; '>
<tr><td style='text-align:right'> Reporter:</td><td></td></tr>
<tr><td style='text-align:right'>   Status:</td><td>new</td></tr>
<tr><td style='text-align:right'>Milestone:</td><td>ET_2022_05</td></tr>
<tr><td style='text-align:right'>  Version:</td><td>ET_2022_05</td></tr>
<tr><td style='text-align:right'>     Type:</td><td>bug</td></tr>
<tr><td style='text-align:right'> Priority:</td><td>major</td></tr>
<tr><td style='text-align:right'>Component:</td><td>Carpet</td></tr>
</table>

<p>Comment (by Roland Haas):</p>
<p>Hmm, one thing I would suggest changing would be to use fewer threads per MPI rank. Right now you have set:</p>
<div class="codehilite"><pre><span></span><span>export OMP_NUM_THREADS=24</span>
</pre></div>


<p>which gives you 24 OpenMP thtreads per MPI rank. The SubmitScipt you use is (essentially, up to comments) <code>generic.sub</code> as far as I can tell, so really only designed for a non-cluster environment (it may work on a cluster, but that would be kind of accidental). </p>
<p>Right now it seems that you are using 8 MPI ranks each with 24 OpenMP threads. So this is a total of 192 cores. So this should be somewhere between 4 and 8 nodes, yes?</p>
<p>My suggestion would be to try and use only about 8 OpenMP threads and correspondingly more MPI ranks, so use <code>--cores 192 --num-threads 8</code> instead of <code>--cores 192 --num-threads 24</code> which is what you seem to have used.</p>
<p>In principle, more threads should of course not make things fail (this would indeed be a bug), though it may be quite hard to reproduce since it would, most likely, be a race condition that only shows up with large thread counts. Also not that multi-threading in Cactus/Carpet tends to not be extremely efficient (since it was added to an existing MPI parallel code instead of being integrated from the beginning), which is why I suggest to use fewer threads.  Usually you want to use as many MPI ranks and as few threads as you can get away with before you are limited by added communication overhead (which scales as the number of MPI ranks and is constant with the number of OpenMP threads).</p>
<p>--<br/>
Ticket URL: <a href='https://bitbucket.org/einsteintoolkit/tickets/issues/2670/refinement-prolongation-all-points-must'>https://bitbucket.org/einsteintoolkit/tickets/issues/2670/refinement-prolongation-all-points-must</a></p>
</html>