<html>#2252: need for the updating of the submit script template for Cori
<table style='border-spacing: 1ex 0pt; '>
<tr><td style='text-align:right'> Reporter:</td><td></td></tr>
<tr><td style='text-align:right'>   Status:</td><td>open</td></tr>
<tr><td style='text-align:right'>Milestone:</td><td></td></tr>
<tr><td style='text-align:right'>  Version:</td><td>ET_2018_09</td></tr>
<tr><td style='text-align:right'>     Type:</td><td>bug</td></tr>
<tr><td style='text-align:right'> Priority:</td><td>major</td></tr>
<tr><td style='text-align:right'>Component:</td><td>SimFactory</td></tr>
</table>

<p>Comment (by Roland Haas):</p>
<p>I am not quite sure yet if this is working as expected. The SMT thread assignment may be off. I did two test runs one using <code>srun -n 4 --threads-per-core 2 -c 16</code> and one using <code>srun -n 4 --threads-per-core 1 -c 16</code> both for a 2 node submission. In both cases I get</p>
<div class="codehilite language-plaintext"><pre><span></span>This process runs on 16 cores: 0-7, 32-39
Thread 0 runs on 16 cores: 0-7, 32-39
</pre></div>


<p>which given the usual logical-cpu to thread mapping are  (I think) 16 hardware threads on 8 cores which is not quite what was intended (namely it should have been 16 cores) and leaves some cores empty. In particular the <code>srun -n 4 --threads-per-core 1 -c 16</code>  version should have used only 1 thread per core.</p>
<p>These runs did not use SystemTopology. I will try with it next which may give some more insight.</p>
<p>--<br/>
Ticket URL: <a href='https://bitbucket.org/einsteintoolkit/tickets/issues/2252/need-for-the-updating-of-the-submit-script'>https://bitbucket.org/einsteintoolkit/tickets/issues/2252/need-for-the-updating-of-the-submit-script</a></p>
</html>