Los nodos AMD Epyc disponibles en el cluster están incorporados a las colas manejadas por slurm. Ya que poseen una arquitectura e instrucciones adicionales a los nodos Xeon del cluster, tener en cuenta lo siguiente:
Los programas optimizados para la architectura Xeon disponible corren sin necesidad de modificación en los nodos Epyc. Sin embargo, como estos además soportan instrucciones AVX2 y FMA, es posible optimizarlos específicamente para los Epyc. Para esto en su compilador debe incluir las líneas -mavx2 -mfma
ó -mtune=znver1
.
Si al encolar un trabajo no se solicitan características especiales, el sistema de colas primero intentará correr el trabajo en los nodos Xeon, y en caso de que no estuvieran libres, a los Epyc si estos estuvieran disponibles. Si desea solicitar específicamente un nodo Epyc debe incluir en la línea de comando de sbatch la opción de -C AVX2
, por ejemplo
sbatch -C AVX2 mijob.sh
Los nodos Epyc poseen 48 cores c/u , con sólo un thread/hilo por core, a diferencia de los Xeones que poseen 16 cores /32 threads por nodo. Es por esto que se recomienda su uso para programas que se beneficien en el uso paralelo de los multiple cores.
Aquí pueden encontrar una guia de mejores prácticas para utilizar esta arquitectura.