Tabla de Contenidos
Hardware
- 30 nodos Dell PowerEdge R720xd
- 3 nodos SuperMicro con dual socket AMD 7401
- 4 nodos Intel Core i7 + NVIDIA Tesla C1060 / M1060
- 1 nodo Intel Core i9 + NVIDIA RTX 3060
- 18.7 TFLOPs
- 1200 hilos/threads (600 cores) de cálculo
- 2.5 TB de RAM totales ( nodos de 64GB y de 128GB )
- 150 TB de almacenamiento
- 16 Gbps BW - 16us LAT Infiniband para trafico MPI y Storage
- 1 Gbps de conexión para trabajos MPI
- 1 Gbps de conexión para storage
- 10 kVA de consumo energético
- 30 kVA de potencia de respaldo (UPS)
Software
- Sistema de colas SLURM
- Sistema operativo CentOS 7.5
- Suite de software OpenHPC
- Suite para GPU CUDA Toolkit - Documentación: https://docs.nvidia.com/cuda/index.html
Lugar
- Sala dedicada para computadoras de cálculo
- Aire acondicionado de 18000 frigorías
- Sistema de aire acondicionado de respaldo
- Acceso restringido
- Sistema de alarma contra incendios
- Tablero de distribución trifásico
- Fuentes duales
- Sistema de respaldo de energía
Límites
- Habilitado para uso de investigadores de DF, IFIBA, INFINA y SNCAD
- Cola/Particion por defecto (nombre
batch
)- 176 CPUs por usuario.
- 5 jobs por usuario.
- 4 nodos por job.
- 3 días walltime máximo, con un default de 2 días.
- Cola/partición de mayor prioridad y corta para pruebas, análisis rápidos, etc (nombre
debug
).- 4 cpus por usuario.
- 1 job por usuario
- 1 nodo por job
- 2 horas de walltime máximo.
- Cola/particion más larga (nombre ''long'').
- 3 nodos máximo entre todos los usuarios.
- 8 cpus por job.
- 2 jobs por usuario
- 10 dias de walltime máximo, con un default de 3 días.
- Cola/partición gpu (ver Utilización del servidor I9 con GPU RTX 3060 )
- 1 nodo i9 de 64GB con GPU con RTX3060 de uso exclusivo por job.
- 2 dias de walltime maximo.
- Cola/particion gpu_debug
- Para pruebas cortas, 1 hora de walltime maximo, 1 job.
- 45 días de preservación de archivos en el directorio temporal ( /scratch ). (Anteriormente 30 dias).