Hardware

  • 30 nodos Dell PowerEdge R720xd
  • 3 nodos SuperMicro con dual socket AMD 7401
  • 4 nodos Intel Core i7 + NVIDIA Tesla C1060 / M1060
  • 1 nodo Intel Core i9 + NVIDIA RTX 3060
  • 18.7 TFLOPs
  • 1200 hilos/threads (600 cores) de cálculo
  • 2.5 TB de RAM totales ( nodos de 64GB y de 128GB )
  • 150 TB de almacenamiento
  • 16 Gbps BW - 16us LAT Infiniband para trafico MPI y Storage
  • 1 Gbps de conexión para trabajos MPI
  • 1 Gbps de conexión para storage
  • 10 kVA de consumo energético
  • 30 kVA de potencia de respaldo (UPS)

Software

Lugar

  • Sala dedicada para computadoras de cálculo
  • Aire acondicionado de 18000 frigorías
  • Sistema de aire acondicionado de respaldo
  • Acceso restringido
  • Sistema de alarma contra incendios
  • Tablero de distribución trifásico
  • Fuentes duales
  • Sistema de respaldo de energía

Límites

  • Habilitado para uso de investigadores de DF, IFIBA, INFINA y SNCAD
  • Cola/Particion por defecto (nombre batch)
    • 176 CPUs por usuario.
    • 5 jobs por usuario.
    • 4 nodos por job.
    • 3 días walltime máximo, con un default de 2 días.
  • Cola/partición de mayor prioridad y corta para pruebas, análisis rápidos, etc (nombre debug).
    • 4 cpus por usuario.
    • 1 job por usuario
    • 1 nodo por job
    • 2 horas de walltime máximo.
  • Cola/particion más larga (nombre ''long'').
    • 3 nodos máximo entre todos los usuarios.
    • 8 cpus por job.
    • 2 jobs por usuario
    • 10 dias de walltime máximo, con un default de 3 días.
    • 1 nodo i9 de 64GB con GPU con RTX3060 de uso exclusivo por job.
    • 2 dias de walltime maximo.
  • Cola/particion gpu_debug
    • Para pruebas cortas, 1 hora de walltime maximo, 1 job.
  • 45 días de preservación de archivos en el directorio temporal ( /scratch ). (Anteriormente 30 dias).

Expansiones futuras

  • Ampliación capacidad de cómputo e infraestructura de red.

img_8365_-_medio_cluster.jpg