Trabajos tipo HTC (High Throughput Computing)
El servicio está diseñado para ejecutar trabajos limitados al número máximo de cores en un solo nodo.
Algunas consideraciones para aprovechar la infraestructura de Grid UNAM:
- La ejecución de un trabajo no se distribuye en diferentes clusters simultáneamente.
- Es posible ejecutar múltiples trabajos independientes simultáneamente en uno o más clusters de la grid.
- La capacidad de memoria garantizada es de 2 GB por core. En caso de que el proyecto requiera una capacidad mayor, envíe un correo electrónico a soporte-grid@unam.mx
- Si el proyecto requiere la ejecución de cálculos paralelos, éstos se realizarán en un sólo nodo de la grid con el modelo de memoria compartida o utilizando MPI (Message Passing Interface). Para mayor información, envíe un correo electrónico a soporte-grid@unam.mx
- Se contará con un máximo de 10 GB por core en scratch durante la ejecución del trabajo o job. Si el usuario requiere una cantidad mayor, es necesario enviar un correo electrónico a soporte-grid@unam.mx
- Grid UNAM soporta trabajos cuyas aplicaciones puedan ejecutarse en ambiente Linux con bibliotecas y compiladores, software base o en contenedores Apptainer. Si la aplicación a correr depende de otro software, envíe un correo electrónico a soporte-grid@unam.mx.
Trabajos tipo HPC (High Performance Computing)
Se caracterizan por la ejecución de procesos paralelos muy acoplados, que requieren gran poder de cálculo intensivo, y como tales deben ejecutarse dentro de un solo cluster y con interconexiones de baja latencia. Si los trabajos de un proyecto son del tipo HPC; es decir, requieren una o más de las siguientes características, serán ejecutados únicamente en el nodo Miztli, cuyos requerimientos son:
- Máximo de 256 cores por trabajo.
- Memoria distribuida. Por ejemplo: MPI.
- Para la ejecución de un trabajo el límite de tiempo será de 72 horas, con opción de reanudarlo a partir del último resultado guardado (checkpoint).
- El sistema de archivos paralelos disponible es Lustre.
- Aplicaciones que se ejecuten en un ambiente Linux.
Recomendaciones
- El usuario podrá revisar las tecnologías o arquitecturas disponibles en Grid UNAM para identificar si el hardware disponible puede correr su aplicación. En la sección Recursos disponibles se pueden consultar los detalles al respecto.
- Se recomienda que el software sea tolerante a fallas; es decir, que cuente con la funcionalidad de guardar resultados parciales que permitan continuar la ejecución a partir del último estado guardado (generar checkpoint). En caso de dudas, envíe un correo electrónico a soporte-grid@unam.mx
- En caso de que el usuario requiera aplicaciones con licencia, es necesario enviar un correo electrónico a soporte-grid@unam.mx