suivi
Ceci est une ancienne révision du document !
Suivi des jobs
SLURM dispose de nombreuses commandes pour le suivi des jobs, et chaque commande a de nombreuses options. On donne ici les principales.
File d'attente
- squeue affiche les jobs en cours et en attente dans l'ordre de leur priorité
- squeue -u <user> affiche les jobs en cours et en attente pour l'utilisateur user
- squeue -p <nomPart> affiche les jobs en cours et en attente pour la partition demandée
- squeue -i <sec> actualise la liste des jobs en cours toutes les sec secondes
- sprio donne la priorité des jobs en attente (les jobs les plus prioritaires ont la priorité la plus élevée)
Etat d'un job
- sacct affiche l'état des jobs de l'utilisateur qu'ils soient en cours ou déjà terminés. Les principaux états possibles sont :
- CA, cancelled : le job a été annulé par l'utilisateur ou l'administrateur
- CD, completed : le job s'est terminé avec succès
- CG, completing : job en cours
- F, failed : le job s'est terminé avec un échec
- PD, pending : le job attend des ressources
- R, running : le job est en cours d'exécution
- TO, timeout : le job s'est terminé car il a atteint son temps d'exécution limite
- sstat <jobID> donne des informations sur la consommation de ressources d'un job en cours d'exécution
suivi.1497618551.txt.gz · Dernière modification : 2018/10/11 22:49 (modification externe)